Загрузка...

Microsoft open sourced Python libs

Thread in Windows created by CORNER Dec 16, 2024. 122 views

  1. CORNER
    CORNER Topic starter Dec 16, 2024 Только что :happycat:
    Microsoft открыла исходный код Python-либы для преобразования файлов в Markdown
    MarkItDown — идеальное решение для конвертации файлов и офисных документов в Markdown. Подойдёт для анализа, индексации или упорядочивания данных.



    Что поддерживает:
    — PDF, PowerPoint, Word, Excel.
    — Изображения (EXIF и OCR).
    — Аудио (метаданные и транскрипция речи).
    — HTML (включая специальную обработку Wikipedia).
    — Text-based форматы: CSV, JSON, XML и другие.


    Плюсом можно прикрутить LLM для описания изображений.

    GitHub:
    https://github.com/microsoft/markitdown?tab=readme-ov-file
     
  2. Корги
    Корги Dec 16, 2024 Играет в Visual Studio Code... 9195 Sep 23, 2022
    Бывает очень даже полезно
     
Top
Loading...