Kreuzberg
18 февраля 2025 г.Open Source
Kreuzberg
Kreuzberg — это современная библиотека на Python, предназначенная для извлечения текста из различных форматов документов, включая PDF, изображения и офисные файлы, с простым асинхронным интерфейсом.
Она не требует подключения к внешним API и способна работать без GPU, что позволяет экономить ресурсы.
Библиотека поддерживает современные технологии Python, такие как async/await, и предоставляет открытые лицензии для использования и модификации.
Kreuzberg отлично подходит для приложений Retrieval Augmented Generation и совместима с Docker и сервер-less функциями.
https://github.com/Goldziher/kreuzberg
================