李一笑: 支持400+集成与AI代理开发,提供灵活代码扩展及自托管选项,兼顾企业级权限管理,开发者可快速构建复杂工作流
https://github.com/microsoft/markitdown
Survivor: 提供命令行和API,测试过,有时候pdf会丢失部分内容,但支持多种文档:PDF,PowerPoint,Word,Excel,Images (EXIF metadata and OCR),Audio (EXIF metadata and speech transcription),HTML,Text-based formats (CSV, JSON, XML),ZIP files (iterates over contents),Youtube URLs,EPubs
https://github.com/truefoundry/cognita
dan: 支持一键部署生产环境,提供模块化组件与可视化界面,兼容主流模型与向量数据库,内置增量索引和模型网关,有效解决RAG系统从实验到落地的工程化难题。
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!