针对大模型的流式输出,采用Sanic和Flask两种方式实现
以图片检索为例子,介绍qanything的检索逻辑(问答逻辑)
对Qanything2.0的图片解析逻辑进行剖析,包括ocr、doc切分合并、向量化
Qanything文件解析服务两个重要函数讲解
Qanything上传文件的逻辑
Qanything 新建知识库的逻辑
最终目的是以debug的形式将项目启动起来,方便了解项目原理
ocr提取具体的内容要写一大堆逻辑,看看如何用大模型一键解决吧
介绍部分qanything的文档解析逻辑,如excel解析、pdf解析、ocr识别,检索逻辑以及ocr+llm做图片逻辑,大模型做reranker的思路