欢迎来到尧图网

客户服务 关于我们

您的位置:首页 > 健康 > 养生 > 解决RAGFlow(v0.19.0)有部分PDF无法解析成功的问题。

解决RAGFlow(v0.19.0)有部分PDF无法解析成功的问题。

2025/6/6 15:15:07 来源:https://blog.csdn.net/QRcode_Y/article/details/148341646  浏览:    关键词:解决RAGFlow(v0.19.0)有部分PDF无法解析成功的问题。

ragflow版本为:v0.19.0


1.解析的时候报错:Internal server error while chunking: Coordinate lower is less than upper。
看报错怀疑是分片的问题,于是把文档的切片方法中的“建议文本块大小”数值(默认512)调小,比如300,发现有些原来不能解析的PDF文档能成功解析了。


2.但是还是有些PDF解析的时候报错如下图:


看报错怀疑是内存不足,实际查看了下CPU的使用情况,发现解析文档的时候CPU已经使用到了99%。但是我使用的启动容器命令是:docker compose -p ragflow -f docker-compose-gpu.yml up -d 。按理说应该使用GPU的,无解。于是想着怎么精简内存,考虑到我们的嵌入模型是自己部署的,于是决定不在使用v0.19.0版本, 遂将docker/.env 文件内的 RAGFLOW_IMAGE 变量改成使用v0.19.0-slim,这样可以减少使用的内存。

重启,发现能成功解析文档。

如果您有其他更好的解决方法,欢迎一起留言讨论。

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com

热搜词