欢迎来到尧图网

客户服务 关于我们

您的位置:首页 > 文旅 > 艺术 > 学习笔记--大模型外接数据库

学习笔记--大模型外接数据库

2025/8/9 12:12:30 来源:https://blog.csdn.net/weixin_45541986/article/details/145928888  浏览:    关键词:学习笔记--大模型外接数据库

「内容仅供参考学习」

公众号:扫码关注


准备

::: block-1

  1. 数据集: 《公平竞争审查条例》
  2. 模型: Qwen2.5-7B-Instruct-1M
  3. 方式: 外挂文档、rog数据检索
  4. 介绍: 不借助微调,使用知识库实现回答内容

:::

开始

  1. 准备知识库文档

  1. 加载知识库
这边借助了langchain架构,内置了很多好用的方法
from langchain_community.vectorstores import FAISS
from langchain_huggingface import HuggingFaceEmbeddingsdocuments = []
for data in knowledge_content.split("\n")doc = Document(page_content=data, metadata={"source": "doc1"})documents.append(doc)
embeddings = HuggingFaceEmbeddings(model)     # 加载适合的NLP文本相似度识别模型
vectorStoresDB = FAISS.from_documents(documents, embeddings)
results = vectorStoresDB.similarity_search(query, k=2)      # 通过比较输入文本与知识哭文本的相似度来排行,最相似的在最上面。k=2表示只取前2个文档
  1. 将准备好的知识库放入提示词Prompt中
prompt = "根据以下文档回答问题:\n{knowledge_data}\n\n问题:{question}"
  1. 然后就是启动程序(省略。。。。。。)

最终效果

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com

热搜词