[Begin]AI Learn Data Day 0-北京尧图网络科技有限公司

AI 对话的原理AI 工作流平台如 DifySkill技能调用MCP模型上下文协议RAG检索增强生成AI 进阶工作流如 LangGraph更多的我就没学了核心模块核心作用 / 原理解释对话原理你必须知道一次 AI 对话底层究竟发生了什么上下文机制与 Token 消耗。工作流平台用于可视化编排工作流限制 AI 的自由发挥让其按预定逻辑产出。Skill赋予大模型调用外部单一工具如代码计算、查天气的能力。MCP提供全局标准化的外部能力接入协议让 AI 深入操作系统或企业级私有系统进行复杂交互。RAG外挂知识库通过向量检索让 AI 基于海量私有数据进行精准回答避免幻觉并降低 Token 成本。LangGraph构建复杂的、支持多智能体协作与循环图状逻辑的底层代码框架。学习这些内容需要扎实的编程基础。就拿 Skill 来说你必须熟悉 Python否则连环境都配不好用 MCP你需要懂网络通信、至少得有一台云服务器还得会点 Linux 运维用 RAG更少不了数据结构、数据库如 PostgreSQL和 Docker 容器化部署的知识。ai全栈的门槛很高当然使用Agent可以完成你的目标。但是这完全没有意义。Agent又不可能替你坐牢出事之后自负后果。以上。希望大家学习ai全栈开发之前先学全栈。对话的原理一次对话的原理其实很简单把文本信息发给模型然后模型返回文本数据。但大模型本身是没有记忆的为了让它“记住”之前的聊天内容唯一的解决办法就是把历史对话记录打包连同新问题一起发过去。这听起来好像有点傻逼但极其有效目前也基本只有这一种主流做法。这样引出一个问题token消耗会很大。我们的目标是又快又好又便宜于是优化是必要的。ai工作流平台为什么我用 Dify因为我目前只会用 Dify笑。这个平台得用**并且前端写的很垃圾。不过是免费的而且很好用于是推荐这个了。你需要有某个模型的api这里推荐dpsk因为便宜好用还快。新手挑战尝试自己做一个“思考型”工作流。获取用户输入。并行调用两次大模型给出两种不同的解决方案。将两种方案汇总给第三个大模型节点让它分析利弊并得出最优解。将最终结果输出给用户。写完这个流程你就会深刻理解最好的工作流就是通过限制和拆解任务让 AI 在每个节点只做最擅长的小事从而达到“又快又好又便宜”的目标。skill让模型调用工具。使用Python因为又简单又方便。Skill 的本质它是一种高内聚、强耦合的轻量级扩展。我们将外部服务的 API 封装好告诉大模型“我这里有个计算器你需要的时候告诉我”。这里给出一段基本的调用代码import json import math from openai import OpenAI # 1. 定义本地 Skill def calculate_gcd(a: int, b: int) - int: 这是我们本地的 Skill用于计算最大公约数 return math.gcd(a, b) # 2. 配置 DeepSeek client OpenAI( api_keysk-5426a5dbb29e4a6a888c5966c1f4208c, # 【请在这里填入你的API KEY】 base_urlhttps://api.deepseek.com # DeepSeek的官方接口 ) # 3. 告诉模型有这个 Skill # 这是标准的 JSON Schema 格式用来向 AI 描述工具长什么样 tools [{ type: function, function: { name: calculate_gcd, description: 计算两个整数的最大公约数 (GCD), parameters: { type: object, properties: { a: {type: integer, description: 第一个整数}, b: {type: integer, description: 第二个整数} }, required: [a, b] } } }] # 4. 开始演示流程 print( 用户提问: 帮我算一下 11451400000 和 191981000000 的最大公约数是多少\n) # 把问题发给 DeepSeek并附带工具列表 response client.chat.completions.create( modeldeepseek-chat, messages[{role: user, content: 帮我算一下 11451400000 和 191981000000 的最大公约数是多少}], toolstools ) # 获取 DeepSeek 的回复 message response.choices[0].message # 判断 AI 是否决定调用工具 (Skill) if message.tool_calls: tool_call message.tool_calls[0] # AI 告诉我们需要调用的函数名和解析出的参数 func_name tool_call.function.name args json.loads(tool_call.function.arguments) print(f AI 决定调用 Skill: {func_name}) print(f AI 自动提取的参数: a{args[a]}, b{args[b]}) # 触发真正的本地函数 if func_name calculate_gcd: result calculate_gcd(args[a], args[b]) print(f✅ 本地 Skill 执行完毕最终 GCD 结果为: {result}) else: print( AI 没有调用 Skill直接回答了, message.content)模型具有逻辑判断能力它能根据用户输入的内容自行决定提取参数并调用你写好的函数。如果不用skill。那你只能让模型给你算一卦了。有了工具库当本地代码计算出准确结果后模型就能把这个精确的数字包装在自然语言里反馈给用户。MCPMCPModel Context Protocol和 Skill 有着本质的系统级差异。Skill就像是为你当前写的代码专门定制的非标准零件直接嵌入在当前环境里。MCP则是行业标准的通用底层协议C/S 架构。它的工作原理是这样的AI 会获取MCP 服务器上的可用技能列表并将它们放进当前对话上下文中。当模型需要时就会自主发起调用。这种方式下诸如递归调用或图状调用等复杂操作会开启新的通信流程虽然会消耗更多的 Token但它能完成极度复杂的系统级任务扩展性和自由度远超简单的 Skill。这里同样展示一段最基本的mcp服务器代码import math from mcp.server.fastmcp import FastMCP # 1. 创建 MCP 服务器实例 mcp FastMCP(GCD_Server) # 2. 使用 mcp.tool() 装饰器将函数注册为大模型可调用的工具 mcp.tool() def calculate_gcd(a: int, b: int) - int: 计算并返回两个整数的最大公约数 (GCD) return math.gcd(a, b) # 3. 启动服务器通过标准输入输出 (stdio) 与 AI 客户端通信 if __name__ __main__: mcp.run()服务器启动之后只需让大模型客户端连接这个服务即可。至于更加具体的我也不会。因为我也是初学者RAGRAG 不是一个东西RAG 的全称是「Retrieval-Augmented Generation」翻译过来就是「检索增强生成」试想一个场景公司里有一份 10GB 大小的内部文档每天有 100 万次的查询需求。你不可能精准记住所需资料的具体位置只能进行“模糊查询”这时候向量数据库就该出手了。它的核心依赖于Embedding嵌入模型。Embedding 模型能将一段文本转化为一串高维向量然后在向量数据库中计算向量间的距离从而找到语义最相似的文本片段。这就实现了真正意义上的“模糊查找”。至于嵌入模型是怎样把文本转换为高维向量您可能需要先学习深度学习如果你已经学过深度学习了那么肯定就不用教就能看懂了。为什么要用这个东西直接把文档喂给聊天大模型让聊天大模型自己去找不就好了吗这样很方便但是代价就是10GB 的文档一天查询 100 万次意味着每天要消耗上千T的 Token您的老板一分钟就倒闭了。通过向量数据库我们可以精准截取最相关的几段文本喂给模型从而极大节约成本。这里讲述如何进行一次基础的检索。准备一个嵌入模型。部署一个向量数据库例如 PostgreSQL 的 pgvector 插件。准备数据集比如 wiki-cn 数据集就不错。切分编写代码将长文档切分成合适大小的文本块。向量化将这些文本块通过嵌入模型转化为向量。入库把向量及对应的原文写入向量数据库。检索与生成当用户输入查询如“什么是民族”先把用户的提问也向量化在数据库中查询距离最接近的文本片段最后交给大模型总结输出给用户。这就是最基本的流程。看似简单但实际落地时有无数个可以优化的地方等待你去发掘。LangGraph目前还没深入学大概知道它类似于 Dify但属于纯代码层面的进阶工作流框架能提供远超可视化界面的定制化能力。至于更多由于没学这里请 AI 帮我补充RAG 的进阶优化方向要真正落地一个工业级的 RAG 系统业界通常会关注以下几大痛点与优化手段RAG 七层架构摄入(Ingestion) → 解析(Parsing) → 切片(Chunking) → 索引(Indexing) → 检索(Retrieval) → 精排(Reranking) → 生成(Generation)。每个环节都可能成为系统瓶颈。切片三剑客掌握语义切片、父子切片Parent-Child Chunking、命题切片这比简单的按字数切分效果好得多。混合检索与改写单一的向量检索容易遗漏关键词使用「向量 BM25(词频检索)」的混合检索配合 Query 改写技术能让召回率提升 50% 以上。精排 (Rerank)这是性价比最高的优化手段。召回粗略结果后用专用模型重新打分排序准确率能轻松提升 10%-20%。评估驱动构建系统必须看重 4 个核心指标并经常进行消融实验Ablation Study来验证每一步优化的实际效果。深度剖析Skill 与 MCP 的架构差异在大语言模型能力扩展的架构体系中技能Skill与模型上下文协议MCP均扮演着核心角色。虽然两者都建立在“函数调用”机制之上旨在打破模型预训练数据的静态壁垒但它们在系统架构和生态通用性上存在根本差异

新闻详情

[Begin]AI Learn Data Day 0

相关资讯

大厂Java面试场景还原：JVM原理、Spring Cloud微服务与AI RAG落地全链路问答

MSP430 ADC模块深度解析：从寄存器配置到低功耗设计实战

Unlock Music：浏览器端音乐解锁完全指南 - 3分钟学会解密各大平台加密音乐

VIM效率跃迁指南：基于coc.nvim构建现代化智能补全环境

Burp Suite实战：从原理到深度利用的XSS漏洞检测指南

什么是开源模型？#

Nmap与Kali Linux实战指南：从网络扫描到自动化渗透测试

计算机毕业设计之基于深度学习的苹果成熟度识别系统的设计与实现

[深度解析]ln命令的-f参数：覆盖与风险，以Python软链接为例

3大核心功能解放双手：炉石佣兵战记智能自动化脚本完全指南

Jable视频下载终极指南：免费开源工具完整教程

终极指南：3分钟学会用Nucleus Co-Op实现免费游戏分屏

管理者的六个层次

AI Coding 六个月真实ROI账本：产品经理的血泪教训，研发的冷静忠告

审计来了，数据权限全开——审计走了，怎么确保权限全部关掉？