Skip to content

AI如何长出手脚

本章内容提要:模型本身的能力边界 / Tool Use:让AI调用外部能力 / API与Schema / MCP:标准化的工具连接 / Skills、Plugins与Hooks / 权限与最小权限原则 / No-code自动化

图解导读:工具让AI能做事,权限决定它能做多少

模型本体擅长生成文字;一旦接上工具、技能和插件,它就能搜索网页、读取文件、操作表格、调用服务。所谓"AI长出手脚",不是模型突然有了魔法,而是它获得了连接外部世界的接口。

AI通过工具、技能和插件获得外部能力
工具扩展能力,协议组织连接,权限划定边界。

因此,最小权限原则会变得非常重要。总结文本可以自动执行,发送邮件可能需要确认,删除文件、支付费用、公开发布通常必须禁止或严格审批。不是不信任AI,而是任何会产生现实后果的动作都需要边界。

权限护栏:可自动执行、需确认、禁止执行
AI越能行动,越要提前画清权限护栏。

模型本身能做什么,不能做什么

一个纯粹的语言模型,能做的事情归结为一件:根据输入的文字,生成输出的文字

模型本体擅长的需要工具才能做的
理解和生成文本读取实时数据
翻译、摘要、问答访问互联网
推理、代码生成操作文件系统
风格转换、创意写作执行代码
结构化输出生成发送消息、调用外部服务

模型只能处理信息,不能改变现实。这不是缺陷,而是架构设计。改变现实的能力来自工具,而工具的使用必须受到控制。

理解这个边界非常重要:当你在ChatGPT里问"今天武汉天气怎么样",如果它给了你一个回答,这个回答要么来自工具调用(搜索),要么来自编造(幻觉)。纯模型本身不可能"知道"今天的天气。

Tool Use:让AI调用外部能力

Tool Use的核心:让模型在生成文字之外,还可以请求调用一个外部工具。

Tool Use的执行过程

  1. 你问AI:"今天武汉天气怎么样?"
  2. 模型判断需要工具,生成结构化请求:{"tool": "get_weather", "city": "武汉"}
  3. 运行时层调用真正的天气API
  4. 结果返回模型
  5. 模型用自然语言回答你

模型负责决策,工具负责执行,两者分工明确。 就像一个管理者和一个技术员工的关系 -- 管理者决定"我们需要这个数据",技术员工负责"去把数据拿回来"。

同一个模型在不同产品中能做的事差别很大,原因不是模型不同,而是配备的工具不同。就像同一个司机,开轿车和开卡车能做的事情完全不同。中国信通院关于智能体的文章把"使用工具"列为大模型智能体的重要能力之一,认为它能帮助大模型克服"有脑无手"的短板[1]

MCP:AI工具世界的"USB-C"

MCP(Model Context Protocol)是Anthropic在2024年底发布的一个开放标准,让AI应用和外部工具用统一的方式沟通。Anthropic官方说明称,MCP旨在为AI助手连接数据源、业务工具和开发环境提供通用开放标准[2]

在MCP出现之前,每个AI产品接入每个工具都需要单独的适配器。这就像早期的手机充电线 -- 每个品牌一种接口。MCP就是AI工具世界的"USB-C":一个标准接口适配所有工具。

三个角色:

  • MCP Host -- 你使用的AI应用(如Claude Desktop、Cursor)
  • MCP Client -- 嵌入Host中的通信组件
  • MCP Server -- 包装了具体工具能力的服务

MCP Server提供三种能力:

  1. 工具(Tools) -- AI可以主动调用的功能(动词):搜索、发送、计算
  2. 资源(Resources) -- AI可以读取的数据源(名词):文件、数据库、API返回值
  3. 提示模板(Prompts) -- 使用指导:告诉AI如何最有效地使用这些工具

Tool -> Skill -> Plugin 的层次

层次定义类比
Tool单个功能(一个API调用)单个音符
Skill多个Tool的编排 + 领域知识一首乐曲
PluginTool + Skill + 认证 + UI完整的乐队演出

Skills的价值

你可以把自己的专业经验"教给"AI。新闻传播学生可以写一份审稿Skill:检查五个W是否完整、数据来源是否可靠、标题是否准确。法学生可以写一份合同审查Skill:检查主体资格、关键条款、违约责任和争议解决。模型提供通用智能,Skill提供领域规范 -- 两者结合产生的效果远大于任何一方单独的能力。

Hooks:关键节点的守护者

Hook在AI行为的关键节点设置自动触发的检查。不是AI主动发起的,而是事件驱动的自动控制

  • 安全检查Hook:阻止AI访问敏感目录
  • 代码质量Hook:AI修改代码后自动运行格式化检查
  • 费用监控Hook:Token消耗超预算时暂停执行
  • 内容审核Hook:AI生成的对外内容自动经过敏感词检查

Hook就像高速公路上的护栏。正常行驶时你感受不到它的存在,但当你偏离车道时,它会把你拦住。

权限与最小权限原则

最小权限原则

任何实体在执行任务时,只应该被授予完成该任务所必需的最小权限。AI只需要读你的日历?不要给它修改权限。只需要访问一个仓库?不要授权所有仓库。只需要读取文件?不要给写入权限。

OAuth是标准化的授权协议:你允许AI在特定范围内代表你访问服务,但不需要把密码给它。这就像你给酒店前台一把只能打开你房间的门卡,而不是酒店的万能钥匙。如果你用过微信登录第三方App时弹出的授权确认页面("允许该应用获取你的昵称和头像"),那就是OAuth在日常生活中的体现。

实用准则:

  1. 授权前仔细阅读权限范围
  2. 优先选择只读权限
  3. 定期清理不再使用的授权
  4. 敏感数据使用本地模型

全国网络安全标准化技术委员会在2024年发布的《生成式人工智能服务安全基本要求》中,对语料安全、模型安全、安全措施和安全评估提出了具体要求[3]。把这些要求落实到普通用户身上,就是尽量减少授权范围、保留人工确认节点、定期检查授权状态。

No-code自动化

Zapier、Make、n8n等平台让非工程背景的用户通过可视化界面搭建AI工作流。国内的类似平台包括Coze(字节跳动)、智谱清言的工作流功能等。

实用场景

每天自动检索最新论文 -> AI生成摘要和相关度评估 -> 高相关度论文发送到你的邮箱。整个流程不需要写一行代码。

或者:客户咨询 -> AI自动分类问题类型 -> 匹配知识库中的标准回答 -> 需要人工处理的转发给对应同事。

本章核心回顾
  • 纯粹的语言模型只能"文字进、文字出",工具是跨越边界的桥梁
  • Tool Use:模型决策 + 工具执行的协作机制
  • MCP是AI工具连接的标准化协议
  • Skill把领域知识封装为可复用能力,Plugin是完整能力包
  • 最小权限原则:只授予完成任务所需的最少权限
  • No-code平台让普通学生也能搭建AI工作流

工具权限管理

AI要读我的日历才能帮我安排会议,直接给它所有权限吧 -- 读写邮件、联系人、文件都开放,方便以后用。

?章节自测

'最小权限原则'在AI工具使用中意味着什么?

?章节自测

MCP(Model Context Protocol)的作用类似于什么?

思考练习

设想你的专业领域中一个重复性的工作流程。试着设计一个No-code自动化方案:触发条件是什么?中间需要AI做什么?最终输出是什么?哪些环节需要人工审核?


参考文献


  1. 中国信通院董晓飞等. (2024). 智能体推动大模型应用普惠向实. https://finance.sina.com.cn/roll/2024-11-29/doc-incxsxxw8904248.shtml ↩︎

  2. Anthropic. (2024). Introducing the Model Context Protocol. https://www.anthropic.com/news/model-context-protocol ↩︎

  3. 全国网络安全标准化技术委员会. (2024).《生成式人工智能服务安全基本要求》(TC260-003). https://www.tc260.org.cn/upload/2024-03-01/1709282398070082466.pdf ↩︎

从提问、学习、判断到智能协作