打通模型与现实世界的最后一公里?MCP极速入门指南

简介: 本文重点讲述如何快速实战上手MCP。

一、MCP介绍

去年 11 月,由Claude的母公司 Anthropic 推出了模型上下文协议(MCP),MCP是一种开放协议,可以实现LLM应用与外部数据源和工具的无缝集成。无论您是在构建一个AI驱动的IDE、增强聊天界面,还是创建定制的AI工作流程,MCP都能提供连接LLM与所需的上下文的一种标准化方式。

MCP实现了两大突破:


  • 面向开发者的服务封装:将任意功能封装为标准化工具(Tool)或资源(Resource)
  • 面向模型的自然交互:大模型通过协议自解释文档,实现零样本工具调用


网络上目前有很多介绍MCP原理的文章值得一读,在这里就不一一列举了,小伙伴们可以自行搜索了解,本文重点在快速实战上手MCP。


二、MCP核心解决的问题

传统范式之困:在传统开发模式中,大模型调用外部服务需要经历复杂的技术链路:


自然语言理解 -> 业务逻辑解析 -> API调用 -> 结果处理


每个环节都可能产生信息损耗,比如下面提到的三个典型问题:


  • 语义鸿沟:自然语言指令到具体API参数的映射模糊
  • 能力黑洞:模型对可用服务缺乏实时认知
  • 安全边界:直接开放API调用存在风险敞口


MCP核心解决的问题:


打通模型与工具、与现实世界、与人类所见、所思、所想的最后一公里。


三、MCP与functionCall的关系

一句话总结:

MCP统一了不同大模型和不同服务之间的协议。

一张图理解:

图片源自网络

再引用两张网络流传甚广的图片帮助理解:

  • 传统API实现调用方式:不同服务提供不同SDK,调用方需要对该应用做接入。
  • MCP方式:不同服务就是一个MCP Server,都遵循MCP协议提供服务。

图片源自网络

图片源自网络

四、快速使用MCP服务

1. 安装vscode+cline

我们使用开源免费的vscode和cline来进行mcp的尝试,当然你也可以用cursor等其他方式。本质上我们只是需要一个agent以及一个对应的IDE(用来编辑mcp配置文件)。

2. 配置cline

我们需要配置cline使用的大模型,cline提供的是与你本地IDE和命令行交互的能力,需要用户配置使用的模型。

可以看到有很多现成的API Provider可以选,如果你有deepseek或者通义千问的现成额度和api key可以直接使用。我研究了一番,发现openrouter很好,他有大量主流模型的免费额度可以使用。如果想快速体验的朋友可以直接选openrouter,cline会引导你注册apikey。(需要谷歌或者Github账号登录)

https://openrouter.ai/

下图可以看到,我只筛选免费,搜索deepseek,包括当前最新的V3 0324模型都可以免费使用(但是有限制)。

跟着cline引导配置完OpenRouter API Key。

配置完成后你可以尝试下现在cline的对话是否ok,来确定openrouter是否调通。

3. 使用现有MCP Server

接下来,我们开始尝试使用网上现成的MCP Server,cline内置了一个MCP应用市场,可以直接点击install。

3.1. Puppeteer MCP

我们先用应用市场内有的浏览器操作框架Puppeteer提供的MCP Server来尝试,当然你完全可以在网上自行找MCP Server来安装。


点击install后,实际上cline就是帮你写了一段提示词,来让大模型帮你全自动安装Puppeteer MCP Server,提示词如下:

根据cline的指引,一步步接受模型指令后,我们可以看到一个配置完成的cline_mcp_settings.json文件,里面申明了我们安装的mcp server列表(目前只有一个Puppeteer MCP Server)。

{
  "mcpServers": {
    "github.com/modelcontextprotocol/servers/tree/main/src/puppeteer": {
      "autoApprove": [],
      "disabled": false,
      "timeout": 60,
      "command": "npx",
      "args": [
        "-y",
        "@modelcontextprotocol/server-puppeteer"
      ],
      "transportType": "stdio"
    }
}

接着我们来使用该mcp访问网页,尝试访问下bilibili首页,并让他告诉我首页有哪些视频标题。

运行后,可以看到Puppeteer自主操作了浏览器,打开了B站首页。

模型通过Puppeteer得到了返回的数据。

成功。

3.2. 高德地图MCP

高德很早就支持了MCP协议,我们就来试试它的能力如何。

我们向模型发起提问:

模型依次调用了查询目的地经纬度、驾车、地铁公交、步行三种方案:

  • maps_geo:将详细的结构化地址转换为经纬度坐标。支持对地标性名胜景区、建筑物名称解析为经纬度坐标。
  • maps_direction_driving:驾车路径规划 API 可以根据用户起终点经纬度坐标规划以小客车、轿车通勤出行的方案,并且返回通勤方案的数据。
  • maps_direction_transit_integrated:根据用户起终点经纬度坐标规划综合各类公共(火车、公交、地铁)交通方式的通勤方案,并且返回通勤方案的数据,跨城场景下必须传起点城市与终点城市。
  • maps_direction_walking:根据输入起点终点经纬度坐标规划100km 以内的步行通勤方案,并且返回通勤方案的数据。

得到了最终方案:

详细的思考和调用截图示例

五、快速搭建MCP服务

我们已经能够调用现成的MCP服务(MCP Server),接下来我们的目标是自己搭建一个MCP Server,让cline来调用。

目前MCP官方已经有多个语言的SDK,在其官方文档都能看到。

https://modelcontextprotocol.io/introduction

我们使用他们的python sdk来创建一个demo

https://github.com/modelcontextprotocol/python-sdk

我们直接偷懒,让cline+deepseek来帮我们写。deepseek一路火花带闪电,完成了工作,主要有下面几个步骤:

最终的mcp server(mcp_server.py)如下,实现了打招呼和两数相加的工具(tool)和资源(resource)。

# server.py
from mcp.server.fastmcp import FastMCP

# Create an MCP server
print("Initializing FastMCP...")
mcp = FastMCP("Demo", port=8001)
print("FastMCP instance created")

# Add an addition tool
print("Registering add tool...")
@mcp.tool()
def add(a: int, b: int) -> int:
    """Add two numbers"""
    return a + b
print("Add tool registered")

# Add a dynamic greeting resource
print("Registering greeting resource...")
@mcp.resource("greeting://{name}")
def get_greeting(name: str) -> str:
    """Get a personalized greeting"""
    return f"Hello, {name}!"
print("Greeting resource registered")

# Start the MCP server
if __name__ == "__main__":
    print("Starting MCP server...")
    try:
        mcp.run(transport="stdio")
        print("MCP server is running")
    except Exception as e:
        print(f"Error starting MCP server: {str(e)}")
        exit(1)

资源、工具、提示词的定义,也是MCP的官方概念,在本文不做详细阐述。

图片源自网络

我们在cline上添加第二个配置。

{
  "mcpServers": {
    "github.com/modelcontextprotocol/servers/tree/main/src/puppeteer": {
      "autoApprove": [],
      "disabled": false,
      "timeout": 60,
      "command": "npx",
      "args": [
        "-y",
        "@modelcontextprotocol/server-puppeteer"
      ],
      "transportType": "stdio"
    },
    "demo-python-server": {
      "autoApprove": [],
      "disabled": false,
      "timeout": 3000,
      "command": "/Users/xxxx/.venv/bin/python3",
      "args": [
        "/Users/xxxxx/mcp_server_demo/mcp_server.py"
      ],
      "transportType": "stdio"
    }
  }
}

配置完成后,可以看到clineUI也展示了我的MCP Server。

接着可以让cline尝试调用一下模型,由于配置文件里有我们自己创造的工具的声明,所以cline调用了工具,完成了打招呼的任务。

展望

技术层面:重构服务提供范式

MCP正在构建AI时代的"数字乐高标准件"技术体系。当协议层实现真正的标准化,将引发三个技术革命:


  • 服务发现机制的进化:未来的MCP工具市场可能会出现全局自动服务发现中心,模型可通过自然语言描述自动发现适配工具链,实现"所想即所得"的服务组合。
  • 性能优化新范式:协议层统一后,工具链性能指标可量化对比,催生出专门针对大模型工具调用的编译优化技术,如工具缓存预加载、调用路径动态优化等。
  • 多模态工具引擎:当前文本交互为主的协议或将扩展为支持视觉-动作-物理世界的多模态交互协议,使AI能操作CAD设计软件、工业机器人等复杂系统。


产品层面:重塑人机协作界面

当工具调用成本趋近于零时,将引爆产品创新奇点:


  • 智能体市场崛起:类似App Store的MCP智能体商店将出现,用户可自由组合不同服务提供商的能力模块。某旅游智能体可能聚合航司API、酒店MCP服务、签证工具链,自动完成复杂行程规划。
  • 无代码智能体工厂:企业可通过可视化拖拽,将内部系统快速封装为MCP服务,如把ERP系统暴露为"库存查询@erp://warehouse"等自然语义接口
  • 个性化服务涌现:每个人的数字分身都能持有专属工具集。教师助理智能体自动组合教案生成器+知识点验证服务,程序员助手动态调用代码分析、云部署等工具链


人文层面:重构知识工作边界


当工具调用成为基础能力,将引发更深层的变革:

  • 技术平权新阶段:语言成为终极编程接口,任何能用自然语言清晰描述需求的人都能创建复杂工具链,知识工作者与开发者的界限逐渐消融
  • 人机协作伦理进化:需要建立新的责任追溯机制,当AI通过MCP调用真实世界服务时,需明确工具开发者、模型提供者、终端用户之间的责任矩阵。

MCP协议正悄然构建着AI时代的"数字巴别塔"。当不同语言、不同平台的服务都能通过统一协议无缝协作时,我们或将见证人类文明史上最大规模的认知革命——在这个新世界里,调用工具的能力,终将成为人类思维的自然延伸。



来源  |  阿里云开发者公众号

作者  |  如驰

相关文章
|
8天前
|
人工智能 监控 JavaScript
MCP实战之Agent自主决策-让 AI玩转贪吃蛇
MCP服务器通过提供资源、工具、提示模板三大能力,推动AI实现多轮交互与实体操作。当前生态包含Manus、OpenManus等项目,阿里等企业积极合作,Cursor等工具已集成MCP市场。本文以贪吃蛇游戏为例,演示MCP Server实现流程:客户端连接服务端获取能力集,AI调用工具(如start_game、get_state)控制游戏,通过多轮交互实现动态操作,展示MCP在本地实践中的核心机制与挑战。
199 34
MCP实战之Agent自主决策-让 AI玩转贪吃蛇
|
18天前
|
传感器 机器学习/深度学习 人工智能
AI Agent 十问十答,降低认知摩擦
本文探讨了AI Agent的相关概念和技术细节,包括其定义、与传统软件的区别、构成组件、工作原理及优化方法。AI Agent是一种基于大语言模型(LLM)的智能代理,能感知环境、推理决策并执行任务。相比传统自动化软件,AI Agent具备更强的理解力和自主性,可处理复杂任务。文章分析了Chatbot向AI Agent演进的趋势及其驱动因素,并详解了提升AI Agent效果的关键要素如模型质量、工具选择和指令设计。此外,还讨论了Workflow与LLM的结合方式以及单智能体与多智能体系统的优劣,为理解和应用AI Agent提供了全面视角。
809 171
|
22天前
|
人工智能 自然语言处理 运维
Bolt.diy 一键部署,“一句话”实现全栈开发
Bolt.diy 是 Bolt.new 的开源版本,提供更高灵活性与可定制性。通过自然语言交互简化开发流程,支持全栈开发及二次开发,使零基础开发者也能实现从创意到云端部署的完整链路。本方案基于阿里云函数计算 FC 搭建,集成百炼模型服务,快速完成云端部署。用户可通过对话开启首个项目,两步完成部署并获300社区积分。方案优势包括多模型适配、高度定制化、全栈开发支持及智能化辅助工具,助力高效开发与创新。
487 102
|
5天前
|
IDE 搜索推荐 程序员
《CodeBuddy:像哆啦A梦一样智能的编程助手》
本文介绍腾讯云代码助手CodeBuddy——智能编程伙伴,宛如哆啦A梦般的存在。它具备智能辅助、个性化学习、多场景适配等优势,支持主流IDE与多种编程语言,保护代码隐私并开源透明。通过上下文理解、实时错误检测等功能提升开发效率;根据编码风格优化建议,构建知识图谱。下载链接提供,安装后即可在IDE中使用,助你成为更高效的开发者。
77 17
《CodeBuddy:像哆啦A梦一样智能的编程助手》
|
18天前
|
人工智能 前端开发 搜索推荐
利用通义灵码和魔搭 Notebook 环境快速搭建一个 AIGC 应用 | 视频课
当我们熟悉了通义灵码的使用以及 Notebook 的环境后,大家可以共同探索 AIGC 的应用的更多玩法。
460 123
|
29天前
|
机器学习/深度学习 存储 人工智能
三问一图万字拆解DeepSeek-R1:训练之道、实力之源与市场之变
本文是作者基于自己的学习经历重新组织的一篇更易于初心者理解的关于DeepSeek的文章,也可以说是作者阶段性的学习笔记。
221 43
三问一图万字拆解DeepSeek-R1:训练之道、实力之源与市场之变
|
8天前
|
机器学习/深度学习 人工智能 数据库
RAG 2.0 深入解读
本文从RAG 2.0 面临的主要挑战和部分关键技术来展开叙事,还包括了RAG的技术升级和关键技术等。
208 75
|
29天前
|
人工智能 自然语言处理 运维
智能体Agent:用自然语言重构数据开发
本文分享如何基于利用MCP协议,配置MCP Server,以调用大数据开发与治理平台DataWorks Open API搭建智能体Agent,实现通过自然语言完成数据集成与数据开发等任务。文章还介绍了MCP协议的基本知识,帮助大家了解背后实现原理。大家可以通过自行配置体验数据工作流智能自动化运行。
294 47
智能体Agent:用自然语言重构数据开发
|
8天前
|
人工智能 安全 API
不到100行代码,实现一个简易通用智能LLM Agent
本文将分享如何使用不到 100 行的 Python 代码,实现一个具备通用智能潜力的简易 LLM Agent。你将看到整个实现过程——从核心原理、提示(Prompt)调优、工具接口设计到主循环交互,并获得完整复现代码的详细讲解。
414 98
不到100行代码,实现一个简易通用智能LLM Agent
|
22天前
|
安全 API UED
A2A(Agent2Agent) 简介
本文主要介绍Google于2025年4月9日发布的Agent2Agent Protocol(简称“A2A”),这是一个旨在促进不同类型智能体(Agent)之间高效沟通与协作的开放协议。
653 73
A2A(Agent2Agent) 简介
OSZAR »