[{"content":"2025年12月9日，Anthropic做了一个决定。\n他们把MCP——自己亲手打造的Agent协议——捐给了Linux基金会。同一天，OpenAI和Block也拿出了自己的东西：AGENTS.md和goose。三家凑在一起，成立了Agentic AI Foundation（AAIF）。\n六个月后，A2A——Google的Agent通信协议——也进了AAIF。IBM的ACP紧随其后。\n三个协议，三家巨头，一个基金会。\n看起来像和平，实际上是另一种战争的开始。\n先搞清楚一件事：这三个协议解决的不是同一个问题 很多人一看到\u0026quot;MCP vs A2A vs ACP\u0026quot;的标题，第一反应是：谁赢谁输？\n这个问题本身就错了。\n它们根本不在同一个维度上打架。\nMCP解决的是Agent怎么连接工具。你的Agent要读数据库、调API、查文件系统——这些\u0026quot;手\u0026quot;怎么接上去？MCP定义了接口。\nA2A解决的是Agent怎么跟Agent说话。一个做研究的Agent把结果交给一个做PPT的Agent，中间怎么传？任务状态怎么同步？A2A定义了流程。\nACP解决的也是Agent之间的通信，但走的是另一条路——IBM式的、企业级的、RESTful的路。\n打个比方：MCP是USB-C，让设备能插上配件。A2A是蓝牙，让设备之间能对话。ACP是另一种蓝牙协议，来自另一个阵营。\n它们不是竞品。它们是协议栈的不同层。\nMCP：从Anthropic的孩子，到行业的\u0026quot;普通话\u0026quot; 2024年11月，Anthropic发布MCP的时候，没几个人当回事。\n一个做Claude的公司搞了个协议，让AI能调工具？听着像功能更新，不像行业变革。\n但数据说话。\n到2026年5月，MCP生态里有14,000多个公开服务器，核心仓库86,000+ GitHub Stars，SDK累计下载9,700万次。微软、GitHub、Stripe、Atlassian、Figma、Cloudflare——全部接入了MCP。\n更关键的是谁加入了MCP的治理。\nAAIF的白金成员名单：AWS、Bloomberg、Cloudflare、Google、Microsoft。\n没错，Google和Microsoft。一边有自己的协议，一边加入了对手的协议治理。\n这叫什么？这叫\u0026quot;打不过就加入\u0026quot;的高级版——\u0026ldquo;加入它，然后影响它\u0026rdquo;。\nMCP为什么能赢？不是因为它技术最先进，而是因为它最早、最简单、最开放。2024年11月发布，2025年4月Google DeepMind接入，2025年12月捐给Linux基金会。节奏卡得刚刚好。\n当你的协议成了事实标准，捐出去比攥在手里更有价值。Anthropic懂这个道理。\nA2A：Google的后发制人 Google在Agent协议上慢了半拍。\nMCP 2024年11月发布的时候，Google没有对标产品。直到2025年4月Cloud Next大会，A2A才正式亮相。\n但Google做对了一件事：直接瞄准MCP没解决的问题。\nMCP让Agent能调工具，但如果一个复杂任务需要多个Agent协作呢？一个Agent负责搜索，一个负责分析，一个负责写报告——它们之间怎么通信？任务状态怎么传递？中间失败了怎么回滚？\nA2A的核心抽象是Task。不是一个简单的消息，而是一个包含状态、上下文、结果、元数据的完整对象。v1.0规范在2026年3月发布，强调无状态、分层架构、标准协议绑定——这些都是Web架构的老原则，但用在Agent通信上是第一次。\n到2026年4月，A2A宣布150+组织支持，深度集成进Google Cloud和Microsoft平台。\nGoogle的策略很清晰：MCP你拿走了\u0026quot;Agent到工具\u0026quot;这一层，那\u0026quot;Agent到Agent\u0026quot;这一层归我。\n不是竞争，是分工。\nACP：IBM的第三条路 如果说MCP和A2A是主角，ACP就是那个安静但不可忽视的第三极。\nIBM Research在2025年推出了ACP（Agent Communication Protocol），建在BeeAI框架之上。和A2A一样解决Agent间通信，但设计哲学不同。\nACP是纯RESTful API。支持长时间运行的任务。框架无关——BeeAI、LangChain、CrewAI、甚至你自己写的Agent，都能接入。\nIBM的赌注是：企业不会用一个创业公司的协议。\nMCP背后是Anthropic，A2A背后是Google。ACP背后是IBM——一个卖了四十年企业软件的公司。当银行、保险公司、政府机构要选Agent通信协议的时候，\u0026ldquo;IBM\u0026quot;这两个字本身就是一种信任。\nACP目前生态还小，主要在IBM/BeeAI圈子里。但如果企业市场真的爆发，ACP可能是那个\u0026quot;安全选项\u0026rdquo;。\n真正的战争不在协议之间，在协议之内 三个协议各自占了一层。看起来和平。\n但真正的战争发生在每一层内部。\nMCP生态里，谁做的Server最多？谁的工具链最完善？谁的SDK下载量最高？这些才是决定\u0026quot;事实标准\u0026quot;细节的关键。\nA2A生态里，v1.0刚发布，v1.2已经在路上。谁贡献的扩展最多？谁的集成最深入？谁在企业场景里跑得最远？\nACP生态里，BeeAI能不能吸引到IBM之外的开发者？能不能证明\u0026quot;企业级\u0026quot;不等于\u0026quot;封闭\u0026quot;？\n协议层的竞争是\u0026quot;谁成为默认选项\u0026quot;。协议内的竞争是\u0026quot;谁定义默认选项的具体形态\u0026quot;。\n后者才是真金白银。\n为什么是Linux基金会？ 2025年12月AAIF成立的时候，很多人问：为什么是Linux基金会？\n答案很简单：中立。\nLinux基金会管过Linux内核、Kubernetes、Node.js、Hyperledger。它知道怎么让竞争对手在同一个屋檐下合作。\n如果AAIF设在Anthropic名下，Google和Microsoft不会来。设在Google名下，Anthropic和OpenAI不会来。只有Linux基金会，能让这五家公司坐在同一张桌子前。\n更重要的是先例。\nHTTP没有属于某家公司。TCP/IP没有属于某家公司。Web属于所有人，所以它能成为基础设施。\nAgent协议如果真想成为\u0026quot;AI时代的HTTP\u0026quot;，它必须属于所有人。\nLinux基金会提供了这个\u0026quot;所有人\u0026quot;的容器。\n对开发者意味着什么？ 如果你是一个正在构建Agent系统的开发者，这三个协议的关系其实很简单：\n用MCP连接工具。用A2A或ACP连接其他Agent。\n不需要选边站。它们解决的是不同层的问题。\n但有一个建议：现在就开始学MCP。\n不是因为它\u0026quot;最好\u0026quot;，而是因为它已经是事实标准。14,000个Server、9,700万次下载、所有主流AI厂商支持——这个生态的引力已经大到无法忽视。\nA2A和ACP还在早期。可以关注，可以实验，但不用急着押注。\n等A2A的v2.0出来，等ACP的企业案例再多几个，再做决定也不迟。\n写在最后 Agent协议的格局，在2026年上半年基本定型了。\nMCP拿下了\u0026quot;Agent到工具\u0026quot;这一层。A2A和ACP在\u0026quot;Agent到Agent\u0026quot;这一层竞争。Linux基金会提供了中立的治理框架。\n这不是终局。协议会演进，扩展会增加，新的玩家会入场。\n但至少现在，AI Agent有了自己的\u0026quot;普通话\u0026quot;。\n不是某一家公司的方言，而是整个行业 agreed-upon 的通信方式。\n这件事的意义，可能要五年后才能完全看清。\n就像2000年的人看HTTP——知道它重要，但想象不到它会催生什么。\n如果你也在关注 AI 行业的格局变化，欢迎订阅本博客，持续追踪 AI 领域的深度分析。\n","permalink":"https://blog.mlrun.ai/posts/mcp-a2a-acp-agent-protocol/","summary":"MCP 管工具连接，A2A 管 Agent 协作，ACP 走企业路线。三个协议各占一层，真正的战争在协议内部。","title":"MCP、A2A、ACP：谁在定义 AI Agent 的'普通话'？"},{"content":"什么是 RAG？ RAG（Retrieval-Augmented Generation）通过将外部知识检索与大语言模型生成相结合，解决 LLM 的知识时效性和幻觉问题。\n系统架构 1 用户提问 → Query Embedding → 向量检索 → 上下文组装 → LLM 生成 → 回答 关键组件选型 向量数据库 数据库 特点 适用场景 Milvus 高性能、分布式 大规模生产环境 Chroma 轻量、易上手 原型开发 Pinecone 全托管 不想运维 文档切分策略 1 2 3 4 5 6 7 8 from langchain.text_splitter import RecursiveCharacterTextSplitter splitter = RecursiveCharacterTextSplitter( chunk_size=500, chunk_overlap=50, separators=[\u0026#34;\\n\\n\u0026#34;, \u0026#34;\\n\u0026#34;, \u0026#34;。\u0026#34;, \u0026#34;，\u0026#34;, \u0026#34; \u0026#34;] ) chunks = splitter.split_documents(documents) 检索优化技巧 混合检索：向量检索 + BM25 关键词检索 Query 改写：用 LLM 扩展用户原始问题 Re-ranking：用 Cross-Encoder 对召回结果重排序 总结 RAG 是当前企业落地 LLM 最实用的模式，关键在于检索质量的优化。\n","permalink":"https://blog.mlrun.ai/posts/rag-practice/","summary":"\u003ch2 id=\"什么是-rag\"\u003e什么是 RAG？\u003c/h2\u003e\n\u003cp\u003eRAG（Retrieval-Augmented Generation）通过将外部知识检索与大语言模型生成相结合，解决 LLM 的知识时效性和幻觉问题。\u003c/p\u003e","title":"RAG 实战：构建企业级知识库问答系统"},{"content":"部署挑战 将 AI 模型从 Jupyter Notebook 搬到生产环境，需要解决：\n推理延迟与吞吐 资源利用率 模型版本管理 监控与告警 推理框架选型 1 2 3 4 5 # vLLM：高吞吐 LLM 推理 pip install vllm python -m vllm.entrypoints.openai.api_server \\ --model meta-llama/Llama-3-8B \\ --tensor-parallel-size 2 容器化部署 1 2 3 4 FROM nvidia/cuda:12.1-runtime-ubuntu22.04 RUN pip install vllm COPY model/ /app/model/ CMD [\u0026#34;python\u0026#34;, \u0026#34;-m\u0026#34;, \u0026#34;vllm.entrypoints.openai.api_server\u0026#34;, \u0026#34;--model\u0026#34;, \u0026#34;/app/model\u0026#34;] 性能优化 KV Cache 量化：显存降低 50% Continuous Batching：吞吐提升 3-5x Speculative Decoding：延迟降低 2x 监控指标 关注 TTFT（Time to First Token）、TPS（Tokens per Second）、P99 延迟。\n","permalink":"https://blog.mlrun.ai/posts/model-deploy/","summary":"\u003ch2 id=\"部署挑战\"\u003e部署挑战\u003c/h2\u003e\n\u003cp\u003e将 AI 模型从 Jupyter Notebook 搬到生产环境，需要解决：\u003c/p\u003e\n\u003cul\u003e\n\u003cli\u003e推理延迟与吞吐\u003c/li\u003e\n\u003cli\u003e资源利用率\u003c/li\u003e\n\u003cli\u003e模型版本管理\u003c/li\u003e\n\u003cli\u003e监控与告警\u003c/li\u003e\n\u003c/ul\u003e\n\u003ch2 id=\"推理框架选型\"\u003e推理框架选型\u003c/h2\u003e\n\u003cdiv class=\"highlight\"\u003e\u003cdiv class=\"chroma\"\u003e\n\u003ctable class=\"lntable\"\u003e\u003ctr\u003e\u003ctd class=\"lntd\"\u003e\n\u003cpre tabindex=\"0\" class=\"chroma\"\u003e\u003ccode\u003e\u003cspan class=\"lnt\"\u003e1\n\u003c/span\u003e\u003cspan class=\"lnt\"\u003e2\n\u003c/span\u003e\u003cspan class=\"lnt\"\u003e3\n\u003c/span\u003e\u003cspan class=\"lnt\"\u003e4\n\u003c/span\u003e\u003cspan class=\"lnt\"\u003e5\n\u003c/span\u003e\u003c/code\u003e\u003c/pre\u003e\u003c/td\u003e\n\u003ctd class=\"lntd\"\u003e\n\u003cpre tabindex=\"0\" class=\"chroma\"\u003e\u003ccode class=\"language-bash\" data-lang=\"bash\"\u003e\u003cspan class=\"line\"\u003e\u003cspan class=\"cl\"\u003e\u003cspan class=\"c1\"\u003e# vLLM：高吞吐 LLM 推理\u003c/span\u003e\n\u003c/span\u003e\u003c/span\u003e\u003cspan class=\"line\"\u003e\u003cspan class=\"cl\"\u003epip install vllm\n\u003c/span\u003e\u003c/span\u003e\u003cspan class=\"line\"\u003e\u003cspan class=\"cl\"\u003epython -m vllm.entrypoints.openai.api_server \u003cspan class=\"se\"\u003e\\\n\u003c/span\u003e\u003c/span\u003e\u003c/span\u003e\u003cspan class=\"line\"\u003e\u003cspan class=\"cl\"\u003e\u003cspan class=\"se\"\u003e\u003c/span\u003e    --model meta-llama/Llama-3-8B \u003cspan class=\"se\"\u003e\\\n\u003c/span\u003e\u003c/span\u003e\u003c/span\u003e\u003cspan class=\"line\"\u003e\u003cspan class=\"cl\"\u003e\u003cspan class=\"se\"\u003e\u003c/span\u003e    --tensor-parallel-size \u003cspan class=\"m\"\u003e2\u003c/span\u003e\n\u003c/span\u003e\u003c/span\u003e\u003c/code\u003e\u003c/pre\u003e\u003c/td\u003e\u003c/tr\u003e\u003c/table\u003e\n\u003c/div\u003e\n\u003c/div\u003e\u003ch2 id=\"容器化部署\"\u003e容器化部署\u003c/h2\u003e\n\u003cdiv class=\"highlight\"\u003e\u003cdiv class=\"chroma\"\u003e\n\u003ctable class=\"lntable\"\u003e\u003ctr\u003e\u003ctd class=\"lntd\"\u003e\n\u003cpre tabindex=\"0\" class=\"chroma\"\u003e\u003ccode\u003e\u003cspan class=\"lnt\"\u003e1\n\u003c/span\u003e\u003cspan class=\"lnt\"\u003e2\n\u003c/span\u003e\u003cspan class=\"lnt\"\u003e3\n\u003c/span\u003e\u003cspan class=\"lnt\"\u003e4\n\u003c/span\u003e\u003c/code\u003e\u003c/pre\u003e\u003c/td\u003e\n\u003ctd class=\"lntd\"\u003e\n\u003cpre tabindex=\"0\" class=\"chroma\"\u003e\u003ccode class=\"language-dockerfile\" data-lang=\"dockerfile\"\u003e\u003cspan class=\"line\"\u003e\u003cspan class=\"cl\"\u003e\u003cspan class=\"k\"\u003eFROM\u003c/span\u003e\u003cspan class=\"s\"\u003e nvidia/cuda:12.1-runtime-ubuntu22.04\u003c/span\u003e\u003cspan class=\"err\"\u003e\n\u003c/span\u003e\u003c/span\u003e\u003c/span\u003e\u003cspan class=\"line\"\u003e\u003cspan class=\"cl\"\u003e\u003cspan class=\"err\"\u003e\u003c/span\u003e\u003cspan class=\"k\"\u003eRUN\u003c/span\u003e pip install vllm\u003cspan class=\"err\"\u003e\n\u003c/span\u003e\u003c/span\u003e\u003c/span\u003e\u003cspan class=\"line\"\u003e\u003cspan class=\"cl\"\u003e\u003cspan class=\"err\"\u003e\u003c/span\u003e\u003cspan class=\"k\"\u003eCOPY\u003c/span\u003e model/ /app/model/\u003cspan class=\"err\"\u003e\n\u003c/span\u003e\u003c/span\u003e\u003c/span\u003e\u003cspan class=\"line\"\u003e\u003cspan class=\"cl\"\u003e\u003cspan class=\"err\"\u003e\u003c/span\u003e\u003cspan class=\"k\"\u003eCMD\u003c/span\u003e \u003cspan class=\"p\"\u003e[\u003c/span\u003e\u003cspan class=\"s2\"\u003e\u0026#34;python\u0026#34;\u003c/span\u003e\u003cspan class=\"p\"\u003e,\u003c/span\u003e \u003cspan class=\"s2\"\u003e\u0026#34;-m\u0026#34;\u003c/span\u003e\u003cspan class=\"p\"\u003e,\u003c/span\u003e \u003cspan class=\"s2\"\u003e\u0026#34;vllm.entrypoints.openai.api_server\u0026#34;\u003c/span\u003e\u003cspan class=\"p\"\u003e,\u003c/span\u003e \u003cspan class=\"s2\"\u003e\u0026#34;--model\u0026#34;\u003c/span\u003e\u003cspan class=\"p\"\u003e,\u003c/span\u003e \u003cspan class=\"s2\"\u003e\u0026#34;/app/model\u0026#34;\u003c/span\u003e\u003cspan class=\"p\"\u003e]\u003c/span\u003e\u003cspan class=\"err\"\u003e\n\u003c/span\u003e\u003c/span\u003e\u003c/span\u003e\u003c/code\u003e\u003c/pre\u003e\u003c/td\u003e\u003c/tr\u003e\u003c/table\u003e\n\u003c/div\u003e\n\u003c/div\u003e\u003ch2 id=\"性能优化\"\u003e性能优化\u003c/h2\u003e\n\u003cul\u003e\n\u003cli\u003e\u003cstrong\u003eKV Cache 量化\u003c/strong\u003e：显存降低 50%\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003eContinuous Batching\u003c/strong\u003e：吞吐提升 3-5x\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003eSpeculative Decoding\u003c/strong\u003e：延迟降低 2x\u003c/li\u003e\n\u003c/ul\u003e\n\u003ch2 id=\"监控指标\"\u003e监控指标\u003c/h2\u003e\n\u003cp\u003e关注 TTFT（Time to First Token）、TPS（Tokens per Second）、P99 延迟。\u003c/p\u003e","title":"AI 模型部署：从实验到生产的完整指南"},{"content":"2026年5月28日，一个标志性的时刻悄然降临。\n《纽约时报》、《卫报》、《商业内幕》几乎同时报道：Anthropic以9650亿美元估值，正式超越OpenAI，成为全球最有价值的AI初创公司。\n这个速度令人震惊。仅仅3个月前，2026年2月，Anthropic刚完成300亿美元融资，估值3800亿美元。短短90天，估值翻了2.5倍。\n更关键的是，这不是资本泡沫。2026年4月，Anthropic的年化收入正式超越OpenAI，而它的研发投入只有OpenAI的四分之一。\n这背后发生了什么？\n一、估值对比：一场戏剧性的反超 让我们先看数字：\nAnthropic的2026年：\n2月：完成300亿美元融资，估值3800亿美元 4月：估值突破万亿美元 5月28日：9650亿美元（最新一轮） OpenAI的2026年：\n2月27日：以7300亿美元估值前估值，融资1100亿美元 3月31日：完成融资，估值8520亿美元 4月15日：估值面临投资者质疑 从2月到5月，Anthropic的估值增长曲线几乎是垂直的，而OpenAI则陷入了增长焦虑。\n二、收入反超：不是估值泡沫，是真实业绩 如果说估值还有情绪成分，那收入就是硬指标。\n2026年4月，一篇标题直白的文章在科技圈流传：\u0026ldquo;Anthropic刚刚在收入上超越了OpenAI，而它的支出只有OpenAI的四分之一。\u0026rdquo;\n这不是偶然。\nClaude的编程能力已经成为开发者社区的事实标准。GitHub Copilot在2026年5月宣布全面接入Claude Opus 4.8，这是继4.7（4月）、4.6（2月）、4.5（2025年11月）之后的又一次迭代。每次版本更新，开发者社区的反应都是同一句话：\n\u0026ldquo;Claude理解代码库的能力，是其他模型无法比拟的。\u0026rdquo;\n这种口碑转化为真实的付费意愿。企业客户愿意为Claude支付溢价，因为它能真正提高生产力。\n三、效率优势：为什么Anthropic花钱更少却做得更好？ 这是最值得深思的问题。\nOpenAI的2026年融资规模是Anthropic的3.7倍（1100亿 vs 300亿），但Anthropic的收入却反超了。\n答案在于技术路线的选择。\nAnthropic从一开始就押注Constitutional AI（宪法式AI）——用规则约束模型行为，而不是靠海量人工标注。这种方法：\n训练成本低：不需要数百万人工标注员 迭代速度快：改规则比重新标注快得多 可解释性强：模型行为可追溯，企业客户更信任 相比之下，OpenAI的RLHF（基于人类反馈的强化学习）虽然效果好，但成本高、迭代慢。\n效率差异在2026年被放大到极致。 当算力成本成为AI公司的核心瓶颈时，谁的算法更高效，谁就能用更少的钱做更多的事。\n四、OpenAI的困境：增长焦虑与信任危机 OpenAI不是没有努力。\n2026年2月，它完成了1100亿美元融资，估值7300亿美元。但问题很快浮现：\n1. 收入未达预期\n2026年4月28日，一篇分析文章标题刺眼：\u0026ldquo;OpenAI misses revenue, is the AI bubble bursting?\u0026quot;（OpenAI收入未达预期，AI泡沫要破了吗？）\n投资者开始质疑：8520亿美元的估值，需要多少收入才能支撑？\n2. 产品同质化\nGPT-4o、o1、o3……OpenAI的模型迭代很快，但在开发者社区的口碑却在下滑。GitHub Copilot从2025年底开始全面转向Claude，这是一个危险信号。\n3. 治理争议持续\n从2023年的董事会危机到2026年的估值质疑，OpenAI的治理问题始终没有真正解决。投资者信心在动摇。\n五、Anthropic的护城河：不只是技术 Anthropic的胜利，本质上是价值观的胜利。\n在AI竞赛最激烈的2024-2026年，当所有人都在喊\u0026quot;更快、更大、更强\u0026quot;时，Anthropic坚持了一条不同的路：\n安全优先，效率为王。\n这条路的代价是短期增长慢。2024年，Anthropic的收入只有OpenAI的三分之一。但到了2026年，当AI从\u0026quot;新奇玩具\u0026quot;变成\u0026quot;生产力工具\u0026quot;时，市场终于意识到：\n企业客户要的不是\u0026quot;最聪明的模型\u0026rdquo;，而是\u0026quot;最可靠、最高效的模型\u0026quot; 开发者要的不是\u0026quot;参数最多的模型\u0026quot;，而是\u0026quot;真正能帮我写代码的模型\u0026quot; 投资者要的不是\u0026quot;增长最快的公司\u0026quot;，而是\u0026quot;单位经济效益最好的公司\u0026quot; Anthropic用3年时间证明：慢就是快。\n六、未来展望：AI竞赛进入新阶段 Anthropic的反超，标志着AI竞赛进入新阶段：\n从\u0026quot;规模竞赛\u0026quot;转向\u0026quot;效率竞赛\u0026quot;。\n过去3年，AI公司比拼的是：\n谁的模型参数更多 谁融的钱更多 谁的用户增长更快 接下来3年，比拼的将是：\n谁的算法更高效 谁的单位经济效益更好 谁能让客户真正付费 这对整个行业是好消息。 它意味着AI不再是一场\u0026quot;烧钱游戏\u0026quot;，而是一个可以持续创造价值的产业。\n结语：价值观的长期回报 回到开头的问题：Anthropic凭什么用4倍少的投入超越OpenAI？\n答案很简单：它做对了选择。\n在所有人都在追求\u0026quot;更快\u0026quot;时，它选择了\u0026quot;更好\u0026quot;。在所有人都在烧钱时，它选择了效率。在所有人都在忽视安全时，它把安全变成了核心竞争力。\n市场最终会奖励那些做对选择的公司。\n2026年5月28日，9650亿美元的估值，就是这份奖励。\n参考资料：\n《纽约时报》2026年5月28日报道 《卫报》2026年5月28日报道 《商业内幕》2026年5月28日报道 路透社2026年2月12日报道 CNBC 2026年2月12日报道 如果你也在关注 AI 行业的格局变化，欢迎订阅本博客，持续追踪 AI 领域的深度分析。\n","permalink":"https://blog.mlrun.ai/posts/anthropic-surpasses-openai-2026/","summary":"从 $380B 到 $965B，Anthropic 凭什么用 4 倍少的投入超越 OpenAI？答案在于 Constitutional AI 的技术路线选择和效率优先的战略。","title":"Anthropic 反超 OpenAI：三个月估值翻 2.5 倍的底层逻辑"},{"content":"开场白 一个坐在你旁边，一个在云端接单。\n2025 年上半年，AI 编程赛道彻底炸了。Anthropic 推出 Claude Code，OpenAI 复活 Codex 品牌，两大巨头几乎同时亮剑。\n但它们走的是完全相反的路——一个是本地终端里的\u0026quot;结对编程搭档\u0026quot;，一个是云端沙箱里的\u0026quot;外包工程师\u0026quot;。\n我两个都深度用了一个月。今天聊聊真实体感。\n哲学之争：本地 vs 云端 Claude Code 的哲学是\u0026quot;陪伴\u0026quot;。 它直接运行在你的终端里，能看到你的整个代码仓库、本地数据库、Git 历史，甚至你刚改了一半还没保存的文件。它像一个坐在你旁边的资深同事，随时可以问：\u0026ldquo;这段逻辑什么意思？\u0026rdquo;\nCodex 的哲学是\u0026quot;委托\u0026quot;。 你把任务描述清楚，它 clone 你的仓库到云端沙箱，自己跑测试、写代码、提交 PR。你该干嘛干嘛，回来看结果就行。\n一个需要你在场，一个不需要你在场。 这不是技术差异，这是工作方式的根本分歧。\nBenchmark：数字说话 指标 Claude Code Codex SWE-bench Verified 72.7% 69.1% Terminal-Bench 58% 未公布 LiveCodeBench v6 74.5% 未公布 Aider Polyglot 81% 未公布 真实体感：五个维度 1. 代码理解深度 Claude Code 完胜。 它能看到你的整个仓库上下文。\n2. Debug 能力 Claude Code 能直接读你的错误日志、stack trace，然后一步步定位问题。\n3. 并行效率 Codex 扳回一城。 它可以同时跑多个沙箱任务。\n4. 安全性 Codex 的沙箱隔离是天然优势。Claude Code 直接操作本地文件系统。\n5. 费用 这是 Claude Code 最大的痛点。 大型仓库单次会话可能消耗 $5-20。\n写在最后 AI 编程工具正在从\u0026quot;代码补全\u0026quot;进化到\u0026quot;自主开发\u0026quot;。\n但有一点是确定的：2025 年，不学会和 AI 协作写代码的开发者，会越来越吃力。\n如果你也在关注 AI 工具的最新进展，欢迎订阅本博客，持续追踪 AI 领域的深度分析。\n","permalink":"https://blog.mlrun.ai/posts/claude-code-vs-codex/","summary":"一个坐在你旁边，一个在云端接单。深度评测 Claude Code 和 Codex 在代码理解、Debug、并行效率、安全性和费用五个维度的真实表现。","title":"Claude Code vs Codex 深度评测：一个坐你旁边，一个在云端接单"}]