AI 必读清单

精选 Anthropic（Claude 背后的公司）的文章、开发者指南和研究论文。每一位 AI 开发者都应该了解的核心内容。

✎ CEO 随笔

慈爱的机器：AI 如何让世界变得更好

Machines of Loving Grace: How AI Could Transform the World for the Better

一篇 15,000 字的乐观展望，探讨 AI 如何变革生物学、医学、经济发展和全球和平——Dario 对"一切顺利"时未来的设想。

Dario Amodei · 2024-10-11

技术的青春期：直面并克服强大 AI 的风险

The Adolescence of Technology: Confronting and Overcoming the Risks of Powerful AI

《慈爱的机器》续篇，20,000 字长文——分析 AI 对国家安全、经济和民主的威胁，并提出应对"作战计划"。

Dario Amodei · 2026-01-26

可解释性的紧迫性

The Urgency of Interpretability

阐述 AI 可解释性研究的重要性——什么是可解释性、为什么对安全至关重要，呼吁在 2027 年前打开 AI 的"黑箱"。

Dario Amodei · 2025-04-24

关于 DeepSeek 与出口管制

On DeepSeek and Export Controls

回应 DeepSeek R1 的发布——论证出口管制正在按预期发挥作用，推动效率提升而非实现对等。

Dario Amodei · 2025-01-29

💻 开发者指南

构建高效的 AI Agent

Building Effective Agents

最具影响力的 Agent 架构指南。核心洞察："最成功的实现使用简单、可组合的模式，而非复杂的框架。"

Anthropic · 2024-12-19

介绍 Model Context Protocol

Introducing the Model Context Protocol

开源 MCP——连接 AI 与工具和数据的通用标准。提供 Python、TypeScript SDK，以及 GitHub、Slack 等预构建服务器。

Anthropic · 2024-11-25 · 有相关工具

上下文检索

Contextual Retrieval

通过在嵌入前添加块特定上下文来大幅改善 RAG。将检索失败率降低 49%（配合重排序可降低 67%）。

Anthropic · 2024-09-01

Claude 的 Prompt 缓存

Prompt Caching with Claude

在 API 调用间缓存常用上下文，缓存读取仅需 0.1 倍输入价格。配合批处理可降低高达 95% 的成本。

Anthropic · 2024-08-14 · 有相关工具

Claude Code：Agentic 编码最佳实践

Claude Code: Best Practices for Agentic Coding

Claude Code CLI 官方使用指南。涵盖代码库理解、多文件编辑和多 Agent 主/从模式。

Anthropic · 2025-06-01 · 有相关工具

高级工具使用介绍

Introducing Advanced Tool Use

三项新功能：工具搜索（从数千工具中发现）、程序化工具调用（代码执行环境）、工具使用示例（准确率从 72% 提升至 90%）。

Anthropic · 2025-06-01 · 有相关工具

Claude 的扩展思考

Claude's Extended Thinking

可见的逐步思维链推理。开发者可设置"思考预算"来控制深度与速度的权衡。

Anthropic · 2025-02-24

🛡 安全与对齐

Constitutional AI：通过 AI 反馈实现无害性

Constitutional AI: Harmlessness from AI Feedback

开创性论文，提出 Constitutional AI——训练 AI 遵循明确原则而非仅依赖人类反馈。Claude 的训练基础。

Anthropic · 2023-01-01

Claude 的新宪法

Claude's New Constitution

以 CC0 许可发布 Claude 完整宪法。描述 Claude 的价值观、优先级和行为准则——强调理解原理而非罗列规则。

Anthropic · 2026-01-21

🔬 研究亮点

绘制大语言模型的心智地图

Mapping the Mind of a Large Language Model

在 Claude 3 Sonnet 内部发现数百万个可解释的"特征"。通过放大单个特征创造了"金门大桥 Claude"。首次详细窥探生产级 LLM 内部。

Anthropic · 2024-05-01

大语言模型的对齐伪装

Alignment Faking in Large Language Models

Claude 3 Opus 能策略性地"伪装"对齐——遵从训练要求的同时私下保持自身偏好。首个此类行为的实证证据。

Anthropic · 2024-12-01

Sleeper Agents：训练能通过安全训练存活的欺骗性 LLM

Sleeper Agents: Training Deceptive LLMs That Persist Through Safety Training

概念验证：LLM 可以在安全微调后保持后门行为——例如为"2023"写安全代码，为"2024"写有漏洞的代码。

Anthropic · 2024-01-01

Anthropic 经济指数

Introducing the Anthropic Economic Index

分析 200 万次 AI 对话：49% 的岗位可在 25%+ 任务中使用 AI。趋势从自动化 (45%) 转向增强 (52%)。

Anthropic · 2026-01-15

相关工具

MCP 生成器

可视化构建 MCP 服务器配置

System Prompt 生成器

分步构建高效 System Prompt

定价计算器

对比所有模型费用

常见问题

Anthropic 最重要的文章有哪些？

推荐从 Dario Amodei 的《Machines of Loving Grace》开始，了解 AI 的乐观前景；然后阅读《Building Effective Agents》学习实用的 Agent 架构模式；《Introducing the Model Context Protocol》是理解 MCP 的必读。

Dario Amodei 是谁？

Dario Amodei 是 Anthropic 的 CEO 和联合创始人，Anthropic 是 Claude 背后的公司。他此前在 OpenAI 领导研究工作。他关于 AI 潜力与风险的长篇文章在 AI 社区广泛传阅。

这个清单会更新吗？

会的，我们会随 Anthropic 发布新文章而更新。当前清单覆盖 2023 年至 2026 年 2 月的内容，包括 Dario Amodei 最新的长文和最新研究论文。