梁文锋与 DeepSeek 的初心:让智能进入普惠时代
从 DeepSeek-V4 的“百万上下文普惠时代”说起,理解梁文锋为什么坚持原创、开源、长期主义,以及 DeepSeek 为什么把技术创新放在商业化之前。
DeepSeek-V4 预览版官方文章的标题里,有一个很值得停下来看看的词:普惠时代。
不是“王炸”,不是“遥遥领先”,也不是“重新定义”。DeepSeek 选择把 1M 上下文、开源权重、低价 API 和 Agent 能力放在一起,用“普惠”概括它想推动的方向。这和梁文锋在公开访谈里反复表达的东西是一致的:DeepSeek 不是只想做一个更会答题的模型,而是想把基础模型变成更多人可调用、可学习、可再创造的技术底座。
“普惠”不是便宜,而是门槛被重新放低
很多人谈 DeepSeek,会先谈价格。价格当然重要,尤其当 DeepSeek-V4 Flash 把文本与 Agent 子任务的 API 成本压到极低之后,个人开发者、学生、小团队都能更大胆地试错。
但“普惠”不只是便宜。便宜只能降低账单,普惠要降低的是参与前沿技术的门槛。
DeepSeek-V4 官方文章里写到,1M 上下文将成为 DeepSeek 官方服务的标配。这个动作背后有一个产品信号:长上下文不是少数高价企业用户的特权,而应该成为普通 API 用户也能使用的基础能力。它让更多开发者可以把代码库、长文档、复杂任务上下文放进模型里,而不用先被上下文窗口挡在门外。
这也是为什么 DeepSeek 的价值不只在模型排行榜上。它真正改变的是一件更底层的事:以前只有大公司能负担的能力,现在开始向普通开发者扩散。
梁文锋真正反复强调的是“原创”
梁文锋最常被引用的一句话,是中国 AI 不能一直处在跟随位置。完整访谈里,他讨论的不是民族情绪,而是技术生态的结构问题:如果只做跟随,就永远只能拿到“第二手消息”;如果要形成自己的路线图,就必须有人站到技术前沿。
这句话的核心不是“超过谁”,而是“贡献什么”。
DeepSeek 从 V2 到 V4 的路线里,最值得注意的不是营销节奏,而是它把模型结构、训练效率、推理成本、长上下文和开源发布都放在同一条线上。梁文锋在访谈中说过一句很短的话:“我们不会闭源。” 这不是一个单纯的商业表态,更像是对技术生态的判断:先有更强的技术共同体,后面才会长出应用、公司和产业分工。
为什么不急着做应用?
很多 AI 公司会先问:流量在哪里?用户在哪里?商业化在哪里?
DeepSeek 的回答一直比较反直觉。梁文锋在《暗涌》访谈里明确说过,研究和技术创新是第一优先级。放到今天看,这并不是“不懂商业”,而是对阶段的判断:当基础模型能力、成本曲线和组织方法还在快速变化时,过早把公司绑死在某个应用形态上,反而可能错过更大的结构性机会。
这也解释了为什么 DeepSeek 的打法显得安静:少融资、少发布会、少个人叙事,更多论文、权重、API 和技术报告。
如果把 AI 当成互联网产品,最重要的是增长飞轮;如果把 AI 当成基础设施,最重要的是技术曲线和生态分工。DeepSeek 更接近后者。
“不诱于誉,不恐于诽”
DeepSeek-V4 官方文章的最后,写下了这句古语:“不诱于誉,不恐于诽。”
这句话很适合用来理解 DeepSeek 过去一年面对的处境。它被高度赞美,也被高度怀疑;被当作中国 AI 的象征,也被各种声音拆解、质疑、放大。对一家前沿模型公司来说,这两种声音都很危险:赞誉会诱使人表演,诋毁会诱使人解释。
真正困难的是继续做研究。
梁文锋在访谈里谈创新时,反复强调热爱、好奇心、基础能力和年轻人的自信。他对人才的判断也很不“商业化”:经验没那么重要,真正重要的是基础能力、创造性和热爱。这样的组织,表面看不像成熟公司,更像一间把资源集中到难题上的研究工坊。
这就是 DeepSeek 最值得记录的地方。它不是没有商业逻辑,而是把商业逻辑推迟到了技术逻辑之后。
普惠时代的真正含义
如果把 DeepSeek 的初心压缩成一句话,我会这样写:
让前沿模型不只属于少数公司,也属于愿意学习、构建和再创造的人。
这就是“普惠时代”的含义。它不是每个人都立刻拥有 AGI,而是前沿能力的边界开始向外移动:学生能读懂模型报告,开发者能调 API,创业团队能承受试错成本,研究者能基于开源权重继续探索。
梁文锋和 DeepSeek 的特别之处,不在于他们说了多少宏大的话,而在于他们把“原创、开源、低成本、长期主义”放进了一套可以运行的工程系统里。
技术行业总喜欢追逐赢家叙事。但 DeepSeek 更值得被记录的,不是它赢过谁,而是它给出了另一种可能:在赞誉和质疑之间,继续沿着基础创新的路走下去。