这60条思考，读懂DeepSeek创始人梁文锋的与众不同—

这60条思考，读懂DeepSeek创始人梁文锋的与众不同

发布时间:2025年02月05日来源：砺石商业评论作者：砺石商业评论浏览量：27

如果不是DeepSeek的巨大成功，其创始人梁文锋的观点会让外界认为过于狂妄。但DeepSeek的成功，则证明了梁文锋这些观点背后的技术先见。

梁文锋 | 作者

路言 | 编辑

砺石商业评论 | 出品

在整个2025年春节期间，DeepSeek的热度都一直不减。

DeepSeek的火爆，本质上还是超预期的产品体验带来的口碑裂变。这再次证明了，在真正的产品力面前，营销力不值一提。笔者在将DeepSeek与其他国产大模型进行细致对比后，最终不得不承认，DeepSeek是完全超越其他大模型一个时代的产品。

在任何一个杰出的产品背后，都离不开一个理想主义的创业者。例如，微信背后有中国最优秀的产品经理张小龙，《黑神话》背后有中国最优秀的游戏人冯骥。DeepSeek也不例外，其成功离不开核心创始人梁文锋。‍‍‍‍‍‍‍‍‍

根据公开资料显示，梁文锋出生于1985年，今年将年满40周岁，他出生于广东省湛江市吴川市覃巴镇。2002年，17岁的梁文锋以高考状元的身份考入浙江大学电子信息工程专业，2010年获得浙江大学信息与通信工程硕士学位。

2008年全球金融危机期间，梁文锋开始探索人工智能在全自动量化交易中的应用。2015年，他在杭州创立量化投资公司幻方量化，截至目前，资产管理规模突破千亿人民币大关。在幻方量化的资金与团队支持下，2023年7月，梁文锋又创建了专业的大模型公司DeepSeek，进军通用人工智能领域，并最终在大模型领域超越了中国所有的科技巨头，成为行业中最成功的技术领先者。

在网络上，关于梁文锋的公开报道并不多。但在DeepSeek火爆之前，他曾接受过36氪旗下《暗涌》公众号的两篇深度专访，从这两篇颇为宝贵的专访中，我们可以清晰看出无论是在技术洞见，还是理想主义的思维模式上，梁文锋确实与众不同。

例如，他坚定的称“我们要做的是AGI（通用人工智能），不是简单应用，也不大是云服务”，他批评“大部分中国公司习惯follow，而不是创新”，他认为“OpenAI不是神，不可能一直冲在前面”，他还犀利地指出，“中国AI和美国真实的gap是原创和模仿的差距”。如果不是DeepSeek的巨大成功，梁文锋的上述观点会让外界认为过于狂妄，但DeepSeek的成功，则证明了梁文锋这些观点背后的技术先见。

为了帮助读者更好的了解这位低调的新锐创业者，我们专门汇总了其最核心的60条思考。这60条思考，一定程度上也可以帮助我们更加直观的理解DeepSeek这家企业脱颖而出的底层逻辑。

DeepSeek创始人梁文锋的60条思考：‍

1.我们做大模型，跟量化和金融都没有直接关系。我们要做的是通用人工智能，也就是AGI。

2.语言大模型是通往AGI的必经之路，并且初步具备了AGI的特征，所以我们从这里开始。

3.我们不会过早设计基于模型的一些应用，会专注在大模型上。从长期看，大模型应用门槛会越来越低，初创公司在未来20年任何时候下场，也都有机会。我们的目标很明确，就是不做垂类和应用，而是做研究，做探索。

4.我们理解人类智能的本质就是语言，人的思维就是一个语言的过程。你以为你在思考，其实可能是你在脑子里编织语言。这意味着，在语言大模型上可能诞生出类人的人工智能（AGI）。

5.只做复刻的话，可以在公开论文或开源代码基础上，只需训练很少次数，甚至只需finetune（微调）一下，成本很低。而做研究，要做各种实验和对比，需要更多算力，对人员要求也更高，所以成本更高。

6.我们希望更多人，哪怕一个小App都可以低成本去用上大模型，而不是技术只掌握在一部分人和公司手中，形成垄断。大厂的模型，可能会和他们的平台或生态捆绑，而我们是完全自由的。

7.从商业角度来讲，基础研究是投入回报比很低的。我们比较确定的是，既然我们想做这个事，又有这个能力，这个时间点上，我们就是最合适人选之一。

8.从最早的1张卡，到2015年的100张卡、2019年的1000张卡，再到一万张，这个过程是逐步发生的。很多人会以为这里边有一个不为人知的商业逻辑，但其实，主要是好奇心驱动，对AI能力边界的好奇。

9.对很多行外人来说，ChatGPT这波浪潮冲击特别大；但对行内人来说，2012年AlexNet带来的冲击已经引领一个新的时代。AlexNet的错误率远低于当时其他模型，复苏了沉睡几十年的神经网络研究。虽然具体技术方向一直在变，但模型、数据和算力这三者的组合是不变的，特别是当2020年OpenAI发布GPT3后，方向很清楚，需要大量算力。那之后，我们有意识地去部署尽可能多的算力。

10.一件激动人心的事，不能单纯用钱衡量。就像家里买钢琴，一来买得起，二来是因为有一群急于在上面弹奏乐曲的人。

11.人工成本是对未来的投资，是公司最大的资产。我们选的人相对朴实一点，有好奇心，来我们这里有机会去做研究。大厂很难单纯去做研究，做训练，它更多会是业务需求驱动。如果不能很快应用，大厂不一定能持续坚持，因为它更需要看到结果。

12.我们招人有条原则是，看能力，而不是看经验。如果追求短期目标，找现成有经验的人是对的。但如果看长远，经验就没那么重要，基础能力、创造性与热爱等更重要。

13.我们的核心技术岗位，基本以应届和毕业一两年的人为主。做一件事，有经验的人会不假思索告诉你，应该这样做，但没有经验的人，会反复摸索、很认真去想应该怎么做，然后找到一个符合当前实际情况的解决办法。

14.我们招人的条件是热爱，这些人的热情通常会表现出来，因为他真的很想做这件事，所以这些人往往同时也在找你。

15.我们的考核标准和一般公司不太一样。我们没有KPI，也没有所谓的任务。

16.创新需要尽可能少的干预和管理，让每个人有自由发挥的空间和试错机会。创新往往都是自己产生的，不是刻意安排的，更不是教出来的。我们交给员工重要的事，并且不干预他。让他自己想办法，自己发挥。

17.招人时确保价值观一致，然后通过企业文化来确保步调一致。当然，我们并没有一个成文的企业文化，因为所有成文的东西，又会阻碍创新。更多时候，是管理者的以身示范，遇到一件事，你如何做决策，会成为一种准则。

18.按照教科书的方法论来推导创业公司，在当下，他们做的事，都是活不下来的。但市场是变化的，真正的决定力量往往不是一些现成的规则和条件，而是一种适应和调整变化的能力。很多大公司的组织结构已经不能快速响应和快速做事，而且他们很容易让之前的经验和惯性成为束缚，而这波AI新浪潮之下，一定会有一批新公司诞生。

19.最让我们兴奋的是去搞清我们的猜想是不是事实，如果是对的，就会很兴奋了。

20.信仰者会之前就在这里，之后也在这里。他们更会去批量买卡，或者跟云厂商签长协议，而不是短期去租。

21.创新是昂贵且低效的，有时候伴随着浪费。所以经济发展到一定程度之后，才能够出现创新。很穷的时候，或者不是创新驱动的行业，成本和效率非常关键。OpenAI也是烧了很多钱才出来的。

22.这个世界存在很多无法用逻辑解释的事，就像很多程序员，也是开源社区的疯狂贡献者，一天很累了，还要去贡献代码。类似你徒步50公里，整个身体是瘫掉的，但精神很满足。

23.不是所有人都能疯狂一辈子，但大部分人，在他年轻的那些年，可以完全没有功利目的，投入地去做一件事。

24.我们的大模型服务降价只是按照自己的步调来做事，然后核算成本定价。我们的原则是不贴钱，也不赚取暴利，在成本之上稍微有点利润。

25.抢用户并不是我们的主要目的。我们降价一方面是因为我们在探索下一代模型的结构中，成本先降下来了，另一方面也觉得无论API，还是AI，都应该是普惠的、人人可以用得起的东西。

26.如果目标是做应用，那沿用Llama结构，短平快上产品也是合理选择。但我们的目的地是AGI，这意味着我们需要研究新的模型结构，在有限资源下，实现更强的模型能力。这是scale up到更大模型所需要做的基础研究之一。除了模型结构，我们还做了大量其他的研究，包括怎么构造数据，如何让模型更像人类等，这都体现在我们发布的模型里。

27.最重要的是参与到全球创新的浪潮里去。过去很多年，中国公司习惯了别人做技术创新，我们拿过来做应用变现，但这并非是一种理所当然。这一波浪潮里，我们的出发点，就不是趁机赚一笔，而是走到技术的前沿，去推动整个生态发展。

28.随着经济发展，中国也要逐步成为贡献者，而不是一直搭便车。过去三十多年IT浪潮里，我们基本没有参与到真正的技术创新里。我们已经习惯摩尔定律从天而降，躺在家里18个月就会出来更好的硬件和软件。但其实，这是西方主导的技术社区一代代孜孜不倦创造出来的，只因为之前我们没有参与这个过程，以至于忽视了它的存在。

29.大部分中国公司习惯follow，而不是创新。

30.创新的成本肯定不低，过去那种拿来主义的惯例和过去的国情有关。但现在，无论中国的经济体量，还是字节、腾讯这些大厂的利润，放在全球都不低。我们创新缺的不是资本，而是缺乏信心以及不知道怎么组织高密度的人才实现有效的创新。

31.过去三十年，我们都只强调赚钱，对创新是忽视的。创新不完全是商业驱动的，还需要好奇心和创造欲。我们只是被过去那种惯性束缚了，但它也是阶段性的。

32.在颠覆性的技术面前，闭源形成的护城河是短暂的。即使OpenAI闭源，也无法阻止被别人赶超。所以我们把价值沉淀在团队上，我们的同事在这个过程中得到成长，积累很多know-how，形成可以创新的组织和文化，这就是我们的护城河。

33.开源，发论文，并没有失去什么。对于技术人员来说，被follow是很有成就感的事。开源更像一个文化行为，而非商业行为。给予是一种额外的荣誉，一个公司这么做也会有文化的吸引力。

34.美国最赚钱的公司，都是厚积薄发的高科技公司。

35.中国AI和美国真实的gap是原创和模仿的差距。如果这个不改变，中国永远只能是追随者，所以有些探索也是逃不掉的。

36.英伟达的领先，不只是一个公司的努力，而是整个西方技术社区和产业共同努力的结果。他们能看到下一代的技术趋势，手里有路线图。中国AI的发展，同样需要这样的生态。很多国产芯片发展不起来，是因为缺乏配套的技术社区，只有第二手消息，所以中国必然需要有人站到技术的前沿。

37.我们不会闭源，我们认为先有一个强大的技术生态更重要。

38.我们短期内没有融资计划，我们面临的问题从来不是钱，而是高端芯片被禁运。

39.更多的投入并不一定产生更多的创新，否则大厂可以把所有的创新包揽了。

40.我们认为当前阶段是技术创新的爆发期，而不是应用的爆发期。长远来说，我们希望形成一种生态，就是业界直接使用我们的技术和产出，我们只负责基础模型和前沿的创新，然后其它公司在DeepSeek的基础上构建toB、toC的业务。如果能形成完整的产业上下游，我们就没必要自己做应用。

41.如果需要，我们做应用也没障碍，但研究和技术创新永远是我们第一优先级。

42.技术没有秘密，但重置需要时间和成本。英伟达的显卡，理论上没有任何技术秘密，很容易复制，但重新组织团队以及追赶下一代技术都需要时间，所以实际的护城河还是很宽。

43.提供云服务不是我们的主要目标，我们的目标是去实现AGI。

44.大厂有现成的用户，但它的现金流业务也是它的包袱，也会让它成为随时被颠覆的对象。

45.大模型创业公司可能活下来2到3家。现在都还处在烧钱阶段，那些自我定位清晰、更能精细化运营的，更有机会活下来。其它公司可能会脱胎换骨。有价值的东西不会烟消云散，但会换一种方式。

46.我经常思考的是，一个东西能不能让社会的运行效率变高，以及你能否在它的产业分工链条上找到擅长的位置。只要终局是让社会效率更高，就是成立的。中间很多都是阶段性的，过度关注必然眼花缭乱。

47.我们发布的V2模型没有海外回来的人，都是本土的。前50名顶尖人才可能不在中国，但我们能自己打造这样的人。

48.DeepSeek也全是自下而上的。而且我们一般不前置分工，而是自然分工。每个人有自己独特的成长经历，都是自带想法的，不需要push他。探索过程中，他遇到问题，自己就会拉人讨论。不过当一个idea显示出潜力，我们也会自上而下地去调配资源。

49.我们每个人对于卡和人的调动是不设上限的。如果有想法，每个人随时可以调用训练集群的卡无需审批，同时因为不存在层级和跨部门，也可以灵活调用所有人，只要对方也有兴趣。

50.我们选人的标准一直都是热爱和好奇心，所以很多人会有一些奇特的经历，很有意思。很多人对做研究的渴望，远超对钱的在意。

51.创新首先是一个信念问题。为什么硅谷那么有创新精神？首先是敢。Chatgpt出来时，整个国内对做前沿创新都缺乏信心，从投资人到大厂，都觉得差距太大了，还是做应用吧。但创新首先需要自信，这种信心通常在年轻人身上更明显。

52.我们在做最难的事。对顶级人才吸引最大的，肯定是去解决世界上最难的问题。其实，顶尖人才在中国是被低估的。因为整个社会层面的硬核创新太少了，使得他们没有机会被识别出来。我们在做最难的事，对他们是有吸引力的。

53.OpenAI不是神，不可能一直冲在前面。

54.AGI可能是2年、5年或者10年，总之会在我们有生之年实现。至于路线图，即使在我们公司内部，也没有统一意见。但我们确实押注了三个方向：一是数学和代码，二是多模态，三是自然语言本身。数学和代码是AGI天然的试验场，有点像围棋，是一个封闭的、可验证的系统，有可能通过自我学习就能实现很高的智能。另一方面，多模态、参与到人类的真实世界里学习，对AGI也是必要的。我们对一切可能性都保持开放。

55.未来会有专门公司提供基础模型和基础服务，会有很长链条的专业分工。更多人在之上去满足整个社会多样化的需求。

56.我主要的精力在研究下一代的大模型，还有很多未解决的问题。

57.所有的套路都是上一代的产物，未来不一定成立。拿互联网的商业逻辑去讨论未来AI的盈利模式，就像马化腾创业时，你去讨论通用电气和可口可乐一样，很可能是一种刻舟求剑。

58.我们经历了一个漫长的积累过程，外部看到的是幻方2015年后的部分，但其实我们做了16年。

59.未来中国产业结构的调整，会更依赖硬核技术的创新。当很多人发现过去赚快钱很可能来自时代运气，就会更愿意俯身去做真正的创新。

60.未来硬核创新会越来越多，现在还不容易被理解，是因为整个社会群体需要被事实教育。当这个社会让硬核创新的人功成名就，群体性想法就会改变，我们只是还需要一堆事实和一个过程。

参考资料：

1.《疯狂的幻方：一家隐形AI巨头的大模型之路》暗涌

2.《揭秘DeepSeeK:一个更极致的中国技术理想主义的故事》暗涌

免责声明：本文来自砺石商业评论客户端，不代表超天才网的观点和立场。文章及图片来源网络，版权归作者所有，如有投诉请联系删除。