DeepSeek创始人梁文锋的除夕夜感言/DeepSeek~通往未来的栈桥

Kelly

<p class="ql-block">编辑:Kelly/深圳</p><p class="ql-block">金句:</p><p class="ql-block">我们不过是站在开源社区巨人们的肩膀上,给国产大模型这栋大厦多拧了几颗螺丝。那个能在手机上跑的mini模型,灵感来自甘肃一位中学老师在GitHub提的issue;“让最偏远山村的孩童,能和硅谷工程师用上同样聪明的AI助教”。DeepSeek愿做大家代码荒野里的火柴,但真正点燃AI火种的,永远是你们眼底不灭的好奇与坚持。最后想对所有人说:请把掌声留给正在改写规则的每个中国开发者。</p><p class="ql-block">~~~~~~~~~~~~~~~</p><p class="ql-block">正文:</p><p class="ql-block">各位知乎的年轻朋友好,我是深度求索(DeepSeek)的梁文锋。除夕之夜,我忍不住想和大家分享一些心里话。前几天看到冯总这篇长文时,我正在调试新模型的损失函数,手边的咖啡直接洒在了键盘上——既因为被行业前辈认可的惶恐,更因为冯总这些灼热的文字让我想起十二年前在浙大实验室第一次跑通神经网络时的颤栗。我们团队读到“国运级”这个形容时,所有人头皮都是麻的。</p><p class="ql-block">我们不过是站在开源社区巨人们的肩膀上,给国产大模型这栋大厦多拧了几颗螺丝。您提到的六大突破,其实每一环都凝结着更动人的故事:那个能在手机上跑的mini模型,灵感来自甘肃一位中学老师在GitHub提的issue;支持联网搜索的功能,是内测用户连续三十天凌晨三点提交错误日志喂出来的。特别想分享个细节:上周有位视障开发者用我们的API做了个“气味导航”应用,当他演示如何通过不同频率的震动识别街道商铺时整个会议室安静得能听见显卡风扇的嗡鸣,那一刻我突然眼眶发热,终于理解了您说的“水与电”——真正伟大的从不是某个模型,而是千万普通人用它创造的善意涟漪。</p><p class="ql-block">冯总说“知识和信息平权”,这正是我们夜夜啃论文的动力。三年前在余杭塘路的小仓库里,我们曾用马克笔在玻璃墙上写下:“让最偏远山村的孩童,能和硅谷工程师用上同样聪明的AI助教”。虽然离这个梦想还很远,但每次看到网友们分享的对话截图,就觉得那些熬掉的头发都值得。请把掌声留给正在改写规则的每个中国开发者。</p><p class="ql-block">说来特别巧,上周在云栖小镇的创业者夜宵摊上,我还和宇树科技的王总蹲在马路牙子啃烧烤——他们给四足机器人装的那个动态平衡算法,看得我们团队直拍大腿。后来强脑科技的韩总过来拼桌,三句话不离脑机接口与具身智能的融合可能,烤茄子还没上桌,我们已经开始在白纸上画异构计算架构了。这就是杭州最迷人的地方吧,所谓“六小龙”从来不是六个孤岛。</p><p class="ql-block">或许在不远的未来,当宇树的机器人踩着云深处的步态算法走来,搭载着强脑的神经接口,运行着DeepSeek的认知引擎,用群核构建的虚拟世界作为训练场——那个我们幻想中的具身智能,就会从西溪湿地的晨雾里跌跌撞撞地走向人间。记得那晚分别时,冯总把竹签子往啤酒瓶里一插,说了句:“你们搞AI的得把灵魂价格打下来啊。”现在想来,真正的“国运”或许就藏在这些街边摊的油烟气里:一群不信邪的傻子,用代码当砖瓦,拿算法做钢筋,在资本与质疑的裂缝中,硬生生垒出通向未来的栈桥。</p><p class="ql-block">最后,我想再次感谢所有支持和关注我们的人。我们所做的一切,都是为了让更多人能够享受到AI带来的便利,让最偏远山村的孩童,能和硅谷工程师用上同样聪明的AI助教。DeepSeek愿做大家代码荒野里的火柴,但真正点燃AI火种的,永远是你们眼底不灭的好奇与坚持。请把掌声留给正在改写规则的每个中国开发者。</p> <p class="ql-block">梁文锋,男,1985年出生,广东省湛江市吴川市覃巴镇米历岭村人,浙江大学毕业,拥有信息与电子工程学系本科和硕士学位。杭州幻方科技有限公司、</p><p class="ql-block">DeepSeek创始人。</p><p class="ql-block">2008年起,梁文锋开始带领团队使用机器学习等技术探索全自动量化交易。</p><p class="ql-block">2015年,幻方量化正式成立。2019年,其资金管理规模突破百亿元;同年,梁文锋在当年的金牛奖颁奖仪式上发表主题演讲《一名程序员眼里中国量化投资的未来》。2020年开始,幻方的AI超级计算机“萤火一号”正式投入运作。2021年,幻方投入十亿建设“萤火二号”。</p><p class="ql-block">2023年7月,幻方量化宣布成立大模型公司DeepSeek,正式进军通用人工智能领域。2024年5月,DeepSeek发布了DeepSeekV2;同年12月27日,DeepSeek-V3面世。 2025年1月20日, DeepSeek正式发布DeepSeek-R1模型;同日,梁文锋参加了中共中央政治局常委、国务院总理李强主持召开专家、企业家和教科文卫体等领域代表座谈会,并在会上发言。</p><p class="ql-block">中文名/梁文锋</p><p class="ql-block">国籍/中国</p><p class="ql-block">出生日期/1985年</p><p class="ql-block">毕业院校/浙江大学</p><p class="ql-block">就职企业</p><p class="ql-block">DeepSeeK杭州幻方科技有限公司</p>