deeper network团队介绍_deep group

admin2019 2025-04-03 18:18:03 电脑数码

小中大

# DeepSeek团队揭秘：一群中国学霸如何用开源模型撼动全球AI格局

当DeepSeek的开源大模型R1以十分之一的成本达到GPT-o1级别表现时，硅谷的科技巨头们第一次感受到了来自东方的"降维打击"。这支平均年龄不到28岁的中国团队，用不到两年时间就从实验室走向世界舞台中央。但真正让海外同行震惊的，不是他们的技术突破，而是这支团队独特的构成——没有明星科学家光环，没有铺天盖地的PR宣传，只有一群穿着格子衬衫的"科技少年班"毕业生，在开源社区里像讨论游戏攻略一样分享着最前沿的AI研究成果。

## 一、创始人梁文锋：从量化交易到AGI的跨界奇才

团队的核心灵魂人物梁文锋，身上带着典型的"理工男"特质——极少接受媒体采访，社交媒体几乎不更新个人动态。这位85后创始人的人生轨迹却充满传奇色彩：广东湛江吴川走出的高考状元、浙江大学信息工程学霸、中国量化投资"四大天王"之一幻方量化的创始人。

2019年，当他的"萤火二号"AI训练平台搭载1万张英伟达A100显卡时，谁也没想到这位量化金融奇才会突然转向AGI赛道。一位接近梁文锋的业内人士透露："他办公室的白板上永远画着三种曲线——股票K线、AI训练损失函数和摩尔定律预测线，这种跨领域的直觉思维正是DeepSeek技术路线的独特之处。"2024年V3模型的横空出世，印证了这种"金融+AI"跨界思维的前瞻性——当其他团队还在比拼参数规模时，DeepSeek已经像优化交易策略一样，在模型架构上实现了惊人的成本控制。

## 二、"清北战队"：中国顶尖实验室的集体突围

翻开DeepSeek核心成员名单，就像打开一份中国顶尖高校的"荣誉校友录"：北大7人、清华4人、北邮2人、中大1人。这群年轻人大多有着相似的成长路径——中学信息学竞赛奖牌得主、大学超算比赛冠军、顶会论文作者，然后在博士毕业前就被梁文锋"截胡"招致麾下。

- **赵成钢**（训练架构工程师）：衡水中学信息学竞赛班出身，清华超算队三冠成员，曾在英伟达北京实习8个月。当被问及为何放弃硅谷offer时，他在技术博客中写道："在NVIDIA实习时我发现，最先进的GPU集群有80%算力都在跑矩阵乘法——这太浪费了。"如今他主导的混合精度训练框架，让DeepSeek模型的训练效率提升了惊人的300%。
- **刘星超**（多模态研究员）：德克萨斯大学奥斯汀分校博士，自称"乐子人"的他在X上活跃得像一个科技博主。当JanusFlow多模态模型被AI学者谢赛宁转发时，他直接在评论区与同行讨论技术细节，这种"开源式交流"后来成为团队的文化标签。
- **罗福莉**（核心算法工程师）：95后"天才AI少女"，学生时代就在NeurIPS发表16篇论文。她参与的动态稀疏化算法，让R1模型在保持性能的前提下，将推理成本压缩到行业平均水平的1/5。

值得注意的是，这支团队几乎没有"海归"背景，成员多来自本土高校实验室。正如某风投合伙人所说："他们像武侠小说里的同门师兄弟，把中国式集体攻关的优势发挥到了极致——当美国团队还在各自为战时，这些年轻人已经用实验室里磨合多年的默契，在模型架构、训练方法、推理优化等环节实现了无缝协同。"

## 三、极客文化下的"叛逆创新"

走进DeepSeek的办公室，你会误以为闯入了某个大学实验室：白板上密密麻麻写着数学公式，工位旁散落着《深度学习花书》和《三体》小说，零食区贴着"省下GPU钱请大家喝奶茶"的纸条。这种混合着学术气息和极客幽默的氛围，孕育出团队独特的技术哲学。

1. **"成本洁癖"**：当行业沉迷于"暴力美学"（堆算力、拼参数）时，DeepSeek工程师们却像对待高考数学题一样追求"最优解"。基础设施组的许哲安曾在推特吐槽："看到别家用价值2亿的GPU集群训练聊天模型，就像看有人用粒子对撞机煮泡面。"这种对计算效率的极致追求，最终让V3模型用560万美元成本达到了竞争对手上亿美元的效果。

2. **开源即信仰**：团队成员在X上的互动堪称行业清流——没有精心策划的PR文案，只有对技术细节的坦诚分享。当R1模型开源引发轰动时，核心开发成员邵智宏的推特简介依然是"喜欢打游戏的AI码农"，他像测评游戏装备一样对比着不同量化方法的优劣。这种去中心化的知识共享，意外造就了DeepSeek在开发者社区的"人缘"。

3. **"问题少年"式创新**：一位投资人透露，DeepSeek的面试题包括"如何用10%算力实现BERT效果"这类"不可能任务"。正是这种刻意为之的资源约束，逼出了动态稀疏训练、梯度累积补偿等原创技术。就像团队内部流传的一句话："EDA软件不让用？那就自己写！A100买不到？正好试试我们的混合精度新算法！"

## 四、少年中国派的"技术民主化"使命

当扎克伯格公开呼吁"限制AI发展"时，DeepSeek团队正在做的事情恰好相反——通过开源和低成本，把曾经被科技巨头垄断的大模型能力，"下放"给全球普通开发者。这种"技术民主化"的追求，或许与团队成员们的成长经历息息相关：

- 梁文锋在吴川一中时，就因买不起正版软件而自学破解；
- 赵成钢在英伟达实习期间，亲眼目睹了中小公司因算力成本被迫放弃AI项目的困境；
- 刘星超读博时曾为获取数据集发过200多封申请邮件...

这些经历塑造了团队共同的技术价值观：用算法创新打破资源垄断。正如R1模型发布后，南京大学俞扬教授的评价："他们证明了一件事——在AI领域，聪明才智可以战胜资本优势。"这种"少年中国派"的颠覆性，或许正是DeepSeek让硅谷寝食难安的真正原因。

这支不足140人的年轻团队，正在改写全球AI竞赛的规则。没有明星光环加持，没有天价融资背书，他们用最中国的解题方式——集体智慧、资源优化和持续迭代，完成了一场精彩的"非对称超越"。当海外媒体用"东方神秘力量"形容DeepSeek时，他们或许没意识到，这种"神秘"恰恰来自最朴素的工程师文化：把每一个技术难题，都当作学生时代那道必须解开的奥数题。

» 转载保留版权：百科全库网 » 《deeper network团队介绍_deep group》

» 本文链接地址：https://baikequanku.com/archives/102115.html