deeper network团队介绍_deep group

范文仓信息网~

# DeepSeek团队揭秘:一群中国学霸如何用开源模型撼动全球AI格局

当DeepSeek的开源大模型R1以十分之一的成本达到GPT-o1级别表现时,硅谷的科技巨头们第一次感受到了来自东方的"降维打击"。这支平均年龄不到28岁的中国团队,用不到两年时间就从实验室走向世界舞台中央。但真正让海外同行震惊的,不是他们的技术突破,而是这支团队独特的构成——没有明星科学家光环,没有铺天盖地的PR宣传,只有一群穿着格子衬衫的"科技少年班"毕业生,在开源社区里像讨论游戏攻略一样分享着最前沿的AI研究成果。

## 一、创始人梁文锋:从量化交易到AGI的跨界奇才

团队的核心灵魂人物梁文锋,身上带着典型的"理工男"特质——极少接受媒体采访,社交媒体几乎不更新个人动态。这位85后创始人的人生轨迹却充满传奇色彩:广东湛江吴川走出的高考状元、浙江大学信息工程学霸、中国量化投资"四大天王"之一幻方量化的创始人。

2019年,当他的"萤火二号"AI训练平台搭载1万张英伟达A100显卡时,谁也没想到这位量化金融奇才会突然转向AGI赛道。一位接近梁文锋的业内人士透露:"他办公室的白板上永远画着三种曲线——股票K线、AI训练损失函数和摩尔定律预测线,这种跨领域的直觉思维正是DeepSeek技术路线的独特之处。"2024年V3模型的横空出世,印证了这种"金融+AI"跨界思维的前瞻性——当其他团队还在比拼参数规模时,DeepSeek已经像优化交易策略一样,在模型架构上实现了惊人的成本控制。

## 二、"清北战队":中国顶尖实验室的集体突围

翻开DeepSeek核心成员名单,就像打开一份中国顶尖高校的"荣誉校友录":北大7人、清华4人、北邮2人、中大1人。这群年轻人大多有着相似的成长路径——中学信息学竞赛奖牌得主、大学超算比赛冠军、顶会论文作者,然后在博士毕业前就被梁文锋"截胡"招致麾下。

- **赵成钢**(训练架构工程师):衡水中学信息学竞赛班出身,清华超算队三冠成员,曾在英伟达北京实习8个月。当被问及为何放弃硅谷offer时,他在技术博客中写道:"在NVIDIA实习时我发现,最先进的GPU集群有80%算力都在跑矩阵乘法——这太浪费了。"如今他主导的混合精度训练框架,让DeepSeek模型的训练效率提升了惊人的300%。
- **刘星超**(多模态研究员):德克萨斯大学奥斯汀分校博士,自称"乐子人"的他在X上活跃得像一个科技博主。当JanusFlow多模态模型被AI学者谢赛宁转发时,他直接在评论区与同行讨论技术细节,这种"开源式交流"后来成为团队的文化标签。
- **罗福莉**(核心算法工程师):95后"天才AI少女",学生时代就在NeurIPS发表16篇论文。她参与的动态稀疏化算法,让R1模型在保持性能的前提下,将推理成本压缩到行业平均水平的1/5。

值得注意的是,这支团队几乎没有"海归"背景,成员多来自本土高校实验室。正如某风投合伙人所说:"他们像武侠小说里的同门师兄弟,把中国式集体攻关的优势发挥到了极致——当美国团队还在各自为战时,这些年轻人已经用实验室里磨合多年的默契,在模型架构、训练方法、推理优化等环节实现了无缝协同。"

## 三、极客文化下的"叛逆创新"

走进DeepSeek的办公室,你会误以为闯入了某个大学实验室:白板上密密麻麻写着数学公式,工位旁散落着《深度学习花书》和《三体》小说,零食区贴着"省下GPU钱请大家喝奶茶"的纸条。这种混合着学术气息和极客幽默的氛围,孕育出团队独特的技术哲学。

1. **"成本洁癖"**:当行业沉迷于"暴力美学"(堆算力、拼参数)时,DeepSeek工程师们却像对待高考数学题一样追求"最优解"。基础设施组的许哲安曾在推特吐槽:"看到别家用价值2亿的GPU集群训练聊天模型,就像看有人用粒子对撞机煮泡面。"这种对计算效率的极致追求,最终让V3模型用560万美元成本达到了竞争对手上亿美元的效果。

2. **开源即信仰**:团队成员在X上的互动堪称行业清流——没有精心策划的PR文案,只有对技术细节的坦诚分享。当R1模型开源引发轰动时,核心开发成员邵智宏的推特简介依然是"喜欢打游戏的AI码农",他像测评游戏装备一样对比着不同量化方法的优劣。这种去中心化的知识共享,意外造就了DeepSeek在开发者社区的"人缘"。

3. **"问题少年"式创新**:一位投资人透露,DeepSeek的面试题包括"如何用10%算力实现BERT效果"这类"不可能任务"。正是这种刻意为之的资源约束,逼出了动态稀疏训练、梯度累积补偿等原创技术。就像团队内部流传的一句话:"EDA软件不让用?那就自己写!A100买不到?正好试试我们的混合精度新算法!"

## 四、少年中国派的"技术民主化"使命

当扎克伯格公开呼吁"限制AI发展"时,DeepSeek团队正在做的事情恰好相反——通过开源和低成本,把曾经被科技巨头垄断的大模型能力,"下放"给全球普通开发者。这种"技术民主化"的追求,或许与团队成员们的成长经历息息相关:

- 梁文锋在吴川一中时,就因买不起正版软件而自学破解;
- 赵成钢在英伟达实习期间,亲眼目睹了中小公司因算力成本被迫放弃AI项目的困境;
- 刘星超读博时曾为获取数据集发过200多封申请邮件...

这些经历塑造了团队共同的技术价值观:用算法创新打破资源垄断。正如R1模型发布后,南京大学俞扬教授的评价:"他们证明了一件事——在AI领域,聪明才智可以战胜资本优势。"这种"少年中国派"的颠覆性,或许正是DeepSeek让硅谷寝食难安的真正原因。

这支不足140人的年轻团队,正在改写全球AI竞赛的规则。没有明星光环加持,没有天价融资背书,他们用最中国的解题方式——集体智慧、资源优化和持续迭代,完成了一场精彩的"非对称超越"。当海外媒体用"东方神秘力量"形容DeepSeek时,他们或许没意识到,这种"神秘"恰恰来自最朴素的工程师文化:把每一个技术难题,都当作学生时代那道必须解开的奥数题。

» 转载保留版权:百科全库网 » 《deeper network团队介绍_deep group》

» 本文链接地址:https://baikequanku.com/archives/102115.html

作者:admin2019
返回顶部