deep sea research_deepscience_deepseek研究团队成员一览表
**DeepSeek研究团队:一群拒绝硅谷的天才如何改写AI格局**
当英伟达市值因一家中国初创公司的技术突破单日蒸发6000亿美元时,全球科技界才猛然意识到:DeepSeek这支平均年龄不足28岁的“学霸军团”,早已用开源模型和极低成本,撕开了美国主导的AI霸权裂缝。
### **1. 核心成员:本土学霸与海归精英的“化学反应”**
DeepSeek的团队构成像极了武侠小说中的“名门正派联盟”——创始人梁文锋(浙大硕士)坐镇中军,麾下聚集了清北学霸、海外顶尖实验室归来的研究员,甚至还有跳级保送的“物理转AI”奇才。
- **潘梓正**:放弃英伟达转正机会的“叛逆者**
这位在英伟达实习期间就被导师Zhiding Yu誉为“罕见天才”的年轻人,2023年毅然拒绝硅谷offer,加入当时仅20余人的DeepSeek。他主导开发的DeepSeek-VL2和R1系列模型,直接推动公司跻身全球第一梯队。其导师在X平台感慨:“中国顶尖人才已不需要通过美国公司证明自己。”
- **Junxiao Song(宋俊骁)**:香港科大走出的算法革新者
他提出的GRPO强化学习算法,将模型训练效率提升40%,成为DeepSeek-R1数学推理能力的核心支柱。同事评价他“像一台永不停歇的灵感喷射器”,甚至会在深夜的会议室白板上推导公式。
- **王培懿**:北大博士的“语言模型外科医生”
天津大学本科、北大直博的背景让他在自然语言处理领域如鱼得水。作为DeepSeek-Math论文核心作者,他设计的推理增强框架让模型在数学竞赛级任务中击败GPT-4。他坦言:“这里(DeepSeek)没有KPI焦虑,只有对AGI的纯粹追求。”
- **高华佐**:从物理奥赛金牌到AI架构师
这位佛山华英学校校友的履历堪称“跨界狂想曲”——北大理论物理专业中途转向AI,其设计的MLA架构让DeepSeek-V2推理性能暴增93.3%。初中老师回忆:“他总在课上偷偷做实验,但每次提问都能对答如流。”
### **2. 团队基因:极客文化与本土智慧的融合**
与硅谷明星公司不同,DeepSeek的工程师们鲜少在社交媒体上高谈阔论,反而更像个“技术修道院”:
- **反内卷的工作哲学**:梁文锋公开反对加班文化,允许研究员自由调用算力资源。一位成员透露:“我们甚至能用公司GPU跑个人兴趣项目,只要最后代码并入主分支。”
- **清北“少年班”气场**:团队中7人来自北大、4人出自清华,还有中科大、浙大等校精英。他们擅长用本土化思维破解技术难题——例如针对中文语境的稀疏训练优化,直接让千亿参数模型训练成本下降65%。
- **开源信仰**:当美国讨论限制AI技术出口时,DeepSeek选择将R1模型全面开源。纽约大学教授评价:“这群年轻人正在复刻Linux的成功,但速度更快。”
### **3. 未来挑战:光环之下的暗涌**
尽管DeepSeek的模型已登顶多国应用商店,团队仍面临诸多考验:
- **人才争夺白热化**:据传OpenAI曾以“空白支票”条件挖角核心成员,但被婉拒。一位研究员笑称:“他们给的薪水确实诱人,但这里能让我亲手塑造AGI的未来。”
- **技术迭代压力**:随着谷歌、Meta推出新一代芯片专供AI训练,DeepSeek需在算力劣势下维持算法优势。梁文锋的应对策略是“用数学之美对抗硬件暴力”,例如近期曝光的动态稀疏训练专利。
这支兼具书生意气与硬核实力的团队,正用中国式创新证明:AI的下一幕,未必由硅谷书写。正如《自然》杂志所评:“DeepSeek的价值不在于它‘像谁’,而在于它提醒世界——最颠覆性的技术,可能诞生于最意想不到的角落。”