deeper network团队介绍_deep科技有限公司

admin2019 2025-04-12 0:00:19 电脑数码

小中大

deepseek技术团队介绍最新

1、deepseek技术团队，全称杭州深度求索人工智能基础技术研究有限公司，由幻方量化联合创始人梁文锋创立，自2023年7月成立，专注大语言模型研发。

2、团队成员大多来自清华、北大等国内顶尖高校，整体年轻高学历，注重开源与创新。

3、创始人梁文锋，80后，毕业于浙大信息与电子工程学专业，在人工智能方向颇有建树，曾发表高质量论文。

4、核心成员潘梓正，曾获英伟达转正offer却选择加入deepseek，成为DeepSeek-VL2等模型核心贡献者。

5、Junxiao Song毕业于香港科技大学，提出强化学习算法GRPO，应用于多款模型训练，在高效训练等工作中作用重大。

6、“95AI天才少女”罗福莉，就读于北师大计算机专业，在北大实习和深造，曾在阿里达摩院工作，2022年加入deepseek，参与MoE大模型和DeepSeek-Ⅴ2研究。

7、天大校友王培懿，直博至北大计算语言学研究所，2023年9月加入deepseek，是研发核心成员之一。

8、刘星超，DeepSeek机器学习和多模态研究员，博士毕业于德克萨斯大学奥斯汀分校，是多模态组成员。

9、邵智宏，实习期间成为DeepSeek Math核心作者之一，后参与R1等模型开发。

10、deepseek技术团队开创性提出多头潜在注意力机制和DeepSeekMoE等创新架构，让模型在权威测评中表现顶尖。

11、团队在模型优化中应用渐进式分层蒸馏技术，构建三级蒸馏体系，实现 “大模型智慧，小模型效率”。

12、采用自研的Dual-Chain Reasoning技术，推理速度提升3倍，能耗降低40%。

13、通过MoE架构实现参数动态激活，在金融风控场景误报率较传统模型降低62%。

14、内置三重内容过滤机制和价值观对齐模块，安全评分达92.5/100 。

15、运用3D并行训练策略，千亿参数模型训练时间从6个月缩短至45天。

16、集成视觉 - 语言联合表征框架，支持图文混合输入解析，在医疗影像分析等场景识别准确率达98.7%。

17、deepseek技术团队凭借独特文化，让员工对工作充满热情，不鼓励内部竞争和加班，给予员工极大自由度。

18、团队仅139名研发人员，其中核心研发人员约70人，对比OpenAI的1200名，研发战斗力相当于1抵9 ，创新实力可见一斑。

19、2023年11月2日开发出首个模型DeepSeek Coder，2024年5月发布DeepSeek V2 ，2024年12月26日发布DeepSeek V3 ，2025年1月20日发布DeepSeek R1 ，研发速度惊人。

20、DeepSeek系列涵盖从7B到超千亿参数完整模型矩阵，在数学推理、代码生成、多轮对话等核心能力达国际领先水平。

作者:admin2019