deeper network团队介绍_deep科技有限公司
deepseek技术团队介绍最新
1、deepseek技术团队,全称杭州深度求索人工智能基础技术研究有限公司,由幻方量化联合创始人梁文锋创立,自2023年7月成立,专注大语言模型研发。
2、团队成员大多来自清华、北大等国内顶尖高校,整体年轻高学历,注重开源与创新。
3、创始人梁文锋,80后,毕业于浙大信息与电子工程学专业,在人工智能方向颇有建树,曾发表高质量论文。
4、核心成员潘梓正,曾获英伟达转正offer却选择加入deepseek,成为DeepSeek-VL2等模型核心贡献者。
5、Junxiao Song毕业于香港科技大学,提出强化学习算法GRPO,应用于多款模型训练,在高效训练等工作中作用重大。
6、“95AI天才少女”罗福莉,就读于北师大计算机专业,在北大实习和深造,曾在阿里达摩院工作,2022年加入deepseek,参与MoE大模型和DeepSeek-Ⅴ2研究。
7、天大校友王培懿,直博至北大计算语言学研究所,2023年9月加入deepseek,是研发核心成员之一。
8、刘星超,DeepSeek机器学习和多模态研究员,博士毕业于德克萨斯大学奥斯汀分校,是多模态组成员。
9、邵智宏,实习期间成为DeepSeek Math核心作者之一,后参与R1等模型开发。
10、deepseek技术团队开创性提出多头潜在注意力机制和DeepSeekMoE等创新架构,让模型在权威测评中表现顶尖。
11、团队在模型优化中应用渐进式分层蒸馏技术,构建三级蒸馏体系,实现 “大模型智慧,小模型效率”。
12、采用自研的Dual-Chain Reasoning技术,推理速度提升3倍,能耗降低40%。
13、通过MoE架构实现参数动态激活,在金融风控场景误报率较传统模型降低62%。
14、内置三重内容过滤机制和价值观对齐模块,安全评分达92.5/100 。
15、运用3D并行训练策略,千亿参数模型训练时间从6个月缩短至45天。
16、集成视觉 - 语言联合表征框架,支持图文混合输入解析,在医疗影像分析等场景识别准确率达98.7%。
17、deepseek技术团队凭借独特文化,让员工对工作充满热情,不鼓励内部竞争和加班,给予员工极大自由度。
18、团队仅139名研发人员,其中核心研发人员约70人,对比OpenAI的1200名,研发战斗力相当于1抵9 ,创新实力可见一斑。
19、2023年11月2日开发出首个模型DeepSeek Coder,2024年5月发布DeepSeek V2 ,2024年12月26日发布DeepSeek V3 ,2025年1月20日发布DeepSeek R1 ,研发速度惊人。
20、DeepSeek系列涵盖从7B到超千亿参数完整模型矩阵,在数学推理、代码生成、多轮对话等核心能力达国际领先水平。
» 转载保留版权:百科全库网 » 《deeper network团队介绍_deep科技有限公司》