DeepSeek的研发团队有哪些成员__deep科技有限公司
# DeepSeek研发团队:大模型背后的神秘力量
在人工智能的竞技场上,DeepSeek宛如一匹黑马,凭借卓越性能与亲民成本脱颖而出。这款由深度求索(DeepSeek Inc.)自主研发的通用大语言模型,自2023年启动研发以来,已在数学推理、代码生成等核心能力上达到国际领先水平,吸引了全球目光。那究竟是哪些幕后英雄造就了这一AI界的璀璨明星?
深度求索公司作为DeepSeek的缔造者,其成立于2023年7月,由量化巨头幻方创立。幻方作为国内最大的量化基金管理公司之一,资金实力雄厚,连续五年荣获中国私募金牛奖,2021年基金规模突破1000亿元且产品全部赢利一倍,为DeepSeek的研发提供了坚实的资金后盾,让团队能够心无旁骛地烧钱搞技术。
在技术研发层面,DeepSeek的成功离不开一支技术精湛且深谙成本控制的团队。他们自主研发的Dual - Chain Reasoning技术,使推理速度相较传统模型提升3倍,能耗降低40%;采用的3D并行训练策略,更是将千亿参数模型训练时间从行业平均6个月缩短至45天,大大提高了研发效率。在模型优化方面,团队创造性地应用渐进式分层蒸馏技术,构建三级蒸馏体系,实现了“大模型智慧,小模型效率”的理想效果,如将175B教师模型蒸馏到13B学生模型,在保持90%性能水平的同时,推理成本降低至1/8 。
从商业合作角度看,诸多企业也间接参与到DeepSeek的生态建设中。因赛集团与DeepSeek - V3建立业务合作,有望在AI模型应用方面开展具体项目;卓创资讯作为大宗商品信息服务企业,其金融语料库为DeepSeek的训练和优化提供数据支持;阳光照明购买幻方3亿元私募产品,凭借外销优势,有望借助Deepseek相关技术拓展海外市场。
值得一提的是,华为在DeepSeek的发展进程中扮演了关键角色。2025年2月4日,华为昇腾携手国内其他三大国产GPU厂商,助力DeepSeek实现中国芯的突破,同一天,DeepSeek多个版本入驻昇腾社区;2月6日,华为ModelEngine AI平台全面支持DeepSeek大模型R1&V3;2月12日,DeepSeek V3/R1(满血版)在华为云上线,华为云昇腾云服务为其提供强大算力支持。
虽然DeepSeek研发团队的具体成员尚未完全公开,但从其取得的成果不难看出,这是一支汇聚了算法研究、模型训练、商业合作等多领域专业人才的梦幻之师。他们犹如一群幕后的魔法师,用智慧与汗水,为我们打造出DeepSeek这一AI神器,引领着人工智能领域迈向新的高度。
» 转载保留版权:百科全库网 » 《DeepSeek的研发团队有哪些成员__deep科技有限公司》