deepseek是哪个公司的创始人_deepseek是哪个公司的产品

admin2019 2025-04-03 19:19:53 电脑数码

小中大

# 探秘DeepSeek：大模型领域的新兴力量
在当下这个科技飞速发展、人工智能浪潮汹涌的时代，新的模型与技术如雨后春笋般不断涌现。其中，DeepSeek宛如一颗璀璨的新星，在人工智能的苍穹中迅速升起，吸引了无数目光。那么，DeepSeek究竟隶属于哪个公司，又有着怎样不为人知的故事呢？

DeepSeek是杭州深度求索人工智能基础技术研究有限公司（简称“深度求索”）发布的一系列人工智能模型。而深度求索这家公司，其诞生与量化私募领域的巨头——幻方量化息息相关。2023年4月，幻方量化高调宣布进军大模型领域，三个月后，即2023年7月17日，深度求索作为独立公司正式成立，DeepSeek也随之登上历史舞台。

幻方量化，管理规模庞大，在量化投资领域成绩斐然。其创始人梁文峰本硕就读于浙江大学人工智能专业，毕业后创立了幻方量化。对AI的热爱与执着，让梁文峰坚信AI将改变世界，这种信念推动了DeepSeek的创立。值得一提的是，DeepSeek是国内少数专注于研究和技术的AI大模型公司，甚至在商业化与融资方面，都未全面涉足，一心专注于打造真正人类级别的人工智能，试图构建一种业界可直接使用其技术和产出，而公司仅负责基础模型和前沿创新的生态。

自诞生以来，DeepSeek在模型研发上不断发力，推出了多款令人瞩目的模型。2024年1月5日，DeepSeek发布首个AI大模型DeepSeek LLM，涵盖7B和67B两种规模，均有基础模型与指令微调模型。尽管当时它未引起太大轰动，但却为后续发展奠定了基础。

真正让DeepSeek声名远扬的，是2024年5月7日发布的DeepSeek - V2。该模型在架构层面进行创新，提出了崭新的MLA（Multi - head Latent Attention，一种新的多头潜在注意力机制）架构，大大降低了显存占用，并优化了计算量。更重要的是，它一发布就开源，打破了大厂对最强模型的垄断局面，在AI社区引发强烈反响，也正式打响中国大模型价格战，随后一周内，国产厂商纷纷跟进降价。

而2024年12月26日发布的DeepSeek - V3，更是将DeepSeek推向新的高度。这款拥有6710亿参数、激活370亿参数、每秒处理60个token的大型语言模型，在多项评测中表现出色，超越众多开源和闭源模型，成为开源模型中的佼佼者。它采用创新的知识蒸馏方法，将推理能力迁移到标准LLM中，同时保留输出风格和长度控制，且训练成本仅约558万美元，实现了低投入高产出的奇迹。

到了2025年1月，DeepSeek发布DeepSeek - R1（671B参数MoE，激活37B参数，128K上下文的深度思考模型），再次震动全球AI圈。该模型不仅成本低，技术上也有大幅提升，在1月27日，DeepSeek应用登顶15个国家和地区的苹果应用商店免费APP下载排行榜，超越了ChatGPT以及Meta、Google等公司的生成式AI产品，甚至引发美股震荡，英伟达等芯片产业链股票当日纷纷大跌。

除了自身强大的研发实力，DeepSeek的发展也离不开众多关联公司的支持。在股权关联方面，浙江东方通过旗下杭州东方嘉富基金参与DeepSeek天使轮投资，华金资本作为珠海国资旗下投资平台，通过华金领越基金间接参与DeepSeek Pre - A轮融资。算力基础设施供应商中，浪潮信息为DeepSeek北京亦庄智算中心提供AI服务器集群，配套英伟达H800芯片及自研AIStation管理平台；中科曙光承建DeepSeek杭州训练中心的液冷系统，单机柜功率密度达35kW，PUE小于1.15。此外，航锦科技能为DeepSeek提供光模块和交换机等硬件设备；并行科技可为DeepSeek提供多种并行计算技术手段；拓尔思与DeepSeek一起合作开发了舆情大模型；金山办公旗下的WPS智能写作，接入了DeepSeek - WriterAPI；南威软件旗下的福建万福信息技术有限公司应用DeepSeek技术，于2024年12月发布了DA - GPT，打造出先进的水库智能体，助力水库管理智能化转型。

DeepSeek所属的杭州深度求索人工智能基础技术研究有限公司，在幻方量化的支持下，凭借其独特的发展理念、强大的研发能力以及众多关联公司的协作，在大模型领域迅速崛起，成为不可忽视的新兴力量，为中国人工智能发展注入了强劲动力，也让我们对其未来发展充满无限期待。

» 转载保留版权：百科全库网 » 《deepseek是哪个公司的创始人_deepseek是哪个公司的产品》

» 本文链接地址：https://baikequanku.com/archives/104729.html