deepseek是哪个公司的创始人_deepseek是哪个公司的产品

范文仓信息网~

# 探秘DeepSeek:大模型领域的新兴力量
在当下这个科技飞速发展、人工智能浪潮汹涌的时代,新的模型与技术如雨后春笋般不断涌现。其中,DeepSeek宛如一颗璀璨的新星,在人工智能的苍穹中迅速升起,吸引了无数目光。那么,DeepSeek究竟隶属于哪个公司,又有着怎样不为人知的故事呢?

DeepSeek是杭州深度求索人工智能基础技术研究有限公司(简称“深度求索”)发布的一系列人工智能模型 。而深度求索这家公司,其诞生与量化私募领域的巨头——幻方量化息息相关。2023年4月,幻方量化高调宣布进军大模型领域,三个月后,即2023年7月17日,深度求索作为独立公司正式成立,DeepSeek也随之登上历史舞台。

幻方量化,管理规模庞大,在量化投资领域成绩斐然。其创始人梁文峰本硕就读于浙江大学人工智能专业,毕业后创立了幻方量化。对AI的热爱与执着,让梁文峰坚信AI将改变世界,这种信念推动了DeepSeek的创立。值得一提的是,DeepSeek是国内少数专注于研究和技术的AI大模型公司,甚至在商业化与融资方面,都未全面涉足,一心专注于打造真正人类级别的人工智能,试图构建一种业界可直接使用其技术和产出,而公司仅负责基础模型和前沿创新的生态。

自诞生以来,DeepSeek在模型研发上不断发力,推出了多款令人瞩目的模型。2024年1月5日,DeepSeek发布首个AI大模型DeepSeek LLM,涵盖7B和67B两种规模,均有基础模型与指令微调模型。尽管当时它未引起太大轰动,但却为后续发展奠定了基础。

真正让DeepSeek声名远扬的,是2024年5月7日发布的DeepSeek - V2。该模型在架构层面进行创新,提出了崭新的MLA(Multi - head Latent Attention,一种新的多头潜在注意力机制)架构,大大降低了显存占用,并优化了计算量。更重要的是,它一发布就开源,打破了大厂对最强模型的垄断局面,在AI社区引发强烈反响,也正式打响中国大模型价格战,随后一周内,国产厂商纷纷跟进降价。

而2024年12月26日发布的DeepSeek - V3,更是将DeepSeek推向新的高度。这款拥有6710亿参数、激活370亿参数、每秒处理60个token的大型语言模型,在多项评测中表现出色,超越众多开源和闭源模型,成为开源模型中的佼佼者。它采用创新的知识蒸馏方法,将推理能力迁移到标准LLM中,同时保留输出风格和长度控制,且训练成本仅约558万美元,实现了低投入高产出的奇迹。

到了2025年1月,DeepSeek发布DeepSeek - R1(671B参数MoE,激活37B参数,128K上下文的深度思考模型),再次震动全球AI圈。该模型不仅成本低,技术上也有大幅提升,在1月27日,DeepSeek应用登顶15个国家和地区的苹果应用商店免费APP下载排行榜,超越了ChatGPT以及Meta、Google等公司的生成式AI产品,甚至引发美股震荡,英伟达等芯片产业链股票当日纷纷大跌。

除了自身强大的研发实力,DeepSeek的发展也离不开众多关联公司的支持。在股权关联方面,浙江东方通过旗下杭州东方嘉富基金参与DeepSeek天使轮投资,华金资本作为珠海国资旗下投资平台,通过华金领越基金间接参与DeepSeek Pre - A轮融资。算力基础设施供应商中,浪潮信息为DeepSeek北京亦庄智算中心提供AI服务器集群,配套英伟达H800芯片及自研AIStation管理平台;中科曙光承建DeepSeek杭州训练中心的液冷系统,单机柜功率密度达35kW,PUE小于1.15。此外,航锦科技能为DeepSeek提供光模块和交换机等硬件设备;并行科技可为DeepSeek提供多种并行计算技术手段;拓尔思与DeepSeek一起合作开发了舆情大模型;金山办公旗下的WPS智能写作,接入了DeepSeek - WriterAPI;南威软件旗下的福建万福信息技术有限公司应用DeepSeek技术,于2024年12月发布了DA - GPT,打造出先进的水库智能体,助力水库管理智能化转型。

DeepSeek所属的杭州深度求索人工智能基础技术研究有限公司,在幻方量化的支持下,凭借其独特的发展理念、强大的研发能力以及众多关联公司的协作,在大模型领域迅速崛起,成为不可忽视的新兴力量,为中国人工智能发展注入了强劲动力,也让我们对其未来发展充满无限期待。

» 转载保留版权:百科全库网 » 《deepseek是哪个公司的创始人_deepseek是哪个公司的产品》

» 本文链接地址:https://baikequanku.com/archives/104729.html

作者:admin2019
返回顶部