deepseek是那个公司的产品_deepseek是那个公司的,上市了么
# 探秘DeepSeek:背后的公司与技术传奇
在科技浪潮翻涌不息的当下,新的AI力量如星辰般不断涌现,DeepSeek便是其中一颗耀眼的新星。它自亮相以来,便在人工智能领域激起千层浪,引得无数目光聚焦。那么,DeepSeek究竟隶属于哪家公司,又有着怎样的故事呢?
DeepSeek是杭州深度求索人工智能基础技术研究有限公司(简称“深度求索”)发布的一系列人工智能模型。这家公司于2023年7月17日成立,其诞生与幻方量化紧密相连,是幻方量化旗下的子公司。幻方量化,在国内量化私募领域堪称巨头,管理规模庞大,在量化投资领域成绩斐然。而这一切,都离不开一位关键人物——梁文峰。
梁文峰堪称一位传奇人物,1985年出生于广东省湛江市吴川市覃巴镇米历岭村,从浙江大学信息与电子工程学系本科读到硕士,可谓是科班出身。2008年,他便带领团队踏上了使用机器学习等技术探索全自动量化交易的征程。2013年,与浙大同学共同创立杭州雅克比投资管理有限公司,紧接着在2015年成立杭州幻方科技有限公司,专注于通过数学和人工智能进行量化投资。在梁文峰的带领下,幻方量化不断发展壮大,2016年推出第一个AI模型,实现量化策略AI化转型,到2017年底,几乎所有量化策略都采用AI模型计算。2018年确立以AI为核心的发展战略,2019年自主研发“萤火一号”训练平台,2020年超级计算机“萤火一号”投入运作,2021年“萤火二号”投入增加到10亿元,幻方的资产管理规模也突破千亿大关,跻身国内量化私募“四大天王”之列。
时间来到2023年,5月梁文峰宣布进军通用人工智能(AGI)领域,7月幻方量化正式成立大模型公司DeepSeek,也就是杭州深度求索人工智能基础技术研究有限公司,正式进军通用人工智能领域。可以说,DeepSeek的诞生,是梁文峰对AI热爱与执着追求的结晶,他坚信AI将改变世界,致力于推动AI技术的发展。
与众多商业导向明显的AI公司不同,DeepSeek在创立之初就展现出独特的气质。它是国内少数专注研究和技术的AI大模型公司,也是唯一一家未全面考虑商业化,甚至没有进行融资的公司。公司专注于打造真正人类级别的人工智能,发布了包括专家预言大模型、代码大模型、视觉语言模型在内的多个模型。DeepSeek希望构建一种生态,让业界能直接使用其技术和产出,而公司自身只负责基础模型和前沿的创新。
在模型研发上,DeepSeek成绩斐然。DeepSeek LLM作为通用大语言模型,拥有7B和67B两种规模,均含基础模型和指令微调模型,发布时就达到了当时开源同级别模型相当的性能。DeepSeek Coder专为编码任务开发,极大提高了编码效率和质量。而DeepSeek-V3更是在2024年12月26日正式发布的最新大型语言模型,拥有6710亿参数,激活370亿参数,每秒处理60个token,比V2快3倍。该模型在多项评测中表现出色,超越众多开源和闭源模型,成为开源模型中的佼佼者。它采用创新的知识蒸馏方法,将推理能力迁移到标准LLM中,同时保留输出风格和长度控制。
DeepSeek的发展也吸引了众多企业与之关联合作。浙江东方通过旗下杭州东方嘉富基金参与DeepSeek天使轮投资,华金资本旗下的华金领越基金间接参与DeepSeek Pre - A轮融资。算力基础设施方面,浪潮信息为DeepSeek北京亦庄智算中心提供AI服务器集群,中科曙光承建DeepSeek杭州训练中心的液冷系统。此外,航锦科技能为其提供光模块和交换机等硬件设备,并行科技提供多种并行计算技术手段,拓尔思与之合作开发舆情大模型,金山办公旗下的WPS智能写作接入了DeepSeek - WriterAPI,南威软件旗下的福建万福信息技术有限公司应用DeepSeek技术发布DA - GPT,打造水库智能体。
从一家低调的公司到如今AI领域的焦点,DeepSeek的崛起,不仅是技术的胜利,更是一群追梦者坚持与创新的成果。相信在未来,随着技术的不断迭代和生态的逐步完善,DeepSeek将在人工智能的舞台上绽放更耀眼的光芒,为行业发展注入源源不断的活力。
» 转载保留版权:百科全库网 » 《deepseek是那个公司的产品_deepseek是那个公司的,上市了么》