全国服务热线:0898-08980898
当前位置: 首页 > 产品展示 > 智能语音识别智能语音识别

业内热议的“新基模五强”如何引领国产大模型迈向新高

发布时间:2025-05-18 11:50:53点击量:

  (记者 安俐)今年年初,Deepseek的横空出世,掀起了“惊涛骇浪”。这个低成本、高性能的AI产品,训练成本仅仅有550万美元,而OpenAI等美国巨头则需要投入数亿美元,有专家指出,这改变了中美大模型竞争格局的同时,还一举打破了国产大模型的产业版图。此前备受业内瞩目的国产大模型“六小虎”在资本与技术的大浪淘沙下逐渐分化。不少业内人士认为,当前中国基础大模型市场,真正留在牌桌上的玩家,已经逐渐演变为“基模五强”,即字节、阿里、阶跃星辰、智谱AI和Deepseek。与之类似,美国市场也呈现出OpenAI、Google、Anthropic、X.ai和Meta“五强争霸”的格局。

  有观察者认为,令人惊叹的技术成就背后,隐藏着一个不容忽视的事实:大模型训练的成本高得惊人,甚至可以用“烧钱如流水”来形容。无论是基础设施建设、新服务的推出,还是市场推广以争夺用户,每一个环节都需要大量的资金投入。

  在这场竞赛中,新“基模五强”有着各自的底气。据了解,字节跳动与阿里作为互联网巨头,采用“大力出奇迹”的打法。据浙商证券统计,2024年字节跳动在AI上的资本开支达到了800亿元,甚至接近百度、阿里、腾讯的总和(约1000亿元)。2025年2月24日,阿里巴巴集团CEO吴泳铭宣布,未来三年,阿里将投入超过3800亿元用于建设云和AI硬件基础设施,总额超过过去十年总和。

  阶跃星辰背后的支持力量也不容小觑。记者发现,融资方面,2024年12月,阶跃星辰宣布完成B轮融资,总融资金额达数亿美元,核心投资方包括上海国有资本投资有限公司及其旗下基金,战略和财务投资人包括腾讯投资、五源资本、启明创投等。

  大模型的数量呈迅猛增长态势,其开发者、训练者的量级也在持续不断增加中,专家表示,这从侧面反映了我国人工智能领域内有行业认可的技术领军人物和充足的人力资源储备。

  字节跳动广纳贤才,公开资料显示,在张一鸣的带领下,包括光年之外原技术骨干田值、谷歌原VideoPoet项目负责人蒋路,零一万物原预训练负责人黄文灏,以及阿里通义大模型原技术负责人周畅等,相继被字节重金招募;DeepSeek团队则由灵魂人物梁文锋带领;阿里由集团CEO吴泳铭统管AI战略;阶跃星辰则由微软前全球副总裁姜大昕担任公司创始人、CEO,ResNet作者之一的AI科学家张祥雨、拥有丰富大规模集群与系统建设经验的AI系统专家朱亦博等都先后加入阶跃星辰;智谱AI则由清华大学计算机系知识工程实验室的技术成果转化而来,由清华大学计算机系博士张鹏领衔。

  在人工智能产业竞争中,“基模五强”企业通过卓越的技术创新能力和前瞻性的战略规划,构成了其主导市场格局的关键要素。专家指出,这些行业领军者已分化出两种差异化发展路径:一类致力于构建通用化智能平台,另一类则聚焦垂直领域深度优化。

  通过对公开信息的梳理可以发现,阿里以“开源王者”的独特定位,不仅在国内市场占据重要席位,更在全球AI开源生态中,稳居“全球TOP 3模型贡献者”行列;字节的大模型以“综合能力强”为特色,覆盖了文本生成、图像理解、视频生成、语音处理等多模态领域。

  阶跃星辰被业内称为是“多模态卷王”,近两年发布了22款自研基座模型,其中16款为多模态模型。最新开源的Step1X-Edit图像编辑模型,性能达到了同类开源模型的SOTA。更难得的是,阶跃星辰的多模态矩阵非常全面。多模态模型的核心,就是综合能力,既要求语音、图片、视频多个模态的能力,又要求模型能理解、生成、推理。在此布局上,阶跃星辰的每条线都达到了第一梯队。

  DeepSeek则像是特立独行的技术奇兵。聚焦语言模型,特别是数理能力,坚定开源路线,力求工程优化的极致。

  阶跃星辰创始人、CEO姜大昕认为,“大模型技术发展还在非常陡峭的区间,阶跃不会在这个过程中放弃主流的前进趋势,会坚持基础模型研发,追求智能的上限。”人力、财力齐备,最终比拼的还是技术。

  追求更高的“智能上限”和突破的“多模态能力”,已成为通往AGI路上必须抢攻的两大技术高地。

  “追求智能的上限仍然是当下最重要的一件事。”姜大昕在近期的采访中表示。大模型应用的繁荣,无法脱离基础模型的能力边界。只有不断突破基础模型的天花板,大模型应用才有可能呈现百花齐放的局面。

  姜大昕还表示,多模态模型是实现AGI的必经之路,但目前尚处于早期阶段,AGI的实现离不开开发者的共同努力。

  去年至今,阶跃星辰一共发布了十余款自研基座模型,包括千亿参数语言大模型Step-1、万亿参数语言大模型Step-2、图像理解大模型Step-1V、图像生成大模型Step-1X、多模态理解大模型Step-1.5V、视频生成大模型Step-Video、语音复刻和生成大模型Step-tts-mini、语音识别大模型Step-Asr、国内首个千亿参数端到端语音大模型Step-1o Audio等。

  其中,Step-2是国内首个由大模型创业公司发布的万亿参数模型。Step系列模型也多次在国内外权威大模型评测榜单上位列中国大模型第一。

  多模态和Agent,是2025年当仁不让的两个关键词。姜大昕也在不同场合反复强调:Agent,是当下业界在AGI道路上探索出来的初始形态。

  当前,阶跃也在重点布局Agent这一领域。在汽车、手机、具身智能、IoT等关键应用场景里,阶跃已经和Oppo、吉利汽车集团、千里科技等企业合作,将Agent应用在关键场景中。

  专家认为,未来对更高智能上限的无尽探索和多模态能力的深度融合,将是决定这场竞赛胜负的关键。

地址:海南省海口市  电话:0898-08980898  手机:13988888888
  ICP备案编号:粤ICP备88888888号