大模型“上海队”进入丰产阶段(神州看点)

  • 2025-07-05 00:53:26
  • 973

前不久,上海AI公司MiniMax(上海稀宇科技有限公司)在其官网和开源平台GitHub上,抛出全球首个开源大规模混合架构推理模型——MiniMax—M1(以下简称“M1”)。该模型在权威评测榜单中,位列全球开源模型第二,仅次于DeepSeek—R1—0528。

之后,这家公司又连续发布视频生成模型Hailuo02、通用智能体MiniMaxAgent等。由Hailuo02生成的“猫跳水”视频,在海外社交平台发布后一周内,获3亿现象级播放量。

这家公司为何能做到?梳理其发展脉络可发现,这家注册于上海徐汇的大模型企业,有着“不跟随”的特质——在2022年底ChatGPT爆火前就已投身AGI(通用人工智能),还是国内主动放弃大模型主流稠密架构和传统注意力机制的创业公司。

实力

大模型竞争,正从单纯的参数规模比拼,转向效率、成本、落地综合实力的较量。

M1的特点,就是高性能、低成本。它支持目前业内最高的上下文输入,达100万token(模型输入输出基本单位)。也就是说,理解和处理一本英文版《三体》绰绰有余。这一能力,可媲美谷歌最新闭源模型Gemini2.5Pro。而成本上,与动辄千万美元投入相比,M1强化学习阶段仅花费53.5万美元。

而Hailuo02则直接“叫板”谷歌第三代视频生成模型Veo3。

过往AI视频里,体操、杂技等复杂动作常会出现肢体错乱、五官扭曲等状况。让谷歌Veo3和Hailuo02各生成一段“猫跳水”视频,前者的视频中,猫咪动作含糊,直扑入水;后者则在空中完整翻腾三周半后入水,动作全程符合逻辑。

基于Hailuo02的重大突破,“动物奥运会”这一AI视频新品类被开创出来。

打磨

为“锤炼”Hailuo02,MiniMax请来一支导演、编剧、美术复合班底,与技术团队一同打磨。

MiniMaxAI艺术总监郑晓东天天跟算法工程师开会,如听“天书”。但他仍理直气壮“代表用户”提要求:一要有电影质感,二要挑战高动态、超复杂、大幅度动作,三是AI生成的片段切入电影或短剧比例要达到5%。

他认为,高质量的数据、创新的算法、精细的训练环节等,是Hailuo02成功的重要原因。

记者采访时,该公司多名员工都提及“做好模型本身”。MiniMax创始人兼CEO闫俊杰亦反复表示:好模型的本质是技术驱动,而模型是产品出现的驱动力。

这条逻辑最终通向产品的落地能力——MiniMax视频生成应用HailuoAI。迄今,HailuoAI已帮助200个国家和地区的创作者生成超过3.7亿个视频。

逆行

M1发布当天,闫俊杰在其社交账号写下:第一次感觉到大山不是不能翻越。

去年以来,迫于内部成本与外部竞争,全球大模型公司持续减少。MiniMax是为数不多仍在坚持基座模型研发的创业公司。

从某种意义上说,MiniMax此次挑战成功,是用逆行换来的。

2023年下半年,国内同行多坚信大模型稠密架构,MiniMax却另辟蹊径,研究“稀疏激活”的MoE架构,以节省计算开销。

不过,大模型发展是一场长跑,决赛远未到来。MiniMax的目标就一个——留在赛道上。

另据记者了解,MiniMax与书生·浦语、商汤、阶跃星辰等四大基座模型,共同构成大模型“上海队”,目前已进入丰产阶段。比如,今年4月,商汤全新升级“日日新SenseNovaV6”;成立2年多的阶跃星辰,不断推出新产品,已累计发布22款自研基座模型。上海还在去年底印发《关于人工智能“模塑申城”的实施方案》,提出到2025年底建成世界级人工智能产业生态,建设3至5个大模型创新加速孵化器,建成一批上下游协同的赋能中心和垂直模型训练场。

《人民日报》(2025年07月03日10版)