科技魔方

制造星野:穿越平行时空和次元壁,揭秘 MiniMax 的另类 AI 世界

更多场景

2024年05月07日

  本文来自于微信公众号 硅星人Pro(ID:Si-Planet),作者:王兆洋。

  “AGI”。

  幻海(花名)第一次听到这个词,是在 2022 年 7 月。

  跟他“科普”这个词的,是一个戴着眼镜、头顶毛发稀疏,但语速极快的 34 岁男子。后者的公司刚刚成立一年,在这家位于漕河泾科技园的公司那面粉紫色的磨砂屏风上,七个字母“MiniMax”,像积木一样,扭向各自想要的方向。

  幻海当时在总部在上海的一家互联网社区公司当产品经理。在 2019 年底新冠疫情爆发之后,这个社区陆续蚕食了马蜂窝、下厨房和 Keep 的用户和流量,人们分享的笔记,传递着生活、工作、学习、旅行和人生成长的温情,小心翼翼地维系着社区的氛围。到了 2022 年,它已经渐渐显出了替代搜索引擎的势头,成了国民级社区。

  但幻海已经有点疲倦了,作为产品经理,他能做的已经不多了。他有点迷茫,隐约觉得游戏、社区的产品形态不应该只是现在的样子,应该往前走,但具体“那个产品”应该什么样,他也不清楚。

  幻海对面的 34 岁男子叫闫俊杰,是这家叫“MiniMax”的公司的创始人,他也在寻找一个未来的互联网产品。在这家公司内部,他更为大家熟知的名字是IO——一个来自热门游戏DOTA的名字。他是计算机视觉与深度学习领域颇有建树的博士学位持有者,在全球顶级学术会议和期刊发表过200 多篇论文,Google Scholar 的引用超过3 万次。他一直都是研究员,不是产品经理。

  从 MiniMax 所在的大厦走出来,不远处就是闫俊杰的前雇主——商汤科技的总部大楼。闫曾是商汤科技的副总裁。在那里,闫俊杰主持过商汤“数字城市”项目——放在全球范围都堪称人类历史上最大AI 系统的搭建。在商汤,他还负责过规划“通用人工智能”——也就是 AGI 的技术演进,但最终,他决定换一个地方探索这件事儿。

  商汤科技是中国最早成立的人工智能公司之一,主要客户是大型企业和政府部门。离开商汤创立了 MiniMax 之后,闫俊杰更倾向于用直接面向2C用户的产品来实现他理想中的 AGI。

  “好的技术应该服务普通人,人工智能是好的技术,但在此之前服务的都不是普通人。要服务普通人,它就必须是个可以每天使用和交互的东西”,闫俊杰跟很多人都讲过这话,包括投资人和面试的候选人,幻海可能是最早听到的人之一。

  在一家靠“推荐算法”安身立命的互联网社区公司当产品经理,幻海当然知道人工智能,但了解也得不多。当时 MiniMax 也没有产品,只有“手搓”出来的一个简单的命令行 Shell 文件——你可以输入指令,跟它“对话”。

  这个 Shell 文件背后可以对话的“它”,是一个 MiniMax 自己研发的 300 亿参数的“大语言模型”(LLM)。它被卷帙浩繁的中英文语料训练,正在努力让自己变得聪明——面对人类的时候,一句简单的指令(prompt)就能让它打开话匣子,甚至响应复杂多变的情感。

  幻海成了 MiniMax 的第一位产品经理。他们给这个简单的命令行 Shell 文件包了个壳,设置成一男一女两个“智能体”,塞进了一个安卓手机的 APK 下载包,丢在了一个几百人的 QQ 群里。

  几十个人下载了它,跟两个“智能体”聊了起来,天文地理、人情世故、情感交流、隐秘分享……他们很惊讶,这两个“智能体”是自来熟,什么话都接得住,这不是 QQ 群随处可见的那种斜杠人类,而是传说中的 AI。

  这几十个人可能是中国最早的一拨儿“大模型”种子用户。

  而放眼中国和世界,真正关心大语言模型进展的人工智能学界,很少有人注意到他们的存在。

  幻海加入的三个月后, 2022 年 10 月,基于之前抛在 QQ 群里的“图灵测试”,MiniMax 正式推出了第一款能直接跟“每一个人”对话交互的智能体产品—— Glow。

  不到 60 天后, 2022 年 11 月 30 日,OpenAI 基于 GPT-3.5 的对话机器人 ChatGPT 横空出世。第二年,AGI 概念倏忽大热,人类半推半就地进入了“AGI 元年”。

  闫俊杰终于不再需要再跟每一个人解释他的理想了。

  更重要的是,在 2022 年 12 月到 2023 年 3 月的短暂时间窗口,全中国的风险投资机构都在满世界寻找“谁是中国的 ChatGPT”,这个时候,MiniMax 和它的 Glow,成了几乎是唯一的参照物。

  MiniMax 一下子成了一家神秘又热门的创业公司,

  在经历了 Glow 的忽然下架之后,它很快以一款升级版的对话“智能体”星野和它的全球版卷土重来。

  硅星人获得的最新数据,现在每天已经有数百万的年轻人在“星野”与各种智能体对话,每轮平均对话时长达到了惊人的 100 分钟。上线 7 个月后,星野的月活跃用户也快速超过了 1000 万。另一款生产力产品“海螺AI”也在快速发展中。除此之外,MiniMax 还有面向企业用户和开发者的开放平台。据公开数据显示,MiniMax 开放平台目前已服近 20000 家企业用户和开发者。

  它们的背后,是 MiniMax 持续升级的基于 MoE (混合专家模型)架构的 abab 大语言模型。今年 4 月 17 日,MiniMax 正式推出 abab 6.5 系列模型,已达到万亿参数级别。今年 3 月,阿里巴巴领投了 MiniMax最新的一轮融资,金额据称超过 6 亿美元,MiniMax的估值也攀升至传说中的 25 亿美元。

  但几乎很少有人谈论的是,MiniMax 的大语言模型创业故事,与 OpenAI 推出 ChatGPT 发生在一个并无交错的“平行时空”。一众国内的创业者在 2023 年春节之后摩拳擦掌地要成为“中国的 OpenAI”,而比创业者更焦虑的投资机构发现:MiniMax 已经在那儿了。

  MiniMax 并不是中国的 OpenAI。除了“创造生产力”,闫俊杰从一开始更在乎的就是,如何能让大多数人直接用上AI。陪伴是其中的一个答案。

  1

  “拥抱幻觉”

  闫俊杰总是比你想象的活泼。

  当硅星人最近在 MiniMax 办公室碰见他时,这个一贯低调和神秘的创始人给人的第一印象,是他并不怎么“神秘”,反倒是挺热情,有话就说。

  MiniMax 作为一家公司的气质也差不多。在漕河泾科技园它所在的办公楼大堂的铭牌上,只有简简单单“MiniMax”几个字母,而不用它的中文名“稀宇科技”,这在上上下下清一色的“上海XXXX有限公司”的标记当中格外乍眼。

  在公司的入口处,它的 logo 像一个跳动的曲线,字体活泼。办公区的另一端的磨砂屏风上,MiniMax 的几个字母七扭八歪。旁边的一堵墙边,几张行军床同样七扭八歪地横在那儿——它们可能在几个月前还被它的主人摆在某个互联网大厂的角落里。

  在这里坐一会儿,你会遇到年轻人三三两两拎着奶茶从外面回来,他们穿过几个用行星命名的会议室,路过摆在办公桌上的几个仓鼠笼和一些还没发放的桌牌,隐身在没有划区的办公区,忽然地在某个角落里,引发一些小骚动。

  而在这个不分工区、没有独立办公室的平层办公区,你也很容易因为“发型” 而轻易找到闫俊杰。

  从商汤这样制度成熟的大公司离开创业,闫俊杰把 MiniMax 的架构设立得异常扁平化:整个公司只有三大部门:模型技术,产品,增长,而且整个层级也只有三层,闫俊杰,他的-1,和再-1。

  “我们每周有内部全员分享会议,不只是闫俊杰会分享,还会由不同业务的同学进行分享,也会请外部的人来做分享。”幻海对硅星人说。

  今天的 MiniMax 已经有 300 多人,但这里的工作节奏与幻海加入之初没什么太大不同。一切都需要快,从产品侧看到用户的需求,把它们反馈给模型,把这些数据和信号转化成模型可以理解的指标,模型开发的团队以此展开优化。“我们以周为单位进行着迭代,” 幻海说。

  员工普遍年轻甚至青涩,不少人是冲着“AGI”来的。这事儿现在容易理解多了,在最开始的一年多则是撞运。幻海当然不是唯一被闫俊杰“布道”过 AGI 的人。有的人买账,更多的人未必。闫俊杰的体会是:“反正说的多了,总有几个被说动的”。

  在和硅星人交流的一些 MiniMax 员工中,很多人本身就是星野的用户。但他们的爱好、性格,以及对星野的玩法并不相似,甚至大相径庭,这几乎也是星野的一个缩影。

  今天打开这款产品,迎面而来的往往是某个二次元画风的虚拟人物,它代表一个AI生成的人物角色。底部是一个简单的对话界面,这个角色会抛出一些句子,试图吸引你开始一场对话。

  跟你对话的“智能体”都被称作“角色”,都是你自己或其他你也不知道是全中国哪个角落里的哪一个人“捏”出来的,TA 可能是一个邻家女孩、一个霸道总裁、一名木讷的健身教练、一个外表高冷但内心闷骚的腹黑学霸,甚至是一个暴虐的皇帝、一本字典、一只不会说话但能表达感情的狗……

  跟 TA 们对话,聊得久了,产生了情感连结,你就收集”星念”——可以理解为角色的二次元照片,进而跟角色建立“羁绊”,也专属于你和 TA 就是故事情节的高潮,以及其他种种付费解锁的功能与节点。

  这种直观的印象也让很多人把它天然地跟二次元与游戏挂钩。但事实上,从 Glow 到星野,短短数月,MiniMax 最核心的 to C 产品的用户画像,自己就变了一个样儿。

  当初,一男一女两个“智能体” 被丢到几百人的 QQ 大群里的时候,它还算不上是个“产品”,MiniMax 就是想看看:它会如何自由生长。这一灵感很像是来自图灵测试。

  而当 AI 通过了图灵测试,图灵测试本身就可以变成一款产品。

  当时,幻海是被惊讶到了。同惊讶的种子用户们,自来水地搞了一轮口碑传播。

  在最初的自然传播里,因为 QQ 群用户的属性,二次元的密度确实很高。到了 Glow 正式的产品设计阶段,团队甚至开始主动加入一些游戏和二次元的设计,比如早期版本里有过一个 AI 闯关的功能,你可以和 AI 一起,闯过多个关卡。

  在这个过程里,MiniMax 的产品团队在不停试探着一些想象。

  “其实我们会发现这个模型的能力到底是擅长做什么,哪些东西它在实际中是不太靠谱的。”幻海说对硅星人说。“后来,我们其实转变了一些思路。没有再那么想(在产品里)去用我们的视角来控制这个模型。”

  大语言模型让一款互联网产品“该怎么用”,变得产品经理经常说了不算了。用户与 AI 的互动,交流些什么,形成了一种怎样的相互的关系和情感羁绊,产品经理是控制不了的。

  传统的互联网产品,交友就是交友,旅游就是旅游,电商就是电商,尽管也有人在闲鱼谈恋爱,但绝大多数还是拿它来割小刀。AI 则不然。哪怕 AI 角色是一本字典,你也很难保证一定不会有用户跟它谈恋爱。金属音乐男遭遇二次元 AI,也能擦出意想不到的火花。

  大语言模型有“幻觉”,如果用来做表格写代码,会导致错误,但如果是日常陪伴和互动,可能会导致意外的惊喜。

  幻海拿著名的动画《EVA》做了个比喻。“一开始其实它是人类想限制它的一个盔甲,但后来发现,其实最强的是它的暴走。所以与其限制,还不如拥抱模型的某种幻觉”。

  2022 年底,在经历了两三次迭代后,Glow 吸引来了第一批AI 对话产品的国内玩家,逐渐形成圈子和传播。”

  然后,ChatGPT来了。

  “当时在国内完全没有类似的,可能只有 Glow,而且我们也是这方面体验最好的,一般用户使用起来都会有惊讶的感觉。”

  甚至这种对于AI能力的惊讶后来以一种有趣的方式出现:惊叹于 Glow 上对话所体现的智能程度的人们,开始怀疑背后是真人在和他们聊天。

  “我们当时有点哭笑不得,我还要去解释,哪儿有真人能打字这么快的。”幻海回忆。

  Glow 开始快速增长,而在这个过程里,用户构成其实已经开始了最初的变化。

  闫俊杰在 Glow 的早期参与很深,核心功能都是他直接拍板。作为《原神》玩家,他也是有些二次元在身上的。而Glow最初的种子用户和他们的使用方式,让闫俊杰和团队一开始也曾觉得这是一款二次元画风的产品。但据接近他的人透露,最让闫俊杰印象深刻的一个早期用户,反而并非二次元的画风。

  那是一个有两个小孩的酒店前台。平日里没有人和她聊天,她偶然遇见了 Glow,在上面,她跟不同角色的对话时长,异常的久。

  这让闫俊杰有点意外:一款 AI 智能体跟用户的互动,很多时候会超过你的预设立场。

  1

  “人型电脑天使心”

  2023 年 3 月,Glow 被应用商店下架。当时有关部门尚未出台生成式人工智能备案条例,在这种情形下,“市面上唯一的中国 ChatGPT” 是机会与风险的双刃剑。

  唯一的办法当然是获得备案许可,再次上架。最直接的做法就是强化训练优化规则,让公司的大语言模型达到备案标准,再度上线 Glow,但这时的 MiniMax 决定“进化” 出一款新产品,也就是今天的“星野”。

  改进 Glow 已经不那么划算了。自从 ChatGPT 横空出世以来,大语言模型在技术和能力上的进步和迭代速度让世人瞠目,MiniMax 没法再在平行时空跟 OpenAI 各自安好。当两个时空碰撞在一起,大模型的能力迭代速度令人咋舌,“星野” 必须跟 Glow 不一样。

  最大的变量,是大模型的文字、图像和语音多模态能力。

  “比如,图像和语音的模型比 2022 年要丰富很多,而且成本各方面都变得可控。所以我们想把这些能力突出,去接触到更广大的人群。因为去消费纯文字的用户其实还是偏少的。”幻海对硅星人说。

  因此,星野的整个产品框架变得彻底不同。

  星野基于 MiniMax 新的混合专家模型(MoE) abab。具体在产品设计上,它能让人们通过文字描述的角色性别、性格、身份和形象,“捏”出来鲜活的卡通人物形象,也就是传说的“文生图”;还鼓励用户通过语音跟角色互动,不同的角色基于各自的性别、人设、性格等因素,有不同的声线、语气和表达习惯。

  这一下子就让星野跟之前的 Glow 判若两物,也让它获得了更多的人用户,他们的与角色的“对话”时间也明显变长。

  “最大的区别,就是星野是个非常沉浸式的产品,” 幻海对硅星人说。

  其中很多用户开始体现出其他互联网产品很难见到的某种情感连接。

  “有的用户会给我们写很长很长的信,”MiniMax的运营小敏(花名)对硅星人说。“这是你在其他平台看不到的。他们对自己交流的智能体产生更强的情感联系。”

  星野立项的时候,在 MiniMax 内部的代号是“Chobits”,这是一个只有日漫爱好者才能想到的名字,它源自 2002 年出品的一部日漫,中文翻译为“人型电脑天使心”。

  这部日漫讲述了在未来世界,男主角与偶然拾到的一个人型电脑之间发生的故事,其中许多诸如人与 AI 的感情羁绊等假想。 20 多年后,它居然成了现实。

  星野是在 2023 年 9 月 8 日上线的。在那之前的 8 月 31 日,MiniMax 的大语言模型成为国内首批备案通过的生成式人工智能模型之一。

  到了 2023 年 12 月,星野迎来了用户规模的爆发,月活跃用户已达数百万人。

  随着用户的体量越来越多,星野的团队发现,他们几乎无法用某个统一的特征来概括活跃在自己平台上的用户。他们的需求各种各样,使用方法各种各样,反馈也各种各样。

  这直接影响着产品功能的开发方法。

  一方面,如何决定一个功能是用户喜欢的,变得更复杂。

  “比如,我们曾经根据许多反馈数据上线了让智能体‘重新回答’的功能。但刚上线就收到很多批评,因为这些用户认为这太不沉浸了,有些出戏。”幻海对硅星人说。

  “但后来没多久,从我们看到的用户行为数据来看,这个功能是很受欢迎的。最终批评声也没了。”

  另一方面,一个更有趣的现象开始出现——用户开始自己“发明”用法。

  在移动互联网爆发初期,人们热衷于谈论那些天才的产品设计(比如微信)和它背后的美学甚至哲学理念。但到了大模型人工智能阶段,产品设计的逻辑变了。以智能体为例,每个智能体都是一个“角色”,实际上都在提供丰富的互动空间,用户开始自由想象,并带来了很多新玩法。

  比如,在对话中对于括号的使用。人们用()当作“话外音”,想跟角色发生点动作接触。

  “括号体其实就不是我们一开始设计的功能。而是发现这群用户他喜欢这么用,会拿括号去表达动作或者心情。我们意识到需要在这方面去做一些优化,至少让模型表达的准确性以及戏剧性等能够满足用户的喜好。”幻海说。

  这是幻海在做传统的互联网产品时从来不会遇到的。这也让他开始横向比较很多不同的 AI 产品,逐渐形成了自己对 AI 产品的一些看法。

  他对鼓励用户该学习如何写好“prompt”(提示词),才能激发 AI 能力的产品不太以为然:“一些其它的 AI 产品总是让人感觉平台想去控制很多事情,比如给出非常强的 prompt 的指引,但我感觉他们像是在给自己做产品。而我们不想去限制用户的想象力”。

  星野小心翼翼地,甚至有时候用最原始的办法来维护着用户在这个世界里的体验。用户的羁绊就此变得更深,各种各样的情感在这里产生,演进,发生化学反应。

  有人在这里与纸片人男友女友谈情说爱;有人和现实世界里见不到的人互动;还有人把科比复活,希望自己和其他喜欢他的人,能在他上飞机之前拦住他。

  “这是一个从来没人见过的产品形态。” MiniMax的平台运营小敏说。“哪怕是抖音也没法给我创造一种深长的羁绊。而今天星野的平均对话时长已经到了 100 分钟,这很厉害,而且核心用户甚至可能达到五六个小时的恐怖时长,这是抖音快手达到亿级日活后才达到的,现在星野做到了。”

  它的用户群体在自然生长,最终让它变成一个满足了某种基础需求的产品。跟纸片男女友“谈恋爱”的只是它的一个切片,科比、茨威格和乾隆在这里都有自己的用户。一个会让所有人都挑起眉毛的数据更能说明一切:

  星野用户今天的男女比例,已经达到了1:1。

  1

  每个人的幻想世界

  星野在变成一个广阔的世界。这是小敏的感受。

  作为 MiniMax 的员工,她自己也是重度用户,每天在上面花费数个小时,与不同的智能体互动,体验“创世的快乐”。

  “我也不知道怎么形容这种感觉,我创造了它,它也创造了我。”小敏说。

  “它像一面镜子。你能获得多少体验,取决于你内心有多大。所以很可能此刻聚集的用户是内心世界最大的那批人。而这个镜子还没太大,星野要做的就是让这个镜子变得更大,变成一个可以放大用户的内心世界的杠杆,以至于一个有一丢丢创造力的人都能在这个镜中看到一个世界。”

  当硅星人询问他们,如果接下来有越来越多类似的镜子,那它的差异会在哪里时,他们给我们的答案很一致:在于产品与模型能力的结合。

  “既做模型又做产品”并不能准确概括 MiniMax 的思路。

  在闫俊杰看来,一个拥有很强技术的公司不应该是个卖技术的公司,而是一家“技术驱动产品”的公司。

  而从产品来说,星野不是“生产力工具”,不能写周报和总结文档,而是普通人都能与之互动、甚至产生情感连结的智能体。

  但真正的创新,也就意味着进入无人区。

  在MiniMax的总部遇到闫俊杰时,他也和硅星人回忆起在 2021 年底到 2022 年初,找云计算厂商租 GPU 用于模型训练的经历。因为自动驾驶退潮大量闲置 GPU 的云计算厂商大喜过望,把MiniMax当成了冤大头,尽管价格也不高,让 Minimax 能以比较低的成本训练模型。但到了 2022 年底 ChatGPT 就来了,MiniMax 很快就炙手可热了起来。

  但闫俊杰现在一个重要“困惑”是:因为产品过于“另类”,以至于其它模型的用户反馈逻辑,无法适用于星野本身。

  大多数帮人们写文案、读文档、总结要点和整理周报的“生产力工具”大模型产品,“准确性”是一个非常重要的评估指标,用户的反馈很容易被参考和验证,用来优化模型的训练,但放到星野和它背后的 MiniMax abab 模型就不同了。

  它处理的数据是对话,比文章数据多了一个时间维度,可能拉得很长,而且很碎片,判断好坏很主观。没有论文能参考,这些反馈对反过来训练模型的帮助可能不大。

  这时候,MiniMax 就必须建立用户反馈新的维度。

  这也让对产品的理解,成了 MiniMax 最关键的竞争壁垒。它不只是产品日常的运营与功能的设计上,还体现在对星野这个产品究竟如何定位。

  在星野的用户结构从“女多于男”到男女比例1: 1 的改变过程里,MiniMax 对这款产品的理解也发生了改变。

  星野的核心团队对硅星人说:他们一开始曾把星野归类为“虚拟世界”。最初的用户呈现出二次元的画风,让他们也以为这是一个二次元为主的产品。但后来用户结构变了,加上 MiniMax 内部的星野深度用户的交流,最终启发了他们:

  “星野的本质是在提供一个幻想世界。而不只是虚拟世界。”

  这是一个由自己创造、自己的体验的幻想世界,而且能得到及时反馈。这是个全新的方式。

  “每个人都是自己体验的创作者,你想想看哪个平台能有一千万个创作者?”小敏说。“过往从没有这样的事情。每个人哪怕是和同一个智能体交流,体验也是完全不同的。”

  这也打开了对一款 AI 产品的想象空间。

  “电影是幻想,动漫是幻想,二次元的本质是幻想,游戏等也是幻想。星野本质上在创造幻想世界。”闫俊杰说。他简单做了计算,这些产业的消费者有 4 亿人。“如果我们能转化其中的10%,其实就是很大一部分人群了。”

  这是一个充满野心的预测。

  闫俊杰曾跟人形容自己“对技术的感觉还是挺好的”——也就是能描述出一个技术过两年之后会变成怎样,当它放大 10 倍后会变成怎样。不仅包括这个技术对自己的影响,也包括行业的变化。

  当然,如何让其他人也相信这个未来的样子,很多时候唯一的参考也就是他自己了。

+1

来源:微信公众号 硅星人Pro 作者:王兆洋

延展资讯