大模型创业走向B端_科技魔方-中文AI大模型门户网站

　　是时候冷静下来，重新思考大模型的价值了。

　　短短一个月，隔壁看大模型的记者已经跑了不下5场发布会。

　　8月31日，国内AI视频技术头部公司百家云召开战略发布会，推出全新大模型产品「百问大模型」。就在两个月前，百家云刚刚发布面向企业市场营销需求的「市场易」GPT大模型。

　　同样是在8月，百川智能发布公司旗下第三款大模型产品Baichuan-53B。这家创业不到半年的公司，在过去三个月里，连续发布了三个大模型。

　　......

　　密集的产品发布，只是今年大模型创业潮的冰山一角。从年初到现在，短短九月间，AIGC创业者数量一路狂飙，“百模大战”带来的硝烟弥漫开来。

　　有业内人士向Chaos新观察表示，中国目前已发布的大模型早已接近 200个。有通用大模型、垂直行业大模型;有已经落地的、即将落地的，甚至还有一些根本没有考虑落地的。上半年，无论行业、什么领域，似乎都能与大模型来个“沾亲带故”。

　　有人在狂热中野蛮生长，有人在狂热中黯然离场。大模型创业这场热潮似乎还没有消退，就已经有玩家倒下，成为了*批炮灰。

　　行业真的需要这么多大模型吗?大模型创业是否会带来泡沫?哪些大模型真正有价值，哪些只是“套壳产品”?国内外大模型较为成熟的落地应用，有哪些经验可以借鉴......

　　是时候冷静下来，重新思考大模型的价值了。

　　大模型狂飙，百模大战开启

　　2022 年底，OpenAI 正式发布 ChatGPT，迅速破圈，短短 2 个月便用户过亿，引发了全球科技爱好者的狂欢。随着 AIGC、大模型概念井喷，大批创业者涌入，大模型数量呈现爆发式增长。

　　与此同时，在二级市场，国内A股多家企业接连发布定增预案，拟定增募集资金用于训练大模型，募资金额常常动辄数亿、数十亿。

　　据科技部5月份发布的《中国人工智能大模型地图研究报告》，中国已发布79个10亿参数规模以上的大模型。其中，自然语言处理仍是最为活跃的重点领域，其次是多模态领域，在计算机视觉和智能语音等领域的大模型还较少。有业内人士估算，目前，国内大模型数量早已逼近200个，甚至有券商报告称，行业正在步入“万模大战”的时代。

　　在同一时期，硅谷也爆发了一波AIGC创企投融资与收并购的高潮。除了最受关注的OpenAI外，欧美许多行业巨头通过收并购AIGC创企，抢滩打造细分领域的护城河。

　　其中，最受关注的包括AI初创公司Anthropic获得4.5亿美元C轮融资，其大模型产品Claude被视为OpenAI GPT-4的主要竞争对手;估值超过550亿美元的云计算巨头Snowflake收购Neeva，后者是一家由两位前Google员工创立的生成式AI搜索公司;估值380亿的大数据巨头Databricks斥资13亿美元，收购生成式AI公司MosaicML，帮助企业进行大模型训练。

　　全球的目光再次聚焦到硅谷。可以看到，人工智能已经成为今年科技领域当之无愧的主战场。然而，频发的大额融资与收并购，也意味着许多初创公司面临着资金枯竭的局面，开始寻求抱紧巨头大腿。

　　有人开始倒下

　　AIGC绕不开商业化大考

　　在千行百业之间的大模型之战一触即发之际，已经有创业者开始倒下。

　　今年7月，来自美国的AI聊天机器人明星创业企业Jasper宣布裁员，给大模型的创业热泼了一盆凉水。Jasper靠OpenAI的GPT-3发家，而当更强的GPT-3.5/4发布，Jasper就瞬间丧失了产品竞争力，颇有点“长江后浪推前浪，前浪死在沙滩上”的意味。

　　同样是在 7 月，国内一款名为“妙鸭相机”的 C 端应用上线，爆火出圈。“只需 9.9 元，上传照片就能获取 AI 写真集”、“让海马体们失业”......不过很快，妙鸭相机就受到了用户数据隐私与安全的质疑，其产品价值也被认为“天花板太低”，同质化产品迅速涌现。

　　热潮之下，创业者们需要更多的冷思考。大模型在今年成为了风口，但它并非是新概念，以百度、腾讯、阿里、华为为代表的国内互联网大厂及科技巨头，均已布局多年。百度在今年 3 月推出文心一言，其前身可追溯到 2019 年的预训练模型 ERNIE 1.0;华为在 2021 年 4 月就发布了盘古大模型;2022 年，腾讯混元大模型问世，阿里则在同年发布通义大模型。

　　要想打造一个技术成熟的大模型，算法、数据、算力缺一不可，这无不需要庞大的人才与资金投入。国盛证券曾估算，GPT-3 训练一次的成本约为 140 万美元，对于更大的大型语言模型，训练成本甚至在 200 万美元至 1200 万美元之间。

　　不是所有入局者都能玩得起、玩得转大模型。

　　在国内，一级市场大额融资越来越难，是国内许多AIGC创业企业面临的尴尬处境。有业内人士评价，目前国内许多AICG创业主要围绕小参数大模型，并且喜欢在各类参数评测上进行比拼，缺乏核心竞争力。

　　而在二级市场，许多A股上市公司借机炒作概念，也让投资人对于AI项目的出手慎之又慎。

　　随着竞争提速，国内外的大模型更加需要重点思考如何商业化落地，如何开始通过自身业务造血。

　　国内的互联网和科技巨头倾向于结合大模型的力量，进一步发布自身所长。百度聚焦搜索、小度智能音箱等场景;腾讯则仰仗微信、QQ 等社交领域的优势;阿里发挥办公、电商等应用所长，华为则拥有 5G、通信等产业基座实力。

　　新入局的企业，需要避开正面交锋，找出差异化发展之道。

　　百川智能创始人、CEO 王小川与曾在与极客公园的对话中表示，一家公司不可能把所有赛道都做完。”百川智能在B端选择做开源模型，赋能行业企业，同时内部部署了C端的超级应用。“我们在思考如何追上 GPT-4，思考大模型到底能给 C 端带来哪些应用。”

　　走向B端，能否成为制胜法宝?

　　在一场商业化浪潮之中，只有极少数人才能站上浪潮之巅，笑到最后。

　　“百模大战”并非只有大厂能赢，提升自身技术实力、抓住产业应用场景才是硬道理。

　　随着时间的推移，公众对于许多AIGC领域C端应用已经开始“去魅”。即使是“老大哥”ChatGPT，也变得不再如原先那般吸引人。分析公司Similarweb数据显示，在今年6月份，ChatGPT网站的阅读流量与访问者数据首次出现了下降。

　　目前，无论是通过GPT生成文本，还是通过Stable Diffusion生成图像，亦或者通过Llama模型进行多模态任务应用，都还没达到促进产业变革的节点。

　　这就是AIGC实力的天花板吗?显然不是。

　　许多企业开始避开C端应用的聚光灯，探索让大模型走进B端，深度赋能产业。

　　今年6月，腾讯才姗姗来迟般首次正式公布行业大模型研发进展，并发布面向B端客户的腾讯云 MaaS(Model-as-a-service，模型即服务)服务解决方案。不同于百度、阿里等聚焦的通用大模型，腾讯云MaaS的技术底座则是一系列的行业大模型，包括金融、政府、文旅、传媒、教育等，与产业结合，致力于让大模型可以长期可持续发展。

　　百家云发布的百问大模型也是一个典型的案例。作为一个AIGC场景化平台，百问主打的就是帮助企业私有化部署GPT大模型。

　　目前来看，大模型要想变成生产力工具，就必须进入应用场景，而百问确实做到了“让新技术更接地气”：一方面百问具备将现有的软件Copilot化，给传统的软件增加更加智能的能力，如在业务系统、办公软件、搜索引擎中加入智能问答，以及帮助企业低成本接入数字人互动直播、智能客服、自动写作等各类AIGC服务等;而另一方面，则是百问可以帮助企业基于AIGC开发全新应用，更好地解决客户问题。

　　可以明显看到，一些企业在布局AIGC赛道时，选择避开聊天机器人、AI制图等C端爆款应用，转而聚焦相对“无聊”的to B产业端口。

　　这种打法，也是国外一些AIGC创企的选择。一个有意思的案例是Databricks与MosaicML之间的联姻。

　　今年6月27日，大数据巨头Databricks斥资13亿美元，收购生成式AI公司MosaicML，成为年度AIGC收购热点。让人出乎意料的是，这场收购竟来源于一场“巧合”。在今年3月份之前，Databricks没想买，而MosaicML也没想卖，双方CEO甚至素未谋面。

　　Databricks的CEO Ali Ghodsi与MosaicML的CEO Naveen Rao，在今年的一场AI会议中认识。在交流之后，他们意识到两家公司的目标极为相似：1、让AI变得触手可及，人人都能训练自己的大模型;2、保护用户的数据隐私安全;3、聚焦toB赛道。

　　这是一条小众的路。“ChatGPT带动了生成式对话应用的狂热，但我们都对这些不感兴趣。”Ali Ghodsi说，“我们聚焦B2B业务，这个赛道很无聊，也没有多少人关注。”

　　MosaicML瞄准的是中小企业训练、部署自身垂直行业大模型的需求。比如通过MosaicML，仅需5万美元，花35天的时间，就可以根据客户需求训练出一个Stable Diffusion模型。

　　Databricks发现，双方不仅有着同一个客户群体，很多客户在训练自己的大模型时，会同时用到Databricks与MosaicML，这构成了双方合作的基础。

　　很多巨头都想买MosaicML，但最终只有Databricks的offer打动了他们。MosaicML的CEO Naveen Rao本身就是AI大神级人物，当初从Intel跳槽出来创业，就是不希望被大公司体系束缚。

　　而Databricks收购MosaicML这件大事，却在短短几周就推进了下去——双方的谈判，只需要一个简单的Zoom链接。这让Naveen Rao好感倍增，认为Databricks没有Intel般的“大公司病”。

　　国外另一家在数据库领域关注度极高的公司Snowflake同样聚焦B端，也常常被拿来与Databricks比较。Snowflake市值超过550亿美元，目前主要聚焦“数据云”业务，并通过对Neeva(企业级AI搜索引擎)的收购，强化AI能力，加速企业与数据的交互和搜索。

　　随着Databricks、Snowflake等科技巨头陆续落子，各家在AIGC领域下一个十年之争的版图也逐渐明晰——从B端企业入手，真正让AI引领产业变革。

　　结语

　　ChatGPT的诞生，意味着奇点时刻降临，它引发了更底层的变化，大模型之争已经开启。没有疑问的是，人工智能是未来必争的战场。

　　然而，大模型并非越多越好。通用大模型耗资巨大，只是少数玩家的游戏。可以预见的是，不久的将来会有越来越多的低质量大模型出现，也会有一大批跟风企业倒下。未来，“百模大战”、“千模大战”、“万模大战”究竟是否会引发多大泡沫，又有多少投资人会血本无归?

　　大模型的产业价值仍待挖掘，与B端深度融合给它带来了更为广阔的想象空间。在数据隐私、数据安全方面，大模型无疑会引发公众更大的担忧。安全性和可信性将成为学术界和工业界关注的重点。

大模型创业走向B端

延展资讯