科技魔方

2023:世界“卷入”大模型 | 年度盘点

更多场景

2024年01月07日

  撰文 | 程书书

  编辑 | 李信马

  题图 | DoNews

  2023年,全球最受关注的公司是哪家?如果在全球科技圈进行一次投票,那么拔得头筹的,很可能是打响了大模型竞赛第一枪的OpenAI。

  去前年年底发布ChatGPT,这家人工智能独角兽,就没有离开过聚光灯下,在年底,更是上演了一出“灵魂人物被裁”的大戏。

  在五天的对峙后,最终 CEO 阿尔特曼(Sam Altman)王者归来,而据最新的消息,OpenAI的收入已经突破 16 亿美金。2022年,OpenAI 的收入才 2800 万美金,当时阿尔特曼预估2023年的公司收入为2亿美金,在今年10月的时候,对收入的预估提升到了13亿美元,但仍低估了收入的增长。

  OpenAI不仅证明了大模型强大的能力,也证明了其商业价值——这不会是一个昂贵的玩具,而将真正改变世界。

  而被大模型成就的也不仅仅是OpenAI,作为OpenAI的亲密战友和投资者,老牌互联网巨头微软,同样在这一年里焕发了生机。2023年全年,微软股价累计上涨达到56.8%,目前市值已经高达2.73万亿美元,距离苹果的2.83万亿美元,已经只有一线之遥。

  微软与OpenAI长期的合作伙伴关系,也让市场信任,其在下一波人工智能技术创新的浪潮中,仍将处于中心地位。投行Wedbush估计,未来3年中,微软产品用户中的50%将使用新的AI工具,这将为微软提升250亿美元的软件销售收入;投行Evercore预计,到2027年,整合的AI功能将给微软新增1000亿美元的收入。

  另一家业绩突飞猛进的老牌巨头是英伟达,2023年,其股价上涨接近240%,市值达到1.22万亿美元的高点,成为了全球首家市值超过1万亿美元的芯片制造商。从赚钱的角度来看,英伟达才是真正的赢家,据市场预测,其2023财年(截至2024年1月)的营收将达到上一财年的2.2倍,即588亿美元。

  聚光灯不止照射巨头和大公司,同样掀起了创业的热潮,市场研究机构Pitchbook的调查数据显示,2023年生成式AI相关的创业公司融资总额达到270亿美元,其中约180亿美元左右的资金,来自微软、谷歌、亚马逊、英伟达等科技巨头。

  而整个市场的增长呢?没人能给出一个足够确切的答案,但我们都知道,那将是一个天文数字。大模型就像是一个漩涡,从科技圈到我们生活的方方面面,都被大模型卷入,然后再造。作为2023年科技领域最重要的年度盘点,DoNews将在下文中,带大家好好回顾一下,今年大模型和生成式AI领域的重要事件。

  2023年大模型大事记

  1月底,ChatGPT的月活用户过亿,用时仅仅两个月,成为史上用户增长速度最快的消费级应用程序。在此之前,达到1亿用户的时间,TikTok用了9个月,Instagram则花了两年半的时间。

  图片来源:红杉美国

  2月7日,百度宣布在筹备类ChatGPT项目,并公布了名字——“文心一言”,DoNews在文章《文心一言,百度的新故事?》中介绍道,在百度公布消息当天,其港股股价大涨15%,美股股价涨幅也达到了12%。

  图片来源:腾讯自选股

  2月7日,谷歌母公司Alphabet宣布将推出名为“Bard”的AI(人工智能)聊天机器人服务以及更多的人工智能项目,以应对竞争对手微软所引领的新计算浪潮。据谷歌CEO桑达尔·皮查伊(Sundar Pichai)6日在其博客中发文介绍,Bard是基于对话应用语言模型(LaMDA)的实验性人工智能程序。

  2月8日,微软宣布推出由ChatGPT支持的最新版本人工智能搜索引擎Bing(必应)和Edge浏览器。新版必应基于OpenAI新款语言模型运行,可轻松切换到人工智能聊天模式,并且能帮助微软利用网络知识与OpenAI技术进行智能对接。

  新必应搜索截图 图片来源:必应

  3月1日,OpenAI 发文宣布,正式推出面向商业用户的ChatGPT和Whisper API接口,让开发者可以将两者AI模型集成在各种应用。文中提到,商业版ChatGPT背后的AI模型从Text-davinci-003模型升级到GPT-3.5-turbo模型,ChatGPT API调用费用降低为原来的10%。

  3月15日,GPT-4正式发布!据OpenAI官方介绍,GPT-4是一个超大的多模态模型,能接受图像和文本输入,输出文本内容,在各种专业和学术基准测试中已做到人类水平的表现。比如律师模拟考试成绩,从ChatGPT的后10%,直接冲进了前10%,击败了90%的人类。

  3月16日,微软公司宣布将通过 Microsoft 365 Copilot 将下一代 AI 的强大功能引入其工作场所生产力工具。Copilot由OpenAI最新推出的GPT-4模型驱动,功能更强大。DoNews在文章《打工人的又一次暴击!微软office新套件居然能自己写稿,做表和PPT?!》中提到,Copilot能够根据不同软件的功能与需要,处理不同类型的任务。例如,在Word中,Copilot能够编写、总结和生成文本;在Excel中,它能够直接分析用户输入的数据,并将结果生成可视化图表;在Outlook邮箱中,Copilot可以帮助管理收件箱、合成回复草稿,并且支持多种语气以及文本长度。

  图片来源:微软

  3月16日,百度正式发布文心一言,百度创始人、董事长兼首席执行官李彦宏现场还展示了文心一言文学创作、商业文案创作、数理推算、中文理解、多模态生成的能力。(详见《李彦宏:文心一言将打造人人可用的超级生产力工具》)李彦宏表示,百度文心一言定位于人工智能基座型的赋能平台,将助力金融、能源、媒体、政务等千行百业的智能化变革。

  图片来源:百度

  3月22日,谷歌公开了Bard的测试版。DoNews在文章《大评测!ChatGPT 、文心一言和Bard谁更强?》中,分别就文学、翻译、创作、艺术、哲学、逻辑推理等方向对三个大模型型测评了一番。

  3月27日,在面向首批邀约测试企业的闭门沟通会上,百度正式推出「文心千帆」大模型平台,提供企业级大语言模型服务。会上介绍,文心千帆大模型平台不仅包括文心一言,还包括百度全套文心大模型、相应的开发工具链,未来还会支持第三方的开源大模型。

  4月7日,阿里云官方宣布,上线自研大模型聊天AI“通义千问”,并定向邀请企业用户进行测试。4月11日,阿里巴巴集团董事会主席兼CEO、阿里云智能集团CEO张勇在2023阿里云峰会上表示,阿里巴巴所有产品未来将接入“通义千问”大模型,进行全面升级。

  4月24日,科大讯飞发布讯飞星火认知大模型,该认知大模型于5月6日正式亮相,现场实测大模型七大核心能力,并发布教育、办公、汽车、数字员工四大行业应用成果。

  图片来源:科大讯飞

  5月11日,谷歌I/O开发者大会发布了自研的PaLM2大语言模型,以及一系列旗下产品的AI化进化,并预告了将在2023年年底发布的下一代基于多模态的Gemini基础大模型。PaLM 2基于Pathways架构,是PaLM的升级版,通过JAX在TPU v4上构建。据介绍,PaLM 2接受了100多种语言的训练,这使得它在语言理解、生成和翻译上的能力更强,并且会更加擅长常识推理、数学逻辑分析。(详见《Google秀肌肉, I/O大会快变成AI大会了!》记录了大会亮点,)

  图片来源:谷歌

  5月23日,微软举办年度开发者大会Build 2023。会上,微软CEO纳德拉一口气抛出了超过50项与AI相关的新技术和产品,并当场重点讲述了在Windows全系统层面集成Copilot、Bing和ChatGPT无缝集成、Microsoft 365的Copilot大升级、AI加持下全新Azure和系统开发等五项体验。(详见《微软的iPhone时刻:Win11+AI副驾,重新定义工作的未来》)

  图片来源:微软发布会

  6月15日,搜狗创始人王小川创立的百川智能公司,宣布开源了70亿参数的大规模预训练语言模型——Baichuan-7B,该模型基于Transformer 结构,支持中英双语、可商用,上下文窗口长度为4096,在大约1.2万亿 tokens上进行了训练。7月11日,百川智能发布 Baichuan-13B 大模型。

  7月18日,微软在全球合作伙伴年度大会上宣布,将推出全新的人工智能订阅服务。针对人工智能助手Microsoft 365 copilot,将向office 365 e3、e5、商业标准版和商业进阶版的订阅商户收取每人每月30美元的费用。消息发布后,微软股价达到366.78美元/股,创下2023年微软股价新高。(详见《AI助手30美元/月,大模型商业化艰难探索》)

  图源:雪球

  8月29日,OpenAI正式发布ChatGPT企业版,可以用来处理更长输入的上下文窗口、拥有加密、企业级安全和营私以及组账户管理功能。

  8月31日, 8 家企业 / 机构的大模型产品首批通过《生成式人工智能服务管理暂行办法》备案,可正式上线面向公众提供服务。具体包括:百度(文心一言)、抖音(云雀大模型)、智谱 AI(GLM 大模型)、中科院(紫东太初大模型)、百川智能(百川大模型)、商汤(日日新大模型)、MiniMax(ABAB 大模型)、上海人工智能实验室(书生通用大模型)。

  9月5日,2023百度云智大会上,百度智能云千帆大模型平台宣布实现2.0全面升级。

  9月7日,2023腾讯全球数字生态大会上,腾讯混元大模型正式亮相,并宣布通过腾讯云对外开放。腾讯混元大模型是由腾讯全链路自研的通用大语言模型,拥有超千亿参数规模,预训练语料超2万亿tokens,DoNews在《腾讯能否借助“混元大模型”逆风翻盘?》一文中对其进行测评,发现有不少亮点值得肯定。

  图片来源:腾讯混元大模型小程序

  10月17日,百度世界2023大会上,李彦宏宣布“文心大模型4.0”正式发布。文心大模型4.0基本技术架构与3.0和3.5版本一脉相承,并在多个关键技术方向上进一步创新突破。此外,文心大模型4.0在输入和输出阶段都进行知识点增强。(详见《李彦宏连甩两个“王炸”,百度抢跑AI原生时代》)

  11月1日,微软正式向全球企业客户推出Microsoft 365 copilot,该服务将为 Word、Excel、PowerPoint 等应用添加生成式 AI 功能,每个用户每月需要支付 30 美元的费用,按年付费。

  11月7日,OpenAI开发者大会发布了GPT-4 Turbo和GPT-s。升级版的GPT-4 Turbo做了6项重要的强化,但大幅降价,大约比使用GPT-4降低了2/3的成本,而且速度变得更快。另一大革命性产品GPTs,允许用户用自然语言自定义“个人版的ChatGPT”。在发布会上,OpenAI还表示将推出GPT Store(GPT商店),这意味着,和苹果App Store一样,无数开发者将可以开发AI应用,在商店中上架。(详见《大降价!GPTs商店,还有Assistants API:OpenAI的首届开发者大会讲了这些事》)

  图片来源:OpenAI

  11月15日,在2023年西丽湖论坛上,李彦宏表示“文心大模型一家的调用量,恐怕比200多家大模型的调用量加起来还要多”,一石激起千层浪。(《李彦宏为大模型挤泡沫:AI时代下有应用才有未来》中记录了李彦宏演讲全文。)

  图片来源:百度

  11月6日,知名投资人、创新工场董事长兼CEO李开复创办的AI 2.0公司“零一万物”发布了首款开源大模型——Yi系列大模型。

  11月18日凌晨,OpenAI高层突发大地震,OpenAI在官网发布公告称,董事会宣布,公司CEO阿尔特曼(Sam Altman)将辞去CEO职务并离开公司,首席技术官米拉·穆拉蒂(Mira Murati)将担任临时CEO,立即生效。联合创始人兼总裁格雷格·布洛克曼 (Greg Brockman) 将辞去董事会主席职务,但会继续担任公司职务向CEO汇报。DoNews在《震惊!OpenAi CEO被开除了,居然说他不坦诚 》中,详细介绍了阿尔特曼过去十年间的创业经历。

  图片来源:X

  12月2日,OpenAI的ChatGPT团队向GPT开发者发布了一封信,“GPT商店”将推迟至2024年发布。原因是CEO罢免事件影响了该产品研发进度,同时收到了大量GPTs的使用反馈,希望优化该产品。

  12月7日,谷歌宣布发布其规模最大、能力最强的 AI 多模态模型 Gemini 1.0,这是谷歌自去年5月份开发者大会上就已经宣布的下一代大模型,从最初的数据训练阶段开始就基于多模态。Gemini 1.0 针对不同尺寸进行了优化,分别是:Ultra、Pro 和 Nano(超大杯,大杯和迷你杯),其中 Gemini Ultra 适用于高度复杂的任务;Gemini Pro 是通用版,而 Gemini Nano 则被用于各种客户端设备。根据谷歌方面的计划,Pro大杯和Nano迷你杯即日推出,而Ultra超大杯则要等到明年。

  图片来源:谷歌

  结语

  看完了2023年大模型和生成式AI的大事记,不难发现,上半年厂商们纷纷在发布大模型,而到了下半年,生态和AI原生应用成了更受关注的话题。

  去年9月,红杉美国在文章《Generative AI’s Act Two》(生成式AI的第二幕)中写到,生成式AI将端到端的解决人类的问题,实现从技术锤子到实际使用案例和价值的演变。业界已经基本认同,2024年,将是AI原生应用大规模落地的一年,也将是大模型赛道真正拉开差距和改造全世界的一年。

  不过,对大模型来说,还会有哪些值得关注的预测呢?去年12月,斯坦福大学人文智能中心(HAI)的教职员工和高级研究员们,提出了七个预测。其中包括:白领们的工作受到挑战、虚假信息传播的风险变大、GPU 短缺、智能代理兴起、多模态大模型兴起等。

  大模型最为一种先进的技术,同样也会是一把双刃剑,在极大便利未来人类的生活和创造价值的同时,也可能会产生负面的影响。但技术的进步,永远是逆水行舟不进则退。2024年,DoNews将继续关注大模型和生成式AI,也和大家共同期待,在这一领域新的突破和进展。

+1

来源:DoNews

延展资讯