科技魔方

288核芯片、4000颗AI处理器做的超算、不用联网的大模型…英特尔要反击了!

大模型

2023年09月20日

  本文来自于微信公众号硅星人Pro(ID:gh_c0bb185caa8d),文|王兆洋编辑| VickyXiao。

  2022年,在英特尔大会的演讲前,英特尔CEO帕特-基辛格在后台做俯卧撑起跳;而今年,他直接在主题演讲的舞台上做了起来。

  9月19日,在圣何塞的会展中心,这位要把英特尔带回巅峰的CEO显得活力十足。在长达90分钟的主题演讲中,热完身的基辛格带来各种重磅发布:从288核的芯片最新进展,到一系列还只能公布内部代号的下一代芯片,到4000颗Gaudi2组成的全世界前15大的超级计算机,再到全新的封装技术以及开发者云平台的全面上线,这场演讲信息量巨大。

  这些进展涵盖了各个方面,不过很显然,这一切都有了同一个主题:AI。关掉那个wifi

  如果在万千发布里找一个时刻,来呈现英特尔想呈现的它在AI浪潮里的独特定位的话,可能是Rewind CEO Dan Siroker 上台后的展示。

  这是一个炙手可热的创业公司,它的产品像是一个时光机,装在你的电脑里后,它能帮你回顾你做过看过的任何事情,并用AI进行处理。他展示了基于联网的GPT-4能力如何使用Rewind之后,基辛格提出了要求:

  “关掉那个Wi-Fi。”

  把Wi-Fi关掉后,Dan选择LLaMa on OpenVINO模式,进入了离线大模型状态。

  他输入了一个问题,这个问题是刚刚基辛格分享的一个故事里提到的:他最喜欢的声音是什么。

  Rewind回答到:“他孙女叫他’papa’(爷爷)的声音。”现场掌声一片,这说明它可以在离线状态用模型的能力处理数据。

  想象一下如此大量存在的这些终端机器,可以在不联网的情况下拥有大模型的能力。

  而提供这种能力的关键支持,是英特尔的OpenVINO,这是英特尔的AI推理和部署运行工具套件,在客户端和边缘平台上为开发人员提供选择。它包括针对跨操作系统和各种不同云解决方案的集成而优化的预训练模型,包括多个生成式AI模型,例如Meta的Llama2模型。

  在人人都争着拼抢大模型的时候,英特尔选择的是从它的已有优势入手。为此,基辛格还提出了一个AI PC的概念,而英特尔是这些PC从PC变成AI PC的必须品。若套用那个让英特尔十分成功的广告语,基辛格这一次想说,只有Intel Inside 才能叫 AI PC。

  AI PC能够实现,背后对应的平台是代号为Meteor Lake的英特尔酷睿Ultra处理器,它配备英特尔首款集成的神经网络处理器(NPU),用于PC的AI加速和本地推理,这是英特尔客户端处理器路线图的重要节点,它首次用了Foveros封装技术,且内置NPU、带有独立显卡级别能力,并采用了Intel4制程节点。它将在12月14日发布。

  这些动作可以看出大模型浪潮里英特尔给自己的定位,一是要牢牢抓住端和数据中心的机会,与自己的客户继续一起赚钱,二是要服务像Rewind这样的公司和开发者,完成一种巨人转身。

  后者可能看起来更加紧迫,以至于这场发布会上基辛格第一次举起展示的物品并非什么GPU,CPU或者任何芯片,而是英特尔开发者云的优惠券。 百分号无处不在

  要做到这两件事里的任何一件,都少不了用能力来打动对方,无论是生态伙伴还是开发者。

  而这家公司的业绩显然正在面对压力,因此你可以看到在这场大会上,英特尔想充分展示自己的底气。

  于是,在大会上,AI无所不在,Intel无所不在,百分号和倍数也无所不在:

  “1.09倍”

  这是Gaudi2对比英伟达H100的追赶步伐,H100相对于Gaudi2仅表现出1.09倍(服务器)和1.28倍(离线)的轻微性能优势。尽管依然是落后,但如此接近就已经是一种成绩。

  “150%”

  这是5纳米的Gaudi3比7纳米的Gaudi2在HBM能力上的提升。

  “99.9%”

  这是对于 GPT-J而言,英特尔至强CPU Max 系列的MLPerf 结果,这也是其首次提交这个测试,它是仅有的能够达到99.9%准确度的 CPU,这一系列可提供高达64GB的高带宽内存。

  “240%”

  这是与第四代至强相比,拥有了288核的,具备高能效的能效核(E-core)处理器Sierra Forest,每瓦能提升的性能,而该处理器还预计将使机架密度提升2.5倍。

  “90%”

  这是OpenVINO去年下载增加的比例。当天包括ai.io和Fit:Match在内的公司现场展示了他们如何使用OpenVINO来加速应用程序:ai.io借助OpenVINO评估运动员的表现;Fit:Match通过OpenVINO革新了零售和健康行业,帮助消费者找到更合身的衣服。

  数据之外,基辛格也展示了多个重要合作。

  其中,有那些多年的盟友,比如微软,基辛格表示双方会在很快的未来在Copilot上合作;也有新的一批最热的创业公司,比如StabilityAI,基辛格宣布,一台大型AI超级计算机将完全采用英特尔至强处理器和4000个英特尔Gaudi2加速器打造,Stability AI是其主要客户。

  还有一些强强联合,比如基于通用芯粒高速互连开放规范(UCIe)的测试芯片封装,不仅集成了基于Intel3制程节点的英特尔UCIe IP芯粒,还有基于TSMC N3E制程节点的Synopsys UCIe IP芯粒。这些芯粒通过EMIB(嵌入式多芯片互连桥接)先进封装技术互连在一起。

  同时,英特尔还再次介绍了Intel Ignite的计划,打造和扶持开发者以及初创公司生态,基辛格在主题演讲里提到了多个参与Ignite计划里的创业公司。

  一名创业者对硅星人表示,基辛格在和他们交流时,问的最多的是他们的反馈,英特尔的产品如何能够帮到他们,还有哪些地方需要改进。

  身段放的很低。 2024,2024,还是2024!

  这些进展最终都指向那个终极的评判标准,基辛格给自己制定的那个“四年五个制程节点”计划。

  基辛格表示,英特尔的“四年五个制程节点”计划进展顺利,Intel7已经实现大规模量产,Intel4已经生产准备就绪,Intel3也在按计划推进中,目标是2023年年底。基辛格在给英特尔找回那个强大的执行和交付能力。

  主题演讲上,基辛格展示了基于Intel20A制程节点打造的英特尔Arrow Lake处理器的首批测试芯片。Arrow Lake将于2024年面向客户端市场推出。Intel20A将是首个应用PowerVia背面供电技术和新型全环绕栅极晶体管RibbonFET的制程节点。同样将采用这两项技术的Intel18A制程节点也在按计划推进中,将于2024年下半年生产准备就绪。

  第五代英特尔至强处理器将于12月14日发布,而Sierra Forest将于2024年上半年上市。

  为边缘计算提供原生软件开发的平台Strata也将于2024年推出。它是一种横向扩展智能边缘(intelligent edge)和混合人工智能(hybrid AI)所需基础设施的方式,并将英特尔和第三方的垂直应用程序整合在一个生态系统内。

  你也许也注意到了,2024出现在多个关键的产品规划里。作为四年计划里的关键一年,2024对英特尔多重要不用多说。

  一名英特尔高管甚至对我表示,这可能是这一代,或者说他们职业生涯里最重要的一年:

  “我们自己的技术进步和客户的技术准备,都将在这一年彼此适配,带来关键的改变。”

  在这场信息量巨大的发布会上,英特尔希望告诉大家,做为一个让AI成为可能的“基建公司”,今天想要研发AI的公司,依然是绕不开它的。你能想到的AI的各个环节,英特尔都站在那里等着你,哪怕有一些目前仍然是“第二选项”。

  但英特尔更想外界知道的是,到了2024年,它就不会满足于仅仅是“在那里”了,它的反击已经真正开始。

+1

来源:微信公众号硅星人Pro

延展资讯