科技魔方

再增两百博士下一线 华为云盘古大模型奔涌进行业

大模型

2023年09月22日

  在过去几个月的大模型落地实践中,业界遇到了方方面面的挑战。为了攻下行业山头,华为常务董事、华为云CEO张平安在华为全联接大会2023上,提出了 “解难题、做难事、行致远”的号召。华为云今年还将派出200多位博士和天才少年,与行业头部企业、战略伙伴一起,开展大模型落地会战。

  文|赵艳秋

  编|牛慧

  9月21日,在盘古大模型3.0推出两个多月后,华为云在华为全联接大会2023上又推出了汽车、医学等新的行业大模型,并对政务、矿山、气象、数字人直播、软件研发等大模型进行了升级。

  与会者观察到,华为云全力在行业大模型的道路上快速推进,打法路径更为明晰。会议上宣布了矿山、气象、政务等大模型落地的标杆案例。

  由于不少行业处于大模型落地早期,在过去几个月的实践中,业界普遍反映,遇到了方方面面不小的困难。华为常务董事、华为云CEO张平安在会上提出了“解难题、做难事、行致远”的号召。

  数智前线获悉,为了攻下行业山头,华为云今年还将增派200多位博士和天才少年到一线,与头部企业、战略伙伴一起,开展各种会战。

  01

  大模型的路线“分歧”

  今年7月华为云发布盘古大模型3.0后,很多客户和业界朋友找到软通动力华为云智能服务总经理魏建勋咨询,华为云所说的大模型,为什么与OpenAI的ChatGPT大语言模型不同?

  华为云对大模型的定义和发展路径,在业界也引发争论。不少大厂今年强力投入的是大语言模型,但华为云发布的是自然语言、视觉、科学计算、预测、多模态等五个基础大模型以及数个行业大模型,对大语言模型并未特别强调。

  有人士认为,这混淆了大模型的概念,也有人士认为,解决行业问题才是硬道理。不过,魏建勋发现,最近一个多月,华为云的大模型单子越来越多,找华为云和软通动力合作的企业也越来越多。“大家看到在行业中,尤其在矿山和气象领域的典型落地案例后,无论在惠民,还是在企业收益上,大家都渐渐有了感知。”

  “华为云主打的是行业,行业有纵深,会遇到多种多样的诉求。”魏建勋告诉数智前线,在这种情况下,只有大语言模型是不行的。

  华为云一位高管告诉数智前线,之所以选择这个模式,是因为他们觉得一个模型解决不了所有问题。“有的模型擅长文,有的擅长理,比如我们的科学计算大模型,能解决调度这类复杂问题。我们的盘古气象大模型,研究成果上了《自然》杂志,就是因为它有一个独立的模型。”

  “从本质上看,华为云的大模型道路是一条可落地、可变现、不烧钱的商业路径。”从事数字人应用开发的云蝠智能创始人魏佳星观察。

  他坦言,华为云选择这条路径与ToB基因密切相关。国内外有多个大厂在做大语言模型,但在大语言模型还未展现出明确商业化优势前,“在这样一个竞争氛围里,我感觉华为即使去做,胜算也不会太高”。而在产业这块就不同了,像华为云盘古气象大模型,一两年内可能就是市场上的独家技术。“在这个窗口期内,它可以继续加大数据、加大算力,做到占领市场。”

  实际上,在华为全联接大会2023上,张平安介绍,盘古气象大模型已在欧洲中期天气预报中心、国家气象局等开始试用。泰国气象局也启动了与盘古的合作。在矿山领域,山东能源集团已把矿山大模型全面应用到9大业务系统、21个场景中。目前,矿山大模型在全国其他8个矿井开始规模使用......

  华为判断,人工智能应用迎来奇点,正在加速进入行业生产系统,未来2年将深入到50%以上的行业核心场景,逐步成为数字经济增长的主引擎。

  “这是不是有点像5年前新能源车的状况?”魏佳星说,“在纯电赛道没有一个明确的定论前,一些企业先做增程式,比做纯电跑得要快,但大家一开始也有争议。”

  不过,大模型落地行业,并不是一件容易的事。

  一位金融行业资深人士向数智前线描述了今年银行落地大模型的状态:二三月,大家都很焦虑,怕落后;四五月,纷纷组建团队去做;之后几个月,大家在找方向、落地上遇到了困难,开始变得理性;现在,他们看标杆,把验证过的场景拿来试用。

  在这个过程中,除了编程助手这类开箱即用的功能外,业界发现,大模型与业务场景结合的难度不小,一方面需要大算力,不少头部企业因为数据与合规要求,要构建基础设施,投资大,有一定周期;另一方面,在行业或企业大模型的训练上,即便是微调,也可能要一两万条数据,还要找到适宜的方法,企业都在探索中;同时,不少企业还要开发算子,解决公有云和私有云协同。

  魏建勋观察,目前阶段,华为云的打法是聚焦头部企业,找到具有代表性和普适性的痛点,结合盘古大模型和企业know-how,打造行业标杆,为行业复制打基础。

  02

  大模型落地大会战

  打造标杆是一件具有开拓性的事。在华为内部有着密密麻麻的Roadmap,科学家和数学家进一步下沉一线,识别行业难点,更快构建行业大模型,拓展行业深度。

  华为云人工智能算法专家金博士,参与了盘古汽车大模型的构建。“下到一线后,我充分理解到自动驾驶中数据的价值。”数据是个吞金兽,一个包含视觉、雷达等多传感器的10秒图像文字训练,数据采集标注成本要几百元,而自动驾驶需要几百万小时的行驶数据。

  同时,如何补足“鬼探头”这类Corner Case长尾数据,解决几年前自动驾驶车将横穿马路的白色大卡车误判为云朵,而酿成事故的这类问题,是行业难题之一。

  在盘古汽车大模型中,采用NeRF构建的数字孪生、元宇宙虚拟环境中,利用大模型的生成和泛化能力,产出大量虚拟数据,而且只要训练一次,就可生成适配不同新车型视角的视频,让Corner Case闭环周期,从两周以上缩短到两天内,也降低了实际道路采集标注成本。

  盘古汽车大模型也进入汽车的研产供销服场景中,一汽解放数字化部宋磊部长,在会上分享了一汽解放,应用盘古汽车大模型的实践。

  在金融领域,负责盘古金融大模型的祝博士,下到一线后,了解到银行的痛点之一,是传统智能客服仍要依赖大量人工,而对一线人员的知识传递也存在瓶颈。大模型结合知识库,可理解专业知识,实现专业问答,成为一线人员的助手。基于盘古金融大模型的网点问答,7月在工行上线后,陆续推广了几百个网点,答案采纳率超过85%,获得一线业务的好评。目前,文档问答孵化成的标准解决方案,又快速复制到交行、农行、银联以及上交所等。

  值得关注的是,工行向祝博士反映,他们在人才上面临两难:一方面不希望员工被大模型取代;另一方面很多岗位还有人才缺口。他们期望大模型释放出的员工,能做更多高价值的事。在这一诉求下,华为联合工行实验室的人力资源团队 ,梳理了大模型在企业应用的人员转身实践,设计了系列培训课程,如Prompt调优、微调、大模型运营等,并与远程银行、网点等部门合作,建立联合项目组,驱动企业人员能力提升。

  “这样的实践,也驱动我们梳理了一整套企业落地方法论,真正做到授人以渔,让企业和员工深入拥抱新技术,提升生产力。”祝博士说。

  在气象领域,盘古气象大模型此前创造了台风路径的预测纪录。这次升级后,它又攻克了暴雨预测这一全球气象领域Top级难题,让暴雨红色预警从3小时预报,提前到24小时发出,这对政府的灾害防御、老百姓的生产生活极为关键。

  深圳气象局也在与华为合作,基于盘古气象大模型,打造深圳区域气象预报大模型。数智前线获悉,这或将成为全球首个区域气象预报模型,有望实现大约三公里精度的气象预报。

  9月30日,华为云还将启动盘古气象平台的邀测,这是一个SaaS服务,让全球用户可以直接调用降水预测等功能。

  在医学领域,乔博士和刘博士的团队在解决医疗大模型严肃性和专业性的挑战。“通用NLP大模型通过公开数据学习,能力非常有限。”乔博士介绍,他们通过大量医学数据,并定义了大量医学任务,教会NLP大模型学习医学的知识和场景。“大模型还结合搜索、知识图谱,进一步保障大模型的可溯源性。”刘博士说。

  盘古医学大模型的目标是让每个医生拥有可信赖的临床助手,这对普惠医疗的实现也意义深远。目前,在由10个科室真实病例构成的检验报告解读测试中,在三个对照组中,盘古医学助手几乎达到了对照组1,也就是相当于临床医生的平均水平。

  在大会期间还公布了多个大模型的落地进展,如政务大模型首次将NLP大模型与CV大模型融合,让城市各类开放和长尾事件秒级发现、分钟级分拨。矿山大模型,让山能济宁二号煤矿每年多产出8000吨精煤,增收数千万元;数字人直播,让丹寨农特产和非遗产业蜡染走出大山,走向全球。

  过去几个月,华为攻克行业难题的各种会战中,合作伙伴的能力和价值也在快速释放中。他们识别行业关键问题,结合自身行业know-how,推动盘古进入行业。魏建勋告诉数智前线,软通动力在尝试突破车险理赔的难点,将原来理赔定损,从几天逐步缩短到小时级、分钟级,“现场就能解决”,目前该项目与车企客户在PoC阶段。

  03

  支撑百模千态

  在大模型训练和落地过程中,算力目前是行业的“集体焦虑”。这也是华为全联接大会2023上,与会者最关注的事情之一。

  “大家都在到处找算力,供需比大约在 1:10 之间。”一位算力行业人士说,“大模型厂商都在各地密集访谈,到处寻找稳定算力的合作伙伴,每家对算力的需求都在万P以上。”

  不光是大模型厂商,一些行业头部企业,如银行也已开始入场抢算力了。“银行动不动就几十万、上百万资料,他们要去做企业模型训练,首先就要购置算力。”

  有资深人士判断,国内目前H800的缺口达到45万张。面对中国的算力需求热,上述算力行业人士称,英伟达的发货政策是优先美国本土,中国供货量不到两成,而这样的供货还有随时被卡的风险。

  此前,由于美国禁令,英伟达为中国提供了特供的A800和H800,今年以来仍不断有消息认为,美国还在考虑打压升级,包括进一步限制A800和H800的出口,限制中国企业使用美国AI云服务等。

  面对算力的稀缺和昂贵,在9月21日的会议中,张平安宣布了华为云昇腾AI云服务正式上线。华为云投入很大,在贵安、乌兰察布和芜湖建设了非常大的AI算力中心。企业只需通过一键接入,即可随取随用AI云服务。

  有趣的是,此前业界云厂商纷纷宣布支持各类开闭源大模型,华为云这次也宣布,除了支持盘古大模型,还将适配业界主流的近一百个开源大模型,如Llama2,GLM等,支持企业既可以基于盘古基础大模型和行业大模型,也可以基于开源大模型,打造自己的专属大模型。

  9月20日,华为云昇腾AI云服务“百模千态”专区上线。千卡训练30天长稳率达到90%,训练作业故障自动恢复,非自动场景下恢复时长小于30分钟;此外,还提供了开发、迁移工具链,30多种可视化调优部署工具,自动化实施工具,典型模型迁移周期可降低到两周。此前,针对华为在《自然》杂志上发表的华为云盘古气象大模型的论文,任正非就在内部讲话中谈及,要“在新的淘金时代卖铲子”。

  为了应对千模百态的需求,在会议期间,华为云CTO张宇昕也介绍,华为云以系统架构创新的思路,正式发布分布式QingTian架构,打破了计算、存储、网络的边界,把过去主从式架构升级为对等架构,来提升AI算力。

  正如华为轮值董事长孟晚舟所言,华为致力于打造中国坚实的算力底座,为世界构建第二选择。

+1

来源:数智前线

延展资讯