科技魔方

百川智能2代开源大模型亮相,王小川:文理兼备,已超越LLaMA 2

大模型

2023年09月07日

  从去年12月ChatGPT的浪潮席卷全球以来,几乎所有的科技企业都想抓住这个机会。经过大半年的沸腾后,大模型行业出现了一股新的浪潮:从闭源到开源。

  LLaMA2发布于今年7月19日,由美国互联网大厂Meta推出,当时在全球引起轰动,外界评价说,LLaMA2的开源将可能影响大模型最终格局。而在百川智能创始人兼CEO王小川看来,全新发布的Baichuan 2系列开源大模型,已经全面超越了LLaMA2的性能。

  北京时间9月6日,百川智能召开主题为“百川汇海,开源共赢”的大模型发布会。会上,百川智能宣布正式开源微调后的Baichuan2-7B、Baichuan2-13B、Baichuan2-13B-Chat与其4bit量化版本,并且均为免费可商用。

  同为大模型创业者的澜舟科技创始人兼CEO周明现身百川智能发布会,周明表示,国外开源模型更多是支持英文为主的西方语言,对中文的支持要么不足,要么不太友好。而Baichuan2两款模型对中文用户的支持非常友好,并且在性能方面都超越了英文同等尺寸模型,因此是对中国大模型领域研究和应用的利好消息。

+1

来源:DoNews

延展资讯