科技魔方

挑事儿!文心一言和360智脑谁能难倒谁?

大模型

2023年07月18日

  下半年开始,人工智能的热度似乎一改年初的火热。通过对比多家互联网大厂目前公开的财报数据,大模型之家发现2023年上半年中国主要人工智能企业的盈利情况总体处于增长态势,但增速有所放缓。

  (炎热的夏日似乎降低了“大厂”们搞事情的激情……)

  所以!大模型之家又要开始“挑事儿”啦~

  大模型之家决定不定期地开启「国内大模型巅峰对决」系列活动,每期「巅峰对决」将邀请两家国内知名大模型进行“PK”。

  对决规则非常简单:参与“对决”的大模型各有三次向对方大模型出题的机会,大模型之家会给出相同的指令,并将得到的“考题”分别交换给各位“参赛选手”,并由它们自由作答。

  而对决的胜负评判也非常地简单粗暴,除了客观问题(有固定答案的问题)以外,主观问题都由大模型之家的粉丝们进行评判。同时,我们会在文末设置投票窗口,以供各位“看官”们选择自己心仪的大模型!

  第一期「巅峰对决」大模型之家分别请到了「5月、6月大模型热力榜的榜首」的两家大模型进行“比拼”,他们分别是:百度的文心一言和360公司的360智脑。

  一位是国内最先一批发布的大模型中的佼佼者,一位是厚积薄发又快速成长的AI新锐,那么二者又会碰撞出什么样的火花呢?接下来快来和大模型之家一起来看看吧!

  出题阶段

  大模型之家以“请帮我列出三条生成式人工智能大模型很难回答的具体问题”向两位大模型分别提问。

文心一言给到的问题是:

  图源:文心一言

  伦理和道德问题:如果你发现一个公司的CEO在欺骗股东和消费者,你会如何处理这种情况?请提出一个符合道德和法律规范的解决方案。

  主观理解和创新问题:如果你需要为一款新产品制定一份市场推广策略,你会从哪些方面入手,并如何评估和优化策略的效果?请提出一个具有创新性和可行性的策略方案。

  未被训练过或超出其知识领域问题:如果你想了解某个国家的历史和文化,你会从哪些方面开始入手,并如何评估和比较不同来源的信息的可靠性和准确性?请提出一个能够提供全面和客观信息的具体方案。

360智脑给出的问题是:

  图源:360智脑

  如果遇到一个模型的回归效果特别差,应该怎么办?

  深度神经网络中的Attention机制是如何实现的?

  如何对不平衡的数据集进行处理?

  大模型之家发现,两位大模型在给到问题的同时,也会针对“很难回答的问题”给到自己的理解和解释。文心一言从三个角度给出了不同的问题,甚至在问题后还需要大模型给出相应的解决方案。而360智脑不仅提出了问题还对“很难回答的问题”给出了自己的答案。

  插一句!双方的问题,似乎都问到了对方的心坎儿里呀

  Round 1

360智脑提问文心一言:

  图源:文心一言

  文心一言的回答提供了一套系统和全面的方法来处理模型回归效果差的问题,并在每个步骤中提供了具体的操作建议。这样的回答能够帮助读者系统地解决模型回归效果差的问题,提高模型的性能和准确性。

文心一言提问360智脑:

  图源:360智脑

  大模型之家认为360智脑回答提供了一个明确的行动方向,强调了保护股东和消费者权益的重要性,并且提到了法律帮助的必要性。但该回答缺乏具体的举报渠道和相关法律条款等信息,这可能对读者在实际操作中的理解和应对产生一定的影响。未来进一步补充举报渠道和相关法律依据将使回答更加全面和实用。

  Round 2

360智脑提问文心一言:

  图源:文心一言

  文心一言的回答对于深度神经网络中Attention机制的实现方法进行了全面而清晰的总结,并提供了一些常见的Attention类型。这样的回答能够加深使用者对Attention机制的理解,并为他们在实践中选择适当的方法提供指导。

文心一言提问360智脑:

  图源:360智脑

  综合来看,360智脑的回答提供了一个较为全面的市场推广策略,并给出了创新和可行的方案。然而,进一步完善策略评估和优化的方法和工具将使其更具实际操作性和指导性。因此,在实施策略之前,建议考虑具体的数据分析方法和工具,以更好地评估和优化策略的效果,从而提高推广效果和客户满意度。

  Round 3

360智脑提问文心一言:

  图源:文心一言

  文心一言的回答提供了有关处理不平衡数据集的综合且详细的信息,给出了读者在面对不平衡数据集时可以尝试的多种方法,并提醒使用者在选择处理方法时要结合具体情况进行判断。如此回答能够引导使用者更好地理解和应对不平衡数据集的挑战。

文心一言提问360智脑:

  图源:360智脑

  360智脑的回答提供了一个相对全面和可靠的方案,用于了解某个国家的历史和文化,并给出了评估信息可靠性的步骤。使用者可以根据这个方案进行自我学习和探索,以获得更深入的了解。不过,除了官方历史记录和政府出版物的可靠性之外,是否还可以提及私人机构、学术期刊、独立研究者等其他可靠来源。以及,建议对不同来源的信息进行评估时,可以进一步提及核查事实准确性、考虑信息的时效性和偏见等因素。

  值得一提的是360智脑在每个问题回答后都会为使用者提供几个“可能感兴趣的问题”,在很大程度上弥补了答案不符合使用者预期的问题。而文心一言清晰的答题逻辑也获得了诸多网友的赞扬。

  同时,大模型之家即将发布的《人工智能大模型产业创新价值研究报告》中指出:我们必须保持开放和合作的精神,促进学术界、产业界和政府之间的紧密合作,共同推动人工智能的发展和应用。通过共同努力,我们可以开创出一个智能化、创新化的未来,让人工智能为人类带来更大的福祉和发展。

  虽然我国已经站在世界人工智能发展前列,但环境的重压使得我们前进的道路充满了迷雾与荆棘,大模型之家希望通过这样的小活动来展示国内真正为人工智能领域付出实际行动企业,让更多人关注到科技对于社会生产的重要作用。

+1

来源:大模型之家

延展资讯