科技魔方

企查查全球首发商查大模型“知彼阿尔法” 助力构建安全可信人工智能

大模型

2023年07月03日

  7月3日,企查查发布全球首款商查大模型——企查查“知彼阿尔法”。这款大模型是基于企查查在商业查询领域近十年可信数据积累后进行大规模预训练的成果,后续将上线的创新产品通过大模型+企业信用数据库共同构建,用AI技术赋能企信大数据创新,打造安全、可信的人工智能产品,为用户提供更加便捷、精准的商业信息查询服务。

  (图:企查查商查大模型“知彼阿尔法”)

  业内首款商查大模型为何会是企查查?

  企查查创始人陈德强表示,企查查拥有覆盖全球近5亿家企业的企信数据库。商业信息查询服务最核心的资源就是相关的数据资源,比如工商信息、诉讼信息等。并且,数据覆盖面要足够广泛,不仅要有中国的全量数据,还要有全球其他国家的数据。此外,在企业标讯、企业尽调等专业性很强的领域,还需要建立专门的数据库。要将AIGC技术引入商业信息查询服务领域,最关键的动作就是用企信数据集来训练相关模型。数据量越大、数据质量越高,最终训练出来的模型才越精准。相对于当前其他大语言模型主要用公开的互联网数据集,工商、司法等专业数据的获取难度更大。可以说,企查查所覆盖的5亿家企业征信数据资源是企查查商查服务最核心壁垒,汇集了目前国内市场中的80个产业链,8000个行业,及海量的市场实时工商信息、风险公示、知识产权、征信报告、股权关系等300+维度的企信数据。这些数据,不仅为企查查构建了较高的竞争壁垒,也为其训练知彼阿尔法商查大模型,奠定了坚实的数据基础。

  据了解,企查查的AI算法模型国内领先,在今年5月获得”中国智能科学技术最高奖”吴文俊人工智能科学技术奖。在算法层面,企查查有着深厚的AI技术积累,多年来,企查查通过运用深度学习、自然语言处理(NLP)等AI技术,现已实现在海量全球多语言文本中进行自动化、智能化的数据分析与文本挖掘,并能进一步实现深层次语义分析,为用户提供更精准的语义检索服务。在预训练模型领域籍由丰富的数据资源,企查查已经有较强的技术积累,本次企查查发布的知彼阿尔法商查大模型实现了完全自主知识产权。

  丰富多样的产品服务与应用场景。用户直接面对的是产品,而不是技术。因此,要想将AIGC底层的大模型技术应用于商查服务,就必须要将技术封装成便于用户使用的产品。而且,针对不同的用户需求,要构建针对性的产品,进而形成相对完备的产品矩阵。以产品矩阵的方式,来为商查用户提供一站式服务。在产品层面,企查查针对不同用户群体,构建了完善的产品矩阵,具体来看:对于企业用户而言,企查查通过定制化服务提供精准拓客、企业评级、尽职调查、风险控制、司法调查、舆情监控、供应链管理等场景的解决方案,辅助企业用户完善企业画像、信息交叉核验、寻找合作伙伴;对于个人用户而言,企查查通过云平台综合多维度数据提供投融资、求职招聘、风险判定等场景的解决方案,为个人用户透视企业股权架构,规避企业识别过程中的信用风险;对于公共部门用户而言,企查查数据既是央行官方征信渠道的重要补充,也是地方政府政策制定、社会信用体系建设、招商引资、筛选政策扶持对象、进行企业信用监管重要参考。

  为什么要打造商查版ChatGPT?

  伴随着数据量的积累以及产品功能的增加,商查领域出现诸多问题和需求痛点,主要表现在两个方面:

  用户还停留在关键词搜索阶段,平台还不能很好理解用户复杂的业务需求。目前大部分商查平台本质上就是企业信用信息领域的搜索引擎,用户通过关键词,在企信数据库里搜索对应的企业或者风险信息,很难表述出用户复杂、结构化的需求。比如:某学校食堂招标过程中希望了解供应商的食品安全风险,用此前的商查产品一般是先输入参与投标的公司名称,然后跳转到到对应公司的主页面,再通过查找该公司“经营风险”中行政处罚或“经营信息”中的“食品安全”内容,才能确定该公司是否存在食品安全风险,步骤繁多,且对新用户并不友好。如果用户还想知道该企业法人经营的其他餐饮公司是否有过重大安全事件?本次投标是否有关联企业陪标?类似这些更深入的需求,简单的检索信息就很难快速满足用户。即使能实现需求,也需要用户本身具备相关的专业知识,并能熟练掌握商查平台各项搜索功能,经过多步相对繁琐的操作,最终才能得到关于该企业更深入、完善的信息。但这对于绝大多数新用户而言,使用门槛过高,不利于在更广泛的范围内打通信息通路。

  此外,搜索引擎模式,商查平台反馈给用户的是大量基础数据,而不是直接的答案。如果是大型集团公司,则可能有成千上万的基础企信数据,如此巨大的浏览量对于用户而言是一个不小的负担。这样的商业信息查询服务,还停留在工具阶段,不能称之为强大的商业助手。同时,企查查拥有查企业、查老板、查风险、查招标、信用大数据、风险大数据等数百类产品服务,用户很难系统学习掌握,基于知彼阿尔法大模型,企查查后续将上线的对话产品,则可以跳过繁琐的检索步骤,用对话的方式充分释放企查查各项产品能力,为用户提供「有整体性的、易于理解的、具备高价值的」商业信息服务。

  而用户如果使用ChatGPT等大语言模型搜索高价值的企信数据时,会发现明显的问题:由于缺乏专业的数据库支持,通过ChatGPT搜索的企业工商、信用数据皆来源于公开的互联网数据,无法保证数据的准确性,与此同时,一些高质量、商业化的企信数据库并不对其开放。缺乏专业数据库的支持,ChatGPT等大语言模型在商查领域的分析都是“无米之炊”,甚至出现“无中生有”的状况。而知彼阿尔法商查大模型则是基于企查查全量可信数据进行的深度训练,可为用户提供专业的企信数据,及多样化的分析结果。

  AIGC+企业信用数据库,商查服务方式再进化

  随着人工智能步入“AIGC时代”,陈德强认为,这将彻底改变数据的查询和使用模式。“行业数据规模达到了一定量级后,数据查询方式发生了变化,AIGC+企业信用数据库,可以把数据完全利用起来。”据介绍,企查查目前发布的知彼阿尔法商查大模型是全球首款商业查询大模型,该模型基于企查查覆盖的全球企业信用数据进行训练,相较于传统商查平台,后续基于知彼阿尔法商查大模型构建的产品实现了以下三个方面的变革:

  人机交互方面实现运用自然语言对话,即能完成复杂的查询步骤。用户要查询某项商业数据,不再局限于关键词搜索,而是可以用一段自然语言的描述,来提出自己的需求,降低用户门槛。例如,当用户想要对某公司进行浅度尽调时,可以提出“某公司行业地位怎么样?有哪些竞争对手?”知彼阿尔法大模型会从用户的描述中理解其需求,并将需求“解构”成对应的指令。这种方式,当用户在了解一家企业时,面对的知彼阿尔法大模型就像是一个专业的商业调查助手,而不是一个没有智慧的工具。

  技术方面针对用户所提需求实现了秒级响应。知彼阿尔法大模型能够根据用户语义,调取企查查企信数据,然后再把“整理、归纳”后的结果呈现给用户。这种情况下,用户得到的不再是一堆零散信息,而是一个完整的答案。为提升响应速度,知彼阿尔法大模型已全量接入企查查超算平台,秒级时间就能完成查询、浏览、总结、结构化输出等繁冗步骤。

  新增“多轮对话”功能,让商查平台具备了逻辑思考能力。知彼阿尔法大模型“多轮对话”功能,是该模型优于以往企查查对话式AI的一大亮点。借助这一能力,知彼阿尔法大模型可以引导用户通过多轮对话的方式,一步步进行更深入的分析。在多轮对话中,用户可以在已经得到的结果基础上,提出新的指令,从而问出更深入的问题。这种方式,让知彼阿尔法大模型不仅成为用户的助手,还可以是“引路人”,循序渐进的引导用户自己去寻求答案。

+1

来源:科技魔方

延展资讯