科技魔方

企业级语言模型Command-R发布:专注RAG和工具使用 支持长达128k的上下文

更多场景

2024年03月12日

  Cohere团队于2024年3月11日发布了Command-R,一款旨在实现生产规模人工智能的新型检索增强生成模型。该模型专注于检索增强生成(RAG)和工具使用,是可扩展的生成模型,旨在帮助企业从概念验证迈向实际生产。

  高性能检索增强生成 (RAG)

  Command-R以其在RAG和工具使用方面的强大准确性、低延迟、高吞吐量以及支持长达128k的上下文而脱颖而出。与Cohere行业领先的Embed和Rerank模型协同工作,Command-R在RAG应用中实现了最佳集成,并在企业使用案例中表现卓越。

  检索增强生成(RAG)已经成为LLMs部署中的关键模式,使企业能够授予模型访问其私有知识。Cohere的Embed模型和Rerank模型在检索步骤中的改进,提高了对相关信息的理解,从而提高了模型的准确性和实用性。

1.jpg

  (左)Command-R 和 Mixtral 在一系列与企业相关的 RAG 应用程序上进行的头对头整体人类偏好评估,考虑到流畅性、答案实用性和引用。(右)使用 Natural Questions( Kwiatkowski et al.2019)、TriviaQA(Joshi et al.2017)和 HotpotQA(Yang et al.2018)(单次检索)基准进行端到端评估的平均准确度所有模型的KILT 维基百科索引 ( Petroni et al.2020)。

  Command-R通过工具使用的能力,实现了将LLMs转变为核心推理引擎,可以自动执行任务并采取实际行动,而不仅仅是处理和生成文本。这包括使用API、代码解释器等用户定义工具,使开发人员能够将Command-R用于自动化需要使用内部基础设施和外部工具的复杂任务和工作流程。

  更多的全球商业语言

2.jpg

  该模型在全球商业中的应用也得到了重视,支持10种主要商业语言,包括英语、法语、西班牙语、意大利语、德语、葡萄牙语、日语、韩语、阿拉伯语和中文。此外,Cohere的Embed和Rerank模型还原生支持100多种语言,使用户能够从各种数据源中提取答案。

  更长的上下文窗口和改进的定价

  Command-R发布的重要升级之一是支持长达128k的上下文,同时在Cohere的托管API上实现价格下调,以及私有云部署的显著效率改进。这使得Command-R在检索增强生成(RAG)应用中能够处理更多上下文,从而实现性能的显著提升。

  Cohere团队强调了对机器学习研究社区的支持,通过其非营利性研究实验室Cohere For AI公开发布Command-R版本的权重,以促进独立评估和学术研究。

  Command-R的发布标志着Cohere在面向生产规模的AI技术方面的持续努力,为企业提供可信赖的AI合作伙伴,同时保持对云选择和数据隐私的核心关注。期待用户对Command-R的反馈,并期待在未来提供更多可扩展的模型,助力企业成功迈向生产规模的人工智能应用。

+1

来源:站长之家

延展资讯