科技魔方

Cohere全面推出微调套件:聊天、重新排序、多标签分类一应俱全

大模型

2023年11月22日

  Cohere宣布推出全新的全面微调套件,其中包括聊天微调、重新排序微调和多标签分类微调等三项新功能,以及现有的生成微调解决方案,旨在满足企业在微调各种AI应用时的需求。

  通过这些新功能,企业可以定制Cohere的生成和表示模型,以在文本生成、摘要、聊天、分类和企业搜索等目标用例上提供更好的性能。

  微调套件引入了全新的微调仪表板,使企业能够轻松管理和运行微调项目。用户可以在几分钟内启动项目,利用测试场地验证微调模型,并通过价格计算器做出关于微调成本的明智决策。新的模型管理界面提供了对正在进行的微调作业进度和状态的实时洞察,确保用户全面了解其模型开发流水线和自定义评估指标,使Cohere客户能够有效管理、监控和优化其微调模型。

  Cohere满足企业定制模型、提高在特定领域的性能需求的要求,通过监督微调在各种用例中实现了更精准的性能。通过微调控制和高达六个超参数的调整,客户可以最大程度地优化微调模型的性能。文章通过一个财务服务提供商的用例进行了说明,展示了通过微调Command Light模型,可以为财务数据的问题提供更准确、更自然的回答,相较于使用原始模型,准确性提升了60%。

  微调不仅提高了模型的质量和准确性,还加速了模型的生产过程。开发人员现在可以在短短30分钟内训练微调模型,这得益于微调框架的改进和高效的TPU分配过程。完成训练后,企业可以在不到一分钟的时间内将微调模型部署到生产环境中,使开发人员能够轻松管理和自信地扩展其AI应用。

  在AI应用的成本效益方面,Cohere致力于提供满足各种企业用例需求的价格选择。为了实现更低的价格点上访问强大的语言模型,Cohere建议微调较小的生成模型,例如Command Light,以优化特定任务的性能,同时成本效益较高。例如,使用包含100万token的数据集进行两个周期的Command Light微调的预期成本为2美元。早期评估显示,相较于直接使用原始模型,微调Command Light可以在更低的延迟和成本下实现类似甚至更好的性能。

  Cohere表示他们将以与基础模型相同的推理成本提供微调模型,使客户能够以相同的价格获得提升精度的微调模型。Cohere客户现在可以访问微调仪表板,根据生成、聊天、分类和重新排序解决方案进行定制。开发人员可以按照指南学习有关它们如何工作的更多信息。

+1

来源:站长之家

延展资讯