研究人员介绍了 LLEMMA,这是一个开源的大型语言模型,专门设计用于解决数学问题。与其他领先的数学语言模型相比,LLEMMA 在性能上表现出色,为进一步的研究提供了一个强大的平台。
英伟达最新的AI AgentEureka搭载了强大的GPT-4模型,通过生成奖励函数的方式,使机器人能够完成多项复杂任务,其中包括一些看似简单但难以实现的动作,如转笔、打开抽屉、抛球等。
北京大学软件工程国家工程研究中心知识计算实验室联合四川天府银行 AI 实验室,19日开源旗下 70 亿参数的代码大模型 CodeShell,号称“同等规模最强代码基座”。
继CodeLlama开源之后,北大等机构正式开源了性能更强的代码基座大模型CodeShell-7B和代码助手CodeShell-Chat。
Cal.ai是一款AI日程助手,为用户提供自动预订和管理会议的能力。它还能够查询实时人员可用性,提供会议重排建议,以及执行其他与日程管理相关的任务。
LLaVA-1.5是来自威斯康星大学麦迪逊分校、微软研究院和哥伦比亚大学的研究人员近期开源的一款全新的端到端多模态大模型,可与OpenAI的GPT-4V形成正面竞争。
9月25日,阿里云开源通义千问140亿参数模型Qwen-14B及其对话模型Qwen-14B-Chat,免费可商用。
据 Arxiv 页面显示,来自苏州大学的一个研发团队近日推出一款名为 OpenBA 的开源 seq2seq 模型。
大型语言模型(LLMs)如GPT-4因其生成各种用户查询的文本响应的能力而变得极为流行。然而,尽管它们具有强大的功能,但在有效传达复杂信息方面存在一些限制。
今年 6 月,上海 AI 实验室发布了“书生・浦语”(InternLM)大模型,为104B 参数,后续又推出了7B 和 13B 规格模型。
商汤科技与上海人工智能实验室联合推出了书生・浦语大模型(InternLM)的200亿参数版本 InternLM-20B,并在阿里云魔搭社区(ModelScope)上进行了开源发布。
腾讯宣布开源LightDiffusionFlow ,LightDiffusionFlow是一个开源插件,基于 AI 绘画开源平台 StableDiffusion webUI(SD)开发而来。
数学通才「猛犸」模型给开源语言模型带来了「推理春天」,面对GPT-4都有一战之力!
9月12日,淘天集团联合爱橙科技正式对外开源大模型训练框架Megatron-LLaMA,以让技术开发者们更方便地提升大语言模型训练性能,降低训练成本。
-------------没有了-------------