昨夜,Meta宣布推出迄今为止最强大的开源模型——Llama 3.1 405B,同时发布了全新升级的Llama 3.1 70B和8B模型。
最近,佐治亚理工学院和英伟达的两位华人学者提出了一种名为RankRAG的新型微调框架,这个框架极大简化了原本复杂的RAG流水线,使用微调方法让同一个LLM完成检索、排名和生成任务,结果还实现了性能的大幅提升。
今年6月,OpenAI宣布终止对中国提供API服务,有业内人士分析,这将打击部分借助OpenAI大模型套壳创业的公司。
芝加哥大学的一项新研究表明,大型语言模型 GPT-4 在预测公司未来盈利增长方面能够胜过人类分析师,而且该人工智能模型仅使用了公司的财务报表,并没有额外的信息辅助。
芝加哥大学的一项新研究表明,大型语言模型 GPT-4 在预测公司未来盈利增长方面能够胜过人类分析师,而且该人工智能模型仅使用了公司的财务报表,并没有额外的信息辅助。
GPT-4越来越懂事了,这背后有着非常巧妙的「调教」策略。OpenAI最新发布的「模型规范」,给LLM列出了条条框框,即正确的行为方式。没想到,评论区一大片网友催更GPT-5。
5月11日消息,据外媒报道,在人工智能领域走在行业前列的OpenAI,已在官网宣布,他们将在太平洋时间5月13日上午10点,也就是北京时间5月14日凌晨1点,进行网络直播,演示部分ChatGPT和GPT-4的更新。
在百度文心一言、商汤日日新等当下国内主流大模型,陆续产品迭代升级至“全面对标GPT-4Turbo”之后,阿里云也入场了。
前段时间,微软公布并开源了最新一代大模型WizardLM-2,号称性能堪比GPT-4。不过,还未上线一天,模型权重和公告全被删除了,原因竟是......
Meta官方数据显示,Llama38B和70B版本在各自参数规模上超越一众对手。
Reka Core是一款最新发布的多模态大型语言模型(LLM),其性能可与GPT-4相媲美,甚至在某些方面超越了现有的前沿模型。
OpenAI最新推出的更新版 GPT-4Turbo 上周已经面向开发人员和付费 ChatGPT 订阅者提供。
近日,OpenAI宣布推出最新版的GPT-4Turbo,这一消息在人工智能领域引起了广泛关注。目前新版 GPT-4Turbo 已向所有付费 ChatGPT 用户开放,这标志着人工智能技术在语言理解和生成方面的又一重大进步。
瑞士洛桑联邦理工学院(EPFL)的研究人员最近进行的一项研究表明,GPT-4在说服力方面比人类表现更出色,优势接近82%,准确来说是81.7%。该研究涉及820人围绕一系列主题展开辩论。
科技媒体 theinformation 近日发布博文,表示 Meta 公司将于下周预告两款 Llama 3 AI 模型,为今年夏季推出“完整形态” Llama 3 铺垫。
普林斯顿大学最近推出了一款名为SWE-agent的AI程序员,这是世界上首个开源的AI程序员,它基于GPT-4技术,能够在GitHub仓库中自动修复bug。这个智能体-计算机接口(ACI)的诞生,标志着AI在软件工程领域的应用迈出了重要一步。
在一项新研究中,美国贝斯以色列医疗中心(BIDMC)的科学家们将一种大型语言模型与人类医生进行了临床推理能力的比较。
随着ChatGPT的出现,大语言模型在生成连贯文本和遵循指令方面获得了巨大技术突破。然后在推理和解决复杂内容方面,面临内容不准确、安全等难题。
近Anthropic刚刚发布了震撼消息:全新Claude3家族登场!据称,最强版本Claude 3 Opus在推理、数学、编码、多语言理解和视觉等领域已经超越了包括GPT- 4 在内的所有大模型,展现出接近人类理解能力。
在这场争夺AIGC话语权与领导力的追逐战里,谷歌与微软争相拼臂力秀肌肉。Gemini1.5Pro的横空出世,将多模态大模型的标准提到了一个新高度。
1月29日,百川智能发布超千亿参数的大语言模型Baichuan 3。在多个权威通用能力评测如CMMLU、GAOKAO和AGI-Eval中,Baichuan 3都展现了出色的能力,尤其在中文任务上更是超越了GPT-4。
2023 年末,有大量用户反馈 GPT-4.0 “变懒”问题,甚至有用户发文称:GPT 回应说它知道问题的答案,但是它不想回答。我甚至用“生命威胁”它才回答问题。
-------------没有了-------------