科技魔方
  • 大语言模型最新相关新闻
  • Meta推出LayerSkip:提升大语言模型推理速度

    Meta公司最新发布了LayerSkip,这是一款端到端的解决方案,专门设计用于提升大型语言模型(LLM)的推理速度。

  • 站长之家 Meta大模型大语言模型
  • 526 0
  • Meta即将推出新一代Llama3大语言模型

    据悉,Llama3最高版本可能拥有超过1400亿个参数,这将使其性能有望赶上OpenAI最新的GPT-4Turbo版本。不过,Meta下周公布的版本暂不支持多模态技术。

  • 站长之家 Meta大模型大语言模型
  • 657 0
  • 新机器学习框架DRAGIN:用于大语言模型中的动态检索增强,胜过传统方法
    新机器学习框架DRAGIN:用于大语言模型中的动态检索增强,胜过传统方法

    研究人员从清华大学和北京理工大学开发了 DRAGIN,这是一种针对大型语言模型设计的动态检索增强生成框架。

  • 站长之家 框架大模型大语言模型
  • 581 0
  • 谷歌新研究成果:让大语言模型理解「图的语言」,性能提升60%
    谷歌新研究成果:让大语言模型理解「图的语言」,性能提升60%

    近日,谷歌在ICLR2024上推出了一项重大成果:他们成功让大型语言模型(LLMs)学会理解「图的语言」,性能提升了高达60%。这项研究解决了LLMs在处理图形问题上的瓶颈,开启了图形数据与文本表示之间的新篇章。

  • 站长之家 谷歌大模型大语言模型
  • 703 0
  • 给大模型补脑?腾讯发布ELLA,让SD模型提示词理解能力更强

    腾讯昨天发布了一个名为ELLA的项目,这是一个高效的大语言模型适配器,能够无需训练就增强现有SD模型提示词理解的能力。ELLA将强大的大语言模型整合到文本到图像的扩散模型中,从而显著提升模型处理文本对齐的能力,而不需要

  • 站长之家 大模型腾讯大语言模型
  • 563 0
  • 腾讯推出ELLA大型语言模型适配器 助力模型语义对齐与高效提示跟踪

    腾讯研发团队于3月8日在预印本平台arXiv发布了一项重要成果,推出了名为ELLA的大型语言模型适配器。这一适配器的推出标志着在扩散模型中配备大语言模型的新里程碑,为模型提供了增强的语义对齐能力。

    TOWER: 开放式多语言大语言模型,用于翻译相关任务

    人工智能的领域开始重新定义多语言自然语言处理的边界,其中大型语言模型(LLMs)在重塑翻译领域的复杂语言细微差别方面发挥着重要作用。

  • 站长之家 Tower大语言模型大模型
  • 601 0
  • 苹果研究人员提出MAD-Bench基准,克服多模态大语言模型中幻觉和误导性提示

    在人工智能领域,多模式大语言模型(MLLMs)在推动进步方面发挥了巨大作用,但它们面临处理误导性信息的挑战,可能导致不正确或产生幻觉的响应。

  • 站长之家 苹果大模型大语言模型
  • 658 0
  • 与Sora一样能生成视频、图像,还能一次解读100万数据!

    大语言模型(LLM)在生成文本内容方面非常强,但在理解、生成视频、图像等方面略显不足。尤其是在Sora一夜爆红之后,让人们意识到未来主流模型一定是文本+音频+图像+视频的多模态生成、理解功能。

    谷歌内部编码AI大语言模型Goose曝光

    谷歌更新了其人工智能项目 Gemini,旨在改善其性能和用户体验,但推出初期遇到了速度缓慢和部分用户遇到问题。谷歌产品负责人表示正在积极修复,特别是拒绝响应的问题已经减少了约一半。

    -------------没有了-------------

    图赏更多>