科技魔方
  • Transformer最新相关新闻
  • MIT斯坦福Transformer最新研究:过度训练会让中度模型“结构顿悟”
    MIT斯坦福Transformer最新研究:过度训练会让中度模型“结构顿悟”

    最新研究指出,经过过度训练,中度的Transformer模型能够展现出结构性泛化能力,这一现象被称为"结构顿悟"。

  • 站长之家 MIT斯坦福Transformer
  • 639 0
  • 五倍吞吐量,性能全面包围Transformer:新架构Mamba引爆AI圈

    屹立不倒的Transformer迎来了一个强劲竞争者。

  • 微信公众号 机器之心 性能Transformer
  • 580 0
  • 比Transformer更好的模型架构?Monarch Mixer更低成本取得更优表现

    近年来,Transformer模型在自然语言处理和计算机视觉领域取得了巨大成功,但它的高成本、复杂性以及依赖于注意力机制和多层感知机(MLP)等组件使得人们开始寻求替代方案。

  • 站长之家 Transformer大模型参数
  • 682 0
  • Transformer一作公司Adept发布多模态大模型Fuyu-8B 80亿参数,100毫秒极速响应

    Transformer一作Ashish Vaswani所在的AI公司Adept发布了多模态大模型Fuyu-8B。这一模型具有80亿参数,可理解各种图像类型,包括照片、图表、PDF和界面UI。

  • 站长之家 Transformer
  • 887 0
  • UMMAFormer:一种有效识别视频中的伪造内容的Transformer框架

    UMMAFormer是一种新工具,专门用于识别视频中的假内容。

  • 站长之家
  • 688 0
  • -------------没有了-------------

    图赏更多>