科技魔方
  • 模型最新相关新闻
  • 个性化扩散模型微调方法DiffuseKronA:个性化扩散模型微调方法,大幅减少参数、合成高质量图像

    2月28日 消息:近期,针对文本到图像(T2I)生成模型领域中的个性化主题驱动模型,出现了一些令人印象深刻的进展,如 DreamBooth 和 BLIP-Diffusion。然而,这些模型普遍存在着对微调的需求较高和参数规模庞大的限制。

  • 站长之家 模型大模型文本图像
  • 516 0
  • 亚马逊云宣布Mistral AI 模型即将登陆 Amazon Bedrock

    Mistral AI 是一家总部位于法国的人工智能公司,专注于将公开可用的模型提升至最先进的性能水平。他们主要致力于构建快速而安全的大型语言模型(LLM),可用于各种任务,如聊天机器人和代码生成。

    蚂蚁集团研发多模态遥感基础模型SkySense,可用于地貌地物观测解译

    2月28日 消息:近日,蚂蚁集团推出20亿参数多模态遥感基础模型SkySense,这是蚂蚁百灵大模型在多模态领域最新的研发成果,其论文已被世界计算机视觉顶会CVPR2024接收。

  • 站长之家 蚂蚁集团模型大模型
  • 632 0
  • 谷歌:希望未来数周内重新上线 Gemini 模型人像生成功能,正在修复问题

    据路透社报道,当地时间 26 日,谷歌 DeepMind 首席执行官德米斯・哈萨比斯在 MWC 2024 的小组讨论会中表示,“我们已下线 Gemini 的人像生成功能,同时正在修复问题,希望未来几周内重新上线。”

  • IT之家 谷歌模型人像
  • 536 0
  • 谷歌发布基础世界模型Genie:11B参数,单张图生成可交互的虚拟世界

    谷歌最新发布了基础世界模型Genie,这一模型拥有110亿参数,能够生成可交互的虚拟世界。Genie的出现让人们看到了人工智能在虚拟世界的无限可能性。

  • 站长之家 谷歌模型大模型
  • 612 0
  • 谷歌发布轻量级开源人工智能模型Gemma

    2月22日消息,据外媒报道,当地时间周三,谷歌发布了开源人工智能(AI)模型系列Gemma,以帮助开发人员和研究人员负责任地构建人工智能。

    多尺度深度生成模型NeuralPLexer:预测蛋白质-配体复合物结构

    科学家们近日在《Nature Machine Intelligence》杂志上发布了一项关于蛋白质-配体复合物结构预测的研究,由 AI 制药公司 Iambic Therapeutics、英伟达(Nvidia Corporation)和加州理工学院联合开发的新方法被称为 Neura

  • 站长之家 模型大模型NeuralPLexer
  • 674 0
  • 目标检测跟踪模型YOLOv8 能快速识别和定位多个对象

    2月21日 消息:YOLOv8是一种先进的目标检测跟踪模型,它在图像或视频帧中能够快速准确地识别和定位多个对象,并能够跟踪它们的移动,同时将其分类。除了检测对象,YOLOv8还可以区分对象的确切轮廓,进行实例分割、估计人体的姿

  • 站长之家 模型大模型YOLOv8
  • 681 0
  • FiT:一种全新的Transformer架构图像生成模型 分辨率和高宽比不受限制

    2月21日 消息:灵活视觉变换器(FiT)是一种全新的Transformer架构图像生成模型,专门设计用于创造没有分辨率和宽高比限制的图像。

  • 站长之家 FiT模型图像
  • 701 0
  • 多视角高斯模型LGM:5秒产出高质量3D物体 支持图文到3D

    近期,由北京大学、南洋理工大学 S-Lab 和上海人工智能实验室联合研究的团队推出的大型多视角高斯模型(LGM)引起广泛关注。

    语音生成的「智能涌现」:10万小时数据训练,亚马逊祭出10亿参数BASE TTS
    语音生成的「智能涌现」:10万小时数据训练,亚马逊祭出10亿参数BASE TTS

    伴随着生成式深度学习模型的飞速发展,自然语言处理(NLP)和计算机视觉(CV)已经经历了根本性的转变,从有监督训练的专门模型,转变为只需有限的明确指令就能完成各种任务的通用模型。

  • 机器之心Pro 语音数据亚马逊模型
  • 675 0
  • 苹果展示AI新模型MGIE 可一句话精修图片
    苹果展示AI新模型MGIE 可一句话精修图片

    2 月 8 日消息,相比较微软的风生水起,苹果公司在 AI 领域的布局显得低调很多,但这并不意味着苹果在该领域就没有丝毫建树。

  • IT之家 苹果AI模型
  • 543 0
  • RAGatouille:几行代码搞定 让你轻松玩转SOTA检索模型ColBERT

    在信息检索中,创建有效的管道,尤其是使用RAG(Retrieval-Augmented Generation)的管道,可能是相当具有挑战性的。这些管道涉及各种组件,选择检索模型至关重要。

  • 站长之家 RAGatouille模型ColBERT
  • 626 0
  • 模型混合新方法SegMoE 无需训练即可混合多个SD模型

    SegMoE是一种无需训练就可以混合多个SD模型组成一个新的模型,类似LLM的MoE模型。据称,他们提供了三个已经混合好的模型,分别由2个SDXL、4个SDXL和4个SD1.5模型组成。

  • 站长之家 模型
  • 556 0
  • 蚂蚁集团CodeFuse-VLM开源 支持多模态多任务预训练/微调

    CodeFuse-VLM是一个支持多种视觉模型和语言大模型的框架,用户可以根据自己的需求搭配不同的Vision Encoder和LLM。

  • 站长之家 蚂蚁集团开源模型
  • 706 0
  • 谷歌推时间序列预测模型TimesFM 可预测股市、天气等

    2月4日 消息:Google研究团队最近推出了一款名为TimesFM的时间序列预测模型。时间序列预测是一种通过分析过去的数据来预测未来事件发生的方法,广泛应用于商业、金融和科研等多个领域,帮助人们做出更明智的决策。

  • 站长之家 谷歌模型大模型
  • 584 0
  • DrugAssist:基于LLM的分子优化模型 可以用自然语言与人类实时交互

    2月4日 消息:随着近年来大型语言模型(LLMs)在语言处理领域的显著进展,研究人员尝试将这些模型应用于药物发现,以优化相关任务。

  • 站长之家 DrugAssist模型语言
  • 643 0
  • GenEM:利用大语言模型实现机器人行为的生成表达

    2月4日 消息:在人机交互领域存在许多挑战,其中之一是使机器人展示类似于人类的表达行为。传统的基于规则和基于数据的方法在新的社交环境中需要更大的可扩展性,而数据驱动方法受到数据集的限制。

  • 站长之家 GenEM大语言模型
  • 628 0
  • 视频生成模型Motion-I2V:支持控制视频运动轨迹

    2月4日 消息:Motion-I2V是一种新型的视频生成模型,可以像Runway的运动笔刷一样控制视频生成。

  • 站长之家 视频模型大模型
  • 595 0
  • Bard推出图片生成功能 由Imagen 2图像生成模型提供支持

    2月2日 消息:Bard已经更新,现在具有生成图片的能力。这一功能由DeepMind的Imagen2图像生成模型提供支持。

  • 站长之家 Bard图像模型
  • 564 0
  • OpenAI不服GPT-4被Bard反超 推出最新模型GPT-4-0125-preview
    OpenAI不服GPT-4被Bard反超 推出最新模型GPT-4-0125-preview

    最新的Chatbot Arena排行榜显示,Bard成功超越了GPT-4,成为第二名,仅次于GPT-4Turbo。这一消息引发了科技圈的热议和关注。

  • 站长之家 OpenAI模型
  • 574 0
  • 新型多模态模型Adept Fuyu-Heavy 专为数字代理设计

    Adept Fuyu-Heavy是一种新型的多模态模型,专为数字代理设计。

  • 站长之家 模型数字代理
  • 681 0
  • 麻省理工推出两款名为“PRISM”的AI模型 可更早检测出胰腺癌

    麻省理工学院 (MIT) 宣布推出两款名为“PRISM”的人工智能模型,旨在比传统方法更早地检测胰腺癌。

  • 站长之家 麻省理工AI模型
  • 638 0
  • 「think step by step」还不够,让模型「think more steps」更有用

    如今,大型语言模型(LLM)及其高级提示策略的出现,标志着对语言模型的研究取得了重大进展,尤其是在经典的 NLP 任务中。

  • 微信公众号 机器之心 模型
  • 653 0
  • 百度推多模态模型UNIMO-G 支持还原图片ID

    在最新的研究中,百度提出了一项名为UNIMO-G的统一图像生成框架,旨在克服现有文本到图像扩散模型面临的挑战。传统模型主要根据简洁的文本提示生成图像,但文本描述的简洁性限制了生成复杂细节图像的能力。

  • 站长之家 百度模型文本视频
  • 665 0
  • -------------没有了-------------

    图赏更多>