模型最新相关新闻-科技魔方_中文AI大模型门户网站

2月28日消息:近期，针对文本到图像(T2I)生成模型领域中的个性化主题驱动模型，出现了一些令人印象深刻的进展，如 DreamBooth 和 BLIP-Diffusion。然而，这些模型普遍存在着对微调的需求较高和参数规模庞大的限制。

站长之家模型大模型文本图像

516

亚马逊云宣布Mistral AI 模型即将登陆 Amazon Bedrock

Mistral AI 是一家总部位于法国的人工智能公司，专注于将公开可用的模型提升至最先进的性能水平。他们主要致力于构建快速而安全的大型语言模型(LLM)，可用于各种任务，如聊天机器人和代码生成。

站长之家 亚马逊云AI模型AmazonBedrock

603

蚂蚁集团研发多模态遥感基础模型SkySense，可用于地貌地物观测解译

2月28日消息:近日，蚂蚁集团推出20亿参数多模态遥感基础模型SkySense，这是蚂蚁百灵大模型在多模态领域最新的研发成果，其论文已被世界计算机视觉顶会CVPR2024接收。

站长之家 蚂蚁集团模型大模型

632

谷歌：希望未来数周内重新上线 Gemini 模型人像生成功能，正在修复问题

据路透社报道，当地时间 26 日，谷歌 DeepMind 首席执行官德米斯・哈萨比斯在 MWC 2024 的小组讨论会中表示，“我们已下线 Gemini 的人像生成功能，同时正在修复问题，希望未来几周内重新上线。”

IT之家谷歌模型人像

536

谷歌发布基础世界模型Genie：11B参数，单张图生成可交互的虚拟世界

谷歌最新发布了基础世界模型Genie，这一模型拥有110亿参数，能够生成可交互的虚拟世界。Genie的出现让人们看到了人工智能在虚拟世界的无限可能性。

站长之家谷歌模型大模型

612

谷歌发布轻量级开源人工智能模型Gemma

2月22日消息，据外媒报道，当地时间周三，谷歌发布了开源人工智能(AI)模型系列Gemma，以帮助开发人员和研究人员负责任地构建人工智能。

TechWeb 谷歌人工智能模型Gemma

587

多尺度深度生成模型NeuralPLexer：预测蛋白质-配体复合物结构

科学家们近日在《Nature Machine Intelligence》杂志上发布了一项关于蛋白质-配体复合物结构预测的研究，由 AI 制药公司 Iambic Therapeutics、英伟达(Nvidia Corporation)和加州理工学院联合开发的新方法被称为 Neura

站长之家模型大模型NeuralPLexer

674

目标检测跟踪模型YOLOv8 能快速识别和定位多个对象

2月21日消息:YOLOv8是一种先进的目标检测跟踪模型，它在图像或视频帧中能够快速准确地识别和定位多个对象，并能够跟踪它们的移动，同时将其分类。除了检测对象，YOLOv8还可以区分对象的确切轮廓，进行实例分割、估计人体的姿

站长之家模型大模型YOLOv8

681

FiT：一种全新的Transformer架构图像生成模型分辨率和高宽比不受限制

2月21日消息:灵活视觉变换器(FiT)是一种全新的Transformer架构图像生成模型，专门设计用于创造没有分辨率和宽高比限制的图像。

站长之家 FiT模型图像

701

多视角高斯模型LGM:5秒产出高质量3D物体支持图文到3D

近期，由北京大学、南洋理工大学 S-Lab 和上海人工智能实验室联合研究的团队推出的大型多视角高斯模型(LGM)引起广泛关注。

站长之家 大模型模型多视角高斯模型3D

600

语音生成的「智能涌现」：10万小时数据训练，亚马逊祭出10亿参数BASE TTS

伴随着生成式深度学习模型的飞速发展，自然语言处理(NLP)和计算机视觉(CV)已经经历了根本性的转变，从有监督训练的专门模型，转变为只需有限的明确指令就能完成各种任务的通用模型。

机器之心Pro 语音数据亚马逊模型

675

苹果展示AI新模型MGIE 可一句话精修图片

2 月 8 日消息，相比较微软的风生水起，苹果公司在 AI 领域的布局显得低调很多，但这并不意味着苹果在该领域就没有丝毫建树。

IT之家苹果AI模型

543

RAGatouille：几行代码搞定让你轻松玩转SOTA检索模型ColBERT

在信息检索中，创建有效的管道，尤其是使用RAG(Retrieval-Augmented Generation)的管道，可能是相当具有挑战性的。这些管道涉及各种组件，选择检索模型至关重要。

站长之家 RAGatouille模型ColBERT

626

模型混合新方法SegMoE 无需训练即可混合多个SD模型

SegMoE是一种无需训练就可以混合多个SD模型组成一个新的模型，类似LLM的MoE模型。据称，他们提供了三个已经混合好的模型，分别由2个SDXL、4个SDXL和4个SD1.5模型组成。

站长之家模型

556

蚂蚁集团CodeFuse-VLM开源支持多模态多任务预训练/微调

CodeFuse-VLM是一个支持多种视觉模型和语言大模型的框架，用户可以根据自己的需求搭配不同的Vision Encoder和LLM。

站长之家 蚂蚁集团开源模型

706

谷歌推时间序列预测模型TimesFM 可预测股市、天气等

2月4日消息:Google研究团队最近推出了一款名为TimesFM的时间序列预测模型。时间序列预测是一种通过分析过去的数据来预测未来事件发生的方法，广泛应用于商业、金融和科研等多个领域，帮助人们做出更明智的决策。

站长之家谷歌模型大模型

584

DrugAssist:基于LLM的分子优化模型可以用自然语言与人类实时交互

2月4日消息:随着近年来大型语言模型(LLMs)在语言处理领域的显著进展，研究人员尝试将这些模型应用于药物发现，以优化相关任务。

站长之家 DrugAssist模型语言

643

GenEM：利用大语言模型实现机器人行为的生成表达

2月4日消息:在人机交互领域存在许多挑战，其中之一是使机器人展示类似于人类的表达行为。传统的基于规则和基于数据的方法在新的社交环境中需要更大的可扩展性，而数据驱动方法受到数据集的限制。

站长之家 GenEM大语言模型

628

视频生成模型Motion-I2V：支持控制视频运动轨迹

2月4日消息:Motion-I2V是一种新型的视频生成模型，可以像Runway的运动笔刷一样控制视频生成。

站长之家视频模型大模型

595

Bard推出图片生成功能由Imagen 2图像生成模型提供支持

2月2日消息:Bard已经更新，现在具有生成图片的能力。这一功能由DeepMind的Imagen2图像生成模型提供支持。

站长之家 Bard图像模型

564

OpenAI不服GPT-4被Bard反超推出最新模型GPT-4-0125-preview

最新的Chatbot Arena排行榜显示，Bard成功超越了GPT-4，成为第二名，仅次于GPT-4Turbo。这一消息引发了科技圈的热议和关注。

站长之家 OpenAI模型

574

新型多模态模型Adept Fuyu-Heavy 专为数字代理设计

Adept Fuyu-Heavy是一种新型的多模态模型，专为数字代理设计。

站长之家模型数字代理

681

麻省理工推出两款名为“PRISM”的AI模型可更早检测出胰腺癌

麻省理工学院 (MIT) 宣布推出两款名为“PRISM”的人工智能模型，旨在比传统方法更早地检测胰腺癌。

站长之家 麻省理工AI模型

638

「think step by step」还不够，让模型「think more steps」更有用

如今，大型语言模型(LLM)及其高级提示策略的出现，标志着对语言模型的研究取得了重大进展，尤其是在经典的 NLP 任务中。

微信公众号机器之心模型

653

百度推多模态模型UNIMO-G 支持还原图片ID

在最新的研究中，百度提出了一项名为UNIMO-G的统一图像生成框架，旨在克服现有文本到图像扩散模型面临的挑战。传统模型主要根据简洁的文本提示生成图像，但文本描述的简洁性限制了生成复杂细节图像的能力。

站长之家百度模型文本视频

665

300 首页上一页 2 3 4 5 6 7 8 9 10 11 下一页尾页

-------------没有了-------------

图赏更多>

: HMD XR21 坚固型手机发布：“换标”版诺基亚 XR21，599.99 欧元

: 荣耀Magic7系列有望年内发布可能与芯片发布提前有关

: OPPO Reno12系列5月23日发布有独占新功能

: 索尼Xperia 1 VI手机发布：骁龙8Gen3加持、长焦升级，屏幕回归主流规格

: AI大模型重构高阶智驾百度ASD将于极越车型量产首发

: 字节跳动正式发布“豆包大模型”家族

最热新闻最新新闻 更多>

用户推荐最热产品 更多>

倾城

小新

张影

创维电视（SKYWORTH）55V40

小米全面屏电视E43K

康佳（KONKA）55D6S

荣泰S60按摩椅

自媒体头条更多>: 极致听感智能降噪三星Galaxy Buds Pro诠释非同凡“响”

未来科技范试驾摩灵MOi｜视频

品牌专区更多>