文本最新相关新闻-科技魔方_中文AI大模型门户网站

文本最新相关新闻

马斯克XAI发布Grok-1.5 Vision 多模态模型可处理文本和图片信息

在人工智能领域，多模态模型的发展一直是行业关注的焦点。近日，马斯克X AI公司发布了其最新的多模态模型——Grok-1.5Vision，这一模型不仅能够处理文本信息，还能够理解和分析各种视觉数据，如文档、图表、截图和照片，标志着公

站长之家 马斯克大模型文本图片

612

报道称百度文心一言即将免费开放200万 -500万长文本能力

据《科创板日报》报道，该报记者从知情人士获悉百度即将免费开放200万 -500万长文本能力。

站长之家百度文心一言文本

536

360智脑内测500万字长文本处理功能将引入360AI 浏览器

日前，360智脑宣布正式内测500万字长文本处理功能。这一功能即将加入360AI 浏览器，同时该浏览器的 APP 也即将上线。

科技魔方 360智脑文本大模型浏览器

621

阿里推AtomoVideo文本+图片生视频模型，媲美Gen-2和Pika

AtomoVideo的使用非常简便，用户只需提供高清图片和简单的文本提示即可在短时间内生成逼真的高清视频，并保留细致的细节。

站长之家阿里AtomoVideo文本

530

MyShell多语言、多口音文本转语音库MeloTTS开源

近日，MyShell公司宣布其多语言、多口音的文本转语音库MeloTTS正式开源。这一消息在开源社区引起了广泛关注。MeloTTS支持的语言包括英语、西班牙语、法语、中文、日语和韩语，为开发人员提供了丰富的选择。

站长之家文本大模型

531

比Sora惊艳！文本生成超25秒视频，带背景音乐、转场等效果

2月29日，著名AI平台Lightricks在官网宣布，推出生成式AI电影制作平台—LTX Studio。

AIGC开放社区公众号 Sora文本视频

523

个性化扩散模型微调方法DiffuseKronA：个性化扩散模型微调方法，大幅减少参数、合成高质量图像

2月28日消息:近期，针对文本到图像(T2I)生成模型领域中的个性化主题驱动模型，出现了一些令人印象深刻的进展，如 DreamBooth 和 BLIP-Diffusion。然而，这些模型普遍存在着对微调的需求较高和参数规模庞大的限制。

站长之家模型大模型文本图像

515

谷歌CEO表示 Gemini AI 多样性错误“完全不可接受”

近日，谷歌首席执行官桑达尔·皮查伊在一份内部备忘录中向员工解释了 Gemini AI 生成的历史不准确图像和文本所引发的争议这一备忘录在上周传出，皮查伊在其中承认 Gemini AI 的表现“冒犯了我们的用户并表现出偏见”。

站长之家谷歌GeminiAI文本

547

替换万物3D！Meta 推ReplaceAnything3D可用文本引导3D场景编辑

2月1日消息:Meta联合伦敦大学学院研究院在一项研究中提出了一种全新的文本引导的3D场景编辑方法，被称为ReplaceAnything3D(RAM3D)。这一方法通过引入Erase-and-Replace策略，能够有效地替换场景中的特定对象，实现了文本

站长之家 3DReplaceAnything3D文本

545

文本直接在3D场景中生成对象，谷歌推出InseRF模型

随着大模型技术的飞速发展，基于语言和视觉的3D场景编辑方法取得了十足进步，如Instruct-NeRF2NeRF在修改和场景控制方面展示了强大功能。

微信公众号 AIGC开放社区文本3D

552

清华、北邮等联合发布首个大模型时代下的文本水印综述

1月26日消息:在大模型时代，清华、港中文、港科广、UIC、北邮联合发布了一篇文本水印综述，全面探讨了大模型与文本水印技术的交融。

站长之家清华北邮大模型文本

705

AI图像高清修复工具SUPIR 可根据文本提示智能修复

1月26日消息:SUPIR是一个通过增加模型规模来提升图像修复能力的技术，它能够根据文本提示进行智能修复，提高图像修复的质量和智能程度。

站长之家 AI图像SUPIR文本

633

百度推多模态模型UNIMO-G 支持还原图片ID

在最新的研究中，百度提出了一项名为UNIMO-G的统一图像生成框架，旨在克服现有文本到图像扩散模型面临的挑战。传统模型主要根据简洁的文本提示生成图像，但文本描述的简洁性限制了生成复杂细节图像的能力。

站长之家百度模型文本视频

664

InstantID模型发布相比PhotoMaker保留了良好的文本可编辑性

1月23日消息:人脸身份保持项目InstantID正式发布模型。与PhotoMaker和IP-Adapter-FaceID相比，InstantID实现了更好的保真度并保留了良好的文本可编辑性。这个项目的发布受到了广泛关注，因为它能够更好地融合面孔和样式

站长之家 InstantID模型文本

671

百度推出视频生成模型UniVG 可处理各种文本和图像的组合输入

1月19日消息，百度推出的UniVG是一款视频生成模型，其特点在于针对高自由度和低自由度两种任务分别采用不同的生成方式，以更好地平衡两者之间的关系。

站长之家百度模型文本视频

556

新文生图模型PIXART-δ:引入ControlNet，加速文本生成图像生成

1月17日消息:近年来，文本到图像生成模型的需求不断增长，但高质量图像的生成往往面临资源密集型训练和慢推理的挑战，制约了其实时应用。本文介绍了PIXART-δ，这是PIXART-α框架的先进版本，无缝整合了Latent Consistency Mo

站长之家模型文本图像

673

文本到3D生成评估器GPTEval3D 让GPT-4对生成的3D模型打分

GPTEval3D提供了一个用于评估文本到3D生成模型性能的评估指标。利用OpenAI和PyTorch，它通过ELO评分系统提供了一个全面的框架，用于评估文本到3D生成模型的性能。

站长之家文本3DGPTEval3D

666

Text2Immersion：可通过文本直接生成3D场景

Text2Immersion是一种创新的方法，通过文本提示生成高质量的3D沉浸式场景。

站长之家 Text2Immersion文本3D场景

696

多模态AI模型Unified-IO2：可理解和生成图像、文本、音频和动作

近期，由艾伦人工智能研究所、伊利诺伊大学厄巴纳-香槟分校和华盛顿大学的研究人员联合开发的“Unified-IO2”标志着人工智能能力的一次巨大飞跃。

站长之家 AI模型图像文本音频

710

文本生成高精准3D模型，北京智源AI研究院等出品—3D-GPT

北京智源AI研究院、牛津大学、澳大利亚国立大学联合发布了一项研究—3D-GPT，通过文本问答方式就能创建高精准3D模型。

微信公众号 AIGC开放社区

601

全球最强长文本大模型，一次可读35万汉字：Baichuan2-192K上线

大模型看书，从来没有这么快过。

微信公众号机器之心

558

Mini- DALLE 3：提高大模型的文本到图像生成技术

近年来，文本到图像(T2I)模型的快速发展为人工内容生成带来了革命性的变化，这些模型在不到两年的时间内就能够生成高质量、多样性和创造性的图像。

站长之家

704

英伟达文本转3D AI工具Masterpiece X首次亮相

Nvidia与3D软件开发商Masterpiece Studio合作发布了Masterpiece X，旨在通过使3D建模像使用MidJourney或Stable Diffusion创建二维图像一样简单，革新了3D建模领域。

站长之家

538

再增两百博士下一线华为云盘古大模型奔涌进行业

在过去几个月的大模型落地实践中，业界遇到了方方面面的挑战。

数智前线

603

instaflow：利用校正流技术加快将文本转化为图像的过程

InstaFlow是一个快速、一步生成图像的模型，能够以接近Stable Diffusion的图像质量显著减少计算资源需求。

站长之家

568

28 1 2 下一页尾页

-------------没有了-------------

图赏更多>

: 冲锋衣难洗？海尔洗衣机专业洗烘：洗净不伤衣

: 华为：Pura 70标准版不支持星闪 Pro/Pro +/Ultra标配

: 华为Pura 70全系维修价格出炉：Ultra版换主板5699元够买台Mate60

: 最强大模型Llama 3正式发布已达GPT4级别

: 已有117个AI大模型通过国家备案

: 字节跳动 “AI作业助手” Gauth在美国教育应用下载量排名第二

最热新闻最新新闻 更多>

用户推荐最热产品 更多>

倾城

小新

张影

创维电视（SKYWORTH）55V40

小米全面屏电视E43K

康佳（KONKA）55D6S

荣泰S60按摩椅

自媒体头条更多>: 极致听感智能降噪三星Galaxy Buds Pro诠释非同凡“响”

未来科技范试驾摩灵MOi｜视频

品牌专区更多>