科技魔方
  • 文本最新相关新闻
  • 马斯克XAI发布Grok-1.5 Vision 多模态模型 可处理文本和图片信息

    在人工智能领域,多模态模型的发展一直是行业关注的焦点。近日,马斯克X AI公司发布了其最新的多模态模型——Grok-1.5Vision,这一模型不仅能够处理文本信息,还能够理解和分析各种视觉数据,如文档、图表、截图和照片,标志着公

  • 站长之家 马斯克大模型文本图片
  • 612 0
  • 报道称百度文心一言即将免费开放200万 -500万长文本能力

    据《科创板日报》报道,该报记者从知情人士获悉百度即将免费开放200万 -500万长文本能力。

  • 站长之家 百度文心一言文本
  • 536 0
  • 360智脑内测500万字长文本处理功能 将引入360AI 浏览器
    360智脑内测500万字长文本处理功能 将引入360AI 浏览器

    日前,360智脑宣布正式内测500万字长文本处理功能。这一功能即将加入360AI 浏览器,同时该浏览器的 APP 也即将上线。

    阿里推AtomoVideo文本+图片生视频模型,媲美Gen-2和Pika

    AtomoVideo的使用非常简便,用户只需提供高清图片和简单的文本提示即可在短时间内生成逼真的高清视频,并保留细致的细节。

  • 站长之家 阿里AtomoVideo文本
  • 530 0
  • MyShell多语言、多口音文本转语音库MeloTTS开源

    近日,MyShell公司宣布其多语言、多口音的文本转语音库MeloTTS正式开源。这一消息在开源社区引起了广泛关注。MeloTTS支持的语言包括英语、西班牙语、法语、中文、日语和韩语,为开发人员提供了丰富的选择。

  • 站长之家 文本大模型
  • 531 0
  • 比Sora惊艳!文本生成超25秒视频,带背景音乐、转场等效果

    2月29日,著名AI平台Lightricks在官网宣布,推出生成式AI电影制作平台—LTX Studio。

  • ​AIGC开放社区公众号 Sora文本视频
  • 523 0
  • 个性化扩散模型微调方法DiffuseKronA:个性化扩散模型微调方法,大幅减少参数、合成高质量图像

    2月28日 消息:近期,针对文本到图像(T2I)生成模型领域中的个性化主题驱动模型,出现了一些令人印象深刻的进展,如 DreamBooth 和 BLIP-Diffusion。然而,这些模型普遍存在着对微调的需求较高和参数规模庞大的限制。

  • 站长之家 模型大模型文本图像
  • 515 0
  • 谷歌CEO表示 Gemini AI 多样性错误“完全不可接受”

    近日,谷歌首席执行官桑达尔·皮查伊在一份内部备忘录中向员工解释了 Gemini AI 生成的历史不准确图像和文本所引发的争议这一备忘录在上周传出,皮查伊在其中承认 Gemini AI 的表现“冒犯了我们的用户并表现出偏见”。

  • 站长之家 谷歌GeminiAI文本
  • 547 0
  • 替换万物3D!Meta 推ReplaceAnything3D可用文本引导3D场景编辑

    2月1日 消息:Meta联合伦敦大学学院研究院在一项研究中提出了一种全新的文本引导的3D场景编辑方法,被称为ReplaceAnything3D(RAM3D)。这一方法通过引入Erase-and-Replace策略,能够有效地替换场景中的特定对象,实现了文本

  • 站长之家 3DReplaceAnything3D文本
  • 545 0
  • 文本直接在3D场景中生成对象,谷歌推出InseRF模型

    随着大模型技术的飞速发展,基于语言和视觉的3D场景编辑方法取得了十足进步,如Instruct-NeRF2NeRF在修改和场景控制方面展示了强大功能。

  • 微信公众号 AIGC开放社区 文本3D
  • 552 0
  • 清华、北邮等联合发布首个大模型时代下的文本水印综述

    1月26日 消息:在大模型时代,清华、港中文、港科广、UIC、北邮联合发布了一篇文本水印综述,全面探讨了大模型与文本水印技术的交融。

  • 站长之家 清华北邮大模型文本
  • 704 0
  • AI图像高清修复工具SUPIR 可根据文本提示智能修复

    1月26日 消息:SUPIR是一个通过增加模型规模来提升图像修复能力的技术,它能够根据文本提示进行智能修复,提高图像修复的质量和智能程度。

  • 站长之家 AI图像SUPIR文本
  • 631 0
  • 百度推多模态模型UNIMO-G 支持还原图片ID

    在最新的研究中,百度提出了一项名为UNIMO-G的统一图像生成框架,旨在克服现有文本到图像扩散模型面临的挑战。传统模型主要根据简洁的文本提示生成图像,但文本描述的简洁性限制了生成复杂细节图像的能力。

  • 站长之家 百度模型文本视频
  • 664 0
  • InstantID模型发布 相比PhotoMaker保留了良好的文本可编辑性

    1月23日 消息:人脸身份保持项目InstantID正式发布模型。与PhotoMaker和IP-Adapter-FaceID相比,InstantID实现了更好的保真度并保留了良好的文本可编辑性。这个项目的发布受到了广泛关注,因为它能够更好地融合面孔和样式

  • 站长之家 InstantID模型文本
  • 671 0
  • 百度推出视频生成模型UniVG 可处理各种文本和图像的组合输入

    1月19日 消息,百度推出的UniVG是一款视频生成模型,其特点在于针对高自由度和低自由度两种任务分别采用不同的生成方式,以更好地平衡两者之间的关系。

  • 站长之家 百度模型文本视频
  • 556 0
  • 新文生图模型PIXART-δ:引入ControlNet,加速文本生成图像生成

    1月17日 消息:近年来,文本到图像生成模型的需求不断增长,但高质量图像的生成往往面临资源密集型训练和慢推理的挑战,制约了其实时应用。本文介绍了PIXART-δ,这是PIXART-α框架的先进版本,无缝整合了Latent Consistency Mo

  • 站长之家 模型文本图像
  • 673 0
  • 文本到3D生成评估器GPTEval3D 让GPT-4对生成的3D模型打分

    GPTEval3D提供了一个用于评估文本到3D生成模型性能的评估指标。利用OpenAI和PyTorch,它通过ELO评分系统提供了一个全面的框架,用于评估文本到3D生成模型的性能。

  • 站长之家 文本3DGPTEval3D
  • 666 0
  • Text2Immersion:可通过文本直接生成3D场景

    Text2Immersion是一种创新的方法,通过文本提示生成高质量的3D沉浸式场景。

  • 站长之家 Text2Immersion文本3D场景
  • 696 0
  • 多模态AI模型Unified-IO2:可理解和生成图像、文本、音频和动作

    近期,由艾伦人工智能研究所、伊利诺伊大学厄巴纳-香槟分校和华盛顿大学的研究人员联合开发的“Unified-IO2”标志着人工智能能力的一次巨大飞跃。

  • 站长之家 AI模型图像文本音频
  • 710 0
  • 文本生成高精准3D模型,北京智源AI研究院等出品—3D-GPT

    北京智源AI研究院、牛津大学、澳大利亚国立大学联合发布了一项研究—3D-GPT,通过文本问答方式就能创建高精准3D模型。

  • 微信公众号 AIGC开放社区
  • 601 0
  • 全球最强长文本大模型,一次可读35万汉字:Baichuan2-192K上线

    大模型看书,从来没有这么快过。

  • 微信公众号 机器之心
  • 558 0
  • Mini- DALLE 3:提高大模型的文本到图像生成技术

    近年来,文本到图像(T2I)模型的快速发展为人工内容生成带来了革命性的变化,这些模型在不到两年的时间内就能够生成高质量、多样性和创造性的图像。

  • 站长之家
  • 704 0
  • 英伟达文本转3D AI工具Masterpiece X首次亮相

    Nvidia与3D软件开发商Masterpiece Studio合作发布了Masterpiece X,旨在通过使3D建模像使用MidJourney或Stable Diffusion创建二维图像一样简单,革新了3D建模领域。

  • 站长之家
  • 538 0
  • 再增两百博士下一线 华为云盘古大模型奔涌进行业

    在过去几个月的大模型落地实践中,业界遇到了方方面面的挑战。

  • 数智前线
  • 603 0
  • instaflow:利用校正流技术加快将文本转化为图像的过程

    InstaFlow是一个快速、一步生成图像的模型,能够以接近Stable Diffusion的图像质量显著减少计算资源需求。

  • 站长之家
  • 568 0
  • -------------没有了-------------

    图赏更多>