科技魔方
  • 图像最新相关新闻
  • 视频生成控制提升几十倍,新一代轻量级ControlNeXt火了,贾佳亚团队正挑战Scaling Law

    最近,又一款国产 AI 神器吸引了众网友和圈内研究人员的关注!它就是全新的图像和视频生成控制工具 —— ControlNeXt,由思谋科技创始人、港科大讲座教授贾佳亚团队开发。

  • 机器之心公众号 视频图像
  • 614 0
  • 谷歌 Pixel 9 手机的 AI 图像生成工具“放飞自我”,或成“造假利器”
    谷歌 Pixel 9 手机的 AI 图像生成工具“放飞自我”,或成“造假利器”

    谷歌上周发布了 Pixel 9 系列智能手机,其中包含一系列以人工智能为核心的新功能。

  • IT之家 谷歌AI图像
  • 526 0
  • 阿里团队推新框架UniPortrait:支持多角色一致性和风格参考

    阿里巴巴集团研究团队发布了UniPortrait框架,专注于人像图像的个性化处理,实现单角色一致性、多角色一致性和风格参考

  • 科技魔方 阿里框架图像
  • 539 0
  • 图像识别再进化!Meta推新一代SAM 2 支持实时视频追踪

    Meta AI推出新一代的Segment Anything Model(SAM2),实现了在视频和图像中实时识别和跟踪特定对象的突破。

  • 科技魔方 MetaAI图像
  • 602 0
  • 帮你把草图变成完整画作,三星One UI 6.1.1引入“手稿到图像”等AI功能

    三星在昨晚的 Galaxy Unpacked 发布会上带来了 Galaxy Z Fold6 / Flip6 等手机新品,两款新机都将内置基于 Android 14的 One UI 6.1.1。

  • IT之家 三星图像AI手机
  • 632 0
  • Meta新模型NLLB获Nature盛赞,200种濒危语言高质量翻译,「不让任何语言掉队」

    MetaAI的NLLB-200登上Nature,「不让任何一门语言掉队」,能翻译200种语言的大模型获得Nature社论的盛赞——复兴了濒临灭绝的语言,但是Nature研究人员也郑重提醒Meta,必须将使用这些语言的社区也纳入进来,才会真正减缓语言

  • 新智元公众号 Meta大模型图像语言
  • 579 0
  • 阿里图片编辑项目MimicBrush 可通过AI技术完美融合两张图片

    MimicBrush是阿里巴巴推出的一款创新的图片编辑项目,它通过先进的AI技术,能够将一张图片的某一部分融合到另一张图片上。这项技术在电商商品展示、图片编辑和内容迁移等多个领域具有广泛的应用潜力。

  • 站长之家 阿里图片AI技术图像
  • 647 0
  • 英特尔团队提出L-MAGIC新技术 通过结合语言模型让图像扩散模型生成高质量360度场景

    在CVPR2024上,美国英特尔研究院的蔡志鹏博士及其团队提出了一种名为L-MAGIC(Language Model Assisted Generation of Images with Coherence)的新技术。

  • 站长之家 英特尔大模型图像模型
  • 532 0
  • 即梦全量上线实时画布功能 简单涂抹加提示词即可生成定制形状的图像

    今天,即梦(前身为剪映Dreamina)官方宣布全量上线实时画布功能,目前,所有人都可以免费体验。

  • 站长之家 即梦画布图像大模型
  • 646 0
  • Ouroboros3D:通过3D感知实现图像到3D的生成

    近日,研究人员提出了一种名为 Ouroboros3D 的新方法,可以通过递归扩散实现图像到3D 的生成。这项研究集成了多视角图像生成和3D 重建技术,构建了一个统一的3D 生成框架。

  • 站长之家 Ouroboros3D图像大模型
  • 565 0
  • 用GPT-3.5生成数据集!北大天工等团队图像编辑新SOTA,可精准模拟物理世界场景

    高质量图像编辑的方法有很多,但都很难准确表达出真实的物理世界。

  • 量子位公众号 GPT-4大模型图像
  • 574 0
  • Aria搭载Google Gemini:用于图像生成和语音功能

    经过与GoogleCloud的合作,今日Aria宣布融入了Google的Gemini模型,为其AI浏览器带来了一次重大升级。

  • 站长之家 Aria图像大模型
  • 549 0
  • 新SDXL蒸馏模型SDXL Flash 速度相对LCM更慢些图像质量更好

    SDXLFlash是一个由SDXL团队与Project Fluently合作推出的新型快速高质量文本到图像转换模型。

  • 站长之家 大模型模型图像
  • 702 0
  • AI图案生成器Ideogram Tile:文本生成无缝重复的图案

    人工智能初创公司 Ideogram 以其先进的文本转图像生成功能而闻名,如今宣布其平台迎来重大升级:Ideogram Tile。这一新功能允许用户从单个文本提示中创建无缝重复的图案,为设计师、艺术家和企业开辟了无限可能。

    AI 框架Ambient Diffusion:从图像中获取灵感,而非复制

    强大的人工智能模型有时会出现错误,包括虚构错误信息或将他人作品作为自己的。为了解决后者的问题,德克萨斯大学奥斯汀分校的研究团队开发了一种名为 "Ambient Diffusion" 的框架。

    谷歌发布开源视觉语言模型PaliGemma 支持多视觉语言任务

    谷歌推出了一款名为PaliGemma的开源视觉语言模型,该模型结合了图像处理和语言理解的能力,旨在支持多种视觉语言任务,如图像和短视频字幕生成、视觉问答、图像文本理解、物体检测、文件图表解读以及图像分割等。

  • 站长之家 谷歌大模型语言图像
  • 593 0
  • OpenAI 发布最新旗舰大模型 GPT-4o
    OpenAI 发布最新旗舰大模型 GPT-4o

    OpenAI 发布最新旗舰大模型 GPT-4o,所有用户都可以免费使用!该模型提供了 GPT-4 级别的 AI 能力,接受文本、音频和图像的任意组合输入,并能够生成文本、音频和图像的任意组合输出。

  • Donews OpenAI大模型图像
  • 678 0
  • 新一代多模态内容生成模型Lumina-T2X 生成质量更高,成本更低

    Lumina-T2X 是一个创新的内容生成系列模型,它采用了统一的 DiT(Diffusion Model)架构,能够通过文本生成图像、视频、多视角3D 对象以及音频剪辑。

  • 站长之家 大模型文本图像视频
  • 661 0
  • StyleMamba:一种高效的文本驱动图像风格转换的ai模型

    近期,来自伦敦帝国理工学院和戴尔的研究团队推出了 StyleMamba,这是一种有效的框架,用于转移图片风格,通过使用文本来指导风格化过程,同时保持原始图像内容。

  • 站长之家 StyleMamba大模型图像
  • 668 0
  • OpenAI开发全新AI人机对话技术 支持识别物体和图像

    据The Information消息,OpenAI正筹备展示一种革命性的人机对话技术。据可靠消息,这一技术将结合声音和文本,不仅能与用户进行流畅的交流,还具备识别物体和图像的能力,为用户带来前所未有的交互体验。

  • 站长之家 OpenAIAI人机对话图像
  • 579 0
  • 华为PixArt-Σ放出模型文件 可在Comfyui使用

    最近,华为的4K图像模型PixArt-Σ放出了模型文件,而且diffusers也支持了这个架构,用户可以在Comfyui上尝试。

  • 站长之家 华为图像大模型
  • 569 0
  • Cog-Become-Image:将任意人物图像转换成指定风格的图

    GitHub 上的 fofr/cog-become-image 项目是一个创新的图像转换工具,它能够将任意人物的面部图像转换成另一种风格的图片。这项技术的应用范围非常广泛,包括但不限于艺术创作、媒体制作和娱乐行业。

  • 站长之家 图像大模型
  • 613 0
  • 新ID保持项目PuLID:图像背景、光线、风格等均保持高度一致

    PuLID是一个新兴的ID保持项目,它在提升ID保持效果的同时,还致力于最小化对原始模型的影响。

  • 站长之家 图像大模型模型
  • 713 0
  •  73    1 2 3 下一页 尾页

    -------------没有了-------------

    图赏更多>