科技魔方
  • 视频最新相关新闻
  • Google Photos将推出Ask Photos功能 动动嘴就能搜索照片和视频

    Google Photos 即将推出一项名为 Ask Photos 的实验性功能,该功能利用 AI 模型 Gemini,允许用户通过自然语言搜索来查找照片和视频,并辅助完成相关任务。

  • 站长之家 GooglePhotos谷歌搜索视频
  • 547 0
  • Midjourney团队公布进展:视频模型进展较慢 3D模型和实时生成效果显著

    Midjourney团队在最近的工作时间透露了他们在视频模型、3D模型、实时生成效果以及网站和模型开发方面的最新进展。以下是他们透露的关键信息:

    ElevenLabs发布配音API 允许开发者在产品中添加音频或视频翻译功能

    ElevenLabs近日发布了配音API,允许开发者在其产品中添加音频或视频翻译功能。利用该API,开发者可以将任意音频或视频翻译成29种语言,并且保留原始发言者声音的独特特征。

  • 站长之家 ElevenLabs音频视频
  • 532 0
  • 新一代多模态内容生成模型Lumina-T2X 生成质量更高,成本更低

    Lumina-T2X 是一个创新的内容生成系列模型,它采用了统一的 DiT(Diffusion Model)架构,能够通过文本生成图像、视频、多视角3D 对象以及音频剪辑。

  • 站长之家 大模型文本图像视频
  • 642 0
  • 开源版EMO?AniTalker可通过照片加音频生成说话视频

    AniTalker是一个创新的开源项目,它能够通过静态肖像画和输入的音频信号生成生动的面部说话视频。

  • 站长之家 开源AniTalker音频视频
  • 688 0
  • Stability AI 推出Stable Artisan Discord 机器人服务 让用户使用SD3、SVD功能

    Stability AI 终于将其生成式 AI 技术应用于文本和视频内容的 Discord平台上。

    Krea AI正式发布视频生成功能 可自定义视频首尾帧

    KreaAI 正式发布了其最新的视频生成功能,这一更新包括了自定义视频首尾帧和为每张图片定义提示词的能力。

  • 站长之家 KreaAI大模型AI视频
  • 581 0
  • GoEnhance支持视频到视频的黏土风格转化

    最近,remini粘土风的图片在全网风靡。也有不少网友借助一些工具,将多张粘土图片转为了粘土风格视频。昨天,抖音上一条把旅行 Vlog 处理成黏土风格的视频爆了。

    解决Sora物理bug!四所美国顶尖高校联合发布PhysDreamer模型

    Sora视频生成器发布后不久,就被网友发现存在物理交互的bug,例如模型对物理世界的理解不足,导致小狗走路时前腿出现不自然的交错问题。

  • 站长之家 Sora人工智能视频
  • 673 0
  • ComfyUI插件Steerable Motion更新1.4版本 支持无限量图片输入

    Steerable Motion是一个用于通过批次图像控制视频的ComfyUI节点,其设计目标是提供最佳质量和最精确的方法来引导视频模型的进化。

    开源Open-Sora大更新:可生成16秒,720P高清视频

    国内著名大模型开源公司潞晨科技,对其开源文生视频模型Open-Sora进行了大更新,现在可生成16秒,分辨率高达720P的视频。

  • AIGC开放社区公众号 开源大模型视频
  • 559 0
  • OPPO最强标准版旗舰 OPPO Find X7白色版开售:3999元起

    今日,OPPO Find X7全新配色白日梦想家”正式开售,提供12GB 256GB、16GB 256GB、16GB 512GB三种配置,起售价分别为3999元、4299元、4599元。

  • 快科技 OPPOFindX7OPPO手机视频
  • 698 0
  • 清华团队国产Sora火了 背后创业公司已融资数亿元

    Sora爆火后,掀起了全球竞逐AI视频生成的热潮。近日,国内一支AI生成的视频短片引发关注。该视频来自生数科技联合清华大学最新发布的视频大模型Vidu。

    清华团队发布视频大模型Vidu 可生成16 秒、1080P 视频

    生数科技与清华大学在中关村论坛未来人工智能先锋论坛上共同发布了中国首个长时长、高一致性、高动态性视频大模型——Vidu。

  • 站长之家 清华大模型视频
  • 966 0
  • Sora 支持的短片创作者解释了人工智能生成视频的优点和局限性

    OpenAI 在二月份推出的视频生成工具Sora引起了 AI 社区的广泛关注。Sora 展示出的流畅、逼真的视频似乎远远领先于竞争对手。然而,Sora 的首次亮相隐藏了一些重要细节。

  • 站长之家 Sora人工智能视频
  • 659 0
  • 中国首个Sora级大模型Vidu:文本生成16秒,1080p高清视频

    4月27日,在2024中关村论坛-未来人工智能先锋论坛上,清华大学联合生数科技正式发布了,中国首个长时间、高一致性、高动态性视频大模型——Vidu。

  • AIGC开放社区公众号 Sora大模型文本视频
  • 540 0
  • Align Your Steps:低步数推理保持高质量结果 适用于SD 1.5和SDXL

    在深度学习领域,扩散模型(DMs)作为生成建模的前沿方法已经得到广泛应用。然而,DMs 的一个关键缺点是其较慢的采样速度,这主要是由于需要通过大型神经网络进行多次顺序函数评估。

  • 站长之家 大模型模型视频
  • 698 0
  • Open-Sora悄悄升级 支持16秒视频生成和720p分辨率

    Open-Sora在开源社区悄悄更新了,现在,该项目不仅支持长达16秒的单镜头视频生成,而且视频分辨率最高可达720p,能够处理各种宽高比的文本到图像、文本到视频、图像到视频、视频到视频以及无限长视频的生成需求。

  • 站长之家 Open-Sora视频镜头开源
  • 553 0
  • AI视频生成工具ID-Animator:可保持角色一致生成视频动画

    为了促进视频生成中身份信息的提取,研究引入了一个面向身份的数据集构建流水线,该流水线结合了从构建的面部图像池中生成分离的人类属性和动作标题的技术。

  • 站长之家 AI视频剪辑AI视频音效
  • 684 0
  • 比Gemini Pro1.5强!可解读视频的多模态模型​Pegasus-1公测

    Twelve Labs最新发布了 Pegasus-1的公测版本,这款视频 - 语言基础模型在视频理解领域取得了新突破。

  • 站长之家 Gemini大模型视频
  • 527 0
  • 新视频分割技术SAM 可高效识别移动物体

    在视频分割领域,Segment Anything 模型(SAM)被用于探索新的视频对象分割技术。研究团队测试了两种不同的模型,旨在结合 SAM 的分割能力和光流技术的优势,以提高视频分割的性能。

  • 站长之家 视频大模型图像
  • 545 0
  • PR+AI重新定义视频剪辑,Sora、Pika全接入,AI视频创企还有的玩吗?

    用户可以直接在PR内调用Sora、Pika、Runway等第三方AI视频模型,来生成视频片段。

  • 头号AI玩家公众号 AI视频剪辑
  • 563 0
  • VSR:支持批量去除视频中的水印和字幕

    VSR(Video Subtitle Remover)是一款基于AI技术的工具,专门用于从视频和图片中去除硬编码的字幕和文本水印。这个工具能在不损失图像分辨率的情况下,清除视频或图片中的不需要的文字信息。

  • 站长之家 VSR视频字幕
  • 639 0
  • AI视频自动剪辑工具Captions 支持对口型、AI自动添加音效等

    这个AI视频剪辑工具是一个完全基于AI功能构建的革命性视频剪辑产品。名为“Captions”的这个工具可以自动识别超长视频中的重要片段,并将其剪辑成多条适合传播的短视频,这极大地简化了视频剪辑流程。

  • 站长之家 AI视频剪辑AI视频音效
  • 681 0
  • 万兴天幕大模型4月28日公测 文生视频支持60秒+内容

    万兴科技公布其旗下音视频多媒体大模型——万兴“天幕”将于4月28日迎来公开测试阶段。

     115    1 2 3 4 5 下一页 尾页

    -------------没有了-------------

    图赏更多>