视频最新相关新闻-科技魔方_中文AI大模型门户网站

Google Photos 即将推出一项名为 Ask Photos 的实验性功能，该功能利用 AI 模型 Gemini，允许用户通过自然语言搜索来查找照片和视频，并辅助完成相关任务。

站长之家 GooglePhotos谷歌搜索视频

547

Midjourney团队公布进展：视频模型进展较慢 3D模型和实时生成效果显著

Midjourney团队在最近的工作时间透露了他们在视频模型、3D模型、实时生成效果以及网站和模型开发方面的最新进展。以下是他们透露的关键信息:

站长之家 Midjourney视频模型大模型3D模型

631

ElevenLabs发布配音API 允许开发者在产品中添加音频或视频翻译功能

ElevenLabs近日发布了配音API，允许开发者在其产品中添加音频或视频翻译功能。利用该API，开发者可以将任意音频或视频翻译成29种语言，并且保留原始发言者声音的独特特征。

站长之家 ElevenLabs音频视频

532

新一代多模态内容生成模型Lumina-T2X 生成质量更高，成本更低

Lumina-T2X 是一个创新的内容生成系列模型，它采用了统一的 DiT(Diffusion Model)架构，能够通过文本生成图像、视频、多视角3D 对象以及音频剪辑。

站长之家 大模型文本图像视频

642

开源版EMO？AniTalker可通过照片加音频生成说话视频

AniTalker是一个创新的开源项目，它能够通过静态肖像画和输入的音频信号生成生动的面部说话视频。

站长之家开源AniTalker音频视频

688

Stability AI 推出Stable Artisan Discord 机器人服务让用户使用SD3、SVD功能

Stability AI 终于将其生成式 AI 技术应用于文本和视频内容的 Discord平台上。

站长之家 StabilityAI机器人视频生成式AI

568

Krea AI正式发布视频生成功能可自定义视频首尾帧

KreaAI 正式发布了其最新的视频生成功能，这一更新包括了自定义视频首尾帧和为每张图片定义提示词的能力。

站长之家 KreaAI大模型AI视频

581

GoEnhance支持视频到视频的黏土风格转化

最近，remini粘土风的图片在全网风靡。也有不少网友借助一些工具，将多张粘土图片转为了粘土风格视频。昨天，抖音上一条把旅行 Vlog 处理成黏土风格的视频爆了。

站长之家 GoEnhance视频图片解决方案

695

解决Sora物理bug！四所美国顶尖高校联合发布PhysDreamer模型

Sora视频生成器发布后不久，就被网友发现存在物理交互的bug，例如模型对物理世界的理解不足，导致小狗走路时前腿出现不自然的交错问题。

站长之家 Sora人工智能视频

673

ComfyUI插件Steerable Motion更新1.4版本支持无限量图片输入

Steerable Motion是一个用于通过批次图像控制视频的ComfyUI节点，其设计目标是提供最佳质量和最精确的方法来引导视频模型的进化。

站长之家 ComfyUISteerableMotion图片视频

677

开源Open-Sora大更新：可生成16秒，720P高清视频

国内著名大模型开源公司潞晨科技，对其开源文生视频模型Open-Sora进行了大更新，现在可生成16秒，分辨率高达720P的视频。

AIGC开放社区公众号开源大模型视频

559

OPPO最强标准版旗舰 OPPO Find X7白色版开售：3999元起

今日，OPPO Find X7全新配色白日梦想家”正式开售，提供12GB 256GB、16GB 256GB、16GB 512GB三种配置，起售价分别为3999元、4299元、4599元。

快科技 OPPOFindX7OPPO手机视频

698

清华团队国产Sora火了背后创业公司已融资数亿元

Sora爆火后，掀起了全球竞逐AI视频生成的热潮。近日，国内一支AI生成的视频短片引发关注。该视频来自生数科技联合清华大学最新发布的视频大模型Vidu。

TechWeb 清华Sora大模型AI视频视频

714

清华团队发布视频大模型Vidu 可生成16 秒、1080P 视频

生数科技与清华大学在中关村论坛未来人工智能先锋论坛上共同发布了中国首个长时长、高一致性、高动态性视频大模型——Vidu。

站长之家清华大模型视频

966

Sora 支持的短片创作者解释了人工智能生成视频的优点和局限性

OpenAI 在二月份推出的视频生成工具Sora引起了 AI 社区的广泛关注。Sora 展示出的流畅、逼真的视频似乎远远领先于竞争对手。然而，Sora 的首次亮相隐藏了一些重要细节。

站长之家 Sora人工智能视频

659

中国首个Sora级大模型Vidu：文本生成16秒，1080p高清视频

4月27日，在2024中关村论坛-未来人工智能先锋论坛上，清华大学联合生数科技正式发布了，中国首个长时间、高一致性、高动态性视频大模型——Vidu。

AIGC开放社区公众号 Sora大模型文本视频

540

Align Your Steps：低步数推理保持高质量结果适用于SD 1.5和SDXL

在深度学习领域，扩散模型(DMs)作为生成建模的前沿方法已经得到广泛应用。然而，DMs 的一个关键缺点是其较慢的采样速度，这主要是由于需要通过大型神经网络进行多次顺序函数评估。

站长之家 大模型模型视频

698

Open-Sora悄悄升级支持16秒视频生成和720p分辨率

Open-Sora在开源社区悄悄更新了，现在，该项目不仅支持长达16秒的单镜头视频生成，而且视频分辨率最高可达720p，能够处理各种宽高比的文本到图像、文本到视频、图像到视频、视频到视频以及无限长视频的生成需求。

站长之家 Open-Sora视频镜头开源

553

AI视频生成工具ID-Animator：可保持角色一致生成视频动画

为了促进视频生成中身份信息的提取，研究引入了一个面向身份的数据集构建流水线，该流水线结合了从构建的面部图像池中生成分离的人类属性和动作标题的技术。

站长之家 AI视频剪辑AI视频音效

684

比Gemini Pro1.5强！可解读视频的多模态模型Pegasus-1公测

Twelve Labs最新发布了 Pegasus-1的公测版本，这款视频 - 语言基础模型在视频理解领域取得了新突破。

站长之家 Gemini大模型视频

527

新视频分割技术SAM 可高效识别移动物体

在视频分割领域，Segment Anything 模型(SAM)被用于探索新的视频对象分割技术。研究团队测试了两种不同的模型，旨在结合 SAM 的分割能力和光流技术的优势，以提高视频分割的性能。

站长之家视频大模型图像

545

PR+AI重新定义视频剪辑，Sora、Pika全接入，AI视频创企还有的玩吗？

用户可以直接在PR内调用Sora、Pika、Runway等第三方AI视频模型，来生成视频片段。

头号AI玩家公众号 AI视频剪辑

563

VSR：支持批量去除视频中的水印和字幕

VSR(Video Subtitle Remover)是一款基于AI技术的工具，专门用于从视频和图片中去除硬编码的字幕和文本水印。这个工具能在不损失图像分辨率的情况下，清除视频或图片中的不需要的文字信息。

站长之家 VSR视频字幕

639

AI视频自动剪辑工具Captions 支持对口型、AI自动添加音效等

这个AI视频剪辑工具是一个完全基于AI功能构建的革命性视频剪辑产品。名为“Captions”的这个工具可以自动识别超长视频中的重要片段，并将其剪辑成多条适合传播的短视频，这极大地简化了视频剪辑流程。

站长之家 AI视频剪辑AI视频音效

681

万兴天幕大模型4月28日公测文生视频支持60秒+内容

万兴科技公布其旗下音视频多媒体大模型——万兴“天幕”将于4月28日迎来公开测试阶段。

站长之家 万兴科技万兴天幕大模型大模型视频

586

115 1 2 3 4 5 下一页尾页

-------------没有了-------------

图赏更多>

: 520双排？满满的爱藏在这台M-ATX机箱里

: 摩托罗拉首款AI手机moto X50 Ultra发布：搭载骁龙8 Gen 3处理器

: 电竞显示器线上销量TOP10出炉：小米杀入前10

: 【会前通知】SmartAH2024智慧行政人资峰会

: 荣耀200官宣5月27日发布：真机外观正式揭晓

: vivo首批适配Android 15 Beta，引领新一轮技术革新

最热新闻最新新闻 更多>

用户推荐最热产品 更多>

倾城

小新

张影

创维电视（SKYWORTH）55V40

小米全面屏电视E43K

康佳（KONKA）55D6S

荣泰S60按摩椅

自媒体头条更多>: 极致听感智能降噪三星Galaxy Buds Pro诠释非同凡“响”

未来科技范试驾摩灵MOi｜视频

品牌专区更多>