生数科技与清华大学在中关村论坛未来人工智能先锋论坛上共同发布了中国首个长时长、高一致性、高动态性视频大模型——Vidu。
在创建沉浸式虚拟体验时,实现真实物体交互至关重要。然而,针对新型交互合成真实的3D 物体动态仍然是一项重大挑战。
4月27日,在2024中关村论坛-未来人工智能先锋论坛上,清华大学联合生数科技正式发布了,中国首个长时间、高一致性、高动态性视频大模型——Vidu。
据相关媒体报道,前搜狗公司CEO王小川创立的百川智能正进行新一轮数亿美元融资,这或将成为2024年国内AI领域最大融资之一。
Synthesia 公司最近推出了一款创新的虚拟数字人形象技术——Expressive-1AI Avatars,这是一款能够根据文本内容自动预测并展现丰富表情的AI虚拟形象。
除了 LLM,Meta 还推出了 Llama Guard2、Code Shield 和 CyberSec Eval2等信任和安全工具,以帮助确保符合行业和用户安全期望。
在深度学习领域,扩散模型(DMs)作为生成建模的前沿方法已经得到广泛应用。然而,DMs 的一个关键缺点是其较慢的采样速度,这主要是由于需要通过大型神经网络进行多次顺序函数评估。
科大讯飞今日发布重大更新,讯飞星火大模型V3.5升级,不仅推出了首个长文本、长图文、长语音大模型,还首次将多情感超拟人合成技术引入市场,并同步推出了星火智能体平台。
MyShell TTS 开发的OpenVoice是一项创新的声音克隆技术,它能够通过仅使用一小段参考发言者的音频片段来复制其声音,并生成多种语言的语音。
如今的OpenAI已经今非昔比,早从当年的默默无闻的小公司成为生成式AI的领导者,而英伟达借助ChatGPT这股东风,成为超2万亿美元的科技巨头。
大模型这把火点燃了整个机器人行业的热情。纵观全世界,过去几个月,国内外大模型大厂和机器人初创公司的合作也是动作不断。看来,机器人的元年真的来了!
华为开发者大会定于6月21日至23日在东莞松山湖盛大举行,届时将见证盘古大模型5.0与HarmonyOSNEXT鸿蒙星河版的首次同台展示。
Twelve Labs最新发布了 Pegasus-1的公测版本,这款视频 - 语言基础模型在视频理解领域取得了新突破。
通过将HiDiffusion应用于各种预训练的扩散模型,不仅可以将图像生成的分辨率提高至4096×4096,而且能将图像生成速度提升1.5至6倍。
激烈的“百模大战”伴随着科技同行对GPU算力的哄抢,大模型竞争的焦点竟不在大模型本身,而在算力。
在2024年一季度,酷特智能牵手华为盘古大模型,并在潍坊安丘开建“生产智能体集群”,深耕AI科技赋能产业发展,与时代潮流同频共振,让业界全面看好其未来发展前景。
-------------没有了-------------