音频最新相关新闻-科技魔方_中文AI大模型门户网站

音频最新相关新闻

AI语音识别工具Universal-1：38秒可以处理60分钟音频比fast Whisper更快

AssemblyAI最新研究成果展示了他们的 Universal-1模型在多语言环境中的表现，该模型在准确性和鲁棒性方面均取得了行业领先地位。

站长之家 AI语音识别音频

593

EMAGE：上传音频就能生成全身动作包括头部、嘴型、身体运动

最近，多所知名大学和研究机构的研究人员共同提出了 EMAGE 框架，旨在从音频和掩码手势生成全身人类手势。

站长之家 EMAGE音频框架

663

谷歌推出多模态VLOGGER AI：让静态肖像图动起来“说话”

谷歌近日在 GitHub 页面发布博文，介绍了 VLOGGER AI 模型，用户只需要输入一张肖像照片和一段音频内容，该模型可以让这些人物“动起来”，富有面部表情地朗读音频内容。

IT之家谷歌大模型图片音频

691

OpenAI首席技术官：Sora或将在今年向大众推出，增加生成音频

OpenAI首席技术官米拉·穆拉蒂(Mira Murati)在接受采访时透露，Sora文生视频工具计划在今年内正式推向公众。此外，OpenAI还计划为Sora加入音频生成功能，进一步丰富视频的场景和情感表达。

热点科技 OpenAISora大模型音频

672

文生音频ElevenLabs融资5亿美元，估值超10亿美元

成立仅两年的AI音频公司ElevenLabs近日宣布B轮成功融资8000万美元，估值超过10亿美元，成功晋升为独角兽公司。

站长之家文生音频ElevenLabs融资

590

上海AI实验室等开源，音频、音乐统一开发工具包Amphion

上海AI实验室、香港中文大学数据科学院、深圳大数据研究院联合开源了一个名为Amphion的音频、音乐和语音生成工具包。

微信公众号 AIGC开放社区 AI实验室音频音乐

689

多模态AI模型Unified-IO2：可理解和生成图像、文本、音频和动作

近期，由艾伦人工智能研究所、伊利诺伊大学厄巴纳-香槟分校和华盛顿大学的研究人员联合开发的“Unified-IO2”标志着人工智能能力的一次巨大飞跃。

站长之家 AI模型图像文本音频

710

Meta发布AI音频模型Audiobox：通过语音和自然语言提示生成音频

Meta最新发布了Audiobox，这是一款基于语音和自然语言提示生成音频的先进研究模型。通过结合语音输入和文本提示，Audiobox可以轻松生成各种声音，包括语音、音效和音景，从而为多种用例提供定制音频。

站长之家 MetaAI音频模型

591

神经可塑性新研究，盲人通过音频也能识别人脸

神经领域的科学家近日展开了一项神经可塑性(neuroplasticity)方面的研究，发现盲人和视力正常的人使用相同的大脑区域来识别基本面孔，这意味着即便脸型是以音频而不是通过视觉皮层传递的，理论上盲人也能识别。

IT之家盲人音频

710

Stability AI 音频负责人因不认同训练材料涉及版权问题辞职

Stability AI 音频团队负责人 Ed Newton-Rex 在 Twitter 上宣布离职，原因是他不同意公司关于在版权作品上训练生成式人工智能模型属于 “公平使用” 的观点，这一举动引发了不同的反应。

站长之家 StabilityAI音频

515

自媒体必备字幕生成工具Videosrt 可批量快速自动生成视频/音频字幕

VideoSrt是一款基于Golang语言，使用lxn/walk Windows-GUI工具包开发的开源软件工具。

站长之家

619

第一代高通S7和S7 Pro音频平台开启全新水平音频体验

在2023骁龙峰会上，高通技术国际有限公司(Qualcomm Technologies International, Ltd.)宣布推出高通迄今为止最先进的音频平台——面向耳塞、耳机和音箱设计的第一代高通S7和S7 Pro音频平台。

科技魔方高通2023骁龙峰会音频

601

Stability AI推出AI音频生成产品Stable Audio

据 Stability AI 官方消息，旗下全新 AI 音频生成产品 Stable Audio 现已发布，提供免费版和专业订阅版两个版本。

DoNews StabilityAI音频

636

USB-C款AirPods Pro为Vision Pro提供无损空间音频体验

苹果正积极围绕Vision Pro打造一个全新的空间计算生态系统，并在积极整合旗下的其他设备。

映维网 USB-CAirPods音频

661

研报显示 AI+3D 模型或成为继 AI+文字/图片/音频/视频后的高门槛的落地场景

中金公司 7 月 18 日研报指出，在工业领域，传统AI模型(如数据分析预测、工业视觉等)应用已经相对成熟，但大语言模型(LLM)应用方兴未艾。

站长之家

608

抢占无线音频产业新机遇，中国率先发布高清无线音频标准

近日，《高清无线音频技术与设备规范及测试方法》(以下简称HWA高清无线音频标准，Hi-Res Wireless Audio，标准)正式发布，该标准的发布填补了我国在无线音频技术标准领域的空白。

中国电子报、电子信息产业网 无线音频无线音频

610

音频消费者调研报告出炉 65%用户看重音质

近日美国科技公司高通发布了《2019全球音频消费者调研报告》。该报告针对全球的6000位16至64岁年龄群的用户进行了调查问卷。

中关村在线音频

325

苹果将推出AirPods音频分享功能：更高科技，更卫生

6月4日消息，据国外媒体报道，当你想跟好友分享你在手机上收听的很棒的新单曲时，你会直接递给他们一个耳塞。

网易科技报道 AirPods更高科技音频

328

新一代iPhone曝光：支持双蓝牙音频连接

今天，日本媒体给出的报道称，苹果下一代iPhone将可能允许用户同时连接两对蓝牙耳机，这一功能类似于三星的双音频功

快科技 iPhone蓝牙音频

524

苹果因iPhone 7音频芯片问题遭到第二起集体起诉

据外媒报道，周一，苹果因所谓的Loop Disease音频芯片问题遭到第二起集体起诉。

腾讯科技 iPhone音频起诉

276

Netflix宣布进军电台音频内容服务

奈飞(Netflix)已经成为全世界最大的版权视频网站(以优质电影电视剧为主)，奈飞的成功引发了互联网公司和好莱坞对于网络视频的浓厚兴趣，一个个准备推出新的服务。

腾讯科技 Netflix电台音频

709

他曾是乔布斯的竞争对手如今带着新音频技术卷土重来

2月21日消息，据外媒报道，2011年10月11日，当全世界都在对苹果公司联合创始人史蒂夫·乔布斯(Steve Jobs)趋势铺天盖地表达悼念之情时，一名男子在新加坡出资1.6万美元打出整版报纸广告，向乔布斯致敬。

腾讯科技

532

游戏配乐师分享VR游戏音频开发的工具和技巧

2018年11月28日，在一系列形式的沉浸式故事中，音频都十分重要。乔治·卢卡斯曾经说过，“声音占体验的一半”。

yivian 配乐音频技巧

428

Intel发布新核显驱动：音频功能与Win10 v1809有冲突

Intel今天发布了面向6/7/8代酷睿处理器的新核显驱动，版本号25.20.100.6326。

快科技

334

苹果HomePod升级增加音频功能 6月18日登陆加拿大等国

据彭博社北京时间5月30日报道，苹果公司将对其智能音箱HomePod进行软件升级，增加重要音频功能。苹果同时宣布，HomePod将于6月18日在加拿大、法国以及德国上市。

凤凰网科技 HomePod音频加拿大

313

26 1 2 下一页尾页

-------------没有了-------------

图赏更多>

: 宇视张鹏国：大模型只是技术升级不是革命

: 欧标A-50%！海尔洗衣机广交会为全球用户定制最节能方案

: Jina-ai/Reader：可将任何网址转换成对大模型友好的输入格式

: Adobe推出PDF阅读AI助手，订阅价4.99美元/月起

: 2024年全球智能手机市场迎来强势开局，第一季度增长11%

: 厨房行业发展迎来崭新篇章

最热新闻最新新闻 更多>

用户推荐最热产品 更多>

倾城

小新

张影

创维电视（SKYWORTH）55V40

小米全面屏电视E43K

康佳（KONKA）55D6S

荣泰S60按摩椅

自媒体头条更多>: 极致听感智能降噪三星Galaxy Buds Pro诠释非同凡“响”

未来科技范试驾摩灵MOi｜视频

品牌专区更多>