科技魔方
  • 音频最新相关新闻
  • AI语音识别工具Universal-1:38秒可以处理60分钟音频 比fast Whisper更快
    AI语音识别工具Universal-1:38秒可以处理60分钟音频 比fast Whisper更快

    AssemblyAI最新研究成果展示了他们的 Universal-1模型在多语言环境中的表现,该模型在准确性和鲁棒性方面均取得了行业领先地位。

  • 站长之家 AI语音识别音频
  • 593 0
  • EMAGE:上传音频就能生成全身动作 包括头部、嘴型、身体运动

    最近,多所知名大学和研究机构的研究人员共同提出了 EMAGE 框架,旨在从音频和掩码手势生成全身人类手势。

  • 站长之家 EMAGE音频框架
  • 663 0
  • 谷歌推出多模态VLOGGER AI:让静态肖像图动起来“说话”
    谷歌推出多模态VLOGGER AI:让静态肖像图动起来“说话”

    谷歌近日在 GitHub 页面发布博文,介绍了 VLOGGER AI 模型,用户只需要输入一张肖像照片和一段音频内容,该模型可以让这些人物“动起来”,富有面部表情地朗读音频内容。

    OpenAI首席技术官:Sora或将在今年向大众推出,增加生成音频

    OpenAI首席技术官米拉·穆拉蒂(Mira Murati)在接受采访时透露,Sora文生视频工具计划在今年内正式推向公众。此外,OpenAI还计划为Sora加入音频生成功能,进一步丰富视频的场景和情感表达。

  • 热点科技 OpenAISora大模型音频
  • 672 0
  • 文生音频ElevenLabs融资5亿美元,估值超10亿美元

    成立仅两年的AI音频公司ElevenLabs近日宣布B轮成功融资8000万美元,估值超过10亿美元,成功晋升为独角兽公司。

  • 站长之家 文生音频ElevenLabs融资
  • 590 0
  • 上海AI实验室等开源,音频、音乐统一开发工具包Amphion

    上海AI实验室、香港中文大学数据科学院、深圳大数据研究院联合开源了一个名为Amphion的音频、音乐和语音生成工具包。

  • 微信公众号 AIGC开放社区 AI实验室音频音乐
  • 689 0
  • 多模态AI模型Unified-IO2:可理解和生成图像、文本、音频和动作

    近期,由艾伦人工智能研究所、伊利诺伊大学厄巴纳-香槟分校和华盛顿大学的研究人员联合开发的“Unified-IO2”标志着人工智能能力的一次巨大飞跃。

  • 站长之家 AI模型图像文本音频
  • 710 0
  • Meta发布AI音频模型Audiobox:通过语音和自然语言提示生成音频
    Meta发布AI音频模型Audiobox:通过语音和自然语言提示生成音频

    Meta最新发布了Audiobox,这是一款基于语音和自然语言提示生成音频的先进研究模型。通过结合语音输入和文本提示,Audiobox可以轻松生成各种声音,包括语音、音效和音景,从而为多种用例提供定制音频。

  • 站长之家 MetaAI音频模型
  • 591 0
  • 神经可塑性新研究,盲人通过音频也能识别人脸

    神经领域的科学家近日展开了一项神经可塑性(neuroplasticity)方面的研究,发现盲人和视力正常的人使用相同的大脑区域来识别基本面孔,这意味着即便脸型是以音频而不是通过视觉皮层传递的,理论上盲人也能识别。

  • IT之家 盲人音频
  • 710 0
  • Stability AI 音频负责人因不认同训练材料涉及版权问题辞职

    Stability AI 音频团队负责人 Ed Newton-Rex 在 Twitter 上宣布离职,原因是他不同意公司关于在版权作品上训练生成式人工智能模型属于 “公平使用” 的观点,这一举动引发了不同的反应。

  • 站长之家 StabilityAI音频
  • 515 0
  • 自媒体必备字幕生成工具Videosrt 可批量快速自动生成视频/音频字幕

    VideoSrt是一款基于Golang语言,使用lxn/walk Windows-GUI工具包开发的开源软件工具。

  • 站长之家
  • 619 0
  • 第一代高通S7和S7 Pro音频平台开启全新水平音频体验
    第一代高通S7和S7 Pro音频平台开启全新水平音频体验

    在2023骁龙峰会上,高通技术国际有限公司(Qualcomm Technologies International, Ltd.)宣布推出高通迄今为止最先进的音频平台——面向耳塞、耳机和音箱设计的第一代高通S7和S7 Pro音频平台。

  • 科技魔方 高通2023骁龙峰会音频
  • 601 0
  • Stability AI推出AI音频生成产品Stable Audio

    据 Stability AI 官方消息,旗下全新 AI 音频生成产品 Stable Audio 现已发布,提供免费版和专业订阅版两个版本。

  • DoNews StabilityAI音频
  • 636 0
  • USB-C款AirPods Pro为Vision Pro提供无损空间音频体验
    USB-C款AirPods Pro为Vision Pro提供无损空间音频体验

    苹果正积极围绕Vision Pro打造一个全新的空间计算生态系统,并在积极整合旗下的其他设备。

  • 映维网 USB-CAirPods音频
  • 661 0
  • 研报显示 AI+3D 模型或成为继 AI+文字/图片/音频/视频后的高门槛的落地场景

    中金公司 7 月 18 日研报指出,在工业领域,传统AI模型(如数据分析预测、工业视觉等)应用已经相对成熟,但大语言模型(LLM)应用方兴未艾。

  • 站长之家
  • 608 0
  • 抢占无线音频产业新机遇,中国率先发布高清无线音频标准

    近日,《高清无线音频技术与设备规范及测试方法》(以下简称HWA高清无线音频标准,Hi-Res Wireless Audio,标准)正式发布,该标准的发布填补了我国在无线音频技术标准领域的空白。

  • 中国电子报、电子信息产业网 无线音频无线音频
  • 610 0
  • 音频消费者调研报告出炉 65%用户看重音质

    近日美国科技公司高通发布了《2019全球音频消费者调研报告》。该报告针对全球的6000位16至64岁年龄群的用户进行了调查问卷。

  • 中关村在线 音频
  • 325 0
  • 苹果将推出AirPods音频分享功能:更高科技,更卫生

    6月4日消息,据国外媒体报道,当你想跟好友分享你在手机上收听的很棒的新单曲时,你会直接递给他们一个耳塞。

  • 网易科技报道 AirPods更高科技音频
  • 328 0
  • 新一代iPhone曝光:支持双蓝牙音频连接
    新一代iPhone曝光:支持双蓝牙音频连接

    今天,日本媒体给出的报道称,苹果下一代iPhone将可能允许用户同时连接两对蓝牙耳机,这一功能类似于三星的双音频功

  • 快科技 iPhone蓝牙音频
  • 524 0
  • 苹果因iPhone 7音频芯片问题遭到第二起集体起诉

    据外媒报道,周一,苹果因所谓的Loop Disease音频芯片问题遭到第二起集体起诉。

  • 腾讯科技 iPhone音频起诉
  • 276 0
  • Netflix宣布进军电台音频内容服务

    奈飞(Netflix)已经成为全世界最大的版权视频网站(以优质电影电视剧为主),奈飞的成功引发了互联网公司和好莱坞对于网络视频的浓厚兴趣,一个个准备推出新的服务。

  • 腾讯科技 Netflix电台音频
  • 709 0
  • 他曾是乔布斯的竞争对手 如今带着新音频技术卷土重来

    2月21日消息,据外媒报道,2011年10月11日,当全世界都在对苹果公司联合创始人史蒂夫·乔布斯(Steve Jobs)趋势铺天盖地表达悼念之情时,一名男子在新加坡出资1.6万美元打出整版报纸广告,向乔布斯致敬。

  • 腾讯科技
  • 532 0
  • 游戏配乐师分享VR游戏音频开发的工具和技巧

    2018年11月28日,在一系列形式的沉浸式故事中,音频都十分重要。乔治·卢卡斯曾经说过,“声音占体验的一半”。

  • yivian 配乐音频技巧
  • 428 0
  • Intel发布新核显驱动:音频功能与Win10 v1809有冲突

    Intel今天发布了面向6/7/8代酷睿处理器的新核显驱动,版本号25.20.100.6326。

  • 快科技
  • 334 0
  • 苹果HomePod升级增加音频功能 6月18日登陆加拿大等国

    据彭博社北京时间5月30日报道,苹果公司将对其智能音箱HomePod进行软件升级,增加重要音频功能。苹果同时宣布,HomePod将于6月18日在加拿大、法国以及德国上市。

  • 凤凰网科技 HomePod音频加拿大
  • 313 0
  • -------------没有了-------------

    图赏更多>