科技魔方
  • 语言最新相关新闻
  • OpenVoice V2版本发布 能对声音风格进行精细控制

    MyShell TTS 开发的OpenVoice是一项创新的声音克隆技术,它能够通过仅使用一小段参考发言者的音频片段来复制其声音,并生成多种语言的语音。

  • 站长之家 声音音频语言大模型
  • 700 0
  • 基于 Gemini 谷歌携手 Fitbit 开发“个人健康大语言模型”

    据谷歌官方消息,该公司旗下的 Google Research 将与 Fitbit 团队合作,共同开发一款"个人健康大语言模型"(Personal Health Large Language Model)。

  • 站长之家 Gemini谷歌大模型语言
  • 604 0
  • 全球首位AI软件工程师Devin问世:能自学新语言、开发迭代App、自动Debug

    初创公司 Cognition 近日发布公告,宣布推出全球首个 AI 软件工程师 Devin,并号称会彻底改变人类构建软件的方式。

  • IT之家 AI软件语言AI
  • 550 0
  • 与Sora一样能生成视频、图像,还能一次解读100万数据!

    大语言模型(LLM)在生成文本内容方面非常强,但在理解、生成视频、图像等方面略显不足。尤其是在Sora一夜爆红之后,让人们意识到未来主流模型一定是文本+音频+图像+视频的多模态生成、理解功能。

    谷歌内部编码AI大语言模型Goose曝光

    谷歌更新了其人工智能项目 Gemini,旨在改善其性能和用户体验,但推出初期遇到了速度缓慢和部分用户遇到问题。谷歌产品负责人表示正在积极修复,特别是拒绝响应的问题已经减少了约一半。

    DrugAssist:基于LLM的分子优化模型 可以用自然语言与人类实时交互

    2月4日 消息:随着近年来大型语言模型(LLMs)在语言处理领域的显著进展,研究人员尝试将这些模型应用于药物发现,以优化相关任务。

  • 站长之家 DrugAssist模型语言
  • 642 0
  • 书生·浦语2. 0 正式开源 支持200K超长上下文

    1月17日 消息:新一代200亿「书生·浦语2.0」是一款开源的大语言模型。它支持200K超长上下文,且20B版本在数学推理方面的性能超越了ChatGPT。该模型使用了第三代数据清洗过滤技术,大幅提升了模型训练效率。

     

    多模态语言模型新基准AMBER 评估和降低模型中的幻觉问题

    AMBER项目是针对多模式语言模型(Multi-Modal Language Models,MLLM)的一个新基准,旨在评估和降低模型中的幻觉问题。

  • 站长之家 语言模型Amber
  • 580 0
  • 谷歌发布5B参数视觉语言模型PaLI-3,更小更快却更强

    谷歌研究院和DeepMind研究人员推出最新PaLI-3视觉语言模型(VLM),模型以更小、更快、更强的特点获得大部分研究人员青睐,在诸多任务中达到SOTA。

  • 微信公众号 新智元 谷歌语言模型
  • 613 0
  • OpenLM:一个专为中等规模语言模型设计的模型训练库
    OpenLM:一个专为中等规模语言模型设计的模型训练库

    OpenLM是一个旨在训练中等规模语言模型的PyTorch代码库,它强调了最大化GPU利用率和训练速度的设计。

  • 站长之家 OpenLM模型训练库语言
  • 595 0
  • 秒懂生成式AI—大语言模型是如何生成内容的?
    秒懂生成式AI—大语言模型是如何生成内容的?

    备受关注的大语言模型,核心是自然语言的理解与文本内容的生成,对于此,你是否好奇过它们究竟是如何理解自然语言并生成内容的,其工作原理又是什么呢?

  • 微信公众号AIGC开放社区 AI语言模型
  • 550 0
  • 新语言Mojo开放下载,运行速度超Python6.8万倍

    新语言Mojo最近开放了编译器和集成开发环境的本地下载,这在开发社区引起了轰动。Mojo的语法简单明了,类似于Python,但运行速度可达到Python的68000倍之多。

  • 站长之家 语言Mojo模型Python
  • 712 0
  • 免费AI在线字幕生成工具Free Subtitles 支持111种语言

    FreeSubtitles.AI 是一个免费的在线字幕生成服务,可以将任何语言的任何内容转录成任何语言,旨在消除语言障碍。免费用户可上传最大300MB,最长30分钟的文件,付费用户可上传最大10GB,最长10小时的文件。

  • 站长之家 AI语言
  • 614 0
  • AntGPT:一个视频中长期行为预测大型语言模型

    AntGPT 是一个将大型语言模型应用于视频长期行为预测(LTA)的视觉语言框架。

  • 站长之家
  • 673 0
  • 阿里达摩院推大语言模型PolyLM:通晓18种语言 拥有1.7B和13B两种参数版本

    最近,阿里巴巴达摩院发布的一个名为 POLYLM 的多语言大型语言模型引起了人们的兴趣。与其他多语言模型不同的是,PolyLM能够在理解、推理和生成自然语言指令方面表现出显著的能力,该模型拥有1.7B和13B两种参数版本可选。

  • 站长之家
  • 649 0
  • -------------没有了-------------

    图赏更多>