在最新的研究论文中,谷歌研究人员引入了一种名为Cappy的预训练评分器模型,旨在增强和超越大型多任务语言模型的性能。这项研究旨在解决大型语言模型(LLM)所面临的挑战,其中包括高昂的计算资源成本和效率低下的训练和推理
根据 Recognise 最近的 CIO 调查,分享了一些有趣的发现。Recognise CIO 调查系列是在美国与250-500位首席信息官进行的定期调查。
谷歌近日在 GitHub 页面发布博文,介绍了 VLOGGER AI 模型,用户只需要输入一张肖像照片和一段音频内容,该模型可以让这些人物“动起来”,富有面部表情地朗读音频内容。
据消息人士透露,苹果公司正在与谷歌进行深入讨论,计划将谷歌的Gemini模型引入iPhone,以提升其人工智能技术支持。
月之暗面近日宣布,其智能助手KimiChat已开放200万字上下文的内测申请,引发了广大用户的热烈关注。作为Moonshot AI公司的产品,KimiChat以其超大的内存和强大的功能吸引了众多用户的目光。
光锥智能获取最新独家消息,继2023年8月首发后,今年4月,字节跳动旗下的大语言模型云雀大模型即将迎来重要版本的升级更新。
OpenRouter是一个创新性的项目,它为大语言模型(LLM)和其他AI模型提供了一个统一的接口。通过这个接口,用户可以直接访问和使用几十种AI模型,包括GPT、LLama、Claude、Command-R等80多个模型,未来还将扩展到数百种。
今天凌晨,马斯克旗下大模型公司 xAI 宣布正式开源 3140 亿参数的混合专家(MoE)模型「Grok-1」,以及该模型的权重和网络架构。
OpenAI首席技术官米拉·穆拉蒂(Mira Murati)在接受采访时透露,Sora文生视频工具计划在今年内正式推向公众。此外,OpenAI还计划为Sora加入音频生成功能,进一步丰富视频的场景和情感表达。
苹果公司最新发布了一款名为MM1的大型多模态基础模型,拥有300亿参数,采用了MoE架构,并且超过一半的作者是华人。该模型在多模态领域具有重要意义,可能预示着苹果未来推出与此相关的产品。
近日,图像编辑平台Fotor正式拓展视频领域,推出名为Clipfly的全新一站式AI长视频平台。Clipfly集成了AI视频生成、增强和编辑等多种功能,用户可在该平台完成从构思到最终视频输出的整个流程。
可以说AI大模型的诞生激励着云计算厂商们开启第二波增长曲线,并推动它们塑造出了云计算应用服务新范式,但在加快技术研究的同时,如何将大模型融入现有的云计算产品,并实现应用已经成为当下云厂商们面临的共同课题。
LaVi-Bridge项目是一个无需训练将不同的语言模型和生成视觉模型结合起来,以实现文本到图像的生成的项目。
谷歌宣布于5月14日在线举办2024年I/O开发者大会。与去年一样,主题演讲将通过网络直播形式进行,任何人都可以通过网络参与观看。
近期,香港大学发布了OpenGraph,这是一项突破性的成果,成功攻克了图基础模型领域的三大难题。该模型通过巧妙的技术实现了零样本学习,可以适配多种下游任务。OpenGraph的构建主要分为统一图Tokenizer、可扩展的图Transform
最新发布的全球最强AI芯片WSE-3引起了行业的瞩目。该芯片采用了先进的4万亿晶体管5nm制程,拥有惊人的性能,单机可训练出24万亿参数的模型,远超英伟达H100GPU。
人工智能技术领域的领先者Anthropic公司最近发布了其最新的Claude3AI模型系列成员,名为Claude3Haiku。这款全新的智能产品被定位为速度最快、成本最实惠的型号,在提供先进的视觉功能和行业标准性能的同时,为企业客户提供
清华大学与阿里安全联合发布了概念半透膜模型(SPM),这一模型能够在 Diffusion 架构的 AI 作图模型中,精准、可控地擦除各类具象或抽象概念。
社交、科技巨头Meta在官网公布了两个全新的24K H100GPU集群(49,152个),专门用于训练大模型Llama-3。
生数科技是一家成立于2023年的公司,专注于多模态大模型的研发,包括图像、3D 和视频等多种原生多模态大模型。他们的团队来自清华大学人工智能研究院和其他科技公司,拥有深厚的技术背景。
-------------没有了-------------