消息源 AssembleDebug 近日挖掘谷歌 AI Core 等应用程序,在代码中发现了关于谷歌 Pixel 9 系列手机将引入的诸多本地 AI 功能,包括 OCR、TEXT_TO_IMAGE、QUESTION_TO_ANSWER 等。
谷歌最近发布了面向企业、开发人员的全新代码模型 Code Gemma,该模型参数小、性能强,同时对硬件要求较低。
据此前报道,谷歌内部人士透露 Pixel 9 系列手机将支持紧急卫星通信功能,该功能基于三星调制解调器 5400。此外下一代 Pixel Fold 和 5G 平板电脑也将配备该调制解调器,有望支持卫星通信。
4月11日,谷歌在官网宣布从5月15日起,将向所有谷歌相册用户免费提供Magic Editor、Photo Unblur和Magic Eraser三款生成式AI编辑工具。
谷歌宣布,之前仅限于Pixel设备和付费订阅者的人工智能驱动的照片编辑功能,现已免费向所有GooglePhotos用户开放。这些功能包括MagicEraser、PhotoUnblur、肖像光等,让用户能够更方便地编辑和优化照片。
近日,有消息称Google将推出一款集多种功能于一体的AI视频工具——Google Vids。这款工具旨在帮助用户轻松创作故事板,并通过AI技术协助编辑内容,选择适合的场景、图片和音乐,自动生成一个完整的类似PPT的宣讲视频。
根据华尔街日报报道,谷歌为了结追溯到 2020 年的集体诉讼案,近日同意删除通过 Chrome 浏览器“无痕(Incognito)模式”下收集的用户数据。
谷歌的研究人员最近推出了一款名为 VLOGGER 的多模态扩散模型,能够自动生成带语音、丰富动作的人物视频。用户只需向 VLOGGER 输入图像和语音,就可以获得逼真的视频效果。
随着ChatGPT的出现,大语言模型在生成连贯文本和遵循指令方面获得了巨大技术突破。然后在推理和解决复杂内容方面,面临内容不准确、安全等难题。
近日,谷歌在ICLR2024上推出了一项重大成果:他们成功让大型语言模型(LLMs)学会理解「图的语言」,性能提升了高达60%。这项研究解决了LLMs在处理图形问题上的瓶颈,开启了图形数据与文本表示之间的新篇章。
谷歌最近发布了一项名为 “Vlogger” 的新视频框架,可以通过仅一张图片和录音即可生成一个本人演讲视频。
在最新的研究论文中,谷歌研究人员引入了一种名为Cappy的预训练评分器模型,旨在增强和超越大型多任务语言模型的性能。这项研究旨在解决大型语言模型(LLM)所面临的挑战,其中包括高昂的计算资源成本和效率低下的训练和推理
谷歌近日在 GitHub 页面发布博文,介绍了 VLOGGER AI 模型,用户只需要输入一张肖像照片和一段音频内容,该模型可以让这些人物“动起来”,富有面部表情地朗读音频内容。
据消息人士透露,苹果公司正在与谷歌进行深入讨论,计划将谷歌的Gemini模型引入iPhone,以提升其人工智能技术支持。
谷歌宣布于5月14日在线举办2024年I/O开发者大会。与去年一样,主题演讲将通过网络直播形式进行,任何人都可以通过网络参与观看。
Google发布了Gemini1.5Pro模型的技术报告,报告介绍了Gemini1.5Pro的模型架构、训练数据与基础设施、长文本评测和通用能力评测。
谷歌近日公开了一项名为“社会学习(Social Learning)”的 AI 框架,该框架允许 AI 语言模型能够通过自然语言互相学习,由于不需要直接交换敏感关键信息,因此训练出的 AI 模型更具隐私保护性。
3月9日消息,“湾景”园区是谷歌在加州山景城新建的总部园区。谷歌对园区及其建筑内引入的众多创新进行了大力宣传,并将从事生成式人工智能研究的员工搬入了这里。不过,有员工表示他们真心希望新总部的Wi-Fi能强点。
-------------没有了-------------