Google Research最近发布了一款名为VideoPoet的大型语言模型(LLM),旨在解决当前视频生成领域的挑战。该领域近年来涌现出许多视频生成模型,但在生成连贯的大运动时仍存在瓶颈。
Stable Diffusion 背后的的公司Stability A现在推出了一项订阅服务,以标准化和改变客户商业用途中对其模型的使用方式。
据 Businessinsider 报道,大型 AI 模型现在已经强大到可以完全自动地创建新的小型 AI 工具,无需任何人类干预。
近日,来自华中科技大学、字节跳动和约翰斯·霍普金斯大学的研究人员推出了一款名为GLEE的全新通用物体级别基础模型,为图像和视频分析带来了全新的可能性。
OpenAI,一个承诺为全人类利益构建人工智能的公司,自去年推出 ChatGPT 以来,其商业雄心在最近的治理危机中变得更加显著。
EdgeSAM是一个优化过的SAM变体,相比原始SAM实现了40倍的速度提升,对性能的影响较小,可以在iPhone14上以30帧每秒的速度运行。
Mozilla 近日推出名为 Solo 的全新项目,面向没有任何编程经验的用户,通过融入 AI 能力,所创建的网站可以媲美专业开发者的开发效果。
开发人员 Oliver Wehrens 近日测试了苹果 M1 Pro、M2 Ultra 和 M3 Max 三款 Apple Silicon 芯片升级 MLX 框架后训练 AI 能力,并对比了英伟达的 RTX 4090 显卡。
海德堡大学最近发布了一个名为ConTorlNetXS的优化版本的ControlNet模型,该模型在图像生成方面的性能得到了极大提升。
Together AI最新发布了StripedHyena-7B,这一人工智能模型领域的创新力量引起了广泛关注。
大模型长期以来一直存在一个致命的问题,即生成幻觉。由于数据集的复杂性,难免会包含过时和错误的信息,这使得输出质量面临着极大的挑战。
继万物皆可分割的SAM模型后,Meta又发布了更高效的EfficientSAM模型。EfficientSAM是一项创新性的工作,旨在降低SAM模型的计算复杂性,使其在更广泛的实际应用中表现出色。
Google 刚刚宣布了其迄今为止最强大的 AI 模型套件 Gemini,但该公司已被指控在其宣传视频中对其性能进行了误导性表述。
Anthropic采用一种新方法来防止人工智能(AI)对受保护群体进行歧视,通过在提示中加入请求,要求AI“非常非常非常非常”友好地对待,并且这一策略在降低歧视方面取得了成功。
据报道,谷歌宣布Gemini AI模型即将首次亮相Pixel8Pro,并计划逐步覆盖整个Android生态系统。
谷歌在当地时间周三宣布推出其认为是迄今为止规模最大、能力最强的人工智能模型 Gemini,以回应公司如何盈利化 AI 的迫切问题。
Runway ML与Getty Images的合作标志着AI视频领域的重要进展。这次合作将开发一个新的生成式AI视频模型,命名为Runway Getty Images Model(RGM),专注于服务好莱坞和广告等视觉媒体行业。
谷歌在 I/O 2023 上宣布Gemini 作为其下一代基础模型。据今天的报道称,谷歌原定于下周推出Gemini,但现在已推迟到明年一月份。
PyTorch 团队发布了一篇名为《Accelerating Generative AI with PyTorch II: GPT, Fast》的博文,重点介绍如何使用纯原生 PyTorch 加速生成式 AI 模型。
-------------没有了-------------