4月24日,苹果开源了大语言模型OpenELM。这与微软刚开源的Phi-3 Mini类似,是一款专门针对手机等移动设备的模型。
从电子计算机诞生前,符号主义学派与连接主义学派的斗争,到后来深度学习的兴起,再到如今AIGC领域的爆发,AI从理论到实践的跨越过程,亦悄然改写了人类的历史进程。
Synthesia,一家领先的人工智能公司,近日宣布即将推出一款新的数字人头像模型——EXPRESS-1。这款新模型的推出,无疑将进一步推动AI在视频制作领域的应用。
博主Tibor Blaho 在推特上披露了ChatGPT即将推出的新功能和改进,尽管关于 GPT-5的具体信息尚未公开,但 OpenAI 显然已经在为 ChatGPT 的下一步发展做准备。
AdobePhotoshop迎来了一次重大更新,通过集成Adobe Firefly Image3Model,引入了多项新的AI功能,这些功能大幅提升了图像编辑的深度与灵活性。
Adobe 发布了 Firefly 图像生成模型的最新版本,名为 Firefly Image3,声称具有 “摄影细节” 的图像生成能力。
前段时间,微软公布并开源了最新一代大模型WizardLM-2,号称性能堪比GPT-4。不过,还未上线一天,模型权重和公告全被删除了,原因竟是......
在视频分割领域,Segment Anything 模型(SAM)被用于探索新的视频对象分割技术。研究团队测试了两种不同的模型,旨在结合 SAM 的分割能力和光流技术的优势,以提高视频分割的性能。
今天,Midjourney发布了一个有趣的功能,可以基于提示词生成完全随机的图像风格。使用方式:在提示词后添加 --sref random,如果找到了喜欢的风格可以通过 --sref url 将风格迁移到新图片上。
字节跳动的Lightning团队发布的新图像模型蒸馏算法Hyper-SD,是一项在图像处理和机器学习领域的重要进展。这项技术通过创新的方法提升了模型在不同推理步骤下的性能,同时保持了模型大小的精简。
AIJukebox是一个利用人工智能技术的音乐生成工具,它通过Hugging Face平台提供服务。这个工具的设计理念在于简化音乐创作过程,使其变得更加智能化和用户友好。
贝勒大学经济学院的Pham Hoang Van和Scott Cunningham两位教授,基于OpenAI的GPT-3.5、GPT-4深度研究了大模型对事情的预测能力。
在数字资产创造和3D重建领域,香港大学CVMI实验室与3D大模型公司VAST以及浙江大学的联合研究团队提出了一项突破性成果——SC-GS(Sparse Control Gaussian Splatting)模型。
近日,国内AI创新企业功夫源科技推出了一款名为「功夫量化」的金融数据分析AI应用,标志着金融数据分析领域的一次重大突破。
在2024年4月19日,斯坦福大学以人为中心的人工智能研究所发布了其备受瞩目的2024年人工智能指数报告。这份全面的研究报告深入分析了人工智能(AI)的现状,探讨了主要趋势、进步和挑战。
英伟达A100算力芯片在中国市场备受瞩目,2021年上市后大规模出口中国,成为AI和大模型应用的基础算力。初期定价为3000-5000美元,随后价格上涨至8000美元。
在图表解析领域,由于样式、数值、文本等的多样性,存在着重大挑战。即使是拥有数十亿参数的先进大型视觉 - 语言模型(LVLMs)也难以令人满意地处理此类任务。
-------------没有了-------------