3月1日消息,昨日晚间,360集团创始人周鸿祎免费课AI系列第一讲——“预见AGI”正式上线。作为互联网行业资深老兵,周鸿祎系统性地分享了他对AI最新发展趋势的洞察、多模态发展的五个层次等硬核AI知识,详解了Sora创新突破的
在人工智能领域,多模式大语言模型(MLLMs)在推动进步方面发挥了巨大作用,但它们面临处理误导性信息的挑战,可能导致不正确或产生幻觉的响应。
如果将过去一年拆解至具体每个季度,市场清晰地发现 , 过去一年里,百度正快速推进自己在 AI领域中中应用成果的落地,这意味着, AI已成为 百度进入新一轮价值回报期的 新动力。
正当AI已近乎袪魅之时,AI大模型的崛起,为AI产业以及更广泛的科技领域,带来了一阵复苏之风——回顾2023年,AIGC浪潮有如一场恰到好处的及时雨,为沉寂已久的商业世界注入了勃勃生机。
3月1日 消息:扩散模型中,UNet的long skip connection上的scaling操作被证实能够稳定模型训练。在一些流行的扩散模型中,如Imagen和Score-based generative model中,已经观察到设置scaling系数可以有效加速模型的训练过程
2月29日 消息:英伟达最新推出的Nemotron-4语言模型引起广泛关注。这一通用大模型拥有150亿参数,经过在8T token上的训练,在英语、多语言和编码任务中表现出色。
2月29日消息,在百度2023年第四季度及全年财报电话会上,百度创始人、董事长兼首席执行官李彦宏透露,百度文心大模型推理成本已降至1%。
近日,来自不列颠哥伦比亚大学和Invertible AI的研究人员推出了一款具有突破性的大型语言模型(LLM)——FinTral,专为金融领域量身定制。
2月28日 消息:近期,针对文本到图像(T2I)生成模型领域中的个性化主题驱动模型,出现了一些令人印象深刻的进展,如 DreamBooth 和 BLIP-Diffusion。然而,这些模型普遍存在着对微调的需求较高和参数规模庞大的限制。
2月28日 消息:近日,蚂蚁集团推出20亿参数多模态遥感基础模型SkySense,这是蚂蚁百灵大模型在多模态领域最新的研发成果,其论文已被世界计算机视觉顶会CVPR2024接收。
2月27日消息,随着AIGC概念的火爆,如何应用AIGC早已成为科技企业探索的重点。而“营销”是最快与AIGC结合并产生实际落地效果的领域之一。
MeloTTS是由MyShell AI开发的一个高质量的多语言文本到语音(TTS)库。这个库支持英语、西班牙语、法语、中文、日语和韩语等多种语言,使其在全球范围内具有广泛的应用价值。
近日,微软推出了升级版的 AI 伴侣 Copilot,其中新增了一项定制的 GPT 功能 ——“健身教练(Fitness trainer)”,可以帮助用户解答健身方面的问题。这一消息由 Copilot 负责人 Jordi Ribas 通过社交媒体平台 X 发布。
微软宣布与开源大模型平台 Mistral AI 达成技术合作,着眼于加强人工智能与大语言模型(LLM)领域的合作。
大语言模型(LLM)在生成文本内容方面非常强,但在理解、生成视频、图像等方面略显不足。尤其是在Sora一夜爆红之后,让人们意识到未来主流模型一定是文本+音频+图像+视频的多模态生成、理解功能。
谷歌最新发布了基础世界模型Genie,这一模型拥有110亿参数,能够生成可交互的虚拟世界。Genie的出现让人们看到了人工智能在虚拟世界的无限可能性。
在巴塞罗那盛大举行的2024世界移动通信大会(MWC2024)上,华为成为焦点。该公司不仅展示了其5G-A全系列产品与解决方案,还首次发布了通信行业的大模型。
近日,香港初创公司 Weitu AI 宣布成功完成天使轮融资,估值高达一亿美金。投资方包括全球数亿月活的互联网科技公司和著名天使投资人。
2月26日 消息:新加坡国立大学尤洋教授团队联合其他机构开发的p-diff扩散模型在AI领域引起热议。这项模型能以44倍的速度生成神经网络参数,得到了深度学习领域的重要人物LeCun的点赞。
-------------没有了-------------