2月2日 消息:Bard已经更新,现在具有生成图片的能力。这一功能由DeepMind的Imagen2图像生成模型提供支持。
最新的Chatbot Arena排行榜显示,Bard成功超越了GPT-4,成为第二名,仅次于GPT-4Turbo。这一消息引发了科技圈的热议和关注。
如今,大型语言模型(LLM)及其高级提示策略的出现,标志着对语言模型的研究取得了重大进展,尤其是在经典的 NLP 任务中。
在最新的研究中,百度提出了一项名为UNIMO-G的统一图像生成框架,旨在克服现有文本到图像扩散模型面临的挑战。传统模型主要根据简洁的文本提示生成图像,但文本描述的简洁性限制了生成复杂细节图像的能力。
OpenAI 宣布将发布两款新模型,包括新版本的 GPT-4 Turbo 预览模型和 GPT-3.5 Turbo 模型,以及两款新的嵌入模型。
来自南洋理工大学、上海 AI 实验室等机构的研究人员共同推出了一款名为3DTopia 的新款文生3D 基础模型。这个模型可以在短短五分钟内生成出多样化、高精度的3D 模型,让人仿佛置身于一个 “魔法博物馆” 之中。
SCEPTER是由阿里巴巴开发的一个专为生成模型设计的开源框架。它用于训练、微调和推理生成模型,涵盖诸如图像生成、转换和编辑等下游任务。这个框架专门用于支持和简化图像生成、合成和编辑任务的开发,包括从文本到图像
在AAAI2024上,小红书搜索算法团队推出了一项创新框架,旨在解决大语言模型(LLMs)在推理任务中的黑盒属性和庞大参数量带来的问题。
据The Information报道,微软正在组建一个名为GenAI的团队,该团队的目标是开发更小、更便宜的人工智能模型。这些模型将专注于语言模型,类似于OpenAI的GPT-4等大型语言模型(LLM),但它们将使用更少的计算资源。
华盛顿大学推出更高效的大模型调优方法“代理调优”,该方法通过对比小型调整模型和未调整模型的预测结果来引导基础模型的预测,实现对模型的调优而无需接触模型的内部权重。
近日,一种名为Depth Anything的模型在社交网络上引起了广泛关注。Depth Anything是一种可以利用大规模无标注图像的单目深度估计模型,其具备强大的性能和实用性。该模型是通过设计一种数据引擎来收集和自动标注大规模无
1月23日 消息:人脸身份保持项目InstantID正式发布模型。与PhotoMaker和IP-Adapter-FaceID相比,InstantID实现了更好的保真度并保留了良好的文本可编辑性。这个项目的发布受到了广泛关注,因为它能够更好地融合面孔和样式
GPTs是可以定制个人版的ChatGPT,不需要懂得编程、不需要懂代码,只需要一个ChatGPT Plus账户+电脑,一个简单的提示词,就可以创建一个属于自己的“小ChatGPT”。
1月22日 消息:Adobe今日发布了全新的视频模型ActAnywhere。这一模型可以根据前景主体的运动和外观,为电影和视觉特效社区生成视频背景。
MFTCoder 是蚂蚁CodeFuse开源的一种多任务微调框架,可以在多个任务上同时进行微调。
文本到视频生成的目标是根据给定提示生成视频。最近,一些商业视频模型已经能够生成逼真的视频,具有最小的噪音、出色的细节和高度的审美评分。
源2.0开源大模型与LLaMA-Factory框架全面适配,用户可通过LLaMA-Factory快捷高效地对不同参数规模的源2.0基础模型进行全量微调及高效微调。
1月19日 消息,百度推出的UniVG是一款视频生成模型,其特点在于针对高自由度和低自由度两种任务分别采用不同的生成方式,以更好地平衡两者之间的关系。
1月19日 消息:英伟达推出了ChatQA模型,据悉其性能可以对飚GPT-4,使用两阶段指令调整和改进的上下文检索等高效的训练方法。
1月19日 消息:高质量的3D内容对于AR/VR、机器人技术、电影和游戏等应用至关重要。然而,纹理的创作一直是视觉和图形领域的挑战之一。传统方法需要密集的视角采样和准确对齐的几何信息,而学习方法则受限于特定数据集内的
1月18日 消息:苹果公司的研究者通过自回归图像模型(AIM)验证了视觉模型“参数越多性能越强”的规律,进一步证明随着容量或预训练数据量的增加,模型能不断提升性能。
1月18日 消息:AI生成图像在世界各地引发争议,即便AI生成图像在选举中的使用在本周世界经济论坛上引起了关注,初创公司仍在推动为创作者提供的AI工具领域不断前行。
-------------没有了-------------