Stefano Rivera分享了利用AI工具制作交互式“MR木偶秀”。利用ChatGPT进行创意和内容策划。Dall-E3和Midjourney生成2D图像。使用tripoai将2D平面图像转化为3D渲染效果。
Vision Mamba 是一种新的视觉模型,通过引入状态空间模型(SSM)来进行视觉建模,并在 ImageNet 分类、COCO 对象检测和 ADE20k 语义分割任务上实现了更高的性能。
1月18日 消息:AI生成图像在世界各地引发争议,即便AI生成图像在选举中的使用在本周世界经济论坛上引起了关注,初创公司仍在推动为创作者提供的AI工具领域不断前行。
1月18日 消息:InstantID是一项新技术,可以通过仅有一张人脸照片,几秒钟内生成不同风格的人物照片。与传统方法需要多张参考图像和复杂的微调过程不同,InstantID只需一张图像,而且无需复杂的训练或微调过程。这项技术能够生成高质量的个性化图像,保持个人特征的真实性,并且能够适应不同的视觉需求。
腾讯最新推出的AI照片生成工具PhotoMaker引发了不少关注,该应用利用强化学习(RL)技术,只要上传照片就可以生成多种风格的个人照片,无需进行额外的LoRA训练,用户可以迅速进行定制。
在使用强化学习(RL)进行文本生成图像(T2I)时,质量奖励成为一个紧迫问题。尽管观察到通过强化学习RL可能提高图像质量,但多个奖励的聚合可能导致在某些度量中过度优化而在其他度量中降级。
DDColor是一款照片级、真实感的图像着色工具,采用了双解码器技术,能够同时考虑色彩分布和像素级详细信息,实现高度真实的图像上色效果。
-------------没有了-------------