科技魔方
  • 图片最新相关新闻
  • 静态图片转视频已经out了!ComfyUI-AdvancedLivePortrait还可编辑表情

    ComfyUI-AdvancedLivePortrait是一款先进的实时动画生成工具,通过强大的面部表情提取和编辑能力,让视频创作更加生动。

  • 科技魔方 图片视频大模型
  • 536 0
  • 网页图片细节尽在掌握:Magnifier Lens Effect 让放大观察变得简单

    在数字时代,网页上的图片展示往往承载着丰富的信息。为了帮助用户更细致地观察这些图片,一款名为 Magnifier Lens Effect 的工具应运而生。它专为网页图片设计,通过添加放大镜效果,使用户能够轻松查看图片的每一个细节。

  • AIbase基地 网页图片图片工具
  • 601 0
  • 阿里图片编辑项目MimicBrush 可通过AI技术完美融合两张图片

    MimicBrush是阿里巴巴推出的一款创新的图片编辑项目,它通过先进的AI技术,能够将一张图片的某一部分融合到另一张图片上。这项技术在电商商品展示、图片编辑和内容迁移等多个领域具有广泛的应用潜力。

  • 站长之家 阿里图片AI技术图像
  • 649 0
  • ComfyUI时间节点系统TimeUi:可快捷添加、删除或重新排列内容

    TimeUi是一个ComfyUI时间节点系统,类似于视频编辑工具的时间线界面,可以快捷添加、删除或重新排列内容,提供流畅的用户体验。

  • 站长之家 TimeUiComfyUI图片视频
  • 718 0
  • GoEnhance支持视频到视频的黏土风格转化

    最近,remini粘土风的图片在全网风靡。也有不少网友借助一些工具,将多张粘土图片转为了粘土风格视频。昨天,抖音上一条把旅行 Vlog 处理成黏土风格的视频爆了。

    OpenAI 推出专用 AI 工具:能识别 DALL・E 3 生成的图片

    OpenAI 公司今天发布新闻稿,宣布推出专用的 AI 检测工具,能够识别某张图片是否由 DALL・E 3 模型生成,且准确率高达 98%。

  • DoNews OpenAIAI工具图片
  • 701 0
  • ComfyUI插件Steerable Motion更新1.4版本 支持无限量图片输入

    Steerable Motion是一个用于通过批次图像控制视频的ComfyUI节点,其设计目标是提供最佳质量和最精确的方法来引导视频模型的进化。

    百度搜索推出AI图片助手 支持去水印、画质修复、AI扩图等功能

    百度宣布,百度搜索推出AI图片助手,在百度APP上搜索「修图」,然后上传图片,即可一键涂抹,去除背景中的路人。

  • 站长之家 百度百度搜索AI图片
  • 714 0
  • 开源多模态LLM InternVL 1.5:具备OCR能力 可解读4K图片

    InternVL 家族的开源套件提供了一种商用多模态模型的可行开源替代方案。

  • 站长之家 开源大模型数据图片
  • 660 0
  • IntrinsicAnything:调整图片光照 保持物体材质

    近期的研究通过神经网络表示材料,并通过基于物理的渲染优化模型参数来解决这一问题。

  • 站长之家 图片物体大模型
  • 546 0
  • MoA:用于图片合成的混合注意力架构 可实现风格参考和人物融合

    在最新的研究中,提出了一种名为注意力混合模式(MoA)的新架构,旨在个性化文本到图像扩散模型,可以实现风格参考和人物融合的效果。

  • 站长之家 图片大模型文本图像
  • 542 0
  • 马斯克XAI发布Grok-1.5 Vision 多模态模型 可处理文本和图片信息

    在人工智能领域,多模态模型的发展一直是行业关注的焦点。近日,马斯克X AI公司发布了其最新的多模态模型——Grok-1.5Vision,这一模型不仅能够处理文本信息,还能够理解和分析各种视觉数据,如文档、图表、截图和照片,标志着公

  • 站长之家 马斯克大模型文本图片
  • 629 0
  • DALL-E将推图片编辑功能 生成图像可局部重绘

    DALL-E即将推出图片的编辑功能,类似于局部重绘。这意味着用户可以通过画笔涂抹指定区域,然后对该区域进行重绘。这一功能的推出将为用户提供更多的创作可能性,让他们能够更加灵活地编辑和调整图像。

  • 站长之家 DALL-E图片图像
  • 693 0
  • 谷歌推出多模态VLOGGER AI:让静态肖像图动起来“说话”
    谷歌推出多模态VLOGGER AI:让静态肖像图动起来“说话”

    谷歌近日在 GitHub 页面发布博文,介绍了 VLOGGER AI 模型,用户只需要输入一张肖像照片和一段音频内容,该模型可以让这些人物“动起来”,富有面部表情地朗读音频内容。

    Gifshift:上传GIF就能一键将梗图转绘成动漫

    Gifshift是一个能够将GIF转换成另一个GIF的工具,用户只需上传一个GIF,然后输入他们想要的提示,描述性和标志性的角色效果。

  • 站长之家 Gifshift图片动漫
  • 611 0
  • 图片编辑技术StableDrag发布 拖动锚点即可编辑图像同时保持高质量

    还记得DragGAN吗?这是一种可以拖动锚点进行图像编辑的技术,但当时代码发布后,由于生成速度慢,且不能自定义外部图片,逐渐被人们淡忘。

  • 站长之家 图片编辑StableDrag图像
  • 564 0
  • FindSD.art:上传一张图片就能匹配到Civitai里同风格的SD模型
    FindSD.art:上传一张图片就能匹配到Civitai里同风格的SD模型

    FindSD.art是一个能够根据单张图像,帮助用户发现 CivitAI 的稳定扩散模型,从而找到最符合其艺术风格的工具。

  • 站长之家 FindSD.art图片
  • 685 0
  • 74%图片、20%视频营销素材由大模型生成 奇富科技客户触达规模提升21.4%

    2月27日消息,随着AIGC概念的火爆,如何应用AIGC早已成为科技企业探索的重点。而“营销”是最快与AIGC结合并产生实际落地效果的领域之一。

    PhotoMaker平替?一张照片InstantID几秒钟就能生成个性化图片

    1月18日 消息:InstantID是一项新技术,可以通过仅有一张人脸照片,几秒钟内生成不同风格的人物照片。与传统方法需要多张参考图像和复杂的微调过程不同,InstantID只需一张图像,而且无需复杂的训练或微调过程。这项技术能够

  • 站长之家 PhotoMaker图片图像
  • 567 0
  • AI图片编辑神器Anydoor:开启图片编辑的任意门 图片主体随意移动

    随着数字时代图像编辑的飞速发展,来自香港大学、阿里巴巴和蚂蚁集团的新成果AnyDoor为图片编辑开辟了一扇全新的时代之门。

  • 站长之家
  • 761 0
  • AI图片处理工具Inpaint-web 支持高清修复和图片局部清除

    Inpaint-web是一个无需客户端的AI图片处理工具,可以通过WebPGU在浏览器上直接运行,开箱即用。

  • 站长之家
  • 735 0
  • ChatGPT大升级:支持图片和语音输入 严格限制被诈骗利用

    近日OpenAI宣布推出新版ChatGPT,增加了两项新功能:语音输入和图像输入。据OpenAI称,新功能将在未来两周内向ChatGPT Plus订阅用户推出,其他人也将很快”能够使用这些功能。

  • 快科技 ChatGPT图片语音输入
  • 584 0
  • 研报显示 AI+3D 模型或成为继 AI+文字/图片/音频/视频后的高门槛的落地场景

    中金公司 7 月 18 日研报指出,在工业领域,传统AI模型(如数据分析预测、工业视觉等)应用已经相对成熟,但大语言模型(LLM)应用方兴未艾。

  • 站长之家
  • 619 0
  • Twitter允许用户在转发推文时添加图片和视频等内容

    5月7日消息,据TechCrunch报道,Twitter的最新的更新中可以让用户在移动应用和浏览器上转发推文时添加图片、视频和动图内容。

    -------------没有了-------------

    图赏更多>