科技魔方
  • GPT-4V最新相关新闻
  • 国产「小钢炮」一夜干翻巨无霸GPT-4V、Gemini Pro!稳坐端侧多模态铁王座

    一夜之间,全球最强端侧多模态模型再次刷新,仅用8B参数,击败了多模态巨无霸Gemini Pro、GPT-4V。而且,其OCR长难图识别刷新SOTA,图像编码速度暴涨150倍。这是国产头部大模型公司献给开发者们最浪漫的520礼物。

  • 新智元公众号 GPT-4V大模型520
  • 679 0
  • 阿里云发布多模态大模型Qwen-VL-Max版本 性能比肩GPT-4V
    阿里云发布多模态大模型Qwen-VL-Max版本 性能比肩GPT-4V

    阿里云公布了多模态大模型的最新研究成果,继Plus版本之后,再次推出Max版本。

  • 站长之家 阿里云大模型GPT-4V
  • 710 0
  • 微软用GPT-4V解读长视频 MM-Vid能看懂电影还能讲给盲人听

    近期,微软Azure AI发布了MM-Vid,这是一项结合GPT-4V与专用工具的创新,致力于解读长视频并为视障人士提供更好的体验。

  • 站长之家
  • 628 0
  • VimGPT:GPT-4V和Vimium的结合,让你更高效地浏览互联网

    随着互联网上的信息量不断增加,很多人都感到应接不暇。然而,现在有一种新的工具正在GitHub上流行,它就是VimGPT。这个工具利用了GPT-4V和Vimium,可以让用户更加快速、高效地浏览互联网。

  • 站长之家 VimGPTGPT-4VVimium
  • 671 0
  • GPT-4V搞不明白勾股定理!最新基准测试错误率竟高达90%

    近日,马里兰大学发布了一项重要研究,针对GPT-4V视觉模型进行了首个专为其设计的基准测试,名为HallusionBench。

  • 站长之家 GPT-4V勾股定理最新基准
  • 661 0
  • 全新视觉提示方法SoM 让GPT-4V看的更准、分的更细

    研究人员推出了一种新的视觉提示方法 Set-of-Mark(SoM),它可以让 OpenAI 多模态大模型 GPT-4V 在视觉内容理解方面有了质的提升。

  • 站长之家 视觉GPT-4V
  • 585 0
  • -------------没有了-------------

    图赏更多>