科技魔方
  • 模型最新相关新闻
  • 微软LongRoPE方法让LLM上下文窗口突破 200 万 8倍扩展还保持性能

    近日,微软研究人员提出的 LongRoPE 方法首次将预训练的大型语言模型(LLM)的上下文窗口扩展至2048k 个 token,实现了8倍的扩展同时保持原始短上下文窗口的性能,而无需进行架构变化和复杂微调。

  • 站长之家 微软大模型模型
  • 636 0
  • 通义千问开源千亿级参数模型, 性能媲美 Llama3

    通义千问开源 1100 亿参数模型 Qwen1.5-110B,成为全系列首个千亿级参数开源模型,并在多项基准测评中都创下可与 Llama3-70B 媲美的成绩。目前 Qwen1.5 系列已累计开源 10 款大模型,通义千问开源模型下载量超过 700 万。

    WebLlama:基于Llama-3-8B的智能网页浏览代理

    WebLlama是一款基于Llama-3-8B模型的智能代理,它通过对话与用户互动,执行网页浏览相关的任务。这款工具能够处理连续的对话,理解并执行用户的指令,自动完成网上搜索、导航和信息检索等操作。

    LLaVA++:为Phi-3和Llama-3模型增加视觉处理能力

    LLaVA++项目通过扩展现有的LLaVA模型,成功地为LLaVA++和Llama-3模型赋予了视觉能力。这一改进标志着AI在多模态交互领域的进一步发展。

  • 站长之家 模型大模型AI
  • 665 0
  • 照片分享平台EyeEm被收购后 将用户照片用于训练人工智能模型

    柏林照片分享社区EyeEm在去年被西班牙公司Freepik收购后,正在采取一项引发争议的举措 - 将用户上传的照片用于训练人工智能模型。

  • 站长之家 EyeEm人工智能模型
  • 516 0
  • 新ID保持项目PuLID:图像背景、光线、风格等均保持高度一致

    PuLID是一个新兴的ID保持项目,它在提升ID保持效果的同时,还致力于最小化对原始模型的影响。

  • 站长之家 图像大模型模型
  • 699 0
  • Align Your Steps:低步数推理保持高质量结果 适用于SD 1.5和SDXL

    在深度学习领域,扩散模型(DMs)作为生成建模的前沿方法已经得到广泛应用。然而,DMs 的一个关键缺点是其较慢的采样速度,这主要是由于需要通过大型神经网络进行多次顺序函数评估。

  • 站长之家 大模型模型视频
  • 698 0
  • 算力不足,小模型成AI模型发展下个方向?

    大模型不是AI的唯一出路,把模型做小也是本事。

  • 新火种公众号 大模型AI模型模型算力
  • 554 0
  • 微软发布iPhone可运行的ChatGPT级AI模型Phi-3系列 挑战OpenAI地位

    近日,微软推出了一款名为Phi-3系列的小型AI模型,该模型在AI领域引起了广泛关注。Phi-3系列中的Phi-3-mini模型,仅拥有3.8B参数,却在多项基准测试中超越了拥有8B参数的Llama3模型。

    苹果开发设备内运行的大型语言模型 优先考虑速度和隐私

    据彭博社报道,苹果公司正在开发自己的大型语言模型(LLM)。这款模型将能够在设备上本地运行,从而优先考虑速度和隐私保护。

  • 站长之家 苹果大模型模型
  • 533 0
  • 可以在手机上用开源模型了!Hugging Face发布手机应用Hugging Chat

    Hugging Face最近发布了一款名为“Hugging Chat”的iOS客户端应用,为用户带来了便捷。用户现在可以在手机上访问和使用Hugging Face平台上托管的各种开源模型。

  • 科技魔方 手机应用开源模型
  • 607 0
  • AI文生图模型PixArt-sigma,可以生成4K分辨率图片

    PixArt-sigma(PixArt-Σ)由华为诺亚方舟实验室联合多个研究机构共同开发的项目,是一个强大的文本到图像生成模型,通过弥散 Transformer 进行弱到强训练,旨在实现4K 分辨率的图像生成。

  • 站长之家 AI文生图模型
  • 666 0
  • InstantMesh:只需10秒就能从图片转3D模型

    InstantMesh是一项突破性的技术,能够从单张图像快速生成高质量的三维网格模型。这项技术利用了前馈框架,结合了多视图扩散模型和基于大规模重建模型(LRM)的稀疏视图重建技术,极大地优化了3D资产的创建过程。

    模型未发API先至!Stable Diffusion 3 API 发布 性能比肩 Midjourney v6

    Stability AI 最近宣布了一个激动人心的消息:其开发者平台API现已支持最新版本的Stable Diffusion3(SD3)及其增强版本Stable Diffusion3Turbo。

  • 科技魔方 模型大模型AI图像
  • 545 0
  • 谷歌发布新代码模型Code Gemma:参数小、性能强,硬件要求低!

    谷歌最近发布了面向企业、开发人员的全新代码模型 Code Gemma,该模型参数小、性能强,同时对硬件要求较低。

  • 科技魔方 谷歌大模型模型代码
  • 535 0
  • MiniMax 稀宇科技发布万亿 MoE 模型abab 6.5

    MiniMax在2024年4月17日推出了abab6.5系列模型,这是一个万亿MoE(Mixture of Experts)模型。

    Ollama更新 优化软件并支持Command R+等多个热门模型

    Ollama软件的最新更新为用户带来了一系列显著的性能提升和新功能。这次更新主要集中在优化软件性能,提高VRAM的利用率,减少内存不足的错误,并改善GPU的运行效率。此外,Ollama还扩展了对一些热门新模型的支持,以满足用户对

  • 站长之家 Ollama软件大模型模型
  • 543 0
  • 代码、模型全开源!贾佳亚团队多模态模型 Mini-Gemini登上热榜

    香港中文大学终身教授贾佳亚团队最近推出了一款名为Mini-Gemini的多模态模型,该模型在多模态任务榜单上取得了显著成绩,其性能堪比GPT-4与DALLE3的结合。

  • 站长之家 代码模型大模型
  • 521 0
  • OpenAI新GPT-4 Turbo模型上线:可供付费ChatGPT用户使用

    据媒体报道,OpenAI的全新GPT-4 Turbo模型已全面上线,并正式向付费ChatGPT用户开放。

    SDXL模型精选微调模型合集SDXL fine-tunes 覆盖各种风格 可直接用于开发

    最近,Replicate上的“SDXL fine-tunes”收藏包含了一系列基于SDXL模型的精选微调模型,这些模型专为生成特定视觉风格和主题的高质量图像而设计。这些微调模型利用了大型生成模型SDXL的强大功能,通过针对特定内容进行优化

  • 站长之家 SDXL模型大模型模型
  • 533 0
  • Mistral AI最新磁力链放出!8x22B MoE模型,281GB解禁

    初创团队MistralAI再次放出一条磁力链,281GB文件解禁了最新的8x22BMoE模型。

  • 新智元公众号 MistralAI大模型模型
  • 690 0
  • Nightshade:使AI模型在未经许可的情况下无法训练图片

    据报道,芝加哥大学的研究人员开发了一种名为Nightshade的工具,旨在防止未经许可的AI图像生成。该工具可以使AI图像生成器无法使用未经许可的图像进行训练,从而保护了艺术家和版权所有者的作品。

  • 站长之家 NightshadeAI模型
  • 697 0
  • Stability AI发布CosXL模型 图像处理能力更精细

    Stability AI 最近推出了CosXL模型,这是一项包括基础版CoXL和增强版Edit CosXL的创新技术。这些模型的发布,标志着图像生成和编辑技术的新里程碑,为用户提供了更加强大和精细的图像处理能力。

  • 站长之家 StabilityAI模型大模型3D
  • 697 0
  • Open-Sora-Plan v1.0.0模型发布 显著提升视频生成质量和文本控制能力

    近日,Open-Sora-Plan v1.0.0模型正式发布,这一最新版本的AI模型在视频生成质量和文本控制能力方面取得了显著的提升。

  • 站长之家 大模型模型视频
  • 547 0
  • Harvey公司与OpenAI合作 为法律专业人士打造定制训练的案例法模型

    近日,Harvey公司与OpenAI宣布合作,共同为法律专业人士打造了一款定制训练的案例法模型。这款AI系统不仅具备复杂的推理能力,还能够处理广泛的法律领域知识,并具备超越单一模型调用的能力。

  • 站长之家 HarveyOpenAI法律模型
  • 609 0
  •  277    1 2 3 4 5 6 7 8 9 10 下一页 尾页

    -------------没有了-------------

    图赏更多>