据彭博社报道,苹果公司正在开发自己的大型语言模型(LLM)。这款模型将能够在设备上本地运行,从而优先考虑速度和隐私保护。
Hugging Face最近发布了一款名为“Hugging Chat”的iOS客户端应用,为用户带来了便捷。用户现在可以在手机上访问和使用Hugging Face平台上托管的各种开源模型。
PixArt-sigma(PixArt-Σ)由华为诺亚方舟实验室联合多个研究机构共同开发的项目,是一个强大的文本到图像生成模型,通过弥散 Transformer 进行弱到强训练,旨在实现4K 分辨率的图像生成。
InstantMesh是一项突破性的技术,能够从单张图像快速生成高质量的三维网格模型。这项技术利用了前馈框架,结合了多视图扩散模型和基于大规模重建模型(LRM)的稀疏视图重建技术,极大地优化了3D资产的创建过程。
Stability AI 最近宣布了一个激动人心的消息:其开发者平台API现已支持最新版本的Stable Diffusion3(SD3)及其增强版本Stable Diffusion3Turbo。
谷歌最近发布了面向企业、开发人员的全新代码模型 Code Gemma,该模型参数小、性能强,同时对硬件要求较低。
MiniMax在2024年4月17日推出了abab6.5系列模型,这是一个万亿MoE(Mixture of Experts)模型。
Ollama软件的最新更新为用户带来了一系列显著的性能提升和新功能。这次更新主要集中在优化软件性能,提高VRAM的利用率,减少内存不足的错误,并改善GPU的运行效率。此外,Ollama还扩展了对一些热门新模型的支持,以满足用户对
香港中文大学终身教授贾佳亚团队最近推出了一款名为Mini-Gemini的多模态模型,该模型在多模态任务榜单上取得了显著成绩,其性能堪比GPT-4与DALLE3的结合。
据媒体报道,OpenAI的全新GPT-4 Turbo模型已全面上线,并正式向付费ChatGPT用户开放。
最近,Replicate上的“SDXL fine-tunes”收藏包含了一系列基于SDXL模型的精选微调模型,这些模型专为生成特定视觉风格和主题的高质量图像而设计。这些微调模型利用了大型生成模型SDXL的强大功能,通过针对特定内容进行优化
初创团队MistralAI再次放出一条磁力链,281GB文件解禁了最新的8x22BMoE模型。
据报道,芝加哥大学的研究人员开发了一种名为Nightshade的工具,旨在防止未经许可的AI图像生成。该工具可以使AI图像生成器无法使用未经许可的图像进行训练,从而保护了艺术家和版权所有者的作品。
Stability AI 最近推出了CosXL模型,这是一项包括基础版CoXL和增强版Edit CosXL的创新技术。这些模型的发布,标志着图像生成和编辑技术的新里程碑,为用户提供了更加强大和精细的图像处理能力。
近日,Open-Sora-Plan v1.0.0模型正式发布,这一最新版本的AI模型在视频生成质量和文本控制能力方面取得了显著的提升。
近日,Harvey公司与OpenAI宣布合作,共同为法律专业人士打造了一款定制训练的案例法模型。这款AI系统不仅具备复杂的推理能力,还能够处理广泛的法律领域知识,并具备超越单一模型调用的能力。
据媒体报道,在最近的一篇论文中,苹果的研究团队宣称,他们提出了一个可以在设备端运行的模型ReALM,这个模型在某些方面可以超过GPT-4。
谷歌的研究人员最近推出了一款名为 VLOGGER 的多模态扩散模型,能够自动生成带语音、丰富动作的人物视频。用户只需向 VLOGGER 输入图像和语音,就可以获得逼真的视频效果。
近日,UT奥斯丁等机构提出的StreamingT2V技术引发了广泛关注,将AI视频生成推向了新的高度。这项技术突破了以往视频长度的限制,实现了生成高度一致且长度可扩展的视频。
智源研究院推出了新一代检索排序模型BGERe-Rankerv2.0,支持100+ 种语言,文本长度更长,并在多项评测中达到了 SOTA(state-of-the-art)的结果。
近日,字节发布了一款名为AnimateDiff-Lightning的模型,这款模型在视频生成方面的性能表现令人瞩目。只需4-8步的推理,就能生成质量非常不错的视频,这对于视频制作行业来说无疑是一次重大的技术突破。
-------------没有了-------------