近日,微软研究人员提出的 LongRoPE 方法首次将预训练的大型语言模型(LLM)的上下文窗口扩展至2048k 个 token,实现了8倍的扩展同时保持原始短上下文窗口的性能,而无需进行架构变化和复杂微调。
LLaVA++项目通过扩展现有的LLaVA模型,成功地为LLaVA++和Llama-3模型赋予了视觉能力。这一改进标志着AI在多模态交互领域的进一步发展。
柏林照片分享社区EyeEm在去年被西班牙公司Freepik收购后,正在采取一项引发争议的举措 - 将用户上传的照片用于训练人工智能模型。
在深度学习领域,扩散模型(DMs)作为生成建模的前沿方法已经得到广泛应用。然而,DMs 的一个关键缺点是其较慢的采样速度,这主要是由于需要通过大型神经网络进行多次顺序函数评估。
据彭博社报道,苹果公司正在开发自己的大型语言模型(LLM)。这款模型将能够在设备上本地运行,从而优先考虑速度和隐私保护。
Hugging Face最近发布了一款名为“Hugging Chat”的iOS客户端应用,为用户带来了便捷。用户现在可以在手机上访问和使用Hugging Face平台上托管的各种开源模型。
PixArt-sigma(PixArt-Σ)由华为诺亚方舟实验室联合多个研究机构共同开发的项目,是一个强大的文本到图像生成模型,通过弥散 Transformer 进行弱到强训练,旨在实现4K 分辨率的图像生成。
InstantMesh是一项突破性的技术,能够从单张图像快速生成高质量的三维网格模型。这项技术利用了前馈框架,结合了多视图扩散模型和基于大规模重建模型(LRM)的稀疏视图重建技术,极大地优化了3D资产的创建过程。
Stability AI 最近宣布了一个激动人心的消息:其开发者平台API现已支持最新版本的Stable Diffusion3(SD3)及其增强版本Stable Diffusion3Turbo。
谷歌最近发布了面向企业、开发人员的全新代码模型 Code Gemma,该模型参数小、性能强,同时对硬件要求较低。
MiniMax在2024年4月17日推出了abab6.5系列模型,这是一个万亿MoE(Mixture of Experts)模型。
Ollama软件的最新更新为用户带来了一系列显著的性能提升和新功能。这次更新主要集中在优化软件性能,提高VRAM的利用率,减少内存不足的错误,并改善GPU的运行效率。此外,Ollama还扩展了对一些热门新模型的支持,以满足用户对
香港中文大学终身教授贾佳亚团队最近推出了一款名为Mini-Gemini的多模态模型,该模型在多模态任务榜单上取得了显著成绩,其性能堪比GPT-4与DALLE3的结合。
据媒体报道,OpenAI的全新GPT-4 Turbo模型已全面上线,并正式向付费ChatGPT用户开放。
最近,Replicate上的“SDXL fine-tunes”收藏包含了一系列基于SDXL模型的精选微调模型,这些模型专为生成特定视觉风格和主题的高质量图像而设计。这些微调模型利用了大型生成模型SDXL的强大功能,通过针对特定内容进行优化
初创团队MistralAI再次放出一条磁力链,281GB文件解禁了最新的8x22BMoE模型。
据报道,芝加哥大学的研究人员开发了一种名为Nightshade的工具,旨在防止未经许可的AI图像生成。该工具可以使AI图像生成器无法使用未经许可的图像进行训练,从而保护了艺术家和版权所有者的作品。
Stability AI 最近推出了CosXL模型,这是一项包括基础版CoXL和增强版Edit CosXL的创新技术。这些模型的发布,标志着图像生成和编辑技术的新里程碑,为用户提供了更加强大和精细的图像处理能力。
近日,Open-Sora-Plan v1.0.0模型正式发布,这一最新版本的AI模型在视频生成质量和文本控制能力方面取得了显著的提升。
近日,Harvey公司与OpenAI宣布合作,共同为法律专业人士打造了一款定制训练的案例法模型。这款AI系统不仅具备复杂的推理能力,还能够处理广泛的法律领域知识,并具备超越单一模型调用的能力。
-------------没有了-------------