不久前 OpenAISora以其惊人的视频生成效果迅速走红,在一众文生视频模型中突出重围,成为全球瞩目的焦点。继2周前推出成本直降46% 的 Sora 训练推理复现流程后,Colossal-AI 团队全面开源全球首个类 Sora 架构视频生成模型
今天凌晨,马斯克旗下大模型公司 xAI 宣布正式开源 3140 亿参数的混合专家(MoE)模型「Grok-1」,以及该模型的权重和网络架构。
由颜水成和程明明领衔的研究团队在Sora核心技术上进行了重要的升级,推出了Masked Diffusion Transformer V2。该模型在ImageNet benchmark上取得了惊人的成绩,FID score达到1.58,刷新了State-of-the-Art(SoTA)。
MyShellAI刚上班了开源项目AIlice,可以控制多个智能体协同完成复杂的任务,例如文档检索、下载、数据分析、画图等。 并且可以针对任务生成代码在虚拟环境中运行。
随着抖音、快手等平台的火爆出圈,越来越多的用户开始制作大量的短视频内容。但对这些视频进行有效的理解和分析仍面临一些困难。
2月22日 消息:谷歌于2月22日宣布开源大语言模型Gemma,成为其生成式AI领域的新力量。Gemma采用Gemini架构,有20亿、70亿两个版本,分别支持预训练和指令微调。
2月22日,谷歌宣布推出全球性能最强大、轻量级的开源模型系列—— Gemma。该模型共分为分为 2B(20 亿参数)和 7B(70 亿)两种尺寸版本,2B 版本甚至可直接在笔记本电脑上运行。
谷歌近日更新博文,宣布开源 Magika,基于人工智能快速高效地识别文件格式和内容类型,相关源代码已托管到 GitHub 上。
CodeFuse-VLM是一个支持多种视觉模型和语言大模型的框架,用户可以根据自己的需求搭配不同的Vision Encoder和LLM。
OLMo是由AI2 研究院发布的开源语言模型和训练框架。该框架提供了完整的训练数据、代码、模型参数以及评估代码等资源,为语言模型技术研究人员提供了全面的支持。
近日,开源鸿蒙OpenHarmony官方发布公告表示,OpenHarmony开源三年多以来,代码行数超过了1亿行,已成为下一代智能操作系统根社区。
SCEPTER是由阿里巴巴开发的一个专为生成模型设计的开源框架。它用于训练、微调和推理生成模型,涵盖诸如图像生成、转换和编辑等下游任务。这个框架专门用于支持和简化图像生成、合成和编辑任务的开发,包括从文本到图像
随着人工智能技术的发展,以 GPT-4为代表的大语言模型依靠其强大的能力正在对社会产生深远的影响。
源2.0开源大模型与LLaMA-Factory框架全面适配,用户可通过LLaMA-Factory快捷高效地对不同参数规模的源2.0基础模型进行全量微调及高效微调。
1月19日 消息:TOFU框架是一个旨在提升大模型安全性的工具,由卡内基梅隆大学研究人员开发。该框架包含遗忘、数据集、评估等多个模块,帮助开发者提升大模型的安全性。
中国电信集团成立的中电信人工智能科技有限公司凭借全自研算法、精心打造的高质量数据集,发布星辰AI大模型。
1月17日 消息:新一代200亿「书生·浦语2.0」是一款开源的大语言模型。它支持200K超长上下文,且20B版本在数学推理方面的性能超越了ChatGPT。该模型使用了第三代数据清洗过滤技术,大幅提升了模型训练效率。
Resemble Enhance是一款令人印象深刻的语音处理技术,专为将嘈杂的音频转换为清晰有力的语音而设计。
元象发布了全球首个上下文窗口长度为256K 的开源大模型 XVERSE-Long-256K,支持输入25万汉字,无条件免费商用。
近日,快手联合哈尔滨工业大学成功开源了「KwaiAgents」系统,实现了7B/13B模型的超越效果。这一成果的背后,是通过Meta-Agent Tuning(MAT)方法提升大模型的通用能力。
-------------没有了-------------