硅基流动通过升级其推理模型API,显著提升了最大上下文长度至128K,增强了模型的推理能力和输出质量,同时引入独立控制思维链与回复内容长度的功能,使开发者能更灵活地调整模型性能。
Mistral AI 发布了全新开源语言模型 Devstral,这款轻量级模型专为代理 AI 软件开发设计,性能优越且支持本地运行,展现了开源社区合作的力量。
英伟达发布的Cosmos-Reason1系列模型,通过物理AI监督微调和强化学习提升AI在物理常识和具身推理上的能力,为机器人和自动驾驶领域带来新可能。
哔哩哔哩(B站)于2025年5月19日开源了最新的动画视频生成模型Index-AniSora,该模型基于AniSora模型并引入强化学习技术框架,显著提升了二次元视频生成的质量与效率。
DeepSeek团队发布关于最新模型DeepSeek-V3的技术论文,探讨了大语言模型训练中的扩展挑战及硬件架构相关思考,提出通过有效硬件感知模型设计实现经济高效的训练与推理。
Lovart AI推出全球首款设计Agent,集成图像、视频和音乐模型,颠覆传统设计工作流。
苹果正式推出FastVLM,这是一款专为高分辨率图像处理优化的视觉语言模型,具有极高的编码速度和卓越的性能,特别适合在移动设备上运行。
近日,DeepSeek发布参数达6710亿的Prover-V2数学模型,支持高效训练与部署。
Google 最近推出了 Gemini2.5Pro Preview AI 模型,标志着其在 AI 领域的持续创新与竞争力提升。
OpenAI正式推出了其最新的GPT-4.1模型,带来了显著的性能提升,特别是在编码能力和指令跟踪方面。
Freepik最近推出了其文本到图像生成模型“F Lite”,旨在为因版权问题而备受争议的生成器提供合法且安全的替代方案。
近日,科技媒体TestingCatalog报道,Anthropic旗下的Claude网页应用将通过引入Model Context Protocol(MCP)进行重大升级。
Runway最近推出的Gen-4References功能为其AI视频生成模型增添了图像一致性参考能力,使创作者能够通过上传参考图像来提取人物、场景或风格特征,从而在生成内容中保持高度一致性。
Ollama官方宣布全面支持阿里巴巴通义千问的最新大语言模型系列Qwen3,此次更新极大丰富了Ollama的开源模型生态,为开发者和企业提供了强大的本地化部署选择。
Moonshot AI 最近推出的 Kimi-VL 模型,凭借其高效的性能和处理长文档、复杂推理的能力,成为多模态 AI 领域的亮点。
Ostris团队推出了Flex.2-preview,这是一款基于8亿参数的文本到图像扩散模型,旨在优化ComfyUI工作流。
OpenAI正式推出了其全新图像生成模型GPT-image-1,并通过API向全球开发者开放使用。这一模型的发布标志着图像生成技术的又一次飞跃,为开发者带来了更多可能性。
-------------没有了-------------