Meta发布Muse Spark AI:单一框架融合文本与视觉,算力需求降低10倍

打印派   2026-04-09 08:50:14

Meta公司近日推出名为Muse Spark的新型人工智能模型,这标志着其AI战略的一次重要调整。该模型是Meta超级智能实验室(Meta Superintelligence Labs)的首个成果,将多模态推理与代理式任务执行能力融为一体。Muse Spark的发布正值各大科技公司竞相定义聊天机器人之外的下一代AI形态之际。

与早期模型不同,Muse Spark能够在单一框架内处理文本、图像和工具调用。它还引入了一个可同时运行多个推理代理的系统。Meta表示,这一设计提升了处理复杂问题的性能,但同时也承认仍有改进空间。Muse Spark可以分析图像、解决视觉STEM问题,并基于上下文理解进行物体识别。它支持对视觉输入的逐步推理——Meta将其称为“视觉思维链”。这些能力使得更实用的应用场景成为可能:用户可以请系统排查家电故障,或通过带注释的视觉内容指导完成操作任务。模型还能生成交互式内容,包括根据用户提示创建简单游戏。

Meta发布Muse Spark AI:单一框架融合文本与视觉,算力需求降低10倍

Muse Spark的另一项关键新增功能是“沉思模式”(Contemplating mode)。该模式并行运行多个推理代理,旨在更有效地应对高难度任务。这一做法与竞争对手通过增加推理时计算来扩展推理能力的思路相似。Meta报告称,Muse Spark在“人类最后考试”(Humanity’s Last Exam)中得分58%,在“前沿科学任务”(FrontierScience Research)中得分38%。不过,由于各模型评估方法不同,这些分数仍然难以直接比较。

在模型发布的背后,是Meta基础设施层面的更大调整。Meta表示,过去九个月中公司重建了训练流水线,重点优化模型设计、算法和数据筛选。据称,这些改进使得Muse Spark在达到相似性能水平时,所需算力比之前的Llama 4 Maverick模型降低了十倍以上。如果情况属实,这一效率提升将有望降低开发更大规模AI系统的成本。强化学习仍是该技术路径的核心,Meta报告称随着训练规模扩大,模型在训练和评估任务中均展现出持续稳定的进步。

Meta将Muse Spark定位为迈向“个人超级智能”的早期一步。这一理念的核心是让AI系统理解用户所处环境并提供定制化辅助。健康是首批重点领域之一,相关训练数据与医生共同开发,以改进医学解释的质量。Muse Spark现已通过Meta的AI平台提供,开发者可获取有限的API访问权限。此次发布凸显了AI领域竞争的转向:各公司不仅是在构建更智能的模型,更是在打造能够部署于现实世界的系统——尽管其可靠性与验证仍然是悬而未决的课题。


0

20 0

发表评论

登陆后参与评论