小米宣布开源声音理解大模型MiDashengLM-7B-河马AI

小米宣布开源声音理解大模型MiDashengLM-7B

时间：2025-08-05 15:47:56 作者：河马AI

小米集团正式发布并全面开源MiDashengLM-7B多模态大模型。根据官方介绍，该模型在声音理解能力方面于22个公开评测集上达到多模态大模型最优水平（SOTA），其单样本推理首token延迟（TTFT）仅为行业先进方案的四分之一，在相同显存占用下数据吞吐效率更是突破至行业标杆水平的20倍以上。目前基于现有版本基础，小米团队正持续推进MiDashengLM系列模型的计算效率优化升级，并重点探索终端设备端侧离线部署方案。