小米宣布开源声音理解大模型MiDashengLM-7B
时间:2025-08-05 15:47:56 作者:河马AI
小米集团正式发布并全面开源MiDashengLM-7B多模态大模型。根据官方介绍,该模型在声音理解能力方面于22个公开评测集上达到多模态大模型最优水平(SOTA),其单样本推理首token延迟(TTFT)仅为行业先进方案的四分之一,在相同显存占用下数据吞吐效率更是突破至行业标杆水平的20倍以上。目前基于现有版本基础,小米团队正持续推进MiDashengLM系列模型的计算效率优化升级,并重点探索终端设备端侧离线部署方案。