小米正式开源XiaomiMiMo-V2-Flash——一款由小米自主研发、专为极致推理性能优化的MoE大模型,总参数量达309B(激活参数仅15B)。该模型创新性融合Hybrid注意力机制与多层级MTP推理加速技术,在多项Agent能力评测中稳居全球开源模型前两名;其代码生成能力超越所有现有开源模型,与顶级闭源模型Claude4.5Sonnet持平,而推理成本仅为后者的2.5%,生成速度更提升至2倍,真正实现了大模型效果与效率的双重突破。MiMo-V2-Flash模...
小米正式开源 xiaomi mimo-v2-flash——一款由小米自主研发、专为极致推理性能优化的 moe 大模型,总参数量达 309b(激活参数仅 15b)。该模型创新性融合 hybrid 注意力机制与多层级 mtp 推理加速技术,在多项 agent 能力评测中稳居全球开源模型前两名;其代码生成能力超越所有现有开源模型,与顶级闭源模型 claude 4.5 sonnet 持平,而推理成本仅为后者的 2.5%,生成速度更提升至 2 倍,真正实现了大模型效果与效率的双重突破。
MiMo-V2-Flash 模型整体架构如下:
MiMo-V2-Flash 核心设计亮点:
采用比例为 5:1 的 Sliding Window Attention(SWA)与 Global Attention(GA)协同结构,滑动窗口大小设为 128,原生支持 32K 上下文,并在训练中扩展至 256K。大量前期实验表明,SWA 在通用性、长文本建模及推理稳定性方面全面优于主流 Linear Attention,同时具备固定尺寸的 KV Cache,极大简化了与现有训练与推理基础设施(Infra)的集成适配流程。
通过 Multi-Token Prediction(MTP)方式强化基座模型能力,并在推理阶段实现多 Token 并行验证,有效缓解传统自回归解码在大 Batch 场景下的显存带宽瓶颈。实测数据显示:启用 3 层 MTP 后,接收长度提升 2.8~3.6 倍,端到端推理加速比达 2.0~2.6 倍。
综上,MiMo-V2-Flash 凭借模型结构与训推系统深度协同的创新设计,可在不同硬件平台上灵活调节 Batch Size 与 MTP 层数,充分释放 GPU 算力,兼顾

高吞吐、低延迟与极致推理性能。
Xiaomi MiMo-V2-Flash 全量模型权重与推理代码均已开源。配套 API 当前限时免费开放,Web 版 Demo 已正式上线。
访问 platform.xiaomimimo.com,即可无缝接入 Claude Code、Cursor、Cline、Kilo Code 等主流开发框架。
立即前往 MiMo Studio Web 端:aistudio.xiaomimimo.com,免费体验模型能力。
源码地址:点击下载
相关推荐:
ChatGPT回答是空白的背后,究竟隐藏着什么秘密?,辽宁ai客服热门服务商
ChatGPT中文版下载,开启智能对话新体验,皇帝像ai
2024最新SEO蜘蛛弛:助力网站排名稳定提升的秘密武器
SEO实现:如何通过SEO优化提升网站流量与排名,南京市公司网站推广
求一个AI软件,彻底改变你的工作与生活!
什么是伪静态?伪静态有何作用?
【干货】小白如何在百度联盟上月赚3000+?实操经验分享
怎么分辨文章是不是AI写的?五大技巧揭开真相
ChatGPT-深度学习与自然语言处理的革命性突破,ai觉醒刘慈欣目录
如何选择适合你的AI工具?全面解析AI工具哪个好用
文章去AI回归创作的本真之美
怎么用AI生成一篇文章?高效创作指南全揭秘!
2024年SEO指南:提升网站排名的全方位策略
AI提供的阅读书目对学生的专业知识有多大帮助,变脸AI变脸
SEO优化排名软件:助力企业突破互联网竞争壁垒,快速提升网站排名
被动赚钱日入300+的暴利赚钱玩法介绍
AI代谢文章:从灵感到成果的创作革命
手机网站关键词优化:提升搜索排名,赢得用户青睐!,ai画大帝
ChatGPT显示503:如何应对AI服务不可用的困境?,ai消去边框
AI仿写文章:开启内容创作新纪元
Bing搜索不能预览了?搜索引擎的新变革与挑战,ai ps硬件要求
AI论文免费生成:颠覆学术写作的新纪元,生成ai专家
ChatGPT免费订阅的使用限制:其潜力与挑战,ai5ai117
AI写作在线生成器免费智能时代的创作利器
AI对不起,这个Adobe应用程序不是可用,ai520880999
SEO就业前景如何?打造数字时代的职业新风口,常州武进区水产网站建设
AI写文档:高效办公新体验
SEO任何:如何通过精准优化让网站流量突破极限,太原网站建设培训班
SEO不错-让你的网站轻松登顶,超越竞争对手
SEO在线服务-让您的网站快速跃升至搜索引擎前列,江西小红书营销推广案例