蚂蚁集团百灵团队近日正式发布了Ling2.0系列的首个开源模型——Ling-mini-2.0。该模型采用创新的MoE架构,激活比例仅为1/32,总参数量达16B,但在处理每个token时仅激活1.4B参数(非embedding部分为789M),实现了高效计算与性能的平衡。Ling-mini-2.0经过超过20万亿token数据的训练,并通过多阶段监督微调和强化学习技术,显著提升了复杂推理和指令遵循能力,整体表现可媲美7–8B级别的dense模型。在多项权威评测中,该模型展现出卓越性能,在Live...
蚂蚁集团百灵团队近日正式发布了ling 2.0系列的首个开源模型——ling-mini-2.0。该模型采用创新的moe架构,激活比例仅为1/32,总参数量达16b,但在处理每个token时仅激活1.4b参数(非embedding部分为789m),实现了高效计算与性能的平衡。
Ling-mini-2.0经过超过20万亿token数据的训练,并通过多阶段监督微调和强化学习技术,显著提升了复杂推理和指令遵循能力,整体表现可媲美7–8B级别的dense模型。
在多项权威评测中,该模型展现出卓越性能,在LiveCodeBench、CodeForces、AIME 2025、HMMT 2025、MMLU-Pro、Humanity's Last Exam等通用与专业推理基准上,均优于同规模的dense模型以及更大规模的MoE模型。
得益于其稀疏激活设计,Ling-mini-2.0在H20硬件上的部署效率极为出色:在2000 token以内的问答场景中,生成速度可达300+ token/s,相较8B dense模型提速超过2倍。
结合YaRN技术,模型上下文长度可外推至128K,在长序列处理任务中,相对加速比最高提升逾7倍,大幅增强其在实际应用中的灵活性与响应能力。
HuggingFace Space:https://www./link/3a03f9afd886282d8d1de4e0af465056
HuggingFace:https://www./link/8ac8abb13b9fe96f24fe2cab11a18fc2
ModelScope:https://www./link/a92df7cbfdddcc938abc806992026a19
GitHub:https://www./link/857cd81e6

a7d216eeaf1946a803a7d5e
相关推荐:
ChatGPT崩了?用户称打开是一片空白,真相竟然如此!,daw ai冲击
揭秘引流项目之百度贴吧诱导引流项目的玩法和思路!
AI论文生成免费:轻松应对论文写作,提升学术效率,ai创作校服
Bing搜索不能预览了?搜索引擎的新变革与挑战,ai ps硬件要求
SEO从事:引领互联网营销的高效之道
2021网站内容优化这么做,快速提高网站排名
ChatGPT无法访问原因分析及解决方案,ai刮胡刀海报
SEO代表什么?让我们深度解析搜索引擎优化的核心意义与实战技巧
《高效采集的秘密:emlog葫芦侠采集器助你提升网站内容效率》,甘肃这边有ai计划吗
AI写文章查重能查到吗?揭秘AI文章创作的秘密
怎么用AI写文章:高效创作的秘诀
2个超级暴利非常赚钱的网络淘金项目操作思路分享!
怎么用AI生成一篇文章?高效创作指南全揭秘!
SEO内容自动生成:让网站流量暴增的秘密武器,alllink ai
SEO一般做什么?揭秘SEO的核心工作与实战技巧
新手必看的全网引流渠道及引流思路介绍!
AI写文稿:让创作更高效的智能工具
AI写文章很容易重复吗?揭开智能写作的真相!
SEO优化排名软件:助力企业突破互联网竞争壁垒,快速提升网站排名
ChatGPTWindows版本如何下载:全面指南,智能办公ai写作
2024年最全SEO资源指南:助你轻松提升网站排名
SEO优化作用:提升网站排名,打开流量大门
SEO发明:引领数字时代营销革命的力量,速卖通外贸推广网站
SEO合同:确保您网站优化成功的关键保障,微博营销推广规则最新
浅析影响网站权重排名的几大要点
【干货】小白如何在百度联盟上月赚3000+?实操经验分享
如何快速搭建ChatGPT梯子,畅享全球网络自由,ai室内立体
AI公众号文章生成,轻松打造爆款内容
SEO优化模式:如何通过智能优化提高网站流量与排名
SEO什么优化:提升网站排名的秘密武器