阿里巴巴通义实验室推出了全新的端到端语音识别大模型FunAudio-ASR。该模型引入创新的Context模块,显著提升了在高噪声环境下的识别稳定性,将幻觉率从78.5%大幅下降至10.7%,降幅接近70%。FunAudio-ASR基于数千万小时的真实音频数据训练而成,并深度融合了大语言模型的语义理解能力,在远场、嘈杂背景及多说话人等复杂场景中表现出色,性能超越Seed-ASR、KimiAudio-8B等当前主流系统。为满足不同应用场景需求,团队还推出了轻量版模型FunAudio-A...
阿里巴巴通义实验室推出了全新的端到端语音识别大模型 funaudio-asr。该模型引入创新的 context 模块,显著提升了在高噪声环境下的识别稳定性,将幻觉率从 78.5% 大幅下降至 10.7%,降幅接近 70%。
FunAudio-ASR 基于数千万小时的真实音频数据训练而成,并深度融合了大语言模型的语义理解能力,在远场、嘈杂背景及多说话人等复杂场景中表现出色,性能超越 Seed-ASR、KimiAudio-8B 等当前主流系统。
为满足不同应用场景需求,团队还推出了轻量版模型 FunAudio-ASR-nano。该版本在保证较高识别精度的同时,大幅降低计算资源消耗,适用于对算力和成本敏感的终端部署场景。
两个版本均支持低延迟流式语音识别、中英文自动切换以及用户自定义热词功能,具备良好的实用性与灵活性。目前,该技术已成功应用于钉钉“AI 听记”、视频会议系统以及 DingTalk A1 硬件设备中。其开放 API 也已在阿里云百炼平台正式上线,供开发者调用。
体验地址:https://www./link/1a79e60cce2641f20b34acb72cd287d7
技术报告:https://www./link/e3
40862bc3c1549012646f7abdc2e155
相关推荐:
SEO外包:提升网站排名与品牌曝光的最佳选择,大创建设网站
从社交APP的九大流派分析做好社交app推广运营的关键!
SEO优化推广业务-助力企业腾飞,掌控搜索引擎流量的秘密
SEO与SEM:数字营销的核心利器,ai形状工具编辑节点
ChatGPT显示“此网站无法加载站点”:背后原因与解决办法详解,ai文字竖排英文
SEM广告:提高品牌曝光与转化的秘密武器
AI人物生成:重新定义虚拟形象创作的未来
SEO快速排名算法
AI写作是怎么形成的揭开人工智能赋能创作的奥秘
AI内容生成:创作新时代的秘密
SEO很多,如何在竞争激烈的市场中脱颖而出?,在SEO优化中
AI免费生成文章让创作变得轻松自如
SEO优化方法价格解析:如何在预算内提高网站排名
如何分析一个网站的流量?从基础到进阶全解析,252369ai
SEO在线服务-让您的网站快速跃升至搜索引擎前列,江西小红书营销推广案例
ChatGPT故障你从未听过的真相,究竟是什么让它偶尔“失灵”?,AI明星线
ChatGPT无服务:如何突破限制,未来人工智能的新可能,sf ai
Typecho加载更多插件:让网站更加智能高效,ai写作蔡徐坤
AI自动化:开启智能未来的无限可能,ai怎么给图片做渐变
策划一个成功的app地推活动方案应该怎么做?
怎么用个人社交账号来进行推广赚钱?
SEO内容自动生成:让网站流量暴增的秘密武器,alllink ai
AI写作一键生成,让创作更简单高效!
怎样用AI写文章?快速高效创作新技能!
SEO也成搜索引擎优化:开启数字营销新纪元
创作新纪元!AI二次创作软件带你进入创意的无尽世界,ai203含量
免费收录网站的网站叫什么?如何让你的站点快速曝光!,白雪皑皑ai皑白雪皑皑
免费爆文采集平台,让你轻松获得优质内容!,ai 生成 植物
揭开“好的AI软件”背后的秘密:让生活和工作更智能的利器
AI写作在线免费一键生成:轻松创作,提升效率!