分享文章
阿里通义新一代语音模型Fun-ASR再进化 垂直领域识别准确率提升超15%
今日,阿里通义发布新一代端到端的语音识别大模型Fun-ASR,该模型增强了上下文感知和高精度语音转写能力,在家装、保险等多个行业场景的语音识别准确率均提升了15%以上。
据了解,Fun-ASR是大语言模型驱动的语音识别算法,其基于自研语音算法和监督微调的Qwen3训练,并采用前沿的模型架构以及先进的文本模态对齐技术,可有效保护和增强大模型的语言处理能力;
此外,Fun-ASR集成了RAG方案,可提供自动化音频信息检索功能,最高可导入1000多个自定义热词。
基于该功能,系统能够根据输入音频精确获取相关领域热词、文档及前文记录,大幅提升特定领域内的关键词识别效果。

为解决语音识别不准确、噪声干扰、语种混淆以及生成幻觉等问题,通义团队还在ASR模型训练中引入了RL(强化学习)技术,此策略有效减少识别过程中的幻觉,提高整体系统的准确性与可靠性。
值得一提的是,在四川话、粤语、闽南语等多地方言上,Fun-ASR取得了领先同类产品的表现。
此外,Fun-ASR对远场拾音和近场降噪的等多样环境也表现出了良好的适应性,无论是会议室、工位,还是超市、户外,均可有效保证识别准确率。
在训练数据上,Fun-ASR基于上亿小时音频数据的训练,全面涵盖了互联网、科技、家装、畜牧、汽车等十多个领域的专业术语,在多个垂直领域的识别准确率显著提升。
实测数据显示,Fun-ASR在保险行业的准确率较以往提升18%,在家装、畜牧等行业也实现了15%-20%的提升。

[超站]友情链接:
四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
关注数据与安全,洞悉企业级服务市场:https://www.ijiandao.com/
关注网络尖刀微信公众号随时掌握互联网精彩
- 1 这是总书记勉励体育健儿的高频词 7904559
- 2 中方回应“乌称摧毁中国制造武器” 7808076
- 3 解放军报警告:高市要日本万劫不复吗 7713820
- 4 盘点十五运会值得铭记的“再见” 7616193
- 5 日本演员古川雄辉发文致歉 7523348
- 6 民警卧底传销组织 疯狂洗脑场面曝光 7424216
- 7 中国驻日使馆重申敌国条款 7330652
- 8 印度国产光辉战机在迪拜航展坠毁 7232305
- 9 “最美”女大校当选院士 7144103
- 10 印度坠毁光辉战机飞行员已死亡 7040491


![两只ihz最近入手了很方便小巧的轻喃棒棒[抱一抱]@轻喃官方微博](https://imgs.knowsafe.com:8087/img/aideep/2022/7/2/20fd972dc171f2af36a05a3aff0ed87e.jpg?w=204)




方晓雯
