如何提高语音识别模型的准确率？

Nysa ·

更新时间:2024-09-20

· 593 次阅读

“智能客服+人工坐席”的新型客户服务模式，通过自动化的语音识别技术，降低客服中心的人力成本，提升客服中心的运营效率。

应用场景：客服质检、机器人外呼、语音导航

智能客服和领域非常相关，不同领域的话题各不相同，还有大量的领域词汇，所以需要根据不同领域来训练相应的语音识别模型。

客服语音识别的技术挑战：
1、有些客户普通话口音重：不同地域有不同的口音特点
2、自然风格说话：语速快、吐字不清、抢话叠字
3、电话信道、领域术语多：电话信道8Kh采样，音质差。不同行业有自己独特的领域术语
4、有些客户讲方言：中国有七大方言区、数十种方言

语音数据训练测试实验：
一、全领域客服测试
测试数据：涵盖金融、电信、教育、电商、房产等领域的客服语音
在这里插入图片描述
ASR1： “普通话朗读数据”训练所得模型
ASR1+2： ASR1基础上，增加“重口音普通话数据”
ASR1+2+3： ASR1+2基础上，增加“普通话自然对话数据”
ASR1+2+3+4：在ASR1+2+3基础上，增加“实网客服语音数据”

结论：
只使用数据堂普通话朗读数据训练后，识别模型的字错率是54.8%，在叠加数据堂重口音普通话、普通话自然对话、实网客服语音后，字错率降到了12.5%.

二、金融领域客服测试
测试数据：金融领域的客服语音
在这里插入图片描述
ASR1： “普通话朗读数据”训练所得模型
ASR1+2： ASR1基础上，增加“重口音普通话数据”
ASR1+2+3： ASR1+2基础上，增加“普通话自然对话数据”
ASR1+2+3+4：在ASR1+2+3基础上，增加“实网客服语音数据”

结论：
只使用数据堂普通话朗读数据训练后，识别模型的字错率是54.8%，在叠加数据堂重口音普通话、普通话自然对话、实网客服语音后，字错率降到了12.5%.

相关实验数据：

一、普通话朗读语音
1505小时普通话手机采集语音数据
在这里插入图片描述

849小时普通话家居交互手机语音数据
在这里插入图片描述

二、普通话自然对话语音

1000小时普通话多人自然对话语音数据
在这里插入图片描述
2000小时普通话两人自然对话语音数据

1420小时普通话自然语音手机采集数据
在这里插入图片描述

三、重口音普通话语音

1026小时重口音普通话手机采集语音数据
在这里插入图片描述

662小时重口音普通话手机采集语音数据
在这里插入图片描述

132小时重口音普通话手机采集语音数据
在这里插入图片描述

四、实网客服语音

2823小时普通话客服实网语音采集数据
在这里插入图片描述

555小时全领域客服实网语音采集数据
在这里插入图片描述

140小时电商客服普通话实网采集语音数据
在这里插入图片描述

五、方言语音

方言语音-朗读
在这里插入图片描述

方言语音-自然对话
在这里插入图片描述
https://www.datatang.com/dataset/all/1

作者：数据堂官方账号

准确率模型语音识别

1024 个赞

需要登录后方可回复, 如果你还没有账号请注册新账号

相关文章

Perl 包和模块

Ilona 2020-09-10

820

Go语言中结构体方法副本传参与指针传参的区别介绍

Rebecca 2021-05-19

817

浅谈CSS3 动画卡顿解决方案

Kalika 2021-01-12

835

OpenAI的Whisper模型进行语音识别使用详解

Kara 2023-02-10

460

pytorch实现模型剪枝的操作方法

Sabah 2023-02-26

256

模型训练时GPU利用率太低的原因及解决

Winola 2023-02-26

499

JavaScript中颜色模型的基础知识与应用详解

Qamar 2023-02-26

1859

pytorch网络模型构建场景的问题介绍

Tia 2023-03-11

227

详解通过OSI七层模型打开计算机网络大门

Pandora 2023-03-27

867

python多进程中的生产者和消费者模型详解

Fawn 2023-03-27

342

Python生产者与消费者模型中的优势介绍

Rose 2023-03-27

891

Linux下利用python实现语音识别详细教程

Bertha 2023-04-02

177

详解Three.js 场景中如何彻底删除模型和性能优化

Tia 2023-04-18

1310

基于Pydantic封装的通用模型在API请求验证中的应用详解

Dulcea 2023-05-02

336

Flutter 模型动态化赋值研究分析

Kirima 2023-05-12

1159

Docker AIGC等大模型深度学习环境搭建步骤最新详细版

Jacinda 2023-05-13

1807

Tensorflow训练模型默认占满所有GPU的解决方案

Bella 2023-05-13

714

利用Pytorch实现ResNet网络构建及模型训练

Tanisha 2023-05-27

1264

DenseNet121模型实现26个英文字母识别任务

Pandora 2023-07-01

1833

linux环境部署清华大学大模型最新版chatglm2-6b图文教程

Carly 2023-07-20

547

我要提问

致谢

帮助他人，成就自己。

人生最大成功就是伸出热情而温暖的双手，尽自己所能去帮助身边的每一个人，只要无私的奉献，就会收获到美好的生活。

1024问感谢每一位朋友的帮助和支持。

软件开发网提供编程的基础软件技术培训教程,软件开发编程实例讲解Go,Node,HTML,CSS,Javascript,Python,Java,Ruby,C,PHP,MySQL等软件开发编程语言以及数据开发的基础知识，也提供大量的软件开发在线实例、从入门到精通就在1024问。

育儿网微养生全球行美食街育儿菜谱大全海南旅游女性养狗百科星座