您好,很高兴为您服务,请问有什么可以帮到您的?
..........
感谢您的致电,祝您生活愉快。
这段来自呼叫中心的话术,相信大家都不陌生。对于服务行业,如:电商、金融、银行、互联网等,呼叫中心是一个促进企业营销、市场开拓并为客户提供良好的交互服务系统,其位置相当重要。为了提高客户满意度、完善客户服务,同时对客服人员工作的考评,很多企业会对此采用质检的方式来保证其服务质量。
极限元智能科技在智能语音、计算机视觉、自然语言处理、大数据分析等技术领域有多年技术积累,推出了一些系列云端、桌面端、移动端、嵌入式端的跨平台AI技术解决方案,产品和服务广泛应用在教育、安全、交通、泛娱乐等多个行业。其中,成熟的音频监测技术落地场景方面更是涉及到反电信诈骗、公安技侦、互联网音视频有害信息检测、呼叫中心录音质检等。
呼叫中心质检内容:
为了提高客户满意度、完善客户服务,为企业创造更多的利润,通常会从以下几个方面对客服电话内容质检:用户、考核、客户问题商机。
(1)客服服务:开场白、结束语、服务态度是否良好;
(2)业务绩效考核部分:业务熟悉度、基本话术、操作引导是否规范,是否使用禁语;
(3)市场拓展:对客户的挖掘、对流失客户的挽留、寻找商机;
传统质检方法
面对每日上万条的电话录音,质检人员只能通过人工测听的方式进行抽检。一个5000人的客服团队,需配备100人左右的质检团队,呼入型质检比率至少在1%,至多不超过30%,呼出型质检比率至少在2%,至多不超过50%。人工抽检,工作量大、效率低、主观性强,很难有效评价整体服务质量。
极限元基于关键词语音检索方案VS目前业内的呼叫中心质检方案
随着科技的发展,计算机技术的应用,目前行业内采用的是基于语音识别技术和语义分析技术来做录音质检,虽然节省了人力成本和提高工作效率,但是也存在一定的问题。
如:(1)录音质检的数据是电话录音由语音识别技术处理后输出的文本数据,对语音识别的准确率要求极高,如果电话录音转写出来的文本跟实际内容差别太大,在此基础上进行的关键词检索和语义分析工作就不能输出正确的结果。
(2)电话录音通常存在着大量的背景噪声、方言口音、信道干扰,而且电话录音通常采用较低的采样率,音质不高,这些都严重影响到语音识别的准确率。
(3)语义分析技术需要针对业务场景训练复杂的模型,随着业务场景的变动,相关学习模型也要经常进行更新,维护周期长、成本高,适应业务变化的实时性不强。
(4)整个录音质检方案需要的复杂运算环节多,带来了业务处理延时较高,执行效率提升有限,同时相关的软、硬件成本偏高。
极限元录音质检三种解决方案组成完整体系
针对现行业内运用的质检方式存在的一系列的问题,极限元采用了基于语音关键词检索技术、音频对比技术、情感识别技术的录音质检方案,可以减少语音识别准确率不高带来的录音质检误差,有效提升了录音质检效率。
1.语音关键词检索
将通话录音识别结果输出音频检索网络,指定的语音关键词转换成音素,在检索网络中进行匹配,输出检索结果。(如下图)
此解决方案不仅绕开了生成文字所需的解码过程,提高检索效率,还能避免语音转文字可能带来的误差,提高识别准确率。
例如:
客户:最近我的电话信号不好,上不了网。
客服:什么时候开始上不了网呢?
客户:好久了。
客服:您地址在哪呢?
客户:我在xxx这里。
客服:好的,我帮您登记下,您还有别的问题么?
客户:没有了,
客服:谢谢您的来电,再见。
语音关键词检索服务器可以识别出这段录音中包含关键词:上不了网,但没有找到其他关键词进行组合逻辑判断,这条录音的检测结果中话务类型为“未定义”,标记为疑似不合格话术,会反馈出现关键词的时间点。
尽管语音关键词检索会造成同音字的误判,但对比语音转文字再进行关键词匹配,造成的误差要小很多,而带来准确率提高和效率提升的优势却很明显。同时对于海量录音数据内容审核的应用场景,也更为实用。
2.音频对比
音频比对是指从音频信号提取特征,通过特征进行比对的方法进行有害信息检索的方法。该方法的核心在于提取的特征值需要满足一定的要求,比如抗噪性、转换不变性、鲁棒性、快速性等特点,主要是为了满足同一音频能够在不同声道下进行准确检索。传统的MFCC、FBANK等声学特征已经不能满足音频比对任务的需求。下图就是一个基于频谱最大值来建模的音频比对方法。在完成最大值点完成建模后,需要进行特征的构建。而特征构建是通过最大值点之间的距离来建模,例如两个最大值点的距离、位置信息作为一个固定的特征来完成音频特征信息的构建。有了上述音频特征之后,就可以对两个不同音频进行检索,最大相似度的地方就是相似点,这种技术最适用于录音片段的检索。
3.情感识别
情感识别解决方案通过分析不同情感状态和语音声学参数的关联关系,抽取出鲁棒声学特征参数,综合考虑不同人对同一段语音的情感感知结果,建立语音情感识别模型。为了提高语音情感识别的鲁棒性,采用非线性建模方法建立情感语音分析模型,有效的解决了噪声环境下情感语音分析问题。针对情感识别中的时序建模问题,采用一种基于特征层建模和决策层建模相结合的多尺度时序建模方法。在特征层实现短粒度的时序建模。在决策层实现更长粒度的时序建模,并与特征层的时序建模实现相互补充。通过上述改进,有效的提高了语音情感识别的准确率,可以对通话者的情感状态进行动态的捕获和跟踪。此外,极限元还可以提供基于音视频多通道情感状态识别的解决方案。
通过极限元录音质检解决方案,可以帮助客户将客服录音数据进行各种分析,从而针对性地改善呼叫中心的服务质量;除了对企业自身呼叫中心质检之外,此方案还可以为企业分析客户的反馈意见,跟踪广大用户的热点问题,从而对公司的产品和服务提出优化建议,实现更加精准的市场决策。