人工智能语音技术在水务客服领域的应用研究
1 智能语音人机交互技术
人机交互技术(Human-Computer Interaction Techniques)是指通过计算机输入、输出设备,以有效的方式实现人与计算机对话的技术。当前最主要的人机交互方式主要为基于传统的硬件设备的交互、基于语音识别的交互、基于触控的交互、基于动作识别的交互和基于眼动追踪的交互
近几年,随着语音技术的不断发展,人机交互逐渐走入语音时代,进入到智能操作系统时代,同时,产业发展也存在一些问题:一方面,语音识别技术主要还是用于识别一些命令词汇和固定的语法格式,大规模的语音数据识别技术仍有待提高;另一方面缺乏成熟的商业模式极大地制约着产业的可持续发展
2 萧山供水智能语音技术的应用
2.1 萧山供水客服现状
萧山供水公司客服中心业务包括咨询、查询面广,诉求点分布不均匀,诉求表达时间不集中,坐席人员较少等特性,同时也存在因突发事件造成的话务暴增造成难以应对的困难。为营造更便捷的水务服务咨询和办理环境,方便居民享受更流畅的水务相关业务服务,萧山供水有限公司与相关企业合作,建设智能语音服务系统,将先进的CTI技术及设备结合人工智能与通信技术,结合个性化的交互流程设计,用口语化、生活化的的语言引导市民准确表达个人需求,同时系统对用户语音进行识别和理解,给予用户准确答案播报。该智能系统以电话网为基础,以互联网为依托,使自动语音查询、人工服务、业务系统紧密结合,为市民提供7d×24h的不间断接入服务,全面提高萧山供水客服中心的工作质量和效率,实现萧山供水服务的“一站式”办理和不受时空限制的“在线服务”。
2.2 萧山供水智能语音服务系统技术架构
萧山供水智能语音导航分为语音识别、语音合成、语义理解及流程管理四部分(见图1)。当ASR(语音识别引擎)接受到IVR传送过来的音频流后,进行语音识别,并将识别结果存储在redis中,并将key值通过IVR透传给CRS(流程管理模块);CRS在收到key值后,会将存在redis中的识别结果取出,调用ISS(语义理解引擎)进行解析,得到的语义结果会交给CRS业务逻辑进行处理,调用相关接口,取得最终结果;CRS将要播报的结果传给TTS(语音合成引擎),合成引擎将结果合成播报给用户。
2.3 萧山供水智能语音技术的实际应用
2.3.1 萧山供水智能语音服务系统具备的能力
萧山供水智能语音服务系统是一个具备语音识别、语音合成、语义理解能力的智能语音导航系统,具体应用在两大核心服务内容:一是智能IVR互动式语音应答,用户在说出自己的业务需求后,系统自动匹配到相应的数据库并转移至相应的服务技能组中。二是智能语音服务,用户说出自己的业务需求后,系统自动跳转至相应的问题解答知识库中,并用语音播报出用户的服务需求。通过智能语音服务系统,可以实现客服系统用户菜单的扁平化,使得用户快速获取所需要的业务信息,提升用户体验感。同时作为人工服务的延伸和拓展,智能语音服务系统可以充当两种角色,一是作为人工服务的前端资源,系统可以优先替人工客服解决部分问题,减小人工坐席的业务压力;二是作为人工服务的后备资源[9],在人工忙时,引导用户使用系统进行自主服务,可提高接通率,大幅减轻忙时人工坐席压力。
2.3.2 萧山供水智能语音服务系统支持的业务
萧山供水智能语音服务系统在开发过程中,根据客服系统的历史数据及业务人员的经验,结合技术实现的可行性,整理出高频业务,并将其扁平化,保证业务流程的易用性、提高业务处理效率。该系统主要支持:(1)户号查询,用户可以通过户号、户号绑定的手机号码以及地址3类方式查询;(2)水费查询,用户可查询当期水费情况、往期水费情况、水费月份、抄表底数、抄表周期等内容;(3)营业厅相关信息,用户可直接查询营业厅名称或者根据所在小区查询所辖区域的营业厅信息;(4)停水咨询查询,系统可根据用户提供的小区信息,告知其所在位置是否存在停水;(5)缴费方式、票据业务等相关有知识库答案的播报。
2.3.3 萧山供水智能语音服务系统运行的情况
萧山供水智能语音服务系统从2019年6月底开始试运行,期间通过对运行数据进行抽样分析,总体变现良好,指标方面,导航正确率为83.77%,转写准确率86.92%,自助服务完成率72.57%(各项指标优化情况见图2~图4所示)。
2.4 萧山供水智能语音服务系统存在的问题及解决办法
萧山供水智能语音服务系统当前存在特殊地名识别准确率较差、复杂通话场景抗干扰能力较弱等问题。针对此类问题,合作方基于Attention模型的核心思想,通过机器学习(Machine Learning,ML)的方法构建了Hybrid CNN即混合的Attention CNN模型,用于构建语音识别声学模型的全局优化,仿照人类视觉机制,同时也借鉴人类大脑处理的一些优势,堪称目前效果更好、资源占用更小、模型更灵活的语音识别框架。具体来说,在DF-CNN基础上,将传统卷积使用扩张卷积(Dilatedconv)代替,让每个卷积输出都包含更大范围的信息,使得模型不使用池化层(Pooling)也可以看到很长的语音段信息,从而实现对语音长时相关性的更精确的表达。与此同时,还引入了基于长短期记忆网络(Long Short-Term Memory,LSTM)的门控机制(Gated Mechanism,GM),使得Hybrid-CNN在长时相关性建模的过程中,能快速地过滤噪声等干扰信息,并加强语境等长时信息,进一步提升模型的抗干扰能力,从而在实际应用中能够保障高噪声等复杂场景的语音识别效果。
3 智能语音技术的应用建议
3.1 提高用户信息收集程度,实现业务快速定位
智能语音技术在水务领域的业务应用与在金融、银行、保险等领域的应用有所区别,主要表现在先天不足。与银行严格要求实名制不同,水务企业在信息实名制方面略显不足,因此在进行业务流程设计时,银行往往能够通过身份证信息或者绑定手机号等唯一核实标准快速对应到用户信息;而作为水表信息的唯一核实标准“户号”,由于不能被大部分人牢记,在实际交互过程中,针对用户信息的准确定位需要进行多次、多方式的尝试性交互方可确定,一定程度上降低了交互的准确性。因此对于水司而言,在日常的表务管理工作中,要加强用户信息的收集,尽量将用户当前使用的手机号及有效身份证信息收集完毕,提高实际业务交互的准确性。
3.2 规范基础数据信息,降低匹配难度
根据智能语音技术的运行原理,在实际业务应用中,要规范基础数据信息,提高经识别、转写引擎后的文本与基础数据库信息的匹配程度。萧山供水智能语音服务系统中率先加入了通过地址查询用户户号、水费信息的功能,目前在智能语音技术领域,对于地址的准确识别和转写是一个难题,同时针对识别转写后的地址信息(文本)与公司内部基础信息数据库进行匹配,确定用户信息也是一个难题。要最终确定用户信息,一方面依赖于识别引擎和转写引擎的优化程度,另一方面与公司内部基础信息数据库的信息规范性也有很大联系。针对第一方面,萧山供水通过增加全区所有小区信息清单、对录音进行分析,不断丰富小区信息的表述方式等手段,增加识别转写的命中率;针对第二方面,由于萧山供水前些年对基础信息数据库中的地址信息进行了地名标准化,所有地址信息都具备一个相对统一的格式,使得匹配起来准确性尚可。
3.3 加强智能语音系统信息维护,准确服务用户
运用智能语音技术的系统在投入运行后,要重视系统知识库信息的维护工作。作为减轻人工坐席压力的辅助手段,在服务用户时,要确保用户得到的信息是准确无误的,实际运行过程中,常容易出现外部政策、公司制度变化导致以往知识库中的内容过期作废的问题,这部分内容需要有专人进行维护,及时更新;同时,对于不断接收的二次高层小区,也需要增设专门的词集信息,确保原本查不到信息的用户能够在接收后及时查询到水费等信息。上述内容在公司分工上,往往是由不同部门完成,因此如何保证信息互通及时,除了系统要有专人负责维护外,在公司管理制度上也需有相应的跟进,确保系统拥有第一手信息。
4 结语
通过合作方式,萧山供水将智能语音技术与水务业务相结合,同时通过运行的数据分析及效果,也证明了AI赋能水务的可行性与潜力。目前萧山供水正在积极将智能语音技术运用到微信小程序中,努力将智能语音服务系统的能力延伸至微信端,进一步拓展服务渠道,提升公司对外服务水平。
[2]崔悦,宋齐军.智能语音技术发展趋势及电信运营商应用浅析[J].邮电设计技术,2016,(12):6-11.
[3] 读懂智能语音人机交互产业链及核心技[EB/OL].http://www.sohu.com/a/114964920_467791,2016-09-23.
[4]王宏芳.智能语音客服系统在呼叫中心领域的应用及展望[J].通信企业管理,2017,(6):57-59.