声纹识别是AI领域一项典型应用,是传统语音识别基础上的新突破,采用生物识别技术实现了从“说什么”到“谁在说”的智能跨越。声纹识别的业务应用场景包含有身份校验、金融反欺诈、金融客服和智能音箱等。本方案面向“智能认知”领域,结合了多种生物特征识别技术,基于NLP技术领域,进行声纹识别方向的创新应用,用声音提升用户体验。 相比于单一的生物识别技术更加安全、可靠,多重认证过程保证了认证结果的准确性。声纹识别是一项提取人的声音特征进行身份辨识的技术。声纹核身将简化身份验证流程, 提高效率;实名到实人, 远程根据说话人的声纹特征识别“说话人是谁”,实现安全可靠远程身份认证,来解决远程服务时的安全与效率问题。
语音情绪识别:由计算机自动识别输入语音的情绪状态,实现对人类情绪感知过程的模拟。情绪的各种变化会对人的发声器官产生影响,从而使声音带有丰富的情绪相关特征。人脑具备感知这些特征的能力,通过聆听语音可以捕捉说话人的情绪状态。 语音情绪识别技术模拟人脑对语音特征的处理,来实现情绪的自动识别。可以用作客户愤怒分析和坐席职业倦怠等方面的监控。支持的功能:声纹库的构建、声纹1:1比对、声纹1:N检索。支持的服务方式:支持API接口调用。
声纹识别是非接触性的,而且语音文件相较于脸部照片来讲隐私程度低;
声纹验证时长短,可极大扩展了声纹在金融领域的应用范围,在许多业务场景下,用户甚至根本没有察觉自己的身份已在办理业务的过程中,在后台通过了声纹验证。
声纹锁登陆”可使用声纹密码代替或辅助传统的字符密码与手势密码,解决用户忘记密码困扰的同时,极大减少了登陆时间,降低了信息泄露的风险。声纹锁采用 1v1 的声纹比对模式, 将用户注册时的声纹信息存于声纹库,每次登陆时用户只需对着手机念出屏幕上的随机数字或文字即可轻松登陆。
使用声纹建立信用欺诈的黑名单库,从而精准拦截二次欺诈,这将为反欺诈工作做出巨大贡献。例如,在信贷申请环节要求用户亲自阅读一段固定的文字存于声纹库,并且同时提取其声纹特征。在信审过程中,系统自动将该声纹与黑名单库中的声纹做对比, 如果命中黑名单,则可以调低信用级别乃至直接拒绝。这种形式类似于指纹识别的形式,但是比指纹识别有更多方式实现且更加安全。
公海710的声纹识别系统已在太平金服、太平金运使用,涉及的功能有声纹识别1:1对比,声纹库(客户、客服、黑名单)构建与管理等功能。
AI模型在应用方面可以进行很多创新性的探索,比如在保险行业, 通过建设一个AI模型运行监控平台, 针对模型的评估指标进行评价,即对模型的数理性能的评价,不涉及业务参数的调优。
模型实际上是根据大量数据构建的, ML 运营人员会花费大量时间来维护数据集。特别是,确保训练集(用于训练模型)和验证集(用于测量模型的准确性)中的数据样本具有相同的统计属性。 但对于模型将要进入生产环境,接收的真实数据就不是那回事了。经济环境变化、客群变化、数据源获取等各种内外部因素都会引起模型分数偏移,甚至出现错误。这些令人担忧的问题是“数据漂移”,即所接收数据的统计性质发生渐变。 最小值和最大值、平均值、中位数、方差等等:所有这些都是决定模型训练期间做出的假设和决策的关键属性。
为了能在第一时间发现问题,我们需要对模型进行动态监控。监控是构成闭环控制非常重要的一环,“AI模型运行监控可视化平台”相当于模型运行控制系统的眼睛。
“AI模型运行监控可视化平台”是一个监控AI模型效果的组件,并根据模型效果提供对应的预警,以保证模型高效、稳定的运转。
AI模型运行监控可视化平台”的功能模块如下所示:
“AI模型运行监控可视化平台”可兼容两种运行机制
采任务监控主页
评分卡模型监控指标群
混淆矩阵监控指标群
混淆矩阵监控指标群-KS
准:直击数据项目落地痛点,打造闭环最后一公里
轻:插件形式部署至业务系统,普遍使用于现今各种形式的环境、建模语言,即取即用,极速上线
精:业务可挑选合适其业务特点的技术指标、业务指标,全面监控,精准直达业务重点。
已产品化的5大常规算法模型的监控组件: 传统机器学习模型-回归算法 传统机器学习模型-混淆矩阵 评分卡算法模型 自然语言算法模型 声纹识别模型
在智能客服的业务场景中,会面临数据未打通、缺少智能客户画像、客户需求识别困难等障碍,因此,整合不同系统的数据,利用大数据和自然语言处理NLP、 深度学习等技术对现有的语音数据及语音音转字文本进行投诉模型、客户忠诚度模型、热点产品分析模型部署,为客服团队提供支持。对客户忠诚度模型进行落地,输出客户标签,帮助客服更好地了解客户;其次,利用大数据构建机器学习、深度学习模型对热点产品进行分析, 输出客户在不同阶段关注的热点问题,实际帮助客服团队提升服务能力,降低客服流失率,同时,也将相关分析成果提供给专业公司参考;最后,帮助客户联系中心参与投诉管理相关工作, 进行投诉开发,探索投诉解决快捷机制。通过构建智能识别投诉模型,搭建投诉准实时监控平台,提升投诉解决效率。
智能投诉识别模型:智能投诉识别模型拟从寿、财险客户投诉历史、用户画像、客户情绪、是否解决问题、语气语调信息、投诉关键词等对客户投诉倾向进行分析,利用分词、词向量、机器学习算法-随机森林及深度学习算法进行投诉模型搭建, 其结果支持疑似投诉录音编号、保单号、客户投诉总次数、客户投诉喜好等信息输出。
热点产品分析模型:热点产品分析模型拟利用分词、词向量、机器学习聚类算法、关联词组算法进行模型搭建。输入指定范围内的热点产品, 可查询到客户对于该产品最关心的几大问题、重点投诉等,结合业务知识为客服提供热点问题话术指导,提升客服服务能力。
客户忠诚度模型:客户忠诚度模型主要利用保单和理赔CIF数据及CC结构化数据,寿险、养险客户以最近一次投保(R)、投保频率(F)、投保金额与理赔金 额差值(M)、理赔次数(C) 4个主要维度构建RFMC忠诚度模型,产险客户忠程度模型分析维度为成为客户时间(T),最近一次投保(R),投保频率(F)和投保金额(M) 4个主要维度构建TRFM忠诚度模型,模型输出客户忠诚度标签(价值客户、潜力客户、口碑客户与休眠客户)存于数据库,通过接口将结果传到CC客服系统。