400-9210-299

扫描二维码,关注阅维微信公众号

首页 解决方案 行业应用方案 详情

关键词语音识别系统

一、系统概述
 

语音识别系统,利用语音特征,实现快速从大量电话语音中挖掘出指定信息(声纹、英语或汉语普通话关键词、不限语种)。本系统融合三种语音识别技术——声纹识别技术、关键词识别技术、语种识别技术,形成一套综合语音处理引擎。系统可根据用户需求对语音记录进行快速处理,及时发现同时具有目标对象、目标关键词、目标语种的通话语音和话单信息。

该语音识别系统,具有历史搜索和实时监控两大功能模式。

1、历史搜索,根据指定声纹对象、关键词、语种,在历史语音库中快速搜索。系统根据设定的条件,对历史语音进行比对,快速扫描搜索出含有设定条件的电话语音。该项功能使大量的历史语音信息得到充分利用,从而提高了用户单位的数据挖掘能力。

2、实时监控,是对大量电话语音进行快速处理、扫描、内容检索分析,寻找出可能对国家、社会安全构成威胁的敏感语音信息。系统解决了大量语音信息无法及时处理的问题,有效扩大监控范围,能及时掌控敏感信息,为实战业务提供信息情报,是一种高科技的新型监控手段。


二、系统组成

语音识别系统由软、硬件两部分组成,硬件是一体化的专用设备,软件包括服务端软件和管理终端软件两部分。


调度模块

  具有任务收集、任务分发两种功能。任务收集主要是实时收集语音,并推送给预处理设备;任务分发,讲预处理结果分发给搜索设备。

预处理模块

  对收集的语音文件进行预处理,并输出预处理结果;根据业务需求,可进行扩展,满足不同级别数据量的处理需求。

搜索模块

  按照设定的条件对预处理结果进行识别比对,快速找到符合条件的语音。用户可指定多个关键词、声纹对象、语种,设定时间段、电话号码匹配类型,最大限度地灵活筛选语音,形成搜索方案。

实时监控模块

  利用上线声纹特征、关键词模型、语种特征,实时对采集到的电话语音进行识别比对,及时发现目标对象通话信息。

管理终端

  实现对象管理、样本管理、设备管理、操作员管理、结果等的处理功能。用户可以自定义结果显示内容,根据业务需求显示指定关键词、声纹对象、语种的中标语音。支持排序、时间分段等列表显示功能。

文件服务器

文件服务器采用通用存储设备,对预处理结果和语音文件保存并备份。

管理终端采用零配置和智能化管理的设计理念,实现了信息管理、系统设备管理、结果处理等功能,并且能在不同的语音识别智能处理系统间方便的切换。


三、基本功能
 

1、实时监控

根据用户上线的关键词、声纹、语种信息,实时对采集到的电话语音进行识别比对,及时发现目标通话信息,实现对目标对象、目标关键词、目标语种通话语音。用户可根据业务需求对上线监控内容进行灵活调整,精确定位目标语音。实时监控结果语音将以列表的形式展现,支持关键词、声纹对象、语种、时间段、状态等筛选排序功能。

2、数据挖掘

语音挖掘功能对海量历史语音的处理速度大大提升,处理方式从单一识别模式扩展为三位一体的多方位识别模式,为相关工作开展提供有力的保障。

通话对象挖掘,从给定语音中将未知说话人的语音特征提取,并和对象标本库中的声纹标本进行对比;通过相似度排序,最终确定说话人信息。

通话内容挖掘,根据已有目标模型,对历史语音库进行识别比对,挖掘出含有目标模型(声纹、关键词、语种)的语音信息。语音挖掘同时支持对话单号码的筛选匹配,用户可自行设定匹配规则。

通话行为挖掘,通过对通话对象和通话内容的挖掘结果进行进一步的分析,可以对说话人的通话习惯、通话行为做总结和归纳。例如:联系对象统计,经常打给哪些人;通话时间规律,在什么时间段打电话;拨号频率计算,拨打哪些电话更频繁;通话方向定位,向哪个区域打电话。


四、产品特点
 

1、系统应用特点

说话人、关键词、语种层层过滤的语音搜索,将三大主流语音识别技术相融合,可对采集到的历史语音进行多维度的全盘搜索,精确定位目标语音 。

关键词、声纹、语种全方位实时侦控,侦控范围扩充至关键词、声纹对象、语种,大大提高了精确度。

2、产品功能特点

识别模型具有可不断学习性,具有很强的自学习能力,对语音的识别能力和准确度会随着训练样本的增加而不断提高。

自动训练,为了增加训练的简便性,将训练过程变为全自动化。即自动录制训练语音,语音无需编辑,直接开始执行训练,形成标本。

可识别双向通话,可直接识别含有双方通话的合路语音,而不影响识别效果。

监控处理能力不受条件个数限制,在1000个监控条件范围内,系统实时监控处理能力不会因为监控条件增加而下降。