一种基于识别结果时间边界的时间位置关键词命中分析方法

文档序号:10472270阅读:180来源:国知局
一种基于识别结果时间边界的时间位置关键词命中分析方法
【专利摘要】本发明公开了一种基于识别结果时间边界的时间位置关键词命中分析方法,根据识别结果中的关键词时间位置进行拆分,计算出每个字符的时间位置;针对字符时间位置进行索引,统计出来一个语音中,每个字符出现的时间位置,并建立到倒排索引中;定义文法规则语法,引入“~”关键字,描述一个字符出现的时间位置;根据字符查询出每个字符出现的时间位置,并遍历出所有字符时间在10s内,同时每个字符紧挨着,并且顺序和查询词语相同。该方法能够识别结果中的文本时间位置信息,可以获取到每一个字符在录音对话中出现的时间点,对时间进行分析可以支持功能。
【专利说明】
一种基于识别结果时间边界的时间位置关键词命中分析方法
技术领域
[0001]本发明属于语音分析技术领域,尤其涉及一种基于识别结果时间边界的时间位置关键词命中分析方法。
【背景技术】
[0002]基于文法规则的描述术语的方式是基于字符位置的,如在第20个字符位置,出现了 “你好”,这在语音分析、文本分析领域具有共性。但是在语音分析领域有一类针对语音时间位置的分析需求,例如在开始5秒钟内,坐席必须向客户说明问候语、报工号等,这在字符位置的命中要求中是无能为力的。

【发明内容】

[0003]本发明的目的在于提供一种基于识别结果时间边界的时间位置关键词命中分析方法,旨在解决针对语音时间位置的分析需求在字符位置的命中要求中是无能为力的问题。
[0004]本发明是这样实现的,一种基于识别结果时间边界的时间位置关键词命中分析方法包括以下步骤:
[0005]步骤一、根据识别结果中的关键词时间位置进行拆分,计算出每个字符的时间位置;
[0006]步骤二、针对字符时间位置进行索引,统计出来一个语音中,每个字符出现的时间位置,并建立到倒排索引中;
[0007]步骤三、定义文法规则语法,引入“?”关键字,描述一个字符出现的时间位置;
[0008]步骤四、根据字符查询出每个字符出现的时间位置,并遍历出所有字符时间在1s内,同时每个字符紧挨着,并且顺序和查询词语相同。
[0009]本发明还采取如下技术措施:
[0010]在步骤一中,考虑到识别结果时间的精确度,字符时间位置偏差控制在100毫秒以内。
[0011]本发明具有的优点和积极效果是:该基于识别结果时间边界的时间位置关键词命中分析方法能够识别结果中的文本时间位置信息,可以获取到每一个字符在录音对话中出现的时间点,对时间进行分析可以支持功能。
【附图说明】
[0012]图1是本发明实施例提供的基于识别结果时间边界的时间位置关键词命中分析方法流程图。
【具体实施方式】
[0013]为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
[0014]下面结合附图及具体实施例对本发明的应用原理作进一步描述。
[0015]基于识别结果时间边界的时间位置关键词命中分析方法包括以下步骤:
[0016]S101、根据识别结果中的关键词时间位置进行拆分,计算出每个字符的时间位置;
[0017]S102、针对字符时间位置进行索引,统计出来一个语音中,每个字符出现的时间位置,并建立到倒排索引中;
[0018]S103、定义文法规则语法,引入“?”关键字,描述一个字符出现的时间位置;
[0019]例如:你好?1s and很高兴
[0020]表示10秒钟内说了“你好”,同时整个对话中说了“很高兴”的对话;
[0021 ] S104、根据字符查询出每个字符出现的时间位置,并遍历出所有字符时间在I Os内,同时每个字符紧挨着,并且顺序和查询词语相同;
[0022]例如:查询“你好?10s”时,首先查找出“你”和“好”在一通对话中出现的所有位置,筛选出出现时间在1s内的,同时“你”和“好”前后紧挨着定的字符,筛选出来的结果即为匹配“你好?10s”的文本。
[0023]在S1I中,考虑到识别结果时间的精确度,字符时间位置偏差控制在1O毫秒以内,这在应用领域是可以满足要求的。
[0024]该方法能够识别结果中的文本时间位置信息,可以获取到每一个字符在录音对话中出现的时间点,对时间进行分析可以支持功能。
[0025]以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
【主权项】
1.一种基于识别结果时间边界的时间位置关键词命中分析方法,其特征在于,该基于识别结果时间边界的时间位置关键词命中分析方法包括以下步骤: 步骤一、根据识别结果中的关键词时间位置进行拆分,计算出每个字符的时间位置;步骤二、针对字符时间位置进行索引,统计出来一个语音中,每个字符出现的时间位置,并建立到倒排索引中; 步骤三、定义文法规则语法,引入“?”关键字,描述一个字符出现的时间位置; 步骤四、根据字符查询出每个字符出现的时间位置,并遍历出所有字符时间在1s内,同时每个字符紧挨着,并且顺序和查询词语相同。2.如权利要求1所述的基于识别结果时间边界的时间位置关键词命中分析方法,其特征在于,在步骤一中,考虑到识别结果时间的精确度,字符时间位置偏差控制在100毫秒以内。
【文档编号】G06F17/30GK105825849SQ201610208299
【公开日】2016年8月3日
【申请日】2016年4月6日
【发明人】刘郁松, 何国涛, 李全忠, 蒲瑶
【申请人】普强信息技术(北京)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1