一种时间信息提取方法及装置、智能问答系统的制作方法_3

文档序号:9929516阅读:来源:国知局
份的年份数字,其中,年份差值X代表中文时间短语中的中文年份与当前年份的数字差值;数字月份信息=预先配置的月份差值Y+当前月份的月份数字,其中,月份差值Y代表中文时间短语中的中文月份与当前月份的数字差值;数字日数信息=预先配置的日数差值Z+当前日数的日数数字,其中,日数差值Z代表中文时间短语中的中文日数与当前日数的数字差值。
[0066]图5是根据本发明优选实施例的时间信息提取装置的示意图,如图5所示,该装置还可以进一步包括:第二转换模块40,用于在第一转换模块20根据预定的转换规则,对中文时间信息中的中文时间短语进行转换之前,将中文时间信息中的中文数字转换成阿拉伯数字;第二提取模块50,用于从阿拉伯数字中分别提取数字年份信息、数字月份信息、和/或数字日数信息,在提取失败的情况下,确定需要由第一转换模块20使用转换规则对中文时间短语进行转换。
[0067]在该装置中,第一提取模块10可以进一步包括:分割单元12,用于按照预定的文本分割规则,对当前文本进行分割,得到短文本;提取单元14,用于按照预定的提取规则,从短文本中提取中文时间信息。
[0068]在本实施例中,文本分割规则可以包括:按照标点符号对用户输入文本进行分割;提取规则包括:按照年、月、日的顺序从短文本中提取至少包含年、月、日三个字中至少一个字的文本信息。
[0069]本发明还提供了一种智能问答系统,用于执行上述时间信息提取方法。图6是根据本发明实施例的智能问答系统的结构框图,如图6所示,该智能问答系统包括图4或图5所示的时间信息提取装置。
[0070]图7是根据本发明优选实施例的智能问答系统的结构示意图,如图7所示,该智能问答系统主要包括:业务层、算法层及数据管理层。业务层主要是针对具体的应用实现不同的需求;算法引擎是核心层,提供文本的处理分析,及输出结果;数据管理层是用来对不同的业务数据做处理,生成算法引擎需要的各种数据。算法引擎和业务应用分开,这种设计可以使一个算法引擎支撑多种不同应用,如智能查询、查询问答等。
[0071]通过该智能问答,系统对于一个输入文本(也就是一个问题)来说,经过问题预处理、问题分析及问题匹配,找到问题所需要的答案,其中,根据每个问题答案不同,需要用到不同的参数,例如,查询天气时需要知道地点和时间,查询话费账单需要知道具体的月份等。
[0072]综上所述,本发明实施例主要涉及中文时间信息的提取与转换技术,更具体地说,是把智能系统中用户输入的文本中的中文时间信息提取出来,将中文格式数字转换成阿拉伯数字,以及对中文时间短语根据语义进行时间信息的提取,最后输出标准日期或自定义的日期格式的时间信息。
[0073]以上所述是本发明的优选实施方式,应当指出,对于本领域的普通技术人员来说,在不脱离本发明所述原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为包含在本发明的保护范围之内。
【主权项】
1.一种时间信息提取方法,其特征在于,包括: 从当前文本中提取出中文时间信息; 根据预定的转换规则,对中文时间信息中的中文时间短语进行转换,得到数字年份信息、数字月份信息、和/或数字日数信息; 根据所述数字年份信息、所述数字月份信息、和/或所述数字日数信息计算出符合预定时间格式的数字时间信息。2.根据权利要求1所述的方法,其特征在于,所述转换规则包括: 所述数字年份信息=预先配置的年份差值X+当前年份的年份数字,其中,所述年份差值X代表所述中文时间短语中的中文年份与所述当前年份的数字差值; 所述数字月份信息=预先配置的月份差值Y+当前月份的月份数字,其中,所述月份差值Y代表所述中文时间短语中的中文月份与所述当前月份的数字差值; 所述数字日数信息=预先配置的日数差值Z+当前日数的日数数字,其中,所述日数差值Z代表所述中文时间短语中的中文日数与所述当前日数的数字差值。3.根据权利要求1所述的方法,其特征在于,在根据预定的转换规则,对中文时间信息中的中文时间短语进行转换之前,包括: 将所述中文时间信息中的中文数字转换成阿拉伯数字; 从所述阿拉伯数字中分别提取数字年份信息、数字月份信息、和/或数字日数信息,在提取失败的情况下,确定需要使用所述转换规则对所述中文时间短语进行转换。4.根据权利要求1所述的方法,其特征在于,从当前文本中提取出中文时间信息,包括: 按照预定的文本分割规则,对所述当前文本进行分割,得到短文本; 按照预定的提取规则,从所述短文本中提取所述中文时间信息。5.根据权利要求4所述的方法,其特征在于, 所述文本分割规则包括:按照标点符号对所述用户输入文本进行分割; 所述提取规则包括:按照年、月、日的顺序从所述短文本中提取至少包含年、月、日三个字中至少一个字的文本信息。6.根据权利要求1至5中任一项所述的方法,其特征在于,根据所述数字年份信息、所述数字月份信息、和/或所述数字日数信息计算出符合预定时间格式的数字时间信息,包括: 按照每个自然年的12个自然月的日数不同的特点,按照顺序对所述数字日数信息、所述数字月份信息、和/或所述数字年份信息进行更新和组合,得到所述数字时间信息;按照所述预定时间格式输出所述数字时间信息。7.一种时间信息提取装置,其特征在于,包括: 第一提取模块,用于从当前文本中提取出中文时间信息; 第一转换模块,用于根据预定的转换规则,对中文时间信息中的中文时间短语进行转换,得到数字年份信息、数字月份信息、和/或数字日数信息; 计算模块,用于根据所述数字年份信息、所述数字月份信息、和/或所述数字日数信息计算出符合预定时间格式的数字时间信息。8.根据权利要求7所述的装置,其特征在于,所述转换规则包括: 所述数字年份信息=预先配置的年份差值X+当前年份的年份数字,其中,所述年份差值X代表所述中文时间短语中的中文年份与所述当前年份的数字差值; 所述数字月份信息=预先配置的月份差值Y+当前月份的月份数字,其中,所述月份差值Y代表所述中文时间短语中的中文月份与所述当前月份的数字差值; 所述数字日数信息=预先配置的日数差值Z+当前日数的日数数字,其中,所述日数差值Z代表所述中文时间短语中的中文日数与所述当前日数的数字差值。9.根据权利要求7所述的装置,其特征在于,还包括: 第二转换模块,用于在所述第一转换模块根据预定的转换规则,对中文时间信息中的中文时间短语进行转换之前,将所述中文时间信息中的中文数字转换成阿拉伯数字; 第二提取模块,用于从所述阿拉伯数字中分别提取数字年份信息、数字月份信息、和/或数字日数信息,在提取失败的情况下,确定需要由所述第一转换模块使用所述转换规则对所述中文时间短语进行转换。10.根据权利要求7至9中任一项所述的装置,其特征在于,所述第一提取模块包括: 分割单元,用于按照预定的文本分割规则,对所述当前文本进行分割,得到短文本; 提取单元,用于按照预定的提取规则,从所述短文本中提取所述中文时间信息。11.根据权利要求10所述的装置,其特征在于, 所述文本分割规则包括:按照标点符号对所述用户输入文本进行分割; 所述提取规则包括:按照年、月、日的顺序从所述短文本中提取至少包含年、月、日三个字中至少一个字的文本信息。12.—种智能问答系统,其特征在于,包括:权利要求7至11中任一项所述的时间信息提取装置。
【专利摘要】本发明公开了一种时间信息提取方法及装置、智能问答系统。其中,该时间信息提取方法包括:从当前文本中提取出中文时间信息;根据预定的转换规则,对中文时间信息中的中文时间短语进行转换,得到数字年份信息、数字月份信息、和/或数字日数信息;根据数字年份信息、数字月份信息、和/或数字日数信息计算出符合预定时间格式的数字时间信息。通过本发明,达到了可以满足用户对智能问答系统提取多样性时间信息的需求的效果。
【IPC分类】G06F17/27, G06F17/28
【公开号】CN105718447
【申请号】CN201410736422
【发明人】丁岩, 韩丙卫, 冯军
【申请人】中兴通讯股份有限公司
【公开日】2016年6月29日
【申请日】2014年12月5日
当前第3页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1