技术特征:
技术总结
本发明实施例公开一种时间词的抽取方法及装置,方法包括:获取待抽取时间词的文本;在文本中抽取出与第一正则匹配的至少一个第一字符串,第一正则为用于识别日期/时刻/日期时刻的规则;如果在文本中第一字符串之后的第一预设数量个字符中包含预设的第一概念词,则为抽取出的第一字符串标记起始标签;第一概念词至少具有一种语义用于表征从一个日期/时刻/日期时刻到另一个日期/时刻/日期时刻;如果在文本中第一字符串之前的第二预设数量个字符中包含预设的第一概念词,则为抽取出的第一字符串标记终止标签;将抽取出的标记有起始标签的第一字符串分别与标记有终止标签的第一字符串进行配对,生成区间时间词。该方法抽取规则简单,抽取准确。
技术研发人员:杨凯程;张青;程剑华;蒋宏飞
受保护的技术使用者:安徽省泰岳祥升软件有限公司
技术研发日:2018.12.07
技术公布日:2019.04.19