基于言语行为理论的用户交互意图识别方法及系统与流程

文档序号:11234125阅读:528来源:国知局
基于言语行为理论的用户交互意图识别方法及系统与流程

本发明涉及计算机科学中的意图识别技术领域,更具体地,涉及一种基于言语行为理论的用户交互意图识别方法及系统。



背景技术:

对用户交互行为的意图进行挖掘和分析在社会公共安全、商务智能、社情舆情等领域具有十分重要的应用价值。随着社交媒体(微博、twitter、facebook等)不断发展和壮大,人们越来越倾向于通过社交媒体分享个人经历、发表观点、表达意愿,并由此产生了海量用户生成内容。这些内容中蕴含着丰富多样的有价值信息,其中,交互意图广泛存在于社交媒体的用户讨论中,对用户的交互意图进行分析和识别,能够为社会、经济、政治、文化相关的多个领域应用提供关键信息和决策支持。

传统的意图识别在人工智能领域有广泛的研究,其研究的重点是基于离线信息检测智能体行为,并与预定义库中的行为模式进行匹配,从而识别智能体的意图。随着社会媒体平台和网络通信的飞速发展,对用户的在线交互进行意图识别已经成为网络大数据应用中的重要研究问题。以往的社交媒体中的意图分析工作主要集中在查询意图和消费意图两个领域。

用户查询意图识别是从搜索引擎日志数据(包括点击、点击序列和查询条件等)中挖掘用户的查询意图,并按照预定义的意图类别分类识别。现有的查询意图分类方法主要包括两种:1)根据查询功能分类,kang等(sigir,2003)将查询意图分类为信息、导航、翻译;2)根据用户行为分类,hu等(www,2009)提出了旅行和工作两种行为相关意图。由于搜索引擎中的查询由词项组成且长度受限,现有的查询意图识别致力于扩展查询特征,恢复完整查询语义,hu等(www,2009)利用维基百科作为外部知识源扩展查询词项,yang等(wsdm,2015)提出自动生成交互问题,根据用户反馈修正意图。

消费意图识别着重从在线文本数据(微博、论坛、查询等)中挖掘用户是否具有购买意愿。长文本数据主要利用nlp技术进行消费意图识别,chen等(hlt-naacl,2013)研究了在特定领域论坛中的购买意图表达模式;短文本数据由于语义的不规范致力于消费对象实体的识别,fu等(计算机科学与探索,2015)提出了一种跨媒体的伪反馈方法,借助外部搜索引擎对微博中的商品名词进行识别。

目前,用户意图识别发展到更一般的社交媒体平台中。wang等(aaai,2015)提出了一种基于用户日常行为的twitter分类方案,包括食品、旅游、教育等,但他们的方法仅限于显式的意图表达,如“我想要…”、“我计划…”;purohit等(socialcom,2015)设计了一种基于特征的方法识别“寻求帮助”和“提供帮助”两种twitter意图,应用的背景限定在危机事件中,而不考虑更一般的用户意图识别。相比之下,我们的工作重点是定义更为通用的意图分类体系,并在海量在线文本数据中识别用户的交互意图。

以往的意图识别方法主要存在以下不足:(1)意图类型主要集中在特定领域,无法对其他交互意图类型进行识别,适用范围比较窄;(2)意图识别的对象主要集中在固定领域的文本中,或带有明显意图的规则表达中,无法对不规则表达中的隐式交互意图进行识别,可用性比较差;(3)现有方法大多利用人工标注数据进行有监督学习或半监督学习,在人工标注语料缺失时无法对大规模数据进行有效交互意图识别。



技术实现要素:

为了解决现有技术中的上述问题,即为了解决识别各种交互意图类型的问题,本发明提供了一种基于言语行为理论的用户交互意图识别方法。

为实现上述目的,本发明提供了如下方案:

一种基于言语行为理论的用户交互意图识别方法,所述用户交互意图识别方法包括:

基于外部知识源构建行为标记语词典,各意图类别分别对应一个行为标记语词典,每个所述行为标记语词典中包含有多个行为标记语;

根据所述行为标记语词典,自动标注用户在社交媒体平台上输入的在线文本的意图;

利用自动标注语料训练基于特征的分类器对所述在线文本的意图进行分类识别,确定用户的交互意图类别。

可选的,所述基于外部知识源构建行为标记语词典包括:

针对每一意图类别选择设定数量的种子词,构造初始行为标记语词典;

选取待加入到所述初始行为标记语词典中的扩充词;

计算所述扩充词与种子词的语义相似度;

筛选出语义相似度大于相似度阈值的扩充词,并添加到对应的所述初始行为标记语词典中,形成对应各所述意图类别的行为标记语词典。

可选的,所述扩充词分为记载在知网hownet中的扩充词和未记载在hownet中的扩充词。

可选的,对于记载在hownet中的扩充词,根据以下公式确定所述扩充词与种子词的语义相似度:

其中,w1为种子词,w2为记载在hownet中的扩充词,sim(w1,w2)为w2与w1的语义相似度,表示w1,w2对应的义原节点在hownet概念树上的距离,α表示可调参数。

可选的,对于未记载在hownet中的扩充词,所述计算所述扩充词与种子词的语义相似度具体包括:

利用中文维基百科语料和开源词向量工具,获得维基百科的词向量模型;

找到与种子词具有类似用法的词汇作为扩充词;

根据以下公式确定所述扩充词与种子词的语义相似度:

其中,w1为种子词,p2为未记载在hownet中的扩充词,sim(w1,p2)为p2与w1的语义相似度,表示p2与w1的最小义原距离,dpos表示p2与w1的词性结构距离,lmax表示p2与w1分解后包含的最大义原个数;λ1和α分别表示可调参数。

可选的,所述行为标记语词典包括代表意图的动词、形容词、副词、代词及语气词中至少一者。

可选的,所述自动标注用户在社交媒体平台上输入的在线文本的意图具体包括:

对所述用户在社交媒体平台上输入的在线文本进行预处理;

将预处理后的在线文本切分为在线句子;

分析句法依存关系,从所述在线句子中确定核心动词及关联词,形成关键词组;

根据所述行为标记语词典对所述关键词组进行行为标记语匹配;

根据匹配的行为标记语所属的意图类别将所述在线文本标注为对应的意图。

可选的,从所述在线句子中确定关联词具体包括:根据句法依存关系选取与所述核心动词距离小于距离阈值的语词。

可选的,所述特征包括常规特征、语义特征及语法特征;其中,

所述常规特征包括社交媒体平台的类型、作者身份、提及类型、提及位置、主题标签数量和链接类型;

所述语义特征包括表情符、颜文字符、hownet情感词典特征、liwc词典特征、行为标记语和文本词汇;

所述句法特征包括标点符号和句法依存关系。

根据本发明的实施例,本发明公开了以下技术效果:

本发明基于言语行为理论的用户交互意图识别方法通过基于外部知识源构建对应不同意图类别的行为标记语词典,并基于行为标记语词典,自动标注扩充语料和基于特征分类识别,能够有效识别社交媒体中的用户交互意图,识别准确度高,可用于商务智能、社情舆情、决策评估等领域的意图分析与识别,应用范围广。

为实现上述目的,本发明提供了如下方案:

一种基于言语行为理论的用户交互意图识别系统,所述用户交互意图识别系统包括:

构建模块,用于基于外部知识源构建行为标记语词典,各意图类别分别对应一个行为标记语词典,每个所述行为标记语词典中包含有多个行为标记语;

自动标注模块,用于根据所述行为标记语词典,自动标注用户在社交媒体平台上输入的在线文本的意图;

识别模块,用于利用自动标注语料训练基于特征的分类器对所述在线文本的意图进行分类识别,确定用户的交互意图类别。

根据本发明的实施例,本发明公开了以下技术效果:

本发明基于言语行为理论的用户交互意图识别系统通过设置构建模块,以基于外部知识源构建对应不同意图类别的行为标记语词典;并通过设置自动标注模块和识别模块,实现自动标注扩充语料和基于特征的分类识别,能够有效识别社交媒体中的用户交互意图,识别准确度高,可用于商务智能、社情舆情、决策评估等领域的意图分析与识别,应用范围广。

附图说明

图1是本发明基于言语行为理论的用户交互意图识别方法的流程图;

图2为在线句子s1的句法依存关系的结构图;

图3为本发明基于言语行为理论的用户交互意图识别系统的模块结构示意图。

符号说明:

构建模块—1,自动标注模块—2,识别模块—3。

具体实施方式

下面参照附图来描述本发明的优选实施方式。本领域技术人员应当理解的是,这些实施方式仅仅用于解释本发明的技术原理,并非旨在限制本发明的保护范围。

本发明提出一种基于言语行为理论的交互意图识别方法,将社交媒体中的用户意图识别问题定义为多分类问题,将用户的表达看作一种意图行为,并根据其语用功能进行分类。

言语行为理论是语用学的一个重要分支,所述言语行为理论最早由austin(howtodothingswithwords,1962)建立,提出话语不仅可以传递信息,同时也在实施行为。searle(expressionandmeaning:studiesinthetheoryofspeechacts,1976)进一步发展了言语行为理论,并根据语言的言外之意将言语行为划分为五大类:指示类、承诺类、表达类、断言类和陈述类,这种分类方案可以帮助识别话语中说话人的意图。根据行为标记语相关研究(meaningandspeechacts,1990),每个句子都由包含行为标记语动词的深层结构产生,而行为标记语本身便具有言外之意来区分言语行为。

如图1所示,本发明基于言语行为理论的用户交互意图识别方法包括:

步骤100:基于外部知识源构建行为标记语词典,各意图类别分别对应一个行为标记语词典,每个所述行为标记语词典中包含有多个行为标记语;

步骤200:根据所述行为标记语词典,自动标注用户在社交媒体平台上输入的在线文本的意图;

步骤300:利用自动标注语料训练基于特征的分类器对所述在线文本的意图进行分类识别,确定用户的交互意图类别。

其中,每一种意图是一类根据交互意图区分的典型言语行为,而每一个意图类别包含相同语用功能的意图,意图分类体系是用户交互意图分类识别的基础和依据。在本实施例中,将社交媒体平台中用户的交互意图分成:指令类、疑问类、承诺类、愿望类、表意类、情感类、断言类、立场类、陈述类和声明类等。以表1所示内容为例,各个意图的具体内容可为:

指令类:用户希望听话人(包括其他用户或机构)做或不做某事,包括:命令,请求、建议、倡导和警告等。

疑问类:用户要求听话人提供信息。

承诺类:用户承诺自己或其所属的机构会在未来做某事。

愿望类:用户描述自己做某事的计划或当前状态,如“我想…”、“我计划…”。

表意类:用户表达自己的礼节和礼貌性态度,包括:祝福、道歉、鼓励、安慰、赞赏和祝贺等。

情感类:用户表达自己的感受或情绪反应,包括:开心、伤心、赞美、责备、同情和惋惜等。

断言类:用户以很确定的语气描述某物,话语中包含了自身的信仰或思想,包括:断言、评价、预测、判断和猜测等。

立场类:用户表达自身对于某事的立场,包括:支持、反对、同意、不同意等。

陈述类:用户描述或解释的某事物,包括:描述、解释、举例等。

声明类:用户发布客观的信息,如新闻,用户通常是官方机构。

表1交互意图类别的示例

在步骤100中,所述基于外部知识源构建行为标记语词典包括:

步骤101:针对每一意图类别选择设定数量的种子词,构造初始行为标记语词典;

步骤102:选取待加入到所述初始行为标记语词典中的扩充词;

步骤103:计算所述扩充词与种子词的语义相似度;

步骤104:筛选出语义相似度大于相似度阈值的扩充词,并添加到对应的所述初始行为标记语词典中,形成对应各所述意图类别的行为标记语词典。

其中,所述行为标记语词典包括代表意图的动词、形容词、副词、代词及语气词中至少一者。构成行为标记语词典的词有两类来源:一是现有的显式行为标记语词;二是带有明显语用功能的词,包括未登录在词典中的显式行为标记语词,隐式行为标记语词。对应的,所述扩充词分为记载在知网hownet中的扩充词和未记载在hownet中的扩充词。

对于记载在hownet中的扩充词,基于中文概念树hownet,计算扩充词与种子词间的语义相似度,筛选出种子词的同义词和近义词,将它们放入种子词所在意图类别的行为标记语词典中。具体的,根据公式(1)确定:

其中,w1为种子词,w2为记载在hownet中的扩充词,sim(w1,w2)为w2与w1的语义相似度,表示w1,w2对应的义原节点在hownet概念树上的距离,α表示可调参数。在本实施例中,α取值为1.6,针对记载在hownet的扩充词,对应的相似度阈值为0.8。

由于hownet中包含的词的数量有限,社交媒体中更多的行为标记语是hownet上查找不到(即未记载在hownet中的扩充词),无法通过公式(1)确定该类词。为了进一步扩充词汇数量,利用中文维基百科语料训练wordembedding模型,找出与种子词具有类似用法的词汇,具体的,对于未记载在hownet中的扩充词,所述计算所述扩充词与种子词的语义相似度具体包括:

利用中文维基百科语料和开源词向量工具(例如google开源的wordembedding工具),获得维基百科的词向量(wordembedding)模型。wordembedding模型能够将词汇表示成基于文档的分布式表示向量,词汇间的向量距离一定程度上体现了词汇使用场景的相似性。

找到与种子词具有类似用法的词汇作为扩充词。也就是说,在wordembedding模型中找出与种子词的向量距离最近的词,在本实施例中,一般选取前40个词。

根据公式(2)确定所述扩充词与种子词的语义相似度:

其中,w1为种子词,p2为未记载在hownet中的扩充词,sim(w1,w2)为p2与w1的语义相似度,表示p2与w1的最小义原距离,dpos表示p2与w1的词性结构距离,lmax表示p2与w1分解后包含的最大义原个数;λ1和α分别表示可调参数。在本实施例中,λ1为0.8、α为1.6,对应的相似度阈值为0.75。

下面以一个与种子词“请求”相关的指令类行为标记语词典构建过程示例(海量微博文本作为外部知识源的输入):

(1)以手工挑选的种子词“请求”为例,将“请求”加入指令类行为标记语词典,并作为行为标记语词典构建过程的种子词。

(2)基于hownet,找到“请求”的近义词为“要求”、“哀求”、“央求”、“呼吁”、“恳求”、“命令”等,将这些同义词或近义词作为扩充词放到指令类行为标记语词典中。

(3)利用利用中文维基百科语料和word2vector开源工具(google开源的wordembedding工具),得到维基百科的wordembedding模型。并找出与输入单词(或短语)具有类似用法的词汇,即在wordembedding模型中找出单词向量距离最近的前40个词作为扩充词。

以输入文本“不要在患者心上插刀”为例,其核心词“不要”在wordembedding模型中的相似用法词和短语如表2所示:

表2利用wordembedding模型扩充词的示例

(4)利用语义相似度函数对所述扩充词进行评价与过滤,选取其中相似度大于相似度阈值的词,放入相应意图类别的行为标记语词典中。

以“不想”为例,由于hownet中没有记载“不想”这个词,所以将“不想”分解为“不”和“想”两个词,在hownet中“不”的义原为:否,而“想”具有:思念、认为、思考、愿意4个义原;通过对比义原在hownet树上的编码,发现“思考”与“要求”的距离最小,

其中,编码距离的计算以如下示例给出:以“思考”和“要求”为例,两者的编码分别为:“1-2-2-2-2-3-3-1-2-1-7”和“1-2-2-2-2-2-1-1”,编码代表根节点到义原节点的最短路径,由左至右每个用“-”分隔开的数字表示路径的一个中间节点,故“思考”和“要求”的距离为9。

由于“不想”和“请求”词性模式为“dv”和“v”,故二者的编辑距离dpos=1,lmax=2。在λ1=0.8,α=1.6时,根据语义相似度得到二者的语义相似度值:

故“不想”低于相似度阈值0.75,不能被加入到指令类行为标记语词典中。

类似地,经过相似度评分函数筛选,将阈值高的“请”、“提醒”、“警告”、“请你”、“所以请”加入到指令类行为标记语词典中。根据上述计算过程,利用不同类别下的种子词可以得到全部交互意图类别的行为标记语词典。

在步骤200中,所述自动标注用户在社交媒体平台上输入的在线文本的意图具体包括:

步骤201:对所述用户在社交媒体平台上输入的在线文本进行预处理。其中,预处理包括去除在线文本中的话题标签、表情符号等文本噪声。

步骤202:将预处理后的在线文本切分为在线句子。

步骤203:分析句法依存关系,从所述在线句子中确定核心动词及关联词,形成关键词组。

其中,从所述在线句子中确定关联词具体包括:根据句法依存关系选取与所述核心动词距离小于距离阈值的语词。在本实施例中,所述距离阈值为2。

步骤204:根据所述行为标记语词典对所述关键词组进行行为标记语匹配。

步骤205:根据匹配的行为标记语所属的意图类别将所述在线文本标注为对应的意图,可为一种或多种。对于不能被标注为任何一种意图的在线句子标注为“无”。

下面以一具体实施例介绍本发明中自动标注的过程:

用户输入微博:回复@买半票的饭团:我支持医院维护自己的权益;我觉得在医院特别是手术室里的医生很辛苦;我就在这生的孩子,医生都很好!请大家多体谅医生的不易。

(1)对输入微博进行预处理,除去回复字段的文本噪声。

(2)将处理后的在线文本切分为在线句子,得到4个在线句子:

s1:我支持医院维护自己的权益;

s2:我觉得在医院特别是手术室里的医生很辛苦;

s3:我就在这生的孩子,医生都很好!

s4:请大家多体谅医生的不易。

(3)分析句法依存关系,从所述在线句子中确定核心动词及关联词,形成关键词组。以s1为例,其句法依存关系的结构如图2所示,例如,“我”与“支持”为主谓关系、“支持”与“维护”为动宾关系、“支持”与“;”为标点关系,“医院”与“维护”为状中关系、“维护”与“权益”为动宾关系,“自己”与“权益”为定中关系。其核心动词为“支持”,保留与核心动词距离小于2的形容词、副词、代词、语气词,得到[我,支持,维护],作为s1的关键词组。

类似地,得到s1~s4的关键词组如表3所示:

表3:关键词组与行为标记语匹配的示例

(4)基于构建的行为标记语词典,对s1~s4中包含的关键词组进行行为标记语匹配。

根据匹配的行为标记语所属的意图类别将所述在线文本标注为对应的意图。如表3所示,在微博中输入的在线文本标注类别为:立场和指令。

在步骤300中,为了更好地刻画用户交互意图的特点,本发明设计了三类特征:常规特征、语义特征和句法特征。常规特征指能够帮助识别用户交互意图的社交媒体平台特征,语义特征和句法特征是不同用户交互意图表现出的具有区分性的某些语义和句法方面的特征。此外,某些语义特征是通过已有资源帮助指导下得到的,如:huang等(中华心理学刊,2012)修订的liwc(linguisticinquiryandwordcount)词典和hownet情感词典。

其中,所述常规特征包括社交媒体平台的类型、作者身份、提及类型、提及位置、主题标签数量和链接类型;所述语义特征包括表情符、颜文字符、hownet情感词典特征、liwc词典特征、行为标记语和文本词汇;所述句法特征包括标点符号和句法依存关系。

以微博为例,本发明选择了共1310个特征,包括13个常规特征,1266个语义特征和31个句法特征。具体如下:

(1)常规特征:

微博类型:区分原创和转发/回复类型,表达和声明类型的微博更多地来自原创类型的微博。

作者身份:区分官方和个人账号,与个人账号相比,官方账号通常会发布更多的声明类型微博。

提及类型:用户提及(@)到的其他用户的用户类型能够帮助区分交互意图,如:用户在社交媒体上发出请求或建议时,可能会提及某些官方账号,来满足其请求或接受其建议。

提及位置:位于微博开篇的@更倾向于起提醒、告知(某人)的作用;位于微博结尾的@则可能是信息的来源;位于微博中间的@则是文本内容的一部分。

主题标签数量:垃圾微博通常包含许多不相关的热门标签,主题标签数量可以帮助区分无关的垃圾信息。

链接类型:某些链接类型,如新闻、文章、图片、视频和发布地点,与微博文本内容相关,可以帮助识别微博中的用户交互意图。

(2)语义特征:

表情符和颜文字符:社交媒体中随处可见表情符和颜文字符。用户通常用它们来表达感情或礼仪。

hownet情感词典特征:hownet情感词典提供了一组用于情感分析的词库,包括程度副词词典、观点词词典、情感词词典和评价词词典,可以帮助识别用户交互意图。

liwc词典特征:liwc词典将词划分为描述性特点、心理特点、语文特点和个人化特点等类别,可以辅助发现用户的心理状态、思考类型甚至人格特征,帮助识别用户交互意图。

行为标记语特征:行为标记语本身就具有言外之意,能有效帮助识别用户交互意图。

文本词汇特征:通过匹配两个不同事件的语料,得到与事件话题无关的文本词语;然后利用textrank算法生成微博的主题词,移除这些主题词,得到话题无关词语;最后按照tf-idf评分进行特征选择。

(3)句法特征:

标点符号:标点符号是识别用户意图类别的重要特征。问号(?)通常引起问题、要求或负面情感。感叹号(!)经常用在表意或情感中。

句法依存关系:依存树能够表示句子中单词之间的关系,本发明用依存句法分析子树表示句法特征。利用hanlp开源工具提取树中的关系类型作为句法特征。

最后建立模型,通过训练多个一对多的二分类器对每个意图进行类别识别。对于每个类别,本发明选择包含当前类别标签的文本作为正样例,带有其他9个类别标签的文本作为负样例。本发明选择决策树(dt)作为分类算法。

下面以一具体实施例介绍本发明基于言语行为理论的用户交互意图识别方法:

从新浪微博中采集了50,298条用户讨论数据,涵盖了2015年到2016年热门话题,主要是关于2015年“天津滨海新区救灾事件”和2016年“医患关系的改善”两个话题的数据。经过垃圾过滤和预处理,我们得到5,733条“天津滨海新区救灾事件”和35,128条“医患关系的改善”微博。

按照“全部一致”准则,两位标注者分别独立地对“天津滨海新区救灾事件”语料的意图类别进行标注。得到意图类别分布为:指令类1,108条、疑问类579条、承诺类53条、愿望类111条、表意类1,553条、情感类1,816条、断言类996条、立场类420条、陈述类432条和声明类439条。

为每个意图类别手工选择几个种子词,如下表4所示。基于本发明步骤100中的方法,自动构建行为标记语词典。扩充词典的参数设定为α和λ1分别为1.6和0.8。最后,得到10个类别下共计892个词汇的行为标记语词典。

表4:种子词选取的示例

基于构建的行为标记语词典,自动标注“医患关系的改善”语料数据。得到的意图类别分布为:指令类4,110条、疑问类1,791条、承诺类1,686条、愿望类351条、表意类1,616条、情感类1,124条、断言类4,226条、立场类3,056条、陈述类4,215条和声明类2,670条。

本发明选择自动标注语料作训练数据集、人工标注语料作测试数据集的方法进行实验。具体地:

选择用本发明方法自动标注的“医患关系的改善”语料作为训练数据集,选择人工标注的“天津滨海新区救灾事件”语料作为测试数据集;

基于本发明中的特征分类器,验证交互意图识别效果。本发明方法对用户交互意图的识别性能如表5所示:

表5:交互意图识别的实验效果

从表5中,可以看到,本发明提出的方法虽然使用完全无监督的自动标注数据作为训练数据,但本发明的方法在多数情况下取得良好的性能。

本发明的方法的优点如下:

本发明提出的基于言语行为理论进行用户交互意图识别方法,借助了言语行为理论的分类方案,提出了更为通用的用户交互意图分类体系;已有的意图识别工作中,意图类型集中在特定领域,无法对其他交互意图类型进行识别。

本发明提出了利用外部知识源构建行为标记语词典的方法,并基于词典自动标注数据,解决了意图语料不足的问题;通过上述行为标记语构建示例可以发现,本发明提出的方法在输入文本较少的情况下,利用外部知识源和相似度比较,依然可以有效扩充并发现行为标记语单词(或短语)。

本发明利用自动标注语料,基于特征对用户交互意图分类识别,验证了本方法不但可以识别用户的交互意图类型,而且在大规模数据下效果良好。因此,在输出结果的可解释性、使用灵活性及有效性方面较已有方法具有明显的优势。

此外,本发明还提供一种基于言语行为理论的用户交互意图识别系统。如图3所示,本发明基于言语行为理论的用户交互意图识别系统包括构建模块1、自动标注模块2及识别模块3。其中,所述构建模块1基于外部知识源构建行为标记语词典,各意图类别分别对应一个行为标记语词典,每个所述行为标记语词典中包含有多个行为标记语;所述自动标注模块2根据所述行为标记语词典,自动标注用户在社交媒体平台上输入的在线文本的意图;所述识别模块3利用自动标注语料训练基于特征的分类器对所述在线文本的意图进行分类识别,确定用户的交互意图类别。

相对于现有技术,本发明基于言语行为理论的用户交互意图识别系统与基于言语行为理论的用户交互意图识别方法的有益效果相同,在此不再赘述。

本领域技术人员应该能够意识到,结合本文中所公开的实施例描述的各示例的模块及方法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明电子硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以电子硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。本领域技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。

至此,已经结合附图所示的优选实施方式描述了本发明的技术方案,但是,本领域技术人员容易理解的是,本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下,本领域技术人员可以对相关技术特征作出等同的更改或替换,这些更改或替换之后的技术方案都将落入本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1