信息处理方法、设备和系统的制作方法

文档序号:7999044阅读:255来源:国知局
信息处理方法、设备和系统的制作方法
【专利摘要】本发明实施例涉及一种信息处理方法、设备和系统,该方法包括:终端设备获取终端用户的用户标识,并将用户标识发送至系统设备,使得系统设备获取与用户标识对应的社交媒体数据,抽取社交媒体数据中的上下文信息,并对上下文信息进行聚类处理,聚类处理后得到用户属性模型;终端设备从系统设备接收终端用户的用户属性模型和信息回复模型,并根据用户属性模型确定终端用户的所有联系人的用户属性;当接收到联系人发送的待回复信息时,抽取待回复信息的上下文信息,并根据待回复信息的上下文信息、联系人的用户属性、以及信息回复模型生成回复信息,并将回复信息发送至联系人。因此,本发明实现了具有用户语言偏好和风格的信息自动回复。
【专利说明】信息处理方法、设备和系统

【技术领域】
[0001] 本发明涉及通信【技术领域】,尤其涉及一种信息处理方法、设备和系统。

【背景技术】
[0002] 随着移动互联网的普及,手机信息业务依然是目前手机用户最常使用的业务之 一,若能为手机用户提供出色的信息操作体验是手机制造商赢得用户的重要途径,因此,手 机制造商为了给手机用户带来更好的体验,帮助用户自动回复信息则是改善用户体验的一 个非常重要方面,同时也给手机用户带来了很大的方便。
[0003] 目前,短信自动回复系统采用的是基于规则的短信自动回复系统或者单纯基于历 史信息作为训练语料的短信自动回复系统。对于基于规则的短信自动回复系统,其待回复 的信息通常是系统内置的或者用户预先定义的,比如,当短信回复系统接收到待回复信息 后,根据预先定义好的规则(如开会、开车等)回复设置好的信息。对于单纯基于历史信 息作为训练语料的短信自动回复系统,一般采用用户的历史信息作为训练语料生成回复模 型,并对接收的信息进行回复。
[0004] 但是,对于基于规则的短信自动回复系统,其回复的内容基本固定而不会根据用 户的语言偏好和风格回复信息。对于单纯基于历史信息作为训练语料的短信自动回复系 统,其用来作为训练语料的历史信息相对较少,很难获取更大范围的训练语料。


【发明内容】

[0005] 本发明提供了一种信息处理方法、设备和系统,以解决现有技术中对于基于规则 的短信自动回复系统,其回复的内容基本固定而不会根据用户的语言偏好和风格回复信 息,以及对于单纯基于历史信息作为训练语料的短信自动回复系统,其用来作为训练语料 的历史信息相对较少,很难获取更大范围的训练语料的问题。
[0006] 在第一方面,本发明提供了一种信息处理方法,所述方法包括:终端设备获取终端 用户的用户标识,并将所述用户标识发送至系统设备,使得所述系统设备获取与所述用户 标识对应的社交媒体数据,抽取所述社交媒体数据中的上下文信息,并对所述上下文信息 进行聚类处理,所述聚类处理后得到用户属性模型;所述终端设备从所述系统设备接收所 述终端用户的所述用户属性模型和信息回复模型,并根据所述用户属性模型确定所述终端 用户的所有联系人的用户属性;当接收到所述联系人发送的待回复信息时,抽取所述待回 复信息的上下文信息,并根据所述待回复信息的上下文信息、所述联系人的用户属性、以及 所述信息回复模型生成回复信息,并将所述回复信息发送至所述联系人。
[0007] 在第一种可能的实现方式中,所述获取终端用户的用户标识具体为:获取所述终 端用户在社交媒体上的用户标识,所述用户标识为所述终端用户在所述社交媒体上注册的 标识信息。
[0008] 结合第一方面或结合第一方面的第一种可能的实现方式,在第二种可能的实现方 式中,所述根据所述待回复信息的上下文信息、所述联系人的用户属性、以及所述信息回复 模型生成回复信息具体为:根据所述待回复信息的上下文信息、所述联系人的用户属性、所 述联系人的历史信息、以及所述信息回复模型生成回复信息。
[0009] 在第二方面,本发明提供了一种信息处理方法,所述方法包括:系统设备接收终端 设备发送的终端用户的用户标识;获取与所述用户标识对应的社交媒体数据,抽取所述社 交媒体数据中的上下文信息,并对所述上下文信息进行聚类处理,所述聚类处理后得到用 户属性模型;对所述社交媒体数据、所述上下文信息和所述用户属性模型进行训练,所述训 练后得到信息回复模型;向所述终端设备发送所述用户属性模型和所述信息回复模型,以 使所述终端设备根据所述用户属性模型和所述信息回复模型对所述终端用户接收到的待 回复信息进行处理。
[0010] 在第一种可能的实现方式中,接收所述终端设备在社交媒体上的用户标识,所述 用户标识为所述终端用户在所述社交媒体上注册的标识信息。
[0011] 结合第二方面或结合第二方面的第一种可能的实现方式,在第二种可能的实现方 式中,所述上下文信息包括时间类、地点类、事件类和人物属性类信息,所述抽取所述社交 媒体数据中的上下文信息,并对所述上下文进行聚类处理,所述聚类处理后得到用户属性 模型具体为:抽取所述社交媒体数据中的时间类、地点类、事件类和人物属性类信息,将所 述人物属性类信息进行聚类并训练,所述训练后得到所述用户属性模型。
[0012] 在第三方面,本发明提供了一种终端设备,所述设备包括:获取单元,用于获取终 端用户的用户标识,并将所述用户标识发送至系统设备,使得所述系统设备获取与所述用 户标识对应的社交媒体数据,抽取所述社交媒体数据中的上下文信息,并对所述上下文信 息进行聚类处理,所述聚类处理后得到用户属性模型;接收单元,用于接收所述系统设备发 送的与所述终端用户相对应的所述用户属性模型和信息回复模型,并根据所述用户属性模 型确定所述终端用户的所有联系人的用户属性,以及将所述所有联系人的用户属性和所述 信息回复模型传输给信息处理单元;信息处理单元,用于从所述接收单元接收所述所有联 系人的用户属性和所述信息回复模型,当接收到所述联系人发送的待回复信息时,抽取所 述待回复信息的上下文信息,并根据所述待回复信息的上下文信息、所述联系人的用户属 性、以及所述信息回复模型生成回复信息,并将所述回复信息发送至所述联系人。
[0013] 在第一种可能的实现方式中,所述获取单元还用于获取所述终端用户在社交媒体 上的用户标识,所述用户标识为所述终端用户在所述社交媒体上注册的标识信息。
[0014] 结合第三方面或结合第三方面的第一种可能的实现方式,在第二种可能的实现方 式中,所述接收单元还用于根据所述待回复信息的上下文信息、所述联系人的用户属性、所 述联系人的历史信息、以及所述信息回复模型生成回复信息。
[0015] 在第四方面,本发明提供了一种系统设备,所述设备包括:接收单元,用于接收终 端设备发送的终端用户的用户标识,以及将所述用户标识传输给用户属性模型生成单元; 用户属性模型生成单元,用于从所述接收单元接收所述用户标识,获取与所述用户标识对 应的社交媒体数据,抽取所述社交媒体数据中的上下文信息,并对所述上下文信息进行聚 类处理,所述聚类处理后得到用户属性模型,及将所述社交媒体数据、所述上下文信息和所 述用户属性模型传输给信息回复模型生成单元,以及将所述用户属性模型传输给发送单 元;信息回复模型生成单元,用于从所述用户属性模型生成单元接收所述社交媒体数据、所 述上下文信息和所述用户属性模型,对所述社交媒体数据、所述上下文信息和所述用户属 性模型进行训练,所述训练后得到信息回复模型,以及将所述信息回复模型传输给发送单 元;发送单元,用于从所述用户属性模型生成单元接收所述用户属性模型,从所述信息回复 模型生成单元接收所述信息回复模型,向所述终端设备发送所述用户属性模型和所述信息 回复模型,以使所述终端设备根据所述用户属性模型和所述信息回复模型对所述终端用户 接收到的待回复信息进行处理。
[0016] 在第一种可能的实现方式中,所述接收单元还用于接收所述终端设备在社交媒体 上的用户标识,所述用户标识为所述终端用户在所述社交媒体上注册的标识信息。
[0017] 结合第四方面或结合第四方面的第一种可能的实现方式,在第二种可能的实现方 式中,所述上下文信息包括时间类、地点类、事件类和人物属性类信息,所述用户属性模型 生成单元还用于抽取所述社交媒体数据中的时间类、地点类、事件类和人物属性类信息,将 所述人物属性类信息进行聚类并训练,所述训练后得到所述用户属性模型。
[0018] 在第五方面,本发明提供了一种信息处理系统,所述系统包括:在第三方面提供的 终端设备和在第四方面提供的系统设备。
[0019] 通过应用本发明公开的信息处理方法、设备和系统,终端设备获取终端用户的用 户标识,并将所述用户标识发送至系统设备;当系统设备接收终端设备发送的终端用户的 用户标识后,获取与所述用户标识对应的社交媒体数据,抽取所述社交媒体数据中的上下 文信息,并对所述上下文信息进行聚类处理,所述聚类处理后得到用户属性模型,以及对所 述社交媒体数据、所述上下文信息和所述用户属性模型进行训练,所述训练后得到信息回 复模型,并向所述终端设备发送所述用户属性模型和所述信息回复模型;当终端设备接收 所述系统设备发送的与所述终端用户相对应的用户属性模型和信息回复模型后,根据所述 用户属性模型确定所述终端用户的所有联系人的用户属性,当接收到所述联系人发送的待 回复信息时,抽取所述待回复信息的上下文信息,并根据所述待回复信息的上下文信息、所 述联系人的用户属性、以及所述信息回复模型生成回复信息,并将所述回复信息发送至所 述联系人,从而使得系统端利用社交媒体数据作为训练语料进行建模,从而扩大了语料采 集的范围,并降低了采集成本,同时,上下文信息作为信息回复模型训练参数,使得回复内 容更具有针对性,还有,引入用户属性模型作为上下文参数,可以将在社交媒体对不同对象 的回复风格、方式引入信息回复;同时,终端设备根据接收到的信息和已训练好的信息回复 模型自动生成回复内容,实现了具有用户语言偏好和风格的信息自动回复。

【专利附图】

【附图说明】
[0020] 图1为本发明实施例一提供的信息处理方法的流程图;
[0021] 图2为本发明实施例二提供的信息处理方法的流程图;
[0022] 图3为本发明实施例三提供的终端设备的示意图;
[0023] 图4为本发明实施例四提供的系统设备的示意图;
[0024] 图5为本发明实施例五提供的终端设备的示意图;
[0025] 图6为本发明实施例六提供的系统设备的示意图;
[0026] 图7为本发明实施例七提供的信息处理系统的示意图。

【具体实施方式】
[0027] 为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例 中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是 本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员 在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0028] 本发明公开了一种信息处理方法、设备和系统,利用终端设备获取终端用户的用 户标识,并将所述用户标识发送至系统设备;当系统设备接收终端设备发送的终端用户的 用户标识后,获取与所述用户标识对应的社交媒体数据,抽取所述社交媒体数据中的上下 文信息,并对所述上下文信息进行聚类处理,所述聚类处理后得到用户属性模型,以及对所 述社交媒体数据、所述上下文信息和所述用户属性模型进行训练,所述训练后得到信息回 复模型,并向所述终端设备发送所述用户属性模型和所述信息回复模型;当终端设备接收 所述系统设备发送的与所述终端用户相对应的用户属性模型和信息回复模型后,根据所述 用户属性模型确定所述终端用户的所有联系人的用户属性,当接收到所述联系人发送的待 回复信息时,抽取所述待回复信息的上下文信息,并根据所述待回复信息的上下文信息、所 述联系人的用户属性、以及所述信息回复模型生成回复信息,并将所述回复信息发送至所 述联系人,从而使得系统端利用社交媒体数据作为训练语料进行建模,从而扩大了语料采 集的范围,并降低了采集成本,同时,上下文信息作为信息回复模型训练参数,使得回复内 容更具有针对性,还有,引入用户属性模型作为上下文参数,可以将在社交媒体对不同对象 的回复风格、方式引入信息回复;同时,终端设备根据接收到的信息和已训练好的信息回复 模型自动生成回复内容,实现了具有用户语言偏好和风格的信息自动回复。
[0029] 图1为本发明实施例一提供的信息处理方法的流程图。如图所示,本实施例具体 包括以下步骤:
[0030] 步骤110,终端设备获取终端用户的用户标识,并将所述用户标识发送至系统设 备,使得系统设备接收到用户标识后,获取与该用户标识对应的社交媒体数据,抽取所述社 交媒体数据中的上下文信息,并对所述上下文信息进行聚类处理,所述聚类处理后得到用 户属性模型。其中,终端用户的用户标识是其在社交媒体上的用户标识,该用户标识为终端 用户在社交媒体上注册的标识信息。其中,社交媒体包括微博、博客和社交网络等。
[0031] 具体地,社交媒体(Social Media)指的是允许人们撰写、分享、评价、讨论、相互沟 通的网站和技术。在当今的网络时代,脸谱(facebook)、推特(twitter)、微博等新兴社交 媒体成为人们沟通的重要渠道。据统计,2012年,互联网用户超过20%的上网时间用于社 交媒体,而目前全球有超过10亿人在使用社交媒体,占网民人数的大约70%。超过6亿用 户每天使用社交媒体。因此,很多用户在社交媒体上留下了大量的社交媒体数据,并且这些 数据是公开的,从而使得花费很小的代价就能获取这些数据。终端设备将终端用户在社交 媒体上的用户标识发送至系统设备,目的是使得系统设备根据用户标识在社交媒体上获取 终端用户的社交媒体数据,并抽取这些社交媒体数据的上下文(context)信息,根据这些 社交媒体数据和抽取出的上下文信息建立用户属性模型和信息回复模型。
[0032] 其中,用户属性模型'如公式(1)所示。
[0033] u(m)-Vi 公式(1)
[0034] 在公式(1)中,m是上下文信息。
[0035] 信息回复模型yi如公式(2)所示。
[0036] f(m,t,1,e,u(m)) - yi 公式(2)
[0037] 在公式⑵中,m是上下文彳目息,t是时间类彳目息,1是地点类彳目息,e是事件类/[目 肩、。
[0038] 在本发明实施例中,使用用户属性模型Vi作为信息回复模型yi中的一个参数。用 户属性模型代表一类用户属性,如亲人、同事、亲密好友等,而用户模型在社交媒体数据和 信息数据中都可以进行学习,并可以进行替换。
[0039] 步骤120,终端设备接收所述系统设备发送的与所述终端用户相对应的用户属性 模型和信息回复模型,并根据所述用户属性模型确定所述终端用户的所有联系人的用户属 性。
[0040] 具体地,当终端设备接收到系统设备发送的用户属性模型即用户属性集合或者聚 类结果后,会为终端用户的通讯簿中的每一个联系人确定其用户属性。其确定过程具体为: 根据某一联系人的历史信息数据和每一个用户属性(可以用聚类的聚类中心)计算相似 度,以相似度最高的属性作为该联系人的用户属性,比如,将一个联系人的历史信息数据, 与亲人、同事、亲密好友等用户属性计算相似度,最后计算出相似度最高的用户属性为亲 人,则该联系人的用户属性为终端用户的亲人。
[0041] 步骤130,当终端设备接收到所述联系人发送的待回复信息时,抽取所述待回复信 息的上下文信息,并根据所述待回复信息的上下文信息、所述联系人的用户属性、以及所述 信息回复模型生成回复信息,并将所述回复信息发送至所述联系人。其中,待回复信息的上 下文信息包括时间类、地点类和事件类信息。
[0042] 具体地,在本发明实施例中引入了"上下文",该上下文包括时间、地点、事件、对话 人物属性等。当终端用于回复某个联系人发送的待回复信息时,在不同的上下文场景中,其 回复信息的表述会有很大的不同。比如,当回复信息为"很忙,现在没时间"这个意思,对于 联系人是客户时可能表述成"我现在有事,稍后会联系您",而对于联系人是好友时可能表 述成"忙死了,回头打给您哈",这里造成回复内容的表述不同的原因是对话人物属性不同 即联系人的用户属性不同。
[0043] 进一步地,步骤130中回复信息的生成不仅根据待回复信息的上下文信息、联系 人的用户属性、以及信息回复模型,还要参考联系人的历史信息。
[0044] 进一步地,步骤130之后还包括:将生成的回复信息进行语言修饰,并将所述语言 修饰后的信息发送至所述联系人。
[0045] 因此,本发明公开了一种信息处理方法,利用终端设备获取终端用户的用户标识, 并将所述用户标识发送至系统设备,接收所述系统设备发送的与所述终端用户相对应的用 户属性模型和信息回复模型,根据所述用户属性模型确定所述终端用户的所有联系人的用 户属性,当接收到所述联系人发送的待回复信息时,抽取所述待回复信息的上下文信息,并 根据所述待回复信息的上下文信息、所述联系人的用户属性、以及所述信息回复模型生成 回复信息,并将所述回复信息发送至所述联系人,从而使得终端设备根据接收到的信息和 已训练好的信息回复模型自动生成回复内容,实现了具有用户语言偏好和风格的信息自动 回复。
[0046] 图2为本发明实施例二提供的信息处理方法的流程图。如图所示,本实施例具体 包括以下步骤:
[0047] 步骤210,系统设备接收终端设备发送的终端用户的用户标识。其中,终端用户的 用户标识是终端用户在社交媒体上的用户标识,该用户标识包括微博、博客和社交网络。 [0048] 步骤220,系统设备获取与所述用户标识对应的社交媒体数据,抽取所述社交媒体 数据中的上下文信息,并对所述上下文进行聚类处理,所述聚类处理后得到用户属性模型。
[0049] 进一步地,步骤220中的上下文信息包括时间类、地点类、事件类和人物属性类信 息。步骤220具体为:系统设备抽取所述社交媒体数据中的时间类、地点类、事件类和人物 属性类信息,将所述人物属性类信息进行聚类并训练,所述训练后得到所述用户属性模型。
[0050] 具体地,系统设备在社交媒体上获取与所述用户标识对应的社交媒体数据,比如, 终端用户的回复信息。当获取到社交媒体数据后,抽取这些社交媒体数据中的上下文信息 即上下文关键词,其包括时间类、地点类、事件类和人物属性类信息,将上下文信息中的人 物属性类信息进行聚类并训练,所述训练后得到用户属性模型,该用户属性模型 Vi如公式 (1)所示。其中,人物属性类信息包括语气词、称呼、习惯用语等。另外,还要将抽取的上下 文信息和社交媒体数据写入数据库。
[0051] 其中,用户属性模型的建立方式一般为:系统设备对终端用户按照和终端用户的 用户属性相关的关键词进行聚类,比如,称呼、口头禅,训练得到用户模型,并将用户属性模 型分别存入数据库和发送给终端设备块。
[0052] 步骤230,系统设备对所述社交媒体数据、所述上下文信息和所述用户属性模型进 行训练,所述训练后得到信息回复模型;
[0053] 具体地,信息回复模型yi如公式(2)所示。
[0054] 步骤240,系统设备向所述终端设备发送所述用户属性模型和所述信息回复模型, 以使所述终端设备根据所述用户属性模型和所述信息回复模型对所述终端用户接收到的 待回复信息进行处理。
[0055] 另外,系统会周期性执行步骤220至步骤240,周期可以较长,比如,7天执行一次。 其目的是及时获取终端用户最新的社交媒体数据,并根据用户最新后社交媒体数据得到用 户属性模型和信息回复模型,并将重新得到的用户属性模型和信息回复模型发送给终端设 备,用以终端设备根据系统设备重新得到的用户属性模型和信息回复模型更新自身保存的 用户属性模型和信息回复模型。
[0056] 因此,本发明实施例提供的信息处理方法,系统设备接收终端设备发送的终端用 户的用户标识,获取与用户标识对应的社交媒体数据,抽取该社交媒体数据中的上下文信 息,并对抽取到的上下文信息进行聚类处理,其聚类处理后得到用户属性模型,以及对社交 媒体数据、上下文信息和用户属性模型进行训练,训练后得到信息回复模型,并向终端设备 发送用户属性模型和信息回复模型,以使终端设备根据用户属性模型和信息回复模型对终 端用户接收到的待回复信息进行处理,从而使得系统端利用社交媒体数据作为训练语料进 行建模,从而扩大了语料采集的范围,并降低了采集成本,同时,上下文信息作为信息回复 模型训练参数,使得回复内容更具有针对性,还有,引入用户属性模型作为上下文参数,可 以将在社交媒体对不同对象的回复风格、方式引入信息回复。
[0057] 图3为本发明实施例三提供的终端设备的示意图。该终端设备用于执行本发明实 施例一提供的信息处理方法。如图所示,本实施例具体包括:获取单元31、接收单元32和 信息处理单元33。
[0058] 获取单元31用于获取终端用户的用户标识,并将所述用户标识发送至系统设备, 使得所述系统设备获取与所述用户标识对应的社交媒体数据,抽取所述社交媒体数据中的 上下文信息,并对所述上下文信息进行聚类处理,所述聚类处理后得到用户属性模型;接收 单元32用于接收所述系统设备发送的与所述终端用户相对应的用户属性模型和信息回复 模型,并根据所述用户属性模型确定所述终端用户的所有联系人的用户属性,以及将所述 所有联系人的用户属性和所述信息回复模型传输给信息处理单元33 ;信息处理单元33用 于从所述接收单元32接收所述所有联系人的用户属性和所述信息回复模型,当接收到所 述联系人发送的待回复信息时,抽取所述待回复信息的上下文信息,并根据所述待回复信 息的上下文信息、所述联系人的用户属性、以及所述信息回复模型生成回复信息,并将所述 回复信息发送至所述联系人。
[0059] 其中,所述待回复信息的上下文信息包括时间类、地点类和事件类信息。
[0060] 进一步地,所述获取单元31还用于获取所述终端用户在社交媒体上的用户标识, 所述用户标识为所述终端用户在所述社交媒体上注册的标识信息。其中,社交媒体包括微 博、博客和社交网络等。
[0061] 进一步地,所述接收单元32还用于根据所述待回复信息的上下文信息、所述发信 人的用户属性、所述发信人的历史信息、以及所述信息回复模型生成回复信息。
[0062] 另外,本发明实施例提供的终端设备还包括:语言修饰单元34。
[0063] 语言修饰单元34用于将所述回复信息进行语言修饰,并将所述语言修饰后的信 息发送至所述联系人。
[0064] 因此,本发明公开了一种终端设备,通过获取终端用户的用户标识,并将所述用户 标识发送至系统设备,接收所述系统设备发送的与所述终端用户相对应的用户属性模型和 信息回复模型,根据所述用户属性模型确定所述终端用户的所有联系人的用户属性,当接 收到所述联系人发送的待回复信息时,抽取所述待回复信息的上下文信息,并根据所述待 回复信息的上下文信息、所述联系人的用户属性、以及所述信息回复模型生成回复信息,并 将所述回复信息发送至所述联系人,从而使得终端设备根据接收到的信息和已训练好的信 息回复模型自动生成回复内容,实现了具有用户语言偏好和风格的信息自动回复。
[0065]图4为本发明实施例四提供的系统设备的示意图。该系统设备用于执行本发明实 施例二提供的信息处理方法。如图所示,本实施例具体包括:接收单元41、用户属性模型生 成单元42、信息回复模型生成单元43和发送单元44。
[0066] 接收单元41用于接收终端设备发送的终端用户的用户标识,以及将所述用户标 识传输给用户属性模型生成单元42 ;用户属性模型生成单元42用于从所述接收单元41 接收所述用户标识,获取与所述用户标识对应的社交媒体数据,抽取所述社交媒体数据中 的上下文信息,并对所述上下文信息进行聚类处理,所述聚类处理后得到用户属性模型,及 将所述社交媒体数据、所述上下文信息和所述用户属性模型传输给信息回复模型生成单元 43,以及将所述用户属性模型传输给发送单元44 ;信息回复模型生成单元43用于从所述用 户属性模型生成单元42接收所述社交媒体数据、所述上下文信息和所述用户属性模型,对 所述社交媒体数据、所述上下文信息和所述用户属性模型进行训练,所述训练后得到信息 回复模型,以及将所述信息回复模型传输给发送单元44 ;发送单元44用于从所述用户属性 模型生成单元42接收所述用户属性模型,从所述信息回复模型生成单元43接收所述信息 回复模型,向所述终端设备发送所述用户属性模型和所述信息回复模型,以使所述终端设 备根据所述用户属性模型和所述信息回复模型对所述终端用户接收到的待回复信息进行 处理。其中,所述上下文信息包括时间类、地点类、事件类和人物属性类信息。
[0067] 进一步地,所述接收单元41还用于接收所述终端设备在社交媒体上的用户标识, 所述用户标识为所述终端用户在所述社交媒体上注册的标识信息。其中,社交媒体包括微 博、博客和社交网络等。
[0068] 进一步地,所述用户属性模型生成单元42还用于抽取所述社交媒体数据中的时 间类、地点类、事件类和人物属性类信息,将所述人物属性类信息进行聚类并训练,所述训 练后得到所述用户属性模型。
[0069] 因此,本发明实施例提供的系统设备,通过接收终端设备发送的终端用户的用户 标识,获取与所述用户标识对应的社交媒体数据,抽取所述社交媒体数据中的上下文信息, 并对所述上下文信息进行聚类处理,所述聚类处理后得到用户属性模型,以及对所述社交 媒体数据、所述上下文信息和所述用户属性模型进行训练,所述训练后得到信息回复模型, 并向所述终端设备发送所述用户属性模型和所述信息回复模型,以使所述终端设备根据所 述用户属性模型和所述信息回复模型对所述终端用户接收到的待回复信息进行处理,从而 使得系统端利用社交媒体数据作为训练语料进行建模,从而扩大了语料采集的范围,并降 低了采集成本,同时,上下文信息作为信息回复模型训练参数,使得回复内容更具有针对 性,还有,引入用户属性模型作为上下文参数,可以将在社交媒体对不同对象的回复风格、 方式引入信息回复。
[0070] 图5为本发明实施例五提供的终端设备的示意图。该终端设备用于执行本发明实 施例一提供的信息处理方法。如图所示,本发明实施例包括:设备端口 51、处理器52和存 储器53。设备总线54用于连接设备端口 51、处理器52和存储器53。
[0071] 设备端口 51用于与系统设备相连接。
[0072] 存储器53可以是永久存储器,例如硬盘驱动器和闪存,存储器53中具有软件模块 和设备驱动程序。软件模块能够执行本发明上述方法的各种功能模块;设备驱动程序可以 是网络和接口驱动程序。
[0073] 在启动时,这些软件组件被加载到存储器53中,然后被处理器52访问并执行如图 1所示的方法。
[0074] 图6为本发明实施例六提供的系统设备的示意图。该系统设备用于执行本发明实 施例二提供的信息处理方法。如图所示,本发明实施例包括:设备端口 61、处理器62和存 储器63。设备总线64用于连接设备端口 61、处理器62和存储器63。
[0075] 设备端口 61用于与终端设备相连接。
[0076] 存储器63可以是永久存储器,例如硬盘驱动器和闪存,存储器63中具有软件模块 和设备驱动程序。软件模块能够执行本发明上述方法的各种功能模块;设备驱动程序可以 是网络和接口驱动程序。
[0077] 在启动时,这些软件组件被加载到存储器63中,然后被处理器62访问并执行如图 2所示的方法。
[0078] 图7为本发明实施例七提供的信息处理系统的示意图。如图所示,本实施例具体 包括:本发明实施例三提供的终端设备71和本发明实施例四提供的系统设备72,或者本发 明实施例五提供的终端设备71和本发明实施例六提供的系统设备72。
[0079] 专业人员应该还可以进一步意识到,结合本文中所公开的实施例描述的各示例的 单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬 件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。 这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。 专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现 不应认为超出本发明的范围。
[0080] 结合本文中所公开的实施例描述的方法或算法的步骤可以用硬件、处理器执行的 软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器 (ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或【技术领域】 内所公知的任意其它形式的存储介质中。
[0081] 以上所述的【具体实施方式】,对本发明的目的、技术方案和有益效果进行了进一步 详细说明,所应理解的是,以上所述仅为本发明的【具体实施方式】而已,并不用于限定本发明 的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含 在本发明的保护范围之内。
【权利要求】
1. 一种信息处理方法,其特征在于,所述方法包括: 终端设备获取终端用户的用户标识,并将所述用户标识发送至系统设备,使得所述系 统设备获取与所述用户标识对应的社交媒体数据,抽取所述社交媒体数据中的上下文信 息,并对所述上下文信息进行聚类处理,所述聚类处理后得到用户属性模型; 所述终端设备从所述系统设备接收所述终端用户的所述用户属性模型和信息回复模 型,并根据所述用户属性模型确定所述终端用户的所有联系人的用户属性; 当接收到所述联系人发送的待回复信息时,抽取所述待回复信息的上下文信息,并根 据所述待回复信息的上下文信息、所述联系人的用户属性、以及所述信息回复模型生成回 复信息,并将所述回复信息发送至所述联系人。
2. 根据权利要求1所述的信息处理方法,其特征在于,所述获取终端用户的用户标识 具体为: 获取所述终端用户在社交媒体上的用户标识,所述用户标识为所述终端用户在所述社 交媒体上注册的标识信息。
3. 根据权利要求1或2所述的信息处理方法,其特征在于,所述根据所述待回复信息的 上下文信息、所述联系人的用户属性、以及所述信息回复模型生成回复信息具体为: 根据所述待回复信息的上下文信息、所述联系人的用户属性、所述联系人的历史信息、 以及所述信息回复模型生成回复信息。
4. 根据权利要求1至3任一项所述的信息处理方法,其特征在于,所述根据所述待回复 信息的上下文信息、所述联系人的用户属性、以及所述信息回复模型生成回复信息之后,还 包括: 将所述回复信息进行语言修饰,并将所述语言修饰后的信息发送至所述联系人。
5. 根据权利要求1至4任一项所述的信息处理方法,其特征在于,所述待回复信息的上 下文信息包括时间类、地点类和事件类信息。
6. -种信息处理方法,其特征在于,所述方法包括: 系统设备接收终端设备发送的终端用户的用户标识; 获取与所述用户标识对应的社交媒体数据,抽取所述社交媒体数据中的上下文信息, 并对所述上下文信息进行聚类处理,所述聚类处理后得到用户属性模型; 对所述社交媒体数据、所述上下文信息和所述用户属性模型进行训练,所述训练后得 到信息回复模型; 向所述终端设备发送所述用户属性模型和所述信息回复模型,以使所述终端设备根据 所述用户属性模型和所述信息回复模型对所述终端用户接收到的待回复信息进行处理。
7. 根据权利要求6所述的信息处理方法,其特征在于,所述接收终端设备发送的终端 用户的用户名信息具体为: 接收所述终端设备在社交媒体上的用户标识,所述用户标识为所述终端用户在所述社 交媒体上注册的标识信息。
8. 根据权利要求6或7所述的信息处理方法,其特征在于,所述上下文信息包括时间 类、地点类、事件类和人物属性类信息,所述抽取所述社交媒体数据中的上下文信息,并对 所述上下文进行聚类处理,所述聚类处理后得到用户属性模型具体为: 抽取所述社交媒体数据中的时间类、地点类、事件类和人物属性类信息,将所述人物属 性类信息进行聚类并训练,所述训练后得到所述用户属性模型。
9. 一种终端设备,其特征在于,所述设备包括: 获取单元,用于获取终端用户的用户标识,并将所述用户标识发送至系统设备,使得所 述系统设备获取与所述用户标识对应的社交媒体数据,抽取所述社交媒体数据中的上下文 信息,并对所述上下文信息进行聚类处理,所述聚类处理后得到用户属性模型; 接收单元,用于接收所述系统设备发送的与所述终端用户相对应的所述用户属性模型 和信息回复模型,并根据所述用户属性模型确定所述终端用户的所有联系人的用户属性, 以及将所述所有联系人的用户属性和所述信息回复模型传输给信息处理单元; 信息处理单元,用于从所述接收单元接收所述所有联系人的用户属性和所述信息回复 模型,当接收到所述联系人发送的待回复信息时,抽取所述待回复信息的上下文信息,并根 据所述待回复信息的上下文信息、所述联系人的用户属性、以及所述信息回复模型生成回 复信息,并将所述回复信息发送至所述联系人。
10. 根据权利要求9所述的终端设备,其特征在于,所述获取单元还用于获取所述终端 用户在社交媒体上的用户标识,所述用户标识为所述终端用户在所述社交媒体上注册的标 识息。
11. 根据权利要求9或10所述的终端设备,其特征在于,所述接收单元还用于根据所述 待回复信息的上下文信息、所述联系人的用户属性、所述联系人的历史信息、以及所述信息 回复模型生成回复信息。
12. 根据权利要求9至11任一项所述的终端设备,其特征在于,所述设备还包括: 语言修饰单元,用于将所述回复信息进行语言修饰,并将所述语言修饰后的信息发送 至所述联系人。
13. 根据权利要求9至12任一项所述的终端设备,其特征在于,所述待回复信息的上下 文信息包括时间类、地点类和事件类信息。
14. 一种系统设备,其特征在于,所述设备包括: 接收单元,用于接收终端设备发送的终端用户的用户标识,以及将所述用户标识传输 给用户属性模型生成单元; 用户属性模型生成单元,用于从所述接收单元接收所述用户标识,获取与所述用户标 识对应的社交媒体数据,抽取所述社交媒体数据中的上下文信息,并对所述上下文信息进 行聚类处理,所述聚类处理后得到用户属性模型,及将所述社交媒体数据、所述上下文信息 和所述用户属性模型传输给信息回复模型生成单元,以及将所述用户属性模型传输给发送 单元; 信息回复模型生成单元,用于从所述用户属性模型生成单元接收所述社交媒体数据、 所述上下文信息和所述用户属性模型,对所述社交媒体数据、所述上下文信息和所述用户 属性模型进行训练,所述训练后得到信息回复模型,以及将所述信息回复模型传输给发送 单元; 发送单元,用于从所述用户属性模型生成单元接收所述用户属性模型,从所述信息回 复模型生成单元接收所述信息回复模型,向所述终端设备发送所述用户属性模型和所述信 息回复模型,以使所述终端设备根据所述用户属性模型和所述信息回复模型对所述终端用 户接收到的待回复信息进行处理。
15. 根据权利要求14所述的系统设备,其特征在于,所述接收单元还用于接收所述终 端设备在社交媒体上的用户标识,所述用户标识为所述终端用户在所述社交媒体上注册的 标识信息。
16. 根据权利要求14或15所述的系统设备,其特征在于,所述上下文信息包括时间类、 地点类、事件类和人物属性类信息,所述用户属性模型生成单元还用于抽取所述社交媒体 数据中的时间类、地点类、事件类和人物属性类信息,将所述人物属性类信息进行聚类并训 练,所述训练后得到所述用户属性模型。
17. -种信息处理系统,其特征在于,所述系统包括:根据权利要求9至13任一项所述 的终端设备和根据权利要求14至16任一项所述的系统设备。
【文档编号】H04W88/02GK104144392SQ201310166626
【公开日】2014年11月12日 申请日期:2013年5月8日 优先权日:2013年5月8日
【发明者】李华飞, 张轶博 申请人:华为技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1