文本信息的生成方法、装置、计算机设备及存储介质与流程

文档序号:15981747发布日期:2018-11-17 00:24阅读:141来源:国知局

本申请涉及计算机技术领域,尤其涉及一种文本信息的生成方法、装置、计算机设备及存储介质。

背景技术

在很多场合下,例如,在银行和保险行业,为了了解用户的特点并与用户进行更好的交谈和互动,目前在一些系统中出现了根据用户的身份、年龄和国家等信息生成的用户的文本信息。但是这些文本信息反映的用户的信息有限,不能较好地描述用户的特点。



技术实现要素:

本申请的目的是提供一种文本信息的生成方法、装置、计算机设备及存储介质,用于生成更好地体现用户人格特点的文本信息。

为实现上述目的,本申请提供一种文本信息的生成方法,包括以下内容:获取用户的社交文本信息;根据所述社交文本信息获取所述用户的性格特征词以及所述性格特征词的词频;将所述用户的性格特征词以及所述性格特征词的词频输入到预先设置的基于神经网络的预测分析系统,得到所述用户的人格特征向量;获取初始特征字词;将所述用户的人格特征向量和所述初始特征字词输入到预先设置的人格化生成模型,生成与所述用户匹配的人格特征文本信息。

在一种可能的实现方式中,上述方法还包括:获取初始特征字词。

上述将用户的人格特征向量输入到预先设置的人格化生成模型,生成与用户匹配的人格特征文本信息,具体包括:

将用户的人格特征向量和初始特征字词输入到预先设置的人格化生成模型,生成与用户匹配的人格特征文本信息。

在一种可能的实现方式中,上述社交文本信息包括用户的社交消息和用户的身份信息中的至少一种。

在一种可能的实现方式中,上述根据社交文本信息获取所述用户的性格特征词以及性格特征词的词频,包括:采用分词技术对社交文本信息进行分词处理,得到分词处理后的词组;根据分词处理后的词组以及预设的心理学词库进行匹配,得到所述用户的性格特征词以及性格特征词的词频。

在一种可能的实现方式中,将用户的性格特征词以及所述性格特征词的词频输入到预先设置的基于神经网络的预测分析系统,得到用户的人格特征向量,包括:

将用户的性格特征词以及性格特征词的词频输入到预先设置的基于神经网络的预测分析系统,得到用户的人格化分析值;

根据用户的人格化分析值得到用户的人格特征向量。

在一种可能的实现方式中,上述人格化分析值为0-1之间或者0-100之间的数值。

在一种可能的实现方式中,人格化的文本生成模型为一种记忆序列模型,记忆序列模型包括多个记忆单元,多个记忆单元用于输出多个文本词,多个记忆单元中的前一个记忆单元输出的文本词为下一个记忆单元的输入。

在一种可能的实现方式中,上述与用户匹配的人格特征文本信息包括用户的人格分析信息。

在一种可能的实现方式中,上述与用户匹配的人格特征文本信息还包括与用户的人格分析信息相匹配的交谈策略信息。

为实现上述目的,本申请还提供一种文本信息的生成装置,该装置具体包括:

获取模块,用于获取用户的社交文本信息;

获取模块还用于根据社交文本信息获取用户的性格特征词以及性格特征词的词频;

生成模块,用于将用户的性格特征词以及性格特征词的词频输入到预先设置的基于神经网络的预测分析系统,得到与用户匹配的人格特征文本信息;

上述获取模块还用于获取初始特征字词;

生成模块还用于将用户的人格特征向量和初始特征字词输入到预先设置的人格化生成模型,生成与用户匹配的人格特征文本信息。

为实现上述目的,本申请还提供一种计算机设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。

为实现上述目的,本申请还提供计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述方法的步骤。

为实现上述目的,本申请还提出了一种文本信息的生成系统,该文本信息的生成信息包括:

文本信息获取模块,用于获取用户的社交文本信息;

确定模块,用于将用户的性格特征词和/或性格相关的文本信息输入基于神经网络技术的预测分析系统中进行计算分析,确定用户的人格特征;

上述用户的人格特征具体可以是用户的人格特征向量;

生成模块,用于将确定模块中确定的人格特征作为输入,构建人格化文本生成,并以此来生成用户人格化文本信息;

输出模块,用于将生成模块生成的用户人格文本信息进行输出。

上述用户社交文本信息往往包含大量用户性格特征的关键词,可以通过用户的社交文本信息和/或用户的历史交谈记录信息等来确定用户的性格特征关键词。例如,通过用户的某一段时间区间的社交文本信息,经过分析来获取用户性格特征关键词。

上述用户人格化文本信息具体可以是与用户的人格特征匹配的文本信息。

本申请提供的文本信息的生成方法、装置、系统、计算机设备及存储介质,通过根据社交文本信息获取用户的性格特征词以及该性格特征词的词频,并结合预先设置的预测分析系统和人格生成模型,能够生成更好地体现用户人格特点的文本信息。

附图说明

图1为本申请实施例的文本信息的生成方法的示意性流程图;

图2为本申请实施例的记忆序列生成模型的示意图;

图3为本申请实施例的文本信息的生成装置的示意性框图;

图4是本申请实施例的计算机设备的示意性框图;

图5是本申请实施例的文本信息的生成系统的示意性框图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

本申请提供的文本信息的生成方法、装置、计算机设备及存储介质,适用于保险、银行以及其它需要识别用户人格特征的领域。本申请通过获取用户的社交文本信息,并根据该社交文本信息中获取能够描述该用户性格特征的性格特征词以及词频,接下来,再通过基于神经网络的预测分析系统和人格化生成模型,对用户的特征词以及特征词的词频进行分析,从而得到与用户人格特征相匹配,并且能够更好地反应用户人格特征的文本信息。

下面结合图1和图2对本申请实施例的文本信息的生成方法进行详细的描述。

图1示出了本申请实施例的文本信息的生成方法。图1所示的方法可以由计算机设备执行,或者由其它具有运算功能的设备来执行。图1所示的方法包括步骤101至步骤104,下面分别对步骤101至步骤104进行详细的描述和介绍。

101、获取用户的社交文本信息。

上述社交文本信息可以包括用户的社交消息和用户的身份信息中的至少一种。

具体地,上述社交消息可以是用户注册的社交账号,用户在社交媒体上发布的消息,转发或者关注的信息,好友信息,聊天信息或者交谈信息等。

用户的身份信息包括用户的身份证号码、手机号、邮箱、年龄、性别、工作和学历等。

上述用户的身份信息具体可以是某一具体网络数据库中的文本信息,例如,某公司经过长时间积累在网络数据(云存储、云数据)平台上的数据。对于互联网中的文本信息,为了获取用户的文本信息,可以采用网络爬虫技术从互联网中的文本信息或者网络平台上的文本信息中抓取用户的文本信息,而对于网络数据平台上的数据,可以采用大数据分析的方法来获取用户的文本信息,具体的大数据分析方法可以包括spark技术、hadoop技术等。

102、根据社交文本信息获取用户的性格特征词以及性格特征词的词频。

上述用户的性格特征词也可以称为用户的心理学特征词或者关键心理特征词,该性格特征词能够反映出一个用户的性格特点或者类型,并且经过进一步的分析之后可以得到能够较好或者较为全面地反映用户性格特征的文本信息。

可选地,根据社交文本信息获取用户的性格特征词以及性格特征词的词频,具体包括:

通过分词技术对用户的文本信息进行分词处理,得到分词处理后的词组;

将分词处理后的词组与预先建立的心理学词库进行匹配,确定用户文本信息中性格特征词以及该性格特征词出现的词频。

例如,获取的社交文本信息为“今天太阳太好了,我的心情非常高兴,在高兴之余还很兴奋”,通过将该社交文本信息与心理学词库进行匹配,可以得到用户的性格特征词为高兴和兴奋,其中,高兴的词频为2,兴奋的词频为1。

103、将用户的性格特征词以及性格特征词的词频输入到预先设置的基于神经网络的预测分析系统,得到用户的人格特征向量。

应理解,上述基于神经网络的预测分析系统可以是预先通过训练得到的。具体地,可以通过大量的历史数据(该历史数据可以是用户的性格特征词以及性格特征词的词频,以及对应的人格特征向量)来训练该基于神经网络的预测分析系统,使得用户的人格特征向量能够较为准确和真实地反映用户的性格特征。

具体地,将用户的性格特征词以及性格特征词的词频输入到预先设置的基于神经网络的预测分析系统,得到用户的人格特征向量,具体包括:

将用户的性格特征词以及性格特征词的词频输入到预先设置的基于神经网络的预测分析系统,得到用户的人格化分析值;

根据用户的人格化分析值得到用户的人格特征向量。

在确定用户的人格化分析值时,具体可以根据用户的性格特征词确定用户在心理学五大人格分类中各种人格的分析值,该数值可以具体为0-100之间的数值,也可以为0-1之间的数值。

具体地,可以通过卷积神经网络将用户的人格特征词以及词频按照心理学人格分类进行匹配度分析,从而确定用户在各个人格分类中的分析值。例如,通过卷积神经网络对获取的用户心理特征词和词频进行分析,确定用户的开放性维度的值为a1=60,责任心维度的值为a2=50,外倾性维度的值为a3=70,宜人性维度的值为a4=80,神经质维度的值为a5=75。接下来,再根据用户在各个人格分析分类中的分析值就可以得到人格特征向量[a1,a2,a3,a4,a5]。

104、将用户的人格特征向量输入到预先设置的人格化生成模型,生成与用户匹配的人格特征文本信息。

可选地,在获取与用户匹配的人格特征文本信息之前,还可以获取初始特征字词。

在获取了初始特征字词之后,可以将用户的人格特征向量以及初始特征字词输入到预先设置的人格化生成模型,从而得到与用户匹配的人格特征文本信息。

可选地,上述与用户匹配的人格特征文本信息具体可以包括用户的人格分析,进一步地,上述文本信息还可以包括针对这种人格特征的交谈策略等信息。

上述人格化的文本生成模型为一种记忆序列模型(也可以称为记忆序列生成模型),该记忆序列模型包括多个记忆单元,多个记忆单元用于输出多个文本词,多个记忆单元中的前一个记忆单元输出的文本词为下一个记忆单元的输入。

本申请中,通过获取用户的社交文本信息,并根据该社交文本信息获取能够描述该用户性格特征的性格特征词以及词频,接下来,再通过基于神经网络的预测分析系统和人格化生成模型,对用户的特征词以及特征词的词频进行分析,从而得到与用户人格特征相匹配,并且能够更好地反应用户人格特征的文本信息。

图2示出了本申请实施例的记忆序列生成模型的示意图。该以及序列生成模型由第一记忆子单元、第二记忆子单元、第三记忆子单元以及第n记忆子单元等n个记忆子单元组成,其中,n为大于1的整数。第一记忆子单元的输出作为第二子单元的输入,也就是说,在图2所示的记忆序列生成模型中,第i(i为大于0小于或者等于n的整数)记忆子单元的输出作为第i+1记忆子单元的输入。

具体地,如图2所示,人格特征向量[0,1,0,1,0]与初始特征字词“我”作为模型输入,经过第一记忆子单元的计算,输出“今天”;接下来,将人格特征向量[0,1,0,1,0]以及第一记忆子单元的输出的“今天”作为第二记忆子单元的输入,输出“心情”;接下来,再按照类似的方式将人格特征向量[0,1,0,1,0]以及第二记忆子单元的输出的“很”作为第三记忆子单元的输入,输出“很”,以此类推,直到通过图2所示的记忆序列生成模型得到一段完整的文本信息为止。

应理解,上述人格化文本生成模型可以是预先通过训练得到的。

具体地,可以通过大量的历史数据(该历史数据可以是用户的人格特征向量以及与该人格特征向量对应的文本信息)来训练人格化文本生成模型,使得最终得到的文本信息能够较为准确和真实地反映用户的性格特征。

上文结合图1和图2对本申请实施例的文本信息的生成方法进行了详细的描述,下面结合图3对本申请实施例的文本信息的生成装置进行描述,应理解,图3中的装置能够执行上文中图1和图2中所涉及的本申请实施例的文本信息的生成方法的各个步骤,也就是说,图3所示的装置包括能够执行本申请实施例的文本信息的生成方法的各个模块,为了简洁,下面在对图3对本申请实施例的文本信息的生成装置进行描述时适当省略重复的内容。

图3为本申请实施例的文本信息的生成装置的示意性框图。图3所示的装置包括:

获取模块201(也可以称为文本信息获取模块),用于获取用户的社交文本信息;

获取模块201还用于根据社交文本信息获取用户的性格特征词以及性格特征词的词频;

生成模块202,用于将用户的性格特征词以及性格特征词的词频输入到预先设置的基于神经网络的预测分析系统,得到用户的人格特征向量;

生成模块202还用于将用户的人格特征向量和初始特征字词输入到预先设置的人格化生成模型,生成与用户匹配的人格特征文本信息。

本申请实施例的文本信息的生成装置通过根据社交文本信息获取用户的性格特征词以及该性格特征词的词频,并结合预先设置的预测分析系统和人格生成模型,能够生成更好地体现用户人格特点的文本信息。

应理解,图3所示的装置200具体可以是计算机设备,或者其它具有运算功能的设备,装置200中的各个模块可以由硬件来实现,也可以由软件来实现,例如,装置200中的模块可以通过硬件电路,现场可编程门阵列等实现,也可以基于软件来实现,或者,装置200中的部分模块通过硬件电路实现,部分模块通过软件来实现。

本申请实施例还提供一种计算机设备,如可以执行程序的智能手机、平板电脑、笔记本电脑、台式计算机、机架式服务器、刀片式服务器、塔式服务器或机柜式服务器(包括独立的服务器,或者多个服务器所组成的服务器集群)等。

如图4所示,本申请实施例的计算机设备300至少包括但不限于:可通过系统总线相互通信连接的存储器301、处理器302。需要指出的是,图4仅示出了具有组件301-302的计算机设备300,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。

应理解,图4所示的计算机设备300也可以执行本申请实施例的文本信息的生成方法,并且,计算机设备300中的处理器302可以相当于文本信息的生成装置200中的获取模块201和生成模块202,处理器302能够实现文本信息的生成装置200中的三个模块执行的功能。

本实施例中,存储器301(即可读存储介质)包括闪存、硬盘、多媒体卡、卡型存储器(例如,sd或dx存储器等)、随机访问存储器(ram)、静态随机访问存储器(sram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、可编程只读存储器(prom)、磁性存储器、磁盘、光盘等。在一些实施例中,存储器301可以是计算机设备300的内部存储单元,例如该计算机设备300的硬盘或内存。在另一些实施例中,存储器301也可以是计算机设备300的外部存储设备,例如该计算机设备300上配备的插接式硬盘,智能存储卡(smartmediacard,smc),安全数字(securedigital,sd)卡,闪存卡(flashcard)等。当然,存储器301还可以既包括计算机设备300的内部存储单元也包括其外部存储设备。本实施例中,存储器301通常用于存储安装于计算机设备300的操作系统和各类应用软件,例如图2所示的文本信息的生成装置200的程序代码等。此外,存储器301还可以用于暂时地存储已经输出或者将要输出的各类数据。

处理器302在一些实施例中可以是中央处理器(centralprocessingunit,cpu)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器302通常用于控制计算机设备300的总体操作。本实施例中,处理器302用于运行存储器301中存储的程序代码或者处理数据,例如运行坐席任务管理装置10,以实现实施例一的文本信息的生成方法。

图5是本申请实施例的文本信息的生成系统的示意性框图。图5所示的文本信息的生成系统可以由上文中的文本信息的生成装置200或者计算机设备300组成,该文本系统也可以执行本申请实施例的文本信息的生成方法中的各个步骤。下面对图5所示的文本信息的生成系统进行描述。

如图5所示,文本信息的生成系统400包括:文本信息获取模块401,确定模块402、生成模块403和输出模块404。

其中,文本信息获取模块401用于获取用户的社交文本信息。

用户社交文本信息往往包含大量用户性格特征的关键词,可以通过用户的社交文本信息和/或用户的历史交谈记录信息等来确定用户的性格特征关键词。例如,通过用户的某一段时间区间的社交文本信息,经过分析来获取用户性格特征关键词。

确定模块402用于将用户的性格特征词和/或性格相关的文本信息输入基于神经网络技术的预测分析系统中进行计算分析,确定用户的人格特征。

上述用户的人格特征具体可以是用户的人格特征向量。

生成模块403用于将确定模块中确定的人格特征作为输入,构建人格化文本生成,并以此来生成用户人格化文本信息。

上述用户人格化文本信息具体可以是与用户的人格特征匹配的文本信息。

输出模块404用于将生成模块生成的用户人格文本信息进行输出。

其中,文本信息获取模块401相当于文本信息的生成装置200中的获取模块201,确定模块402相当于文本信息的生成装置200中的获取模块201,生成模块403相当于文本信息的生成装置200中的获取模块201。与文本信息的生成装置200相比,该文本信息的生成系统400多出一个输出模块404,该输出模块404可以将用户的人格文本信息输出,便于进一步的分析或者使用。

文本信息的生成系统400中的文本信息获取模块401,确定模块402、生成模块403相当于计算机设备300中的处理器302,用于生成用户人格化文本信息。

另外,文本信息的生成系统400可以由一个设备组成,也可以由多个设备组成。

本实施例还提供一种计算机可读存储介质,如闪存、硬盘、多媒体卡、卡型存储器(例如,sd或dx存储器等)、随机访问存储器(ram)、静态随机访问存储器(sram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、可编程只读存储器(prom)、磁性存储器、磁盘、光盘、服务器、app应用商城等等,其上存储有计算机程序,程序被处理器执行时实现相应功能。本实施例的计算机可读存储介质用于存储坐席任务管理装置10,被处理器执行时实现实施例一的文本信息的生成方法。

本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。

所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

在本申请所提供的实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(read-onlymemory,rom)、随机存取存储器(randomaccessmemory,ram)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1