用户画像的构建方法、装置、计算机设备和存储介质与流程

文档序号:19156117发布日期:2019-11-16 00:48阅读:156来源:国知局
用户画像的构建方法、装置、计算机设备和存储介质与流程

本申请涉及信息处理技术领域,特别是涉及一种用户画像的构建方法、装置、计算机设备和存储介质。



背景技术:

用户画像是一种勾画目标用户、联系用户诉求与设计方向的有效工具,用户画像广泛应用于各个领域。例如,电话销售的对话中蕴含大量有价值的信息,根据销售对话构建用户画像,可以帮助销售人员根据用户画像进行二次销售,为目标用户精准推荐产品。

目前,构建用户画像的方式通常是采用关键词识别技术。例如,客户表明想买电动车,识别到其中的关键词为“电动车”,则根据关键词“电动车”构建用户画像。

但是,仅从销售对话中识别关键词,构建用户画像的信息较少,不利于销售人员根据用户画像为目标用户精准推荐产品。



技术实现要素:

基于此,有必要针对上述技术问题,提供一种能够提供更多用户画像信息,更好地帮助销售人员推荐产品的用户画像的构建方法、装置、计算机设备和存储介质。

第一方面,本发明实施例提供了一种用户画像的构建方法,该方法包括:

获取服务文本数据以及服务文本数据对应的目标用户标识和目标业务类型;

根据目标业务类型对服务文本数据进行关键词识别;

若在服务文本数据中未识别到预设的关键词,则根据目标业务类型对服务文本数据进行语义识别和实体识别,得到目标语义标签和目标文本实体;

根据目标用户标识、目标语义标签和目标文本实体构建用户画像。

在其中一个实施例中,服务文本数据包括多个子服务文本数据;

上述根据目标业务类型对服务文本数据进行语义识别和实体识别,得到目标语义标签和目标文本实体,包括:

分别对各子服务文本数据进行语义识别和实体识别,得到各子服务文本数据的目标语义标签和目标文本实体;

上述根据目标用户标识、目标语义标签和目标文本实体构建用户画像,包括:

分别建立各子服务文本数据的目标语义标签和目标文本实体之间的关联关系;

将多个关联关系与目标用户标识对应存储,构建用户画像。

在其中一个实施例中,上述根据目标业务类型对服务文本数据进行语义识别和实体识别,包括:

根据预设的业务类型与识别模型之间的对应关系,从多个语义识别模型中选取目标业务类型对应的目标语义识别模型,以及从多个实体识别模型中选取目标业务类型对应的目标实体识别模型;

采用目标语义识别模型对服务文本数据进行语义识别,得到目标语义标签;其中,语义标签用于指示关注信息的类别;

采用目标实体识别模型对服务文本数据进行实体识别,得到目标文本实体;其中,文本实体用于指示关注信息。

在其中一个实施例中,在获取服务文本数据以及服务文本数据对应的目标用户标识和目标业务类型之前,该方法还包括:

获取服务过程中的语音数据;

将语音数据转换为服务文本数据。

在其中一个实施例中,上述获取服务文本数据对应的目标用户标识,包括:

接收输入的目标用户标识;或,

从语音数据和/或服务文本数据中识别出目标用户标识。

在其中一个实施例中,上述获取服务文本数据对应的目标业务类型,包括:

获取业务类型的选取指令,选取指令包括业务类型标识;

根据业务类型标识确定目标业务类型。

在其中一个实施例中,该方法还包括:

若在服务文本数据中识别出预设的关键词,则根据预设的关键词与关键词标签之间的对应关系,确定服务文本数据对应的关键词标签;

将关键词标签与目标用户标识对应存储,构建用户画像。

第二方面,本发明实施例提供了一种用户画像的构建装置,该装置包括:

文本数据获取模块,用于获取服务文本数据以及服务文本数据对应的目标用户标识和目标业务类型;

关键词识别模块,用于根据目标业务类型对服务文本数据进行关键词识别;

语义和实体识别模块,用于若在服务文本数据中未识别到预设的关键词,则根据目标业务类型对服务文本数据进行语义识别和实体识别,得到目标语义标签和目标文本实体;

第一用户画像构建模块,用于根据目标用户标识、目标语义标签和目标文本实体构建用户画像。

在其中一个实施例中,服务文本数据包括多个子服务文本数据;

语义和实体识别模块,具体用于分别对各子服务文本数据进行语义识别和实体识别,得到各子服务文本数据的目标语义标签和目标文本实体;

第一用户画像构建模块,具体用于分别建立各子服务文本数据的目标语义标签和目标文本实体之间的关联关系;将多个关联关系与目标用户标识对应存储,构建用户画像。

在其中一个实施例中,语义和实体识别模块包括:

模型选取子模块,用于根据预设的业务类型与识别模型之间的对应关系,从多个语义识别模型中选取目标业务类型对应的目标语义识别模型,以及从多个实体识别模型中选取目标业务类型对应的目标实体识别模型;

语义识别子模块,用于采用目标语义识别模型对服务文本数据进行语义识别,得到目标语义标签;其中,语义标签用于指示关注信息的类别;

实体识别子模块,用于采用目标实体识别模型对服务文本数据进行实体识别,得到目标文本实体;其中,文本实体用于指示关注信息。

在其中一个实施例中,该装置还包括:

语音数据获取模块,用于获取服务过程中的语音数据;

文本转换模块,用于将语音数据转换为服务文本数据。

在其中一个实施例中,上述文本数据获取模块包括:

目标用户标识接收子模块,用于接收输入的目标用户标识;

目标用户标识识别子模块,用于从语音数据和/或服务文本数据中识别出目标用户标识。

在其中一个实施例中,上述文本数据获取模块包括:

选取指令获取子模块,用于获取业务类型的选取指令,选取指令包括业务类型标识;

目标业务类型确定子模块,用于根据业务类型标识确定目标业务类型。

在其中一个实施例中,该装置还包括:

关键词标签确定模块,用于若在服务文本数据中识别出预设的关键词,则根据预设的关键词与关键词标签之间的对应关系,确定服务文本数据对应的关键词标签;

第二用户画像构建模块,用于将关键词标签与目标用户标识对应存储,构建用户画像。

第三方面,本发明实施例提供了一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,处理器执行该计算机程序时实现如上述方法的步骤。

第四方面,本发明实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述方法的步骤。

上述用户画像的构建方法、装置、计算机设备和存储介质,获取服务文本数据以及服务文本数据对应的目标用户标识和目标业务类型;根据目标业务类型对服务文本数据进行关键词识别;若在服务文本数据中未识别到预设的关键词,则根据目标业务类型对服务文本数据进行语义识别和实体识别,得到目标语义标签和目标文本实体;根据目标用户标识、目标语义标签和目标文本实体构建用户画像。通过本发明实施例,在构建用户画像时,除了进行关键词识别之外,还进行语义识别和实体识别,从而得到目标语义标签和目标文本实体,根据目标语义标签和目标文本实体构建用户画像,使构建用户画像的维度更广,构建的用户画像更为准确,进而可以更好地帮助服务人员进行二次销售,为客户准确推荐产品。

附图说明

图1为一个实施例中用户画像的构建方法的应用环境图;

图2为一个实施例中用户画像的构建方法的流程示意图;

图3为一个实施例中语义识别和实体识别步骤的流程示意图;

图4为另一个实施例中用户画像的构建方法的流程示意图;

图5为一个实施例中用户画像的构建装置的结构框图;

图6为一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。

本申请提供的用户画像的构建方法,可以应用于如图1所示的应用环境中。在服务过程中,服务人员与被服务人员通过终端102进行交谈。在服务结束时,服务人员与被服务人员的交谈内容存储到服务器104中,服务器104根据服务人员与被服务人员的交谈内容构建被服务人员的用户画像。其中,终端102通过网络与服务器104通过网络进行通信。终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备;服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

在一个实施例中,如图2所示,提供了一种用户画像的构建方法,以该方法应用于图1中的服务器为例进行说明,包括以下步骤:

步骤201,获取服务文本数据以及服务文本数据对应的目标用户标识和目标业务类型。

本实施例中,在服务过程中,服务人员与被服务人员可以采用文字交谈。在服务结束后,服务人员将交谈内容存储至服务器。在构建用户画像时,服务器获取服务文本数据,并得到服务文本数据对应的目标用户标识和目标业务类型。其中,目标用户标识可以是被服务人员的名称、代码等。例如,目标用户标识为“王某”。目标业务类型用于指示服务类型。例如,目标业务类型为购车,或者目标业务类型为购房。本发明实施例对目标业务类型不作详细限定,可以根据实际情况进行设置。

步骤202,根据目标业务类型对服务文本数据进行关键词识别。

本实施例中,服务器在获取到服务文本数据和目标业务类型后,可以根据目标业务类型对服务文本数据进行关键词识别。具体地,预先针对不同的业务类型设置不同的关键词,在确定目标业务类型后,确定服务文本数据中是否包含目标业务类型对应的关键词。如果服务文本数据中不包含目标类型对应的关键词,则执行步骤203。

确定服务文本数据中是否包含预设的关键词可以采用关键词匹配方式。具体地,对服务文本数据进行分句处理和分词处理得到多个服务词语,分别计算各服务词语与预设的关键词的相似度,在至少一个服务词语与预设的关键词的相似度大于预设相似度阈值时,确定服务文本数据包含预设的关键词。如果多个服务词语与预设的关键词的相似度均小于预设相似度阈值,则确定服务文本数据不包含预设的关键词。在计算相似度时,可以计算词语向量的欧氏距离,也可以采用其他方式,本发明实施例对此不作详细限定,可以根据实际情况进行设置。

步骤203,若在服务文本数据中未识别到预设的关键词,则根据目标业务类型对服务文本数据进行语义识别和实体识别,得到目标语义标签和目标文本实体。

本实施例中,如果在服务文本数据中未识别到预设的关键词,则对服务文本数据进行语义识别和实体识别,得到目标语义标签和目标文本实体。例如,服务文本数据中包括“车子的价格在十五万以内是我可以接受的”,对该服务文本数据进行语义识别可以得到目标语义标签“价格”,同时,对该服务文本数据进行实体识别可以得到目标文本实体“十五万”。又例如,服务文本数据中包括“这个房子周围有地铁、多条公交线路”,对该服务文本数据进行语义识别可以得到目标语义标签“交通”,同时,对该服务文本数据进行实体识别可以得到目标文本实体“地铁”、“公交”。本发明实施例对目标语义标签和目标文本实体不作详细限定,可以根据实际情况进行设置。

步骤204,根据目标用户标识、目标语义标签和目标文本实体构建用户画像。

本实施例中,在确定目标用户标识、目标语义标签和目标文本实体后,建立目标用户标识、目标语义标签和目标文本实体之间的对应关系,从而构建用户画像。例如,建立目标用户标识“王某”、目标语义标签“价格”、目标文本实体“十五万”之间的对应关系,则可以构建“王某”的用户画像,即王某在购车方面可以接受的价格为十五万。这样,就方便服务人员根据该用户画像对被服务人员进行二次销售,从而更加准确的推荐产品。

上述用户画像的构建方法中,获取服务文本数据以及服务文本数据对应的目标用户标识和目标业务类型;根据目标业务类型对服务文本数据进行关键词识别;若在服务文本数据中未识别到预设的关键词,则根据目标业务类型对服务文本数据进行语义识别和实体识别,得到目标语义标签和目标文本实体;根据目标用户标识、目标语义标签和目标文本实体构建用户画像。通过本发明实施例,在构建用户画像时,除了进行关键词识别之外,还进行语义识别和实体识别,从而得到目标语义标签和目标文本实体,根据目标语义标签和目标文本实体构建用户画像,使构建用户画像的维度更广,构建的用户画像更为准确,进而可以更好地帮助服务人员进行二次销售,为客户准确推荐产品。

在另一个实施例中,本实施例涉及的是构建用户画像的一种可选的过程。在上述图2所示实施例的基础上,服务文本数据包括多个子服务文本数据;

上述步骤203具体可以包括:分别对各子服务文本数据进行语义识别和实体识别,得到各子服务文本数据的目标语义标签和目标文本实体。

本实施例中,通常情况下,服务人员与被服务人员之间的交谈不只一轮,其中每一轮交谈都可以得到对应的子服务文本数据。在进行语义识别和实体识别时,针对各子服务文本数据进行语义识别和实体识别,得到各子服务文本数据的目标语义标签和目标文本实体。

见图3所示,进行语义识别和实体识别具体可以包括如下步骤:

步骤301,根据预设的业务类型与识别模型之间的对应关系,从多个语义识别模型中选取目标业务类型对应的目标语义识别模型,以及从多个实体识别模型中选取目标业务类型对应的目标实体识别模型。

本实施例中,预先训练多个语义识别模型,各语义识别模型可以识别出的语义标签不同。同时,预先设置多个实体识别模型,各实体识别模型可以识别出的文本实体不同。然后,根据业务类型所需的语义标签和文本实体设置业务类型和语义识别模型之间的对应关系,以及业务类型和实体识别模型之间的对应关系。

例如,预先训练出5个语义识别模型,并设置了5个实体识别模型,根据业务需求,设置业务类型“购车”与语义识别模型1和实体识别模型3之间的对应关系,以及设置业务类型“购房”与语义识别模型3和实体识别模型2之间的对应关系。

在确定目标业务类型后,从多个语义识别模型选取目标业务类型对应的目标语义识别模型,从多个实体识别模型中选取目标业务类型对应的目标实体识别模型。例如,如果目标业务类型是购车,则从多个语义识别模型中选取语义识别模型1,从多个实体识别模型中选取实体识别模型3;如果目标业务类型是购房,则从多个语义识别模型中选取语义识别模型2,从多个实体识别模型中选取实体识别模型2。

步骤302,采用目标语义识别模型对服务文本数据进行语义识别,得到目标语义标签;其中,语义标签用于指示关注信息的类别。

本实施例中,确定目标业务类型对应的目标语义识别模型后,采用目标语义识别模型对服务文本数据进行语义识别,得到目标语义标签。其中,语义标签指示关注信息的类别。

例如,服务文本数据为“车子的价格在十五万以内是我可以接受的”,采用语义识别模型1对该服务文本数据进行语义识别,该服务文本数据关注的是“十五万”,其所属的类别为“价格”,因此得到目标语义标签为“价格”。又例如,服务文本数据为“这个房子周围有地铁、多条公交线路”,采用语义识别模型2对该服务文本数据进行语义识别,该服务文本数据关注的包括“地铁”和“公交”,其所属的类别为“交通”,因此得到目标语义标签为“交通”。

步骤303,采用目标实体识别模型对服务文本数据进行实体识别,得到目标文本实体;其中,文本实体用于指示关注信息。

本实施例中,确定目标业务类型对应的目标实体识别模型后,采用目标语实体识别模型对服务文本数据进行实体识别,得到目标文本实体。其中,文本实体即为关注信息。

例如,服务文本数据为“车子的价格在十五万以内是我可以接受的”,采用实体识别模型3对该服务文本数据进行实体识别,该服务文本数据关注的是“十五万”,因此得到目标文本实体为“十五万”。又例如,服务文本数据为“这个房子周围有地铁、多条公交线路”,采用实体识别模型2对该服务文本数据进行实体识别,该服务文本数据关注的包括“地铁”和“公交”,因此得到目标文本实体为“地铁”和“公交”。

采用目标语义识别模型和目标实体识别模型对服务文本数据进行语义识别和实体识别,可以得到更多的用户信息,从而可以丰富用户画像,为服务人员的二次销售提供信息基础。

上述步骤204具体可以包括:分别建立各子服务文本数据的目标语义标签和目标文本实体之间的关联关系;将多个关联关系与目标用户标识对应存储,构建用户画像。

本实施例中,在识别出各子服务文本数据的目标语义标签和目标文本实体后,建立各子服务文本数据的目标语义标签和目标文本实体之间的关联关系。例如,识别出子服务文本数据1的目标语义标签为“价格”,目标文本实体为“十五万”;识别出子服务文本数据2的目标语义标签为“外饰”,目标文本实体为“天窗”;则建立“十五万”和“价格”之间的关联关系以及“外饰”和“天窗”之间的关联关系。

建立关联关系之后,将多个关联关系与目标用户标识对应存储,则构建成用户画像。例如,将“十五万”和“价格”之间的关联关系以及“外饰”和“天窗”之间的关联关系与“王某”对应存储,构建成“王某”的用户画像。这样,服务人员就可以根据用户画像进行二次销售,为客服准确推荐产品,从而提高销售业绩。

上述构建用户画像的过程中,将服务文本数据拆分为多个子服务文本数据,对各子服务文本数据进行识别,得到各子服务文本数据的目标语义标签和目标文本实体,建立各分别建立各子服务文本数据的目标语义标签和目标文本实体之间的关联关系;将多个关联关系与目标用户标识对应存储,构建用户画像。通过本发明实施例,得到的关联关系越多,用户画像的信息越丰富,因而用户画像就更加准确,进而可以更好地帮助服务人员进行二次销售。

在另一个实施例中,如图4所示,本实施例涉及的是构建用户画像的一种可选的过程。在上述图2所示实施例的基础上,具体可以包括如下步骤:

步骤401,获取服务过程中的语音数据;将语音数据转换为服务文本数据。

本实施例中,在服务过程中,服务人员与被服务人员可以采用语音交谈。在服务结束后,服务人员将服务过程中的语音数据存储至服务器。然后服务器可以采用asr(automaticspeechrecognition,自动语音识别)技术,将语音数据转换为服务文本数据,以备后续构建用户画像。

并且,可以在一个服务器进行语音数据转换为服务文本数据的处理,在另一个服务器进行用户画像的构建,本发明实施例对此不作详细限定,可以根据实际情况进行设置。

步骤402,接收输入的目标用户标识;或,从语音数据和/或服务文本数据中识别出目标用户标识。

本实施例中,可以接收服务人员输入的目标用户标识,例如,服务人员在存储语音数据或服务文本数据时,输入客户名字“王某”,服务器接收目标用户标识“王某”。也可以从语音数据中识别出目标用户标识,例如,交谈过程中,客户介绍自己的名字为“王某”,则可以识别出目标用户标识为“王某”。还可以从服务文本数据中识别出目标用户标识,例如,对服务文本数据进行实体识别,从服务文本数据识别出名字“王某”。本发明实施例对如何确定目标用户标识不作详细限定,可以根据实际情况进行设置。

步骤403,获取业务类型的选取指令,选取指令包括业务类型标识;根据业务类型标识确定目标业务类型。

本实施例中,服务器可以显示多个业务类型,然后服务人员从多个业务类型中选取目标业务类型,则服务器获取到业务类型的选取指令,根据选取指令中包含的业务类型标识确定目标业务类型。

例如,服务器显示购车、购房、购买保险等多个业务类型,服务人员勾选购车,则服务器获取到勾选购车的选取指令,根据选取指令来确定目标业务类型为购车。

步骤404,根据目标业务类型对服务文本数据进行关键词识别。

步骤405,若在服务文本数据中识别出预设的关键词,则根据预设的关键词与关键词标签之间的对应关系,确定服务文本数据对应的关键词标签;将关键词标签与目标用户标识对应存储,构建用户画像。

本实施例中,预先设置关键词和关键词标签之间的对应关系,如果在服务文本数据中识别出预设的关键词,则根据对应关系确定服务文本数据对应的关键词标签。

例如,服务文本数据包括“想买电动车”,在该服务文本数据中识别出预设的关键词“电动车”,由于预先设置关键词“电动车”对应关键词标签“新能源”,则可以确定服务文本数据“想买电动车”对应的关键词标签为“新能源”。本发明实施例对预设的关键词和关键词标签不作详细限定,可以根据实际情况进行设置。

步骤406,若在服务文本数据中未识别到预设的关键词,则根据目标业务类型对服务文本数据进行语义识别和实体识别,得到目标语义标签和目标文本实体。

步骤407,根据目标用户标识、目标语义标签和目标文本实体构建用户画像。

上述构建用户画像的过程中,获取服务过程中的语音数据,并将语音数据转换为服务文本数据;获取目标用户标识;获取目标业务类型;根据目标业务类型对服务文本数据进行关键词识别;若在服务文本数据中识别出预设的关键词,则根据预设的关键词与关键词标签之间的对应关系,确定服务文本数据对应的关键词标签;将关键词标签与目标用户标识对应存储,构建用户画像;若在服务文本数据中未识别到预设的关键词,则根据目标业务类型对服务文本数据进行语义识别和实体识别,得到目标语义标签和目标文本实体。通过本发明实施例,可以根据关键词构建用户画像,也可以根据目标语义标签和目标文本实体构建用户画像,构建用户画像的维度更广,得到用户画像的信息更多,从而使用户画像更为准确,进而可以更好地帮助服务人员进行二次销售。

应该理解的是,虽然图2-4的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2-4中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

在一个实施例中,如图5所示,提供了一种用户画像的构建装置,包括:

文本数据获取模块501,用于获取服务文本数据以及服务文本数据对应的目标用户标识和目标业务类型;

关键词识别模块502,用于根据目标业务类型对服务文本数据进行关键词识别;

语义和实体识别模块503,用于若在服务文本数据中未识别到预设的关键词,则根据目标业务类型对服务文本数据进行语义识别和实体识别,得到目标语义标签和目标文本实体;

第一用户画像构建模块504,用于根据目标用户标识、目标语义标签和目标文本实体构建用户画像。

在其中一个实施例中,服务文本数据包括多个子服务文本数据;

语义和实体识别模块,具体用于分别对各子服务文本数据进行语义识别和实体识别,得到各子服务文本数据的目标语义标签和目标文本实体;

第一用户画像构建模块,具体用于分别建立各子服务文本数据的目标语义标签和目标文本实体之间的关联关系;将多个关联关系与目标用户标识对应存储,构建用户画像。

在其中一个实施例中,语义和实体识别模块包括:

模型选取子模块,用于根据预设的业务类型与识别模型之间的对应关系,从多个语义识别模型中选取目标业务类型对应的目标语义识别模型,以及从多个实体识别模型中选取目标业务类型对应的目标实体识别模型;

语义识别子模块,用于采用目标语义识别模型对服务文本数据进行语义识别,得到目标语义标签;其中,语义标签用于指示关注信息的类别;

实体识别子模块,用于采用目标实体识别模型对服务文本数据进行实体识别,得到目标文本实体;其中,文本实体用于指示关注信息。

在其中一个实施例中,该装置还包括:

语音数据获取模块,用于获取服务过程中的语音数据;

文本转换模块,用于将语音数据转换为服务文本数据。

在其中一个实施例中,上述文本数据获取模块包括:

目标用户标识接收子模块,用于接收输入的目标用户标识;

目标用户标识识别子模块,用于从语音数据和/或服务文本数据中识别出目标用户标识。

在其中一个实施例中,上述文本数据获取模块包括:

选取指令获取子模块,用于获取业务类型的选取指令,选取指令包括业务类型标识;

目标业务类型确定子模块,用于根据业务类型标识确定目标业务类型。

在其中一个实施例中,该装置还包括:

关键词标签确定模块,用于若在服务文本数据中识别出预设的关键词,则根据预设的关键词与关键词标签之间的对应关系,确定服务文本数据对应的关键词标签;

第二用户画像构建模块,用于将关键词标签与目标用户标识对应存储,构建用户画像。

关于用户画像的构建装置的具体限定可以参见上文中对于用户画像的构建方法的限定,在此不再赘述。上述用户画像的构建装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图6所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储用户画像的构建数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种用户画像的构建方法。

本领域技术人员可以理解,图6中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。

在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:

获取服务文本数据以及服务文本数据对应的目标用户标识和目标业务类型;

根据目标业务类型对服务文本数据进行关键词识别;

若在服务文本数据中未识别到预设的关键词,则根据目标业务类型对服务文本数据进行语义识别和实体识别,得到目标语义标签和目标文本实体;

根据目标用户标识、目标语义标签和目标文本实体构建用户画像。

在其中一个实施例中,服务文本数据包括多个子服务文本数据;处理器执行计算机程序时还实现以下步骤:

分别对各子服务文本数据进行语义识别和实体识别,得到各子服务文本数据的目标语义标签和目标文本实体;

分别建立各子服务文本数据的目标语义标签和目标文本实体之间的关联关系;

将多个关联关系与目标用户标识对应存储,构建用户画像。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:

根据预设的业务类型与识别模型之间的对应关系,从多个语义识别模型中选取目标业务类型对应的目标语义识别模型,以及从多个实体识别模型中选取目标业务类型对应的目标实体识别模型;

采用目标语义识别模型对服务文本数据进行语义识别,得到目标语义标签;其中,语义标签用于指示关注信息的类别;

采用目标实体识别模型对服务文本数据进行实体识别,得到目标文本实体;其中,文本实体用于指示关注信息。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:

获取服务过程中的语音数据;

将语音数据转换为服务文本数据。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:

接收输入的目标用户标识;或,

从语音数据和/或服务文本数据中识别出目标用户标识。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:

获取业务类型的选取指令,选取指令包括业务类型标识;

根据业务类型标识确定目标业务类型。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:

若在服务文本数据中识别出预设的关键词,则根据预设的关键词与关键词标签之间的对应关系,确定服务文本数据对应的关键词标签;

将关键词标签与目标用户标识对应存储,构建用户画像。

在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:

获取服务文本数据以及服务文本数据对应的目标用户标识和目标业务类型;

根据目标业务类型对服务文本数据进行关键词识别;

若在服务文本数据中未识别到预设的关键词,则根据目标业务类型对服务文本数据进行语义识别和实体识别,得到目标语义标签和目标文本实体;

根据目标用户标识、目标语义标签和目标文本实体构建用户画像。

在其中一个实施例中,服务文本数据包括多个子服务文本数据;计算机程序被处理器执行时还实现以下步骤:

分别对各子服务文本数据进行语义识别和实体识别,得到各子服务文本数据的目标语义标签和目标文本实体;

分别建立各子服务文本数据的目标语义标签和目标文本实体之间的关联关系;

将多个关联关系与目标用户标识对应存储,构建用户画像。

在一个实施例中,计算机程序被处理器执行时还实现以下步骤:

根据预设的业务类型与识别模型之间的对应关系,从多个语义识别模型中选取目标业务类型对应的目标语义识别模型,以及从多个实体识别模型中选取目标业务类型对应的目标实体识别模型;

采用目标语义识别模型对服务文本数据进行语义识别,得到目标语义标签;其中,语义标签用于指示关注信息的类别;

采用目标实体识别模型对服务文本数据进行实体识别,得到目标文本实体;其中,文本实体用于指示关注信息。

在一个实施例中,计算机程序被处理器执行时还实现以下步骤:

获取服务过程中的语音数据;

将语音数据转换为服务文本数据。

在一个实施例中,计算机程序被处理器执行时还实现以下步骤:

接收输入的目标用户标识;或,

从语音数据和/或服务文本数据中识别出目标用户标识。

在一个实施例中,计算机程序被处理器执行时还实现以下步骤:

获取业务类型的选取指令,选取指令包括业务类型标识;

根据业务类型标识确定目标业务类型。

在一个实施例中,计算机程序被处理器执行时还实现以下步骤:

若在服务文本数据中识别出预设的关键词,则根据预设的关键词与关键词标签之间的对应关系,确定服务文本数据对应的关键词标签;

将关键词标签与目标用户标识对应存储,构建用户画像。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram)或者外部高速缓冲存储器。作为说明而非局限,ram以多种形式可得,诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双数据率sdram(ddrsdram)、增强型sdram(esdram)、同步链路(synchlink)dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)等。

以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。

以上实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1