未读消息的处理方法、装置、存储介质及设备与流程

文档序号:20488335发布日期:2020-04-21 21:50阅读:124来源:国知局
未读消息的处理方法、装置、存储介质及设备与流程

本发明涉及计算机技术领域,具体地涉及一种未读消息的处理方法、装置、存储介质及设备。



背景技术:

在现有技术中,当存在多条未读im(instantmessaging,即时通信)消息时,用户需要逐条阅读以找到感兴趣的消息,延长了用户获取到有效信息的时间,降低了信息获取效率。



技术实现要素:

本发明实施例的目的是提供一种未读消息的处理方法、装置、存储介质及设备,解决了现有技术中对于未读消息中获取有效信息效率低的问题,通过将未读消息中的关键词标签提供给用户,以便用户快速定位所需要的信息,提高消息获取效率。

为了实现上述目的,本发明实施例提供一种未读消息的处理方法,包括:获取待处理的未读消息数据,所述未读消息数据包括未读消息、对应的消息标识以及发送方标识;对所述未读消息进行预处理,得到所述未读消息对应的文档集合;根据关键词库与所述文档集合,得到所述文档集合中文档的关键词标签;显示关键词标签列表,所述关键词标签列表中的所述关键词标签关联于对应的消息标识、发送方标识以及关键词位置索引。

进一步地,所述未读消息数据还包括发送时间,所述对所述未读消息进行预处理,得到所述未读消息对应的文档集合的步骤,包括:根据预设时间间隔以及所述发送方标识对应的未读消息的发送时间,将所述发送方标识对应的未读消息划分为独立会话;将所述独立会话中的文本进行合并,得到会话文本;利用中文分词技术与停用词词库,去除所述会话文本中的停用词,得到所述会话文本对应的会话文档;利用词性标注技术,保留所述会话文档中的名词和形容词,得到所述会话文档构成的文档集合。

进一步地,所述根据关键词库与所述文档集合,得到所述文档集合中文档的关键词标签的步骤,包括:利用关键词库中的关键词与所述文档集合中的文档的词条进行匹配;统计匹配成功的关键词以及所述匹配成功的关键词的成功次数;将成功次数最多的前设定个数的关键词作为对应文档的关键词标签。

进一步地,所述根据关键词库与所述文档集合,得到所述文档集合中文档的关键词标签的步骤,包括:利用词频-逆文档频率tf-idf技术,得到所述文档集合中的文档的词条的权重值;将权重值最大的前设定个数的词条作为对应文档的待定关键词标签;将关键词库中的关键词与所述文档的待定关键词标签进行匹配;将匹配成功的关键词与所述待定关键词作为对应文档的关键词标签。

进一步地,在所述显示关键词标签列表的步骤之后,所述方法还包括:当获取到所选择的关键词标签时,根据所选择的关键词标签关联的发送方标识以及消息标识,查找所述发送方标识对应的会话界面中的所述消息标识对应的未读消息;根据所选择的关键词标签关联的关键词位置索引,在所述会话界面中的未读消息上突出显示所述关键词标签对应的关键词。

进一步地,在所述获取待处理的未读消息数据的步骤之后,所述方法还包括:将所获取的待处理的未读消息数据的未读状态显示为已读状态。

相应的,本发明实施例还提供一种未读消息的处理装置,包括:获取单元,用于获取待处理的未读消息数据,所述未读消息数据包括未读消息、对应的消息标识以及发送方标识;预处理单元,用于对所述未读消息进行预处理,得到所述未读消息对应的文档集合;标签处理单元,用于根据关键词库与所述文档集合,得到所述文档集合中文档的关键词标签;显示单元,用于显示关键词标签列表,所述关键词标签列表中的所述关键词标签关联于对应的消息标识、发送方标识以及关键词位置索引。

进一步地,所述未读消息数据还包括发送时间,所述预处理单元还用于根据预设时间间隔以及所述发送方标识对应的未读消息的发送时间,将所述发送方标识对应的未读消息划分为独立会话;将所述独立会话中的文本进行合并,得到会话文本;利用中文分词技术与停用词词库,去除所述会话文本中的停用词,得到所述会话文本对应的会话文档;利用词性标注技术,保留所述会话文档中的名词和形容词,得到所述会话文档构成的文档集合。

进一步地,所述标签处理单元还用于利用关键词库中的关键词与所述文档集合中的文档的词条进行匹配;统计匹配成功的关键词以及所述匹配成功的关键词的成功次数;将成功次数最多的前设定个数的关键词作为对应文档的关键词标签。

进一步地,所述标签处理单元还用于利用词频-逆文档频率tf-idf技术,得到所述文档集合中的文档的词条的权重值;将权重值最大的前设定个数的词条作为对应文档的待定关键词标签;将关键词库中的关键词与所述文档的待定关键词标签进行匹配;将匹配成功的关键词与所述待定关键词作为对应文档的关键词标签。

进一步地,所述获取单元还用于获取所选择的关键词标签;所述装置还包括:查找单元,用于当所述获取单元获取到所选择的关键词标签时,根据所选择的关键词标签关联的发送方标识以及消息标识,查找所述发送方标识对应的会话界面中的所述消息标识对应的未读消息;所述显示单元还用于根据所选择的关键词标签关联的关键词位置索引,在所述会话界面中的未读消息上突出显示所述关键词标签对应的关键词。

进一步地,所述显示单元还用于将所获取的待处理的未读消息数据的未读状态显示为已读状态。

相应的,本发明实施例还提供一种存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行如上所述的未读消息的处理方法。

相应的,本发明实施例还提供一种设备,所述设备包括至少一个处理器、以及与所述处理器连接的至少一个存储器、总线;其中,所述处理器与所述存储器通过所述总线完成相互间的通信;所述处理器用于调用所述存储器中的程序指令,以执行如上所述的未读消息的处理方法。

通过上述技术方案,在获取待处理的未读消息数据之后,对未读消息进行预处理,从而得到未读消息对应的文档集合,然后根据关键词库与所述文档集合,得到所述文档集合中文档的关键词标签,并显示关键词标签列表,其中,所述关键词标签列表中的关键词标签关联于对应的消息标识、发送方标识以及关键词位置索引,以便用户选择需要查看关键词标签对应的未读消息中的关键词。本发明实施例解决了现有技术中对于未读消息中获取有效信息效率低的问题,通过将未读消息中的关键词标签提供给用户,以便用户快速定位所需要的信息,提高消息获取效率。

本发明实施例的其它特征和优点将在随后的具体实施方式部分予以详细说明。

附图说明

附图是用来提供对本发明实施例的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本发明实施例,但并不构成对本发明实施例的限制。在附图中:

图1是本发明实施例提供的一种未读消息的处理方法的流程示意图;

图2是本发明实施例提供的另一种未读消息的处理方法的流程示意图;

图3是本发明实施例提供的一种未读消息的处理装置的结构示意图;

图4是本发明实施例提供的另一种未读消息的处理装置的结构示意图;

图5是本发明实施例提供的一种设备的结构示意图。

具体实施方式

以下结合附图对本发明实施例的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本发明实施例,并不用于限制本发明实施例。

现有技术中当存在多条未读消息时,需要用户逐一的去阅读以便查找到需要的信息,例如,对于用户与房产经纪人之间的消息会话,当房产经纪人发送多条im消息时,对于用户而言并不是每一条都感兴趣,如果用户想要把所有的未读消息的未读状态变为已读状态,则需要多次点击,易导致用户产生厌烦情绪,而且用户获取有效信息的时间变长,降低房产交易的转化率及促成时间。本发明实施例正是解决了现有技术中对于未读消息中获取有效信息效率低的问题,通过将未读消息中的关键词标签提供给用户,以便用户快速定位所需要的信息。下面将详细描述本发明实施例。

图1是本发明实施例提供的一种未读消息的处理方法的流程示意图。如图1所示,所述方法包括如下步骤:

步骤101,获取待处理的未读消息数据,所述未读消息数据包括未读消息、对应的消息标识以及发送方标识;

步骤102,对所述未读消息进行预处理,得到所述未读消息对应的文档集合;

步骤103,根据关键词库与所述文档集合,得到所述文档集合中文档的关键词标签;

步骤104,显示关键词标签列表,所述关键词标签列表中的所述关键词标签关联于对应的消息标识、发送方标识以及关键词位置索引。

其中,本发明实施例可应用于具有处理im消息功能的智能终端,当用户发现存在多个发送方发送的多条未读消息时,则可通过点击类似于未读消息选择按钮,从而用户可进入未读消息的选择界面,当选择要提取关键词标签的未读消息之后,即可获取到用户所选择的待处理的未读消息数据。其中,每条未读消息数据包括未读消息,该条未读消息对应的消息标识,发送该条未读消息的发送方标识以及发送时间。上述选择的未读消息可能对应于同一发送方,也可能对应于多个发送方。其中,所述消息标识用于唯一标识每一条消息,无论是针对于同一发送方,还是针对于不同发送方,其消息标识均是唯一性的,例如,在接收到每一条未读消息时,均会对消息进行编号,以唯一标识所有消息。

在步骤102中,对所述未读消息进行预处理,并得到所述未读消息对应的文档集合。其中,首先根据预设时间间隔以及每个发送方标识对应的未读消息的发送时间,将每个发送方标识对应的未读消息划分为独立会话。也就是说,根据未读消息的发送时间,当一个发送方发送的多条未读消息是在预设时间间隔内发送的,则将所述多条未读消息划分为独立会话,例如,当一个发送方发送的多条未读消息是在5分钟之内发送的,则将该发送方在这5分钟之内发送的多条未读消息划分为一个独立会话,而将下一个5分钟之内发送的未读消息划分为另一个独立会话,以此类推,从而得到多个发送方发送的多条独立会话。之后,将所述独立会话中的文本进行合并,得到会话文本,并利用中文分词技术与停用词词库,去除所述会话文本中的停用词,得到所述会话文本对应的会话文档。例如,利用中文分词技术,将每个会话文本进行分词,并利用停用词词库中的停用词,如,“的”、“是”、“在”等停用词,将每个会话文本中的停用词去除,避免将多次出现的停用词作为关键词标签。然后,利用词性标注技术,保留所述会话文档中的名词和形容词,得到所述会话文档构成的文档集合。例如,采用隐马尔科夫词性标注模型对每个会话文档进行词性标注,并将标注为名称和形容词的词条保留,删除其它词性的词条,从而将保留有名称和形容词的会话文档构成文档集合。

在步骤103中,根据关键词库与所述文档集合,得到所述文档集合中文档的关键词标签,可采用两种方式:

第一种方式,是利用关键词库中的关键词与所述文档集合中的文档的词条进行匹配,并统计匹配成功的关键词以及所述匹配成功的关键词的成功次数,然后将匹配成功的关键词的成功次数进行排序,将成功次数最多的前设定个数的关键词作为对应文档的关键词标签,例如,成功次数按照从大到小的顺序排序后,将前3个关键词作为对应文档的关键词标签。

第二种方式,是利用现有技术中的tf-idf(termfrequency-inversedocumentfrequency,词频-逆文档频率)技术,得到所述文档集合中的文档的词条的权重值。

首先,计算每个文档中每个词条的词频(tf,termfrequency)tf,利用公式(1),得到词条ti在第j个文档中的出现频率tfi,j:

其中,ni,j为词条ti在第j个文档中出现的次数,∑knk,j为第j个文档中所有词条出现的次数总和。

然后,利用公式(2),计算逆文档频率(idf,inversedocumentfrequency),得到词条ti的逆文档频率idfi:

其中,|d|为所述文档集合中文档的总数,|{j:ti∈dj}|表示包含词条ti的文档数目。

之后,tfi,j*idfi得到词条ti的权重值。通过上述公式(1)和(2)可得到所述文档集合中每个文档的词条的权重值。然后,将每个文档中的词条的权重值按照从大到小的顺序进行排序,并将权重值最大的前设定个数的词条作为对应文档的待定关键词标签。之后,将关键词库中的关键词与所述文档的待定关键词标签进行匹配,将匹配成功的关键词与所述待定关键词作为对应文档的关键词标签。例如,以房产经纪人向用户发送的未读消息为例,在得到每个文档的待定关键词标签之后,将包含房源类关键词的关键词库中的关键词与所述待定关键词进行匹配,并将匹配成功的关键词与所述待定关键词共同作为对应文档的关键词标签。将关键词库中的关键词与每个文档的待定关键词标签进行匹配的目的,是为了避免得到的待定关键词标签不符合对应场景的语言,因此,将更符合场景的关键词库中的关键词加入关键词标签中,如满五唯一、近地铁等关键词。

在将上述得到的关键词标签列表推荐给用户之后,用户会根据自己的需求选择所要读取的关键词标签,当获取到用户所选择的关键词标签时,根据所选择的关键词标签关联的发送方标识以及消息标识,查找到所述发送方标识对应的会话界面,然后根据所述消息标识找到会话界面中的所述消息标识对应的未读消息,之后再根据所选择的关键词标签关联的关键词位置索引,在所述会话界面中的未读消息上突出显示所述关键词标签对应的关键词,例如,当用户选择“近地铁”的关键词标签时,则直接在该关键词标签关联的会话界面中的未读消息上高亮显示“近地铁”对应的关键词。

通过本发明实施例,利用关键词标签,可便于用户快速定位标签相关的消息部分,从而提高有效信息的获取效率。

为了便于理解本发明实施例,图2是本发明实施例提供的一种未读消息的处理方法的流程示意图,如图2所示,所述方法包括如下步骤:

步骤201,获取待处理的未读消息数据,所述未读消息数据包括未读消息、对应的消息标识、发送方标识以及发送时间;

步骤202,将所获取的待处理的未读消息数据的未读状态显示为已读状态;

步骤203,根据预设时间间隔以及所述发送方标识对应的未读消息的发送时间,将所述发送方标识对应的未读消息划分为独立会话;

步骤204,将所述独立会话中的文本进行合并,得到会话文本;

步骤205,利用中文分词技术与停用词词库,去除所述会话文本中的停用词,得到所述会话文本对应的会话文档;

步骤206,利用词性标注技术,保留所述会话文档中的名词和形容词,得到所述会话文档构成的文档集合;

步骤207,根据关键词库与所述文档集合,得到所述文档集合中文档的关键词标签。

其中包括两种方式得到每个文档的关键词标签:

第一种方式,是利用关键词库中的关键词与所述文档集合中的文档的词条进行匹配,并统计匹配成功的关键词以及所述匹配成功的关键词的成功次数,然后将匹配成功的关键词的成功次数进行排序,将成功次数最多的前设定个数的关键词作为对应文档的关键词标签,例如,成功次数按照从大到小的顺序排序后,将前3个关键词作为对应文档的关键词标签。

第二种方式,是利用现有技术中的tf-idf(termfrequency-inversedocumentfrequency,词频-逆文档频率)技术,得到所述文档集合中的文档的词条的权重值。然后,将每个文档中的词条的权重值按照从大到小的顺序进行排序,并将权重值最大的前设定个数的词条作为对应文档的待定关键词标签。之后,将关键词库中的关键词与所述文档的待定关键词标签进行匹配,将匹配成功的关键词与所述待定关键词作为对应文档的关键词标签。例如,以房产经纪人向用户发送的未读消息为例,在得到每个文档的待定关键词标签之后,将包含房源类关键词的关键词库中的关键词与所述待定关键词进行匹配,并将匹配成功的关键词与所述待定关键词共同作为对应文档的关键词标签。将关键词库中的关键词与每个文档的待定关键词标签进行匹配的目的,是为了避免得到的待定关键词标签不符合对应场景的语言,因此,将更符合场景的关键词库中的关键词加入关键词标签中,如满五唯一、近地铁等关键词。

步骤208,显示关键词标签列表,所述关键词标签列表中的所述关键词标签关联于对应的消息标识、发送方标识以及关键词位置索引;

步骤209,当获取到所选择的关键词标签时,根据所选择的关键词标签关联的发送方标识以及消息标识,查找所述发送方标识对应的会话界面中的所述消息标识对应的未读消息;

步骤210,根据所选择的关键词标签关联的关键词位置索引,在所述会话界面中的未读消息上突出显示所述关键词标签对应的关键词。

通过本发明实施例,当获取到待处理的未读消息数据后,对所有未读消息进行预处理,得到所有未读消息对应的文档集合,然后可通过两种方式,根据关键词库与所述文档集合,得到所述文档集合中每个文档的关键词标签,之后显示关键词标签列表,以便用户选择需要查看关键词标签对应的未读消息中的关键词。本发明实施例解决了现有技术中对于未读消息中获取有效信息效率低的问题,通过将未读消息中的关键词标签提供给用户,以便用户快速定位所需要的信息,提高消息获取效率。

相应的,图3是本发明实施例提供的一种未读消息的处理装置的结构示意图。如图3所示,所述装置30包括:获取单元31,用于获取待处理的未读消息数据,所述未读消息数据包括未读消息、对应的消息标识以及发送方标识;预处理单元32,用于对所述未读消息进行预处理,得到所述未读消息对应的文档集合;标签处理单元33,用于根据关键词库与所述文档集合,得到所述文档集合中文档的关键词标签;显示单元34,用于显示关键词标签列表,所述关键词标签列表中的所述关键词标签关联于对应的消息标识、发送方标识以及关键词位置索引。

通过上述技术方案,在获取待处理的未读消息数据之后,对所有未读消息进行预处理,从而得到所有未读消息对应的文档集合,然后根据关键词库与所述文档集合,得到所述文档集合中每个文档的关键词标签,并显示所述关键词标签列表,其中,所述关键词标签列表中的每个关键词标签关联于对应的消息标识、发送方标识以及关键词位置索引,以便用户选择需要查看关键词标签对应的未读消息中的关键词。本发明实施例解决了现有技术中对于未读消息中获取有效信息效率低的问题,通过将未读消息中的关键词标签提供给用户,以便用户快速定位所需要的信息,提高消息获取效率。

进一步地,所述未读消息数据还包括发送时间,所述预处理单元还用于根据预设时间间隔以及所述发送方标识对应的未读消息的发送时间,将所述发送方标识对应的未读消息划分为独立会话;将所述独立会话中的文本进行合并,得到会话文本;利用中文分词技术与停用词词库,去除所述会话文本中的停用词,得到所述会话文本对应的会话文档;利用词性标注技术,保留所述会话文档中的名词和形容词,得到所述会话文档构成的文档集合。

进一步地,所述标签处理单元还用于利用关键词库中的关键词与所述文档集合中的文档的词条进行匹配;统计匹配成功的关键词以及所述匹配成功的关键词的成功次数;将成功次数最多的前设定个数的关键词作为对应文档的关键词标签。

进一步地,所述标签处理单元还用于利用词频-逆文档频率tf-idf技术,得到所述文档集合中的文档的词条的权重值;将权重值最大的前设定个数的词条作为对应文档的待定关键词标签;将关键词库中的关键词与所述文档的待定关键词标签进行匹配;将匹配成功的关键词与所述待定关键词作为对应文档的关键词标签。

进一步地,所述获取单元还用于获取所选择的关键词标签,如图4所示,所述装置还包括:查找单元35,用于当所述获取单元获取到所选择的关键词标签时,根据所选择的关键词标签关联的发送方标识以及消息标识,查找所述发送方标识对应的会话界面中的所述消息标识对应的未读消息;所述显示单元还用于根据所选择的关键词标签关联的关键词位置索引,在所述会话界面中的未读消息上突出显示所述关键词标签对应的关键词。

进一步地,所述显示单元还用于将所获取的待处理的未读消息数据的未读状态显示为已读状态。

所述未读消息的处理装置的具体实现过程,参见上述未读消息的处理方法的处理过程。

相应的,本发明实施例还提供一种存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行如上述实施例所述的未读消息的处理方法。

相应的,图5是本发明实施例提供的一种设备的结构示意图,如图5所示,所述设备50包括至少一个处理器51、以及与所述处理器连接的至少一个存储器52、总线53;其中,所述处理器与所述存储器通过所述总线完成相互间的通信;所述处理器用于调用所述存储器中的程序指令,以执行如上述实施例所述的未读消息的处理方法。

本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:rom、ram、磁碟或者光盘等各种可以存储程序代码的介质。

以上所描述的电子设备等实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台电子设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1