一种社交通信方法和装置与流程

文档序号:12470145阅读:132来源:国知局
一种社交通信方法和装置与流程

本发明涉及通信技术领域,特别是涉及一种社交通信方法和装置。



背景技术:

对于当前面向陌生人的社交系统,群组沟通一般是由个人发起,或者由系统默认或人工维护的。通过这样的群组沟通建立社交关系往往会导致效率低,时间成本高,且针对性不强。

采用上述社交系统,不能支持海量数据的大规模分析处理,也不支持流式数据的实时处理。



技术实现要素:

本发明的目的在于提供一种社交通信方法和装置,可以减少沟通时间和提高社交效率。

第一方面,本发明实施例提供了一种社交通信方法,包括:

获取用户历史行为信息,将所述用户历史行为信息通过自然语言处理算法得到文本向量空间;

将所述文本向量空间通过聚类算法生成话题聊天室列表;

获取用户行为信息和统计信息,将所述用户行为信息和所述统计信息进行特征提取得到用户特征向量空间;

根据所述用户特征向量空间向用户推荐相关话题聊天室列表;

根据用户活跃状态信息和用户状态数据信息利用不同的策略模型确定所述用户在所述相关话题聊天室列表中的活跃状态。

结合第一方面,本发明实施例提供了第一方面第一种可能的实施方式,所述将所述用户历史行为信息通过自然语言处理算法得到文本向量空间包括:

对所述历史行为信息进行处理得到文本内容信息;

将所述文本内容信息进行分词处理和去除听词处理得到多个分词;

分别统计各个分词在段落中和文档内容中对应的频率次数,从而构成所述文本向量空间。

结合第一方面,本发明实施例提供了第一方面第二种可能的实施方式,所述将所述文本向量空间通过聚类算法生成话题聊天室列表包括:

将所述文本向量空间通过高斯混合GMM模型或线性鉴别分析LDA算法进行聚类生成聚类话题结果;

将所述聚类话题结果进行评分得到对应的评分数据;

将所述对应的评分数据进行排序得到排序的评分数据;

根据所述排序的评分数据的文本内容生成所述话题聊天室列表。

结合第一方面,本发明实施例提供了第一方面第三种可能的实施方式,所述根据所述用户特征向量空间向用户推荐相关话题聊天室列表包括:

将所述用户特征向量空间与聚类话题结果通过矩阵相乘或协同过滤算法得到相关性结果;

将所述相关性结果进行评分排序得到排序的相关性结果;

将所述排序的相关性结果中评分最高的相关性结果作为所述相关话题聊天室列表。

结合第一方面,本发明实施例提供了第一方面第四种可能的实施方式,在所述根据所述用户特征向量空间向用户推荐相关话题聊天室列表之后,在所述根据用户活跃状态信息和用户状态数据信息利用不同的策略模型确定所述用户在所述相关话题聊天室列表中的活跃状态之前,所述方法还包括:

获取所述用户在所述相关话题聊天室列表中的任一聊天室的社交内容信息。

结合第一方面,本发明实施例提供了第一方面第五种可能的实施方式,所述方法还包括:

接收终端发送的用户注册信息;

对所述注册信息进行验证;

如果验证通过,则向所述终端发送验证成功响应信息。

第二方面,本发明提供了一种社交通信装置,所述装置包括:

处理单元,用于获取用户历史行为信息,将所述用户历史行为信息通过自然语言处理算法得到文本向量空间;

第一生成单元,用于将所述文本向量空间通过聚类算法生成话题聊天室列表;

提取单元,用于获取用户行为信息和统计信息,将所述用户行为信息和所述统计信息进行特征提取得到用户特征向量空间;

推荐单元,用于根据所述用户特征向量空间向用户推荐相关话题聊天室列表;

确定单元,用于根据用户活跃状态信息和用户状态数据信息利用不同的策略模型确定所述用户在所述相关话题聊天室列表中的活跃状态。

结合第二方面,本发明实施例提供了第二方面第一种可能的实施方式,所述第一生成单元包括:

将所述文本向量空间通过高斯混合GMM模型或线性鉴别分析LDA算法进行聚类生成聚类话题结果;

将所述聚类话题结果进行评分得到对应的评分数据;

将所述对应的评分数据进行排序得到排序的评分数据;

根据所述排序的评分数据的文本内容生成所述话题聊天室列表。

结合第二方面,本发明实施例提供了第二方面第二种可能的实施方式,所述推荐单元包括:

将所述用户特征向量空间与聚类话题结果通过矩阵相乘或协同过滤算法得到相关性结果;

将所述相关性结果进行评分排序得到排序的相关性结果;

将所述排序的相关性结果中评分最高的相关性结果作为所述相关话题聊天室列表。

结合第二方面,本发明实施例提供了第二方面第三种可能的实施方式,所述处理单元包括:

对所述历史行为信息进行处理得到文本内容信息;

将所述文本内容信息进行分词处理和去除听词处理得到多个分词;

分别统计各个分词在段落中和文档内容中对应的频率次数,从而构成所述文本向量空间。

本发明提供的一种社交通信方法和装置,通过获取用户历史行为信息,将用户历史行为信息通过自然语言处理算法得到文本向量空间,将文本向量空间通过聚类算法生成话题聊天室列表,获取用户行为信息和统计信息将用户行为信息和所述统计信息进行特征提取得到用户特征向量空间,根据用户特征向量空间向用户推荐相关话题聊天室列表,根据用户活跃状态信息和用户状态数据信息利用不同的策略模型确定用户在相关话题聊天室列表中的活跃状态,从而可以减少沟通时间和提高社交效率。

附图说明

为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。

图1为本发明实施例提供的一种社交通信方法流程图;

图2为本发明实施例提供的一种社交通信装置示意图。

附图标记说明:

10-处理单元; 20-第一生成单元; 30-提取单元;

40-推荐单元; 50-确定单元。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。

针对现有的的社交系统中的群组沟通一般是由个人发起或由系统默认的,通过这种社交关系往往会导致效率低,时间成本高,且针对性不强。本发明提供的一种社交通信方法和装置,通过获取用户历史行为信息,将用户历史行为信息通过自然语言处理算法得到文本向量空间,将文本向量空间通过聚类算法生成话题聊天室列表,获取用户行为信息和统计信息将用户行为信息和所述统计信息进行特征提取得到用户特征向量空间,根据用户特征向量空间向用户推荐相关话题聊天室列表,根据用户活跃状态信息和用户状态数据信息利用不同的策略模型确定用户在相关话题聊天室列表中的活跃状态,从而可以减少沟通时间和提高社交效率。下面通过实施例进行详细描述。

图1为本发明实施例提供的一种社交通信方法流程图。

参照图1,步骤S101,获取用户历史行为信息,将用户历史行为信息通过自然语言处理算法得到文本向量空间;

这里,用户历史行为信息包括帖子信息(浏览的次数和时间)、浏览信息、评论信息和偏好信息,其中,偏好信息是指对电影或音乐的偏好。

步骤S102,将文本向量空间通过聚类算法生成话题聊天室列表;

步骤S103,获取用户行为信息和统计信息,将用户行为信息和统计信息进行特征提取得到用户特征向量空间;

这里,用户行为信息即为动态信息,动态信息包括用户登录系统的时间、使用时长、浏览内容的时间及频次、浏览的内容、发布的内容以及对相关内容的点赞或者评论等。

统计信息为静态信息,静态信息包括用户姓名、年龄、出生日期、身高、在读院校、专业和家乡等。

步骤S104,根据用户特征向量空间向用户推荐相关话题聊天室列表;

步骤S105,根据用户活跃状态信息和用户状态数据信息利用不同的策略模型确定用户在相关话题聊天室列表中的活跃状态。

这里,用户进入相关话题聊天室列表中的任一聊天室后,系统实时监控用户活跃状态信息,其中,用户活跃状态信息为用户在聊天室中的活跃状态,具体为用户进入聊天室的时间、消息发送的时间、消息发送的内容和消息的类型等。

用户在系统中的用户状态数据信息包括用户登录系统的时间,发布内容的时间,发布的内容,内容的类型等。

利用不同的策略模型确定所述用户在所述相关话题聊天室列表中的活跃状态。对于非活跃用户,系统会终止该用户与其它人的聊天,并将用户从该聊天室中移出。例如:当用户A在聊天室X中发表的最后一条消息是10分钟之前的,如果将这一条件作为一个简单的策略模型,则用户A会被系统从聊天室X中移出,即使用户再次进入聊天室X,也无法看到之前聊天室中的问题。

另外,在用户A从聊天室X中被移出后,可以再次进入聊天室X中或进行到其它的聊天室中。

根据本发明的示例性实施例,所述将所述用户历史行为信息通过自然语言处理算法得到文本向量空间包括:

对所述历史行为信息进行处理得到文本内容信息;

将所述文本内容信息进行分词处理和去除听词处理得到多个分词;

分别统计各个分词在段落中和文档内容中对应的频率次数,从而构成所述文本向量空间。

具体地,历史行为信息包括非文本形式的内容和文本形式的内容,在对历史行为信息进行自然语言处理时,需要将非文本形式的内容转化为文本形式的内容。

非文本形式的内容转化为文本形式的内容的具体过程可以做相关的识别,例如非文本形式的内容为语音,可以将语音转化成文字。

根据本发明的示例性实施例,所述将所述文本向量空间通过聚类算法生成话题聊天室列表包括:

将所述文本向量空间通过GMM(Gaussian Mixture Model,高斯混合)模型或LDA(Linear Discriminant Analysis,线性鉴别分析)算法进行聚类生成聚类话题结果;

将所述聚类话题结果进行评分得到对应的评分数据;

将所述对应的评分数据进行排序得到排序的评分数据;

根据所述排序的评分数据的文本内容生成所述话题聊天室列表。

根据本发明的示例性实施例,所述根据所述用户特征向量空间向用户推荐相关话题聊天室列表包括:

将所述用户特征向量空间与所述聚类话题结果通过矩阵相乘或协同过滤算法得到相关性结果;

将所述相关性结果进行评分排序得到排序的相关性结果;

将所述排序的相关性结果中评分最高的相关性结果作为所述相关话题聊天室列表。

这里,在获取到相关话题聊天室列表后,将相关话题聊天室列表发送给用户。用户可以选择相关话题聊天室列表中的任一聊天室进行聊天。

用户在进入任一聊天室后,通过文字、语音、图片和视频的方式与聊天室中的其他人员进行沟通。

根据本发明的示例性实施例,在所述根据所述用户特征向量空间向用户推荐相关话题聊天室列表之后,在所述根据用户活跃状态信息和用户状态数据信息利用不同的策略模型确定所述用户在所述相关话题聊天室列表中的活跃状态之前,所述方法还包括:

获取所述用户在所述相关话题聊天室列表中的任一聊天室的社交内容信息。

这里,社交内容信息就是指用户与其它人员进行沟通时发送的文字内容、语音内容、图片内容和视频内容等。

根据本发明的示例性实施例,所述方法还包括:

接收终端发送的用户注册信息;

对所述注册信息进行验证;

如果验证通过,则向所述终端发送验证成功响应信息。

这里,终端向系统发送用户注册信息后,系统会对注册信息进行验证,如果验证通过,则用户就可以进入并使用该系统了。

本发明提供的一种社交通信方法,通过获取用户历史行为信息,将用户历史行为信息通过自然语言处理算法得到文本向量空间,将文本向量空间通过聚类算法生成话题聊天室列表,获取用户行为信息和统计信息将用户行为信息和所述统计信息进行特征提取得到用户特征向量空间,根据用户特征向量空间向用户推荐相关话题聊天室列表,根据用户活跃状态信息和用户状态数据信息利用不同的策略模型确定用户在相关话题聊天室列表中的活跃状态,从而可以减少沟通时间和提高社交效率。

图2为本发明实施例提供的一种社交通信装置示意图。

参照图2,该装置包括处理单元10、第一生成单元20、提取单元30、推荐单元40和确定单元50。

处理单元10,用于获取用户历史行为信息,将所述用户历史行为信息通过自然语言处理算法得到文本向量空间;

第一生成单元20,用于将所述文本向量空间通过聚类算法生成话题聊天室列表;

提取单元30,用于获取用户行为信息和统计信息,将所述用户行为信息和所述统计信息进行特征提取得到用户特征向量空间;

推荐单元40,用于根据所述用户特征向量空间向用户推荐相关话题聊天室列表;

确定单元50,用于根据用户活跃状态信息和用户状态数据信息利用不同的策略模型确定所述用户在所述相关话题聊天室列表中的活跃状态。

根据本发明的示例性实施例,所述第一生成单元20包括:

将所述文本向量空间通过高斯混合GMM模型或线性鉴别分析LDA算法进行聚类生成聚类话题结果;

将所述聚类话题结果进行评分得到对应的评分数据;

将所述对应的评分数据进行排序得到排序的评分数据;

根据所述排序的评分数据的文本内容生成所述话题聊天室列表。

根据本发明的示例性实施例,所述推荐单元40包括:

将所述用户特征向量空间与所述聚类话题结果通过矩阵相乘或协同过滤算法得到相关性结果;

将所述相关性结果进行评分排序得到排序的相关性结果;

将所述排序的相关性结果中评分最高的相关性结果作为所述相关话题聊天室列表。

根据本发明的示例性实施例,处理单元10包括:

对所述历史行为信息进行处理得到文本内容信息;

将所述文本内容信息进行分词处理和去除听词处理得到多个分词;

分别统计各个分词在段落中和文档内容中对应的频率次数,从而构成所述文本向量空间。

本发明提供的一种社交通信装置,通过获取用户历史行为信息,将用户历史行为信息通过自然语言处理算法得到文本向量空间,将文本向量空间通过聚类算法生成话题聊天室列表,获取用户行为信息和统计信息将用户行为信息和所述统计信息进行特征提取得到用户特征向量空间,根据用户特征向量空间向用户推荐相关话题聊天室列表,根据用户活跃状态信息和用户状态数据信息利用不同的策略模型确定用户在相关话题聊天室列表中的活跃状态,从而可以减少沟通时间和提高社交效率。

本发明实施例所提供的装置可以为设备上的特定硬件或者安装于设备上的软件或固件等。本发明实施例所提供的装置,其实现原理及产生的技术效果和前述方法实施例相同,为简要描述,装置实施例部分未提及之处,可参考前述方法实施例中相应内容。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,前述描述的系统、装置和单元的具体工作过程,均可以参考上述方法实施例中的相对应过程,在此不再赘述。

在本发明所提供的实施例中,应该理解到,所揭露装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通话连接可以是通过一些通话接口,装置或单元的间接耦合或通话连接,可以是电性,机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本发明提供的实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。

而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释,此外,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。

最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围。都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1