一种信息处理方法和信息处理装置的制造方法

文档序号：9417516阅读：164来源：国知局

一种信息处理方法和信息处理装置的制造方法
【技术领域】
[0001]本发明涉及一种信息处理方法，并且更具体地涉及一种用于社交网络的信息处理方法和装置。
【背景技术】
[0002]在社交网络中，关于用户的用户名的描述往往从下面几个方面来进行:1、用户自己填写的信息，包括关于用户的用户名的标签，职位，专业等；2、用户使用自己的用户名所发布的信息内容；3、用户的该用户名所加入的社交圈等。由于用户自主填写的关于用户名的标签很少，所以需要我们从不同角度为用户的该用户名添加标签。

【发明内容】

[0003]为了解决现有技术中的上述不足之处，根据本发明的一方面，提供一种一种信息处理方法，所述信息处理方法包括:获取第一信息集合，所述第一信息集合包括第一组多个用户名和多个词汇；使用语言模型来训练所述第一信息集合，得到第一多维向量集合，所述第一多维向量集合中的一个多维向量表示所述第一组多个用户名和多个词汇中的一个词汇或者一个用户名；以及根据所述第一多维向量集合中的每个多维向量表示的第一组多个用户名和多个词汇中的各个词汇和各个用户名相互之间的相似度来对所述第一组多个用户名和多个词汇进行聚类，将所述第一组多个用户名和多个词汇划分为第一多个社区。
[0004]此外，根据本发明的一个实施例，所述的信息处理方法，进一步包括:根据表示特定社区中的各个词汇和各个用户名之间的相似度的多维向量来建立相似度网络；以及根据随机游走算法确定对应于所述特定社区中的每个词汇的权重，使用权重大于用户预设的第一阈值的词汇作为所述特定社区的标签。
[0005]此外，根据本发明的一个实施例，所述的信息处理方法进一步包括:根据所述相似度网络来计算所述特定社区中每个用户名对于所述特定社区的影响力，使用所述影响力大于用户预设的第二阈值的用户名作为所述特定社区的标签。
[0006]此外，根据本发明的一个实施例，所述的信息处理方法进一步包括:当有特定用户名关注所述特定社区中的一个用户名时，根据所述特定社区中的被关注的用户名的影响力以及所述特定社区的特定词汇的权重来计算是否能够用所述特定社区中的所述特定词汇作为所述特定用户的标签。
[0007]此外，根据本发明的一个实施例，所述的信息处理方法，进一步包括:当所述特定社区中的第一用户发布了第一信息时，将所述第一信息推荐给所述特定社区中的除第一用户以外的其他用户。
[0008]—种信息处理装置，所述信息处理装置包括:获取单元，经配置来获取第一信息集合，所述第一信息集合包括第一组多个用户名和多个词汇；训练单元，经配置来使用语言模型来训练所述第一信息集合，得到第一多维向量集合，所述第一多维向量集合中的一个多维向量表示所述第一组多个用户名和多个词汇中的一个词汇或者一个用户名；以及分类单元，经配置来根据所述第一多维向量集合中的每个多维向量表示的第一组多个用户名和多个词汇中的各个词汇和各个用户名相互之间的相似度来对所述第一组多个用户名和多个词汇进行聚类，将所述第一组多个用户名和多个词汇划分为第一多个社区。
[0009]此外，根据本发明的一个实施例，其中，所述的信息处理装置进一步包括:相似度建立单元，经配置来根据表示特定社区中的各个词汇和各个用户名之间的相似度的多维向量来建立相似度网络，以及社区表示单元，经配置来根据随机游走算法确定对应于所述特定社区中的每个词汇的权重，使用权重大于用户预设的第一阈值的词汇作为所述特定社区的标签。
[0010]此外，根据本发明的一个实施例，其中，所述社区表示单元进一步经配置来:根据所述相似度网络来计算所述特定社区中每个用户名对于所述特定社区的影响力，使用所述影响力大于用户预设的第二阈值的用户名作为所述特定社区的标签。
[0011]此外，根据本发明的一个实施例，其中，所述社区表示单元进一步包括:计算单元，当有特定用户名关注所述特定社区中的一个用户名，则所述计算单元经配置来根据所述特定社区中的被关注的用户名的影响力以及所述特定社区的特定词汇的权重来计算是否能够用所述特定社区中的所述特定词汇作为所述特定用户的标签。
[0012]此外，根据本发明的一个实施例，其中，所述的信息处理装置，进一步包括:推荐单元，当所述特定社区中的第一用户发布了第一信息时，所述推荐单元经配置来将所述第一信息推荐给所述特定社区中的除第一用户以外的其他用户。
[0013]由此可见，本发明提供的用于社交网络的信息处理方法和装置，在进行社区发现时，能够综合考虑用户名的网络结构，信息内容和信息传递；并且可以获取足够数量和种类的标签来标识所发现的社区；同时，本发明提供的用于社交网络的信息处理方法和装置，不涉及复杂网络的计算，速度更快，更加高效和实用，提高了用户的使用体验。
【附图说明】
[0014]为了更清楚地说明本发明实施例的技术方案，下面将对实施例的描述中所需要使用的附图作简单地介绍。下面描述中的附图仅仅是本发明的示例性实施例:
[0015]图1示出了根据本发明实施例的应用于一电子设备的信息处理方法100的流程图；
[0016]图2示出了根据本发明实施例的应用于一电子设备的信息处理装置200的示范性结构框图。
【具体实施方式】
[0017]为了使得本发明的目的、技术方案和优点更为明显，下面将参照附图详细描述根据本发明的示例实施例。显然，所描述的实施例仅仅是本发明的一部分实施例，而不是本发明的全部实施例，应理解，本发明不受这里描述的示例实施例的限制。基于本公开中描述的本发明实施例，本领域技术人员在没有付出创造性劳动的情况下所得到的所有其它实施例都应落入本发明的保护范围之内。
[0018]以下，将参考附图详细描述本发明的优选实施例。
[0019]图1示出了根据本发明实施例的应用于一电子设备的信息处理方法100的流程图。其中，所述信息处理方法100可以用于进行社区发现，此外，在本发明的一个实施例中，所述信息处理方法100还可以用于获取标签来标识所发现的社区。
[0020]下面，将参照图1来描述根据本发明的一个实施例的语料处理方法100。如图1所示，首先，在步骤SllO中，获取第一信息集合，所述第一信息集合包括第一组多个用户名和多个词汇。一般地，第一信息集合中的每条信息都可以从社交网站上获取，其中，从社交网站上获取的信息既包括用户名还可以包括用户名以外的词汇，用户名与词汇可以互为上下文。在本发明的一个示例中，词汇可以从用户名的标签、职位、专业以及所发布信息内容等中获取。
[0021]接下来，在步骤S120中，使用语言模型来训练所述第一信息集合，得到第一多维向量集合，所述第一多维向量集合中的一个多维向量表示所述第一组多个用户名和多个词汇中的一个词汇或者一个用户名。具体而言，语言模型一般是指根据语言客观事实而进行的语言抽象数学建模，通过使用语言模型可以建立一个能够描述给定词序列在语言中的出现的概率的分布。在本发明的一个实施例中，所述语言模型可以是多层反馈神

完整全部详细技术资料下载

当前第1页1 2 3 4

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：卢小东;
技术所有人：联想（北京）有限公司;
我是此专利的发明人

上一篇：一种面向HBase的性能测试系统的制作方法
上一篇：Json数据转二维数组的方法及系统的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。