一种自媒体文章未经授权发布的影响评估方法及系统与流程

文档序号:17740933发布日期:2019-05-24 20:05阅读:258来源:国知局
一种自媒体文章未经授权发布的影响评估方法及系统与流程

本发明属于自媒体技术领域,特别是涉及一种自媒体文章未经授权发布的影响评估方法及系统。



背景技术:

在自媒体时代,文章抄袭的现象严重,若影响力较强的媒体未经原作者授权发布文章,会严重损害文章原作者的名誉及利益,但目前还没有评估文章抄袭对文章原作者所带来的影响的方案。需要一种能够评估自媒体文章未经授权发布的影响的技术方案,为此提出一种自媒体文章未经授权发布的影响评估方法及系统。



技术实现要素:

本发明所要解决的技术问题是不能评估自媒体文章未经授权发布的影响的问题,提出一种自媒体文章未经授权发布的影响评估方法及系统。

本发明采用即时通信软件系统,所述即时通信软件系统是指具有自媒体文章发布功能的app或网页或小程序的任一项。本发明通过计算未经授权发布自媒体文章的发布方账号订阅量及未经授权发布的文章阅读量,评估自媒体文章未经授权发布的影响程度。本发明所述的方法及系统可以用于自媒体原作者获取文章被抄袭的情况及评估被抄袭的影响程度。

本发明的自媒体文章未经授权发布的影响评估方法,包括以下步骤:

识别未经授权发布的文章:识别自媒体文章的内容关键词,搜索相似文章,根据关键词重复的比例计算搜索出的文章与该自媒体文章的相似度;排除已授权发布的文章,生成未经授权发布的文章集合,记为集合a,统计集合a中文章的数量,记为n,对集合a中的文章进行编号,记为i,1≤i≤n。

所述内容关键词是指对文章含义起决定意义的字或词或句或段落的任一项或多项组合。

所述未经授权发布的文章是指与原文章的相似度超过一定阈值且未经过原文章作者授权的文章。

计算发布未授权文章的账号影响值:识别集合a中文章的发布方账号及其订阅量,根据发布账号的订阅量计算发布账号的权重值,记为pi,根据发布账号的权重值pi计算发布未授权文章的账号影响值,记为w。

所述发布账号的权重值其中hi表示转发账号的订阅量,h是事先设置的订阅量阈值,p是事先设置的权重边界值。

所述发布未授权文章的账号影响值其中g是事先设置的账号影响值计算系数。

计算未经授权发布的文章阅读量影响值:提取该自媒体文章的阅读量,记为r,提取集合a中文章的阅读量,记为si,根据该自媒体文章的阅读量r与未经授权发布的文章阅读量si计算未经授权发布的文章阅读量影响值,记为v。

所述未经授权发布的文章阅读量影响值其中k是事先设置的阅读量影响值计算系数。

评估自媒体文章未经授权发布的影响程度:根据发布未授权文章的账号影响值w及未经授权发布的文章阅读量影响值v计算自媒体文章未经授权发布的影响值x;根据自媒体文章未经授权发布的影响值x评估该自媒体文章未经授权发布的影响程度。

所述自媒体文章未经授权发布的影响值x=d·w·v,其中d是事先设置的影响值计算系数。

本发明的自媒体文章未经授权发布的影响评估系统,其特征在于包括:

一个或多个处理器;

存储器;

以及

一个或多个程序,其中所述一个或多个程序被存储在所述存储器中,并且被配置成由所述一个或多个处理器执行,所述程序包括:

识别未经授权发布的文章模块:识别自媒体文章的内容关键词,搜索相似文章,根据关键词重复的比例计算搜索出的文章与该自媒体文章的相似度;排除已授权发布的文章,生成未经授权发布的文章集合,记为集合a,统计集合a中文章的数量,记为n,对集合a中的文章进行编号,记为i,1≤i≤n。

所述内容关键词是指对文章含义起决定意义的字或词或句或段落的任一项或多项组合。

所述未经授权发布的文章是指与原文章的相似度超过一定阈值且未经过原文章作者授权的文章。

计算发布未授权文章的账号影响值模块:识别集合a中文章的发布方账号及其订阅量,根据发布账号的订阅量计算发布账号的权重值,记为pi,根据发布账号的权重值pi计算发布未授权文章的账号影响值,记为w。

所述发布账号的权重值其中hi表示转发账号的订阅量,h是事先设置的订阅量阈值,p是事先设置的权重边界值。

所述发布未授权文章的账号影响值其中g是事先设置的账号影响值计算系数。

计算未经授权发布的文章阅读量影响值模块:提取该自媒体文章的阅读量,记为r,提取集合a中文章的阅读量,记为si,根据该自媒体文章的阅读量r与未经授权发布的文章阅读量si计算未经授权发布的文章阅读量影响值,记为v。

所述未经授权发布的文章阅读量影响值其中k是事先设置的阅读量影响值计算系数。

评估自媒体文章未经授权发布的影响程度模块:根据发布未授权文章的账号影响值w及未经授权发布的文章阅读量影响值v计算自媒体文章未经授权发布的影响值x;根据自媒体文章未经授权发布的影响值x评估该自媒体文章未经授权发布的影响程度。

所述自媒体文章未经授权发布的影响值x=d·w·v,其中d是事先设置的影响值计算系数。

本发明的方法及系统具有的优点是:

(1)根据发布未授权文章的账号订阅量及未经授权发布的文章阅读量,有效评估自媒体文章未经授权发布的影响程度。

(2)通过评估自媒体文章未经授权发布的影响程度,为自媒体文章原作者或权利人的维权提供依据。

附图说明

图1是本发明实施例的自媒体文章未经授权发布的影响评估方法流程图;

图2是本发明实施例的自媒体文章未经授权发布的影响评估系统结构示意图。

具体实施方式

下面对本发明优选实施例作详细说明。

本发明采用即时通信软件系统,所述即时通信软件系统是指具有自媒体文章发布功能的app或网页或小程序的任一项。本发明通过计算未经授权发布自媒体文章的发布方账号订阅量及未经授权发布的文章阅读量,评估自媒体文章未经授权发布的影响程度。本发明所述的方法及系统可以用于自媒体原作者获取文章被抄袭的情况及评估被抄袭的影响程度。本实施例中,本专利方法及系统用于自媒体作者评估文章被抄袭的影响。

本实施例的自媒体文章未经授权发布的影响评估方法,按如下步骤实现:

识别未经授权发布的文章:识别自媒体文章的内容关键词,搜索相似文章,根据关键词重复的比例计算搜索出的文章与该自媒体文章的相似度;排除已授权发布的文章,生成未经授权发布的文章集合,记为集合a,统计集合a中文章的数量,记为n,对集合a中的文章进行编号,记为i,1≤i≤n。

所述内容关键词是指对文章含义起决定意义的字或词或句或段落的任一项或多项组合。

所述未经授权发布的文章是指与原文章的相似度超过一定阈值且未经过原文章作者授权的文章。本实施例中,针对某作者(微信公众号:好机友)的自媒体文章“支付宝集五福很容易,每天扫出8张福”,识别其内容关键词为“集五福”、“实体福卡”、“阿里系”、“花花卡”以及文章中的攻略段落,以内容关键词搜索相似文章,判断各文章中关键词重复的比例,若重复的比例大于事先设置的阈值(本实施例中阈值为90%),则判定该文章是未经授权发布的文章,据此生成未经授权发布的文章集合a,集合a中有3篇文章,n=3,文章的编号记为i。

计算发布未授权文章的账号影响值:识别集合a中文章的发布方账号及其订阅量,根据发布账号的订阅量计算发布账号的权重值,记为pi,根据发布账号的权重值pi计算发布未授权文章的账号影响值,记为w。

所述发布账号的权重值其中hi表示转发账号的订阅量,h是事先设置的订阅量阈值,p是事先设置的权重边界值。

所述发布未授权文章的账号影响值其中g是事先设置的账号影响值计算系数。本实施例中,识别集合a中3篇文章的发布方账号,其订阅量分别为h1=10,h2=10万,h3=1000,事先设置的订阅量阈值h=1万,事先设置的权重边界值p=1,则计算发布账号的权重值为p1=p=1,事先设置的账号影响值计算系数g=1,计算发布未授权文章的账号影响值

计算未经授权发布的文章阅读量影响值:提取该自媒体文章的阅读量,记为r,提取集合a中文章的阅读量,记为si,根据该自媒体文章的阅读量r与未经授权发布的文章阅读量si计算未经授权发布的文章阅读量影响值,记为v。

所述未经授权发布的文章阅读量影响值其中k是事先设置的阅读量影响值计算系数。本实施例中,提取该自媒体账号中该文章的阅读量r=2000,提取集合a中文章的阅读量分别为s1=1,s2=10000,s3=50,事先设置的阅读量影响值计算系数k=1,计算未经授权发布的文章阅读量影响值

评估自媒体文章未经授权发布的影响程度:根据发布未授权文章的账号影响值w及未经授权发布的文章阅读量影响值v计算自媒体文章未经授权发布的影响值x;根据自媒体文章未经授权发布的影响值x评估该自媒体文章未经授权发布的影响程度。

所述自媒体文章未经授权发布的影响值x=d·w·v,其中d是事先设置的影响值计算系数。本实施例中,事先设置的影响值计算系数d=1,计算自媒体文章未经授权发布的影响值x=d·w·v=1×1.101×5.026=5.53;根据计算出的自媒体文章未经授权发布的影响值x评估该自媒体文章未经授权发布的影响程度,x的值越大,则影响程度越大。

本实施例的自媒体文章未经授权发布的影响评估方法流程图,如图1所示。

本实施例的自媒体文章未经授权发布的影响评估系统,其特征在于包括:

一个或多个处理器;

存储器;

以及

一个或多个程序,其中所述一个或多个程序被存储在所述存储器中,并且被配置成由所述一个或多个处理器执行,所述程序包括:

识别未经授权发布的文章模块:识别自媒体文章的内容关键词,搜索相似文章,根据关键词重复的比例计算搜索出的文章与该自媒体文章的相似度;排除已授权发布的文章,生成未经授权发布的文章集合,记为集合a,统计集合a中文章的数量,记为n,对集合a中的文章进行编号,记为i,1≤i≤n。

所述内容关键词是指对文章含义起决定意义的字或词或句或段落的任一项或多项组合。

所述未经授权发布的文章是指与原文章的相似度超过一定阈值且未经过原文章作者授权的文章。本实施例中,针对某作者(微信公众号:好机友)的自媒体文章“支付宝集五福很容易,每天扫出8张福”,识别其内容关键词为“集五福”、“实体福卡”、“阿里系”、“花花卡”以及文章中的攻略段落,以内容关键词搜索相似文章,判断各文章中关键词重复的比例,若重复的比例大于事先设置的阈值(本实施例中阈值为90%),则判定该文章是未经授权发布的文章,据此生成未经授权发布的文章集合a,集合a中有3篇文章,n=3,文章的编号记为i。

计算发布未授权文章的账号影响值模块:识别集合a中文章的发布方账号及其订阅量,根据发布账号的订阅量计算发布账号的权重值,记为pi,根据发布账号的权重值pi计算发布未授权文章的账号影响值,记为w。

所述发布账号的权重值其中hi表示转发账号的订阅量,h是事先设置的订阅量阈值,p是事先设置的权重边界值。

所述发布未授权文章的账号影响值其中g是事先设置的账号影响值计算系数。本实施例中,识别集合a中3篇文章的发布方账号,其订阅量分别为h1=10,h2=10万,h3=1000,事先设置的订阅量阈值h=1万,事先设置的权重边界值p=1,则计算发布账号的权重值为p1=p=1,事先设置的账号影响值计算系数g=1,计算发布未授权文章的账号影响值

计算未经授权发布的文章阅读量影响值模块:提取该自媒体文章的阅读量,记为r,提取集合a中文章的阅读量,记为si,根据该自媒体文章的阅读量r与未经授权发布的文章阅读量si计算未经授权发布的文章阅读量影响值,记为v。

所述未经授权发布的文章阅读量影响值其中k是事先设置的阅读量影响值计算系数。本实施例中,提取该自媒体账号中该文章的阅读量r=2000,提取集合a中文章的阅读量分别为s1=1,s2=10000,s3=50,事先设置的阅读量影响值计算系数k=1,计算未经授权发布的文章阅读量影响值

评估自媒体文章未经授权发布的影响程度模块:根据发布未授权文章的账号影响值w及未经授权发布的文章阅读量影响值v计算自媒体文章未经授权发布的影响值x;根据自媒体文章未经授权发布的影响值x评估该自媒体文章未经授权发布的影响程度。

所述自媒体文章未经授权发布的影响值x=d·w·v,其中d是事先设置的影响值计算系数。本实施例中,事先设置的影响值计算系数d=1,计算自媒体文章未经授权发布的影响值x=d·w·v=1×1.101×5.026=5.53;根据计算出的自媒体文章未经授权发布的影响值x评估该自媒体文章未经授权发布的影响程度,x的值越大,则影响程度越大。

本实施例的自媒体文章未经授权发布的影响评估系统结构示意图,如图2所示。

当然,本技术领域中的普通技术人员应当认识到,以上实施例仅是用来说明本发明的,而并非作为对本发明的限定,只要在本发明的范围内,对以上实施例的变化、变型都将落入本发明的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1