基于区块链的自媒体数据管理系统及方法与流程

文档序号:30968829发布日期:2022-07-30 20:21阅读:143来源:国知局
基于区块链的自媒体数据管理系统及方法与流程

1.本发明涉及自媒体数据管理技术领域,具体为基于区块链的自媒体数据管理系统及方法。


背景技术:

2.自媒体是指普通大众通过网络等途径向外发布他们本身的事实和新闻的传播方式,是普通大众经由数字科技与全球知识体系相连之后,一种提供与分享他们本身的事实和新闻的途径。是私人化、平民化、普泛化、自主化的传播者,以现代化、电子化的手段,向不特定的大多数或者特定的单个人传递规范性及非规范性信息的新媒体的总称。
3.在目前的生活中,自媒体的不断普及让大多数人能够更加自由的发布内容,因此博取关注量、获取广告资源成为了一种新的盈利方式,在这样的背景下,如何获得更大的曝光量成为了自媒体人亟待解决的问题,因此出现了一种多平台发布器,其可以通过一次编辑后同步发到多个自媒体平台,从而获得更多的曝光量,然而各平台的机制不同,如何在发布时进行更改才能获得更多地曝光量成为了一个问题。与此同时,在利润的加持下,抄袭、搬运等不道德行为出现在网络自媒体环境下,如何抵制并审核这样的行为也成为一个重要问题。


技术实现要素:

4.本发明的目的在于提供基于区块链的自媒体数据管理系统及方法,以解决上述背景技术中提出的问题。
5.为了解决上述技术问题,本发明提供如下技术方案:
6.基于区块链的自媒体数据管理方法,该方法包括以下步骤:
7.s1、获取多平台发布器下的多平台自媒体历史数据,构建标题管理模型,生成智能调节标题需求反馈至发布人员端口,所述多平台发布器指可将一篇自媒体数据同时发布在多个社交平台的中间件;例如在目前较为常见的有“融x宝、简x、易x助手”等等软件,其主要功能均是可以一键管理多平台账号,在发布内容时,只需编辑一次,即可同时转发到多个登陆好的社交平台;
8.s2、构建内容管理模型,在多平台上获取相似内容,利用发布时间判断是否出现抄袭,并将结果反馈至审核人员端口;
9.s3、构建评论管理模型,获取评论内容,构建相似度对比,分析是否出现搬运,并将结果反馈至审核人员端口;
10.s4、构建区块链存储模块,利用区块链存储模块对发布数据、审核数据进行存储,并设置密钥,允许通过密钥调用数据。
11.根据上述技术方案,所述标题管理模型包括:
12.获取多平台发布器下的多平台自媒体历史数据,所述多平台自媒体历史数据包括多平台标题数据;
13.所述多平台标题数据包括标题字数、标题格式、标题中心位置、文章阅读量;
14.所述标题格式指标题发布时的行数量;主要体现为标题在发布后,能否全部被用户看到,例如将标题分为两行发布、三行发布等;
15.所述标题中心位置指文章重点内容在标题上体现的位置;所述标题上体现的位置包括前、中、后三种,将标题按照字节数均分为3份,分别记为标题前、中、后位置,无法整分的将余数记入标题后位置;获取文章重点内容字节数在标题前、中、后位置所占比例,所述标题中心位置为文章重点内容字节数在标题前、中、后位置所占比例最大的位置;若存在相同比例情况,则按照标题前位置、标题中位置、标题后位置的顺序为优先级进行划分;
16.以标题字数、标题格式、标题中心位置为自变量,以文章阅读量为因变量,构建线性模型:
17.ma=k1*x1+k2*x2+k3*x3+β
18.其中,ma代表文章a的文章阅读量的归一化数据;k1、k2、k3分别代表标题字数、标题格式、标题中心位置的线性回归参数;x1、x2、x3分别代表标题字数、标题格式、标题中心位置的归一化数据;β记为误差因子,受到各平台注册用户的年龄影响;
19.构建各平台的文章阅读量预警值,若存在ma低于预警值,则反馈智能调节标题需求至发布人员端口。
20.根据上述技术方案,所述内容管理模型包括:
21.在多平台发布器发布文章时,以单平台优先发布的方式进行发布;
22.所述的单平台优先发布方式为自媒体领域通用的管理方式,即优先选择曝光率适应度高的平台发布原创文章,再设置间隔时间,间隔时间过后,在其余平台上统一发布,然而在这种方式下,有些平台会存在有全网审核系统,会认定后续发布的内容为抄袭内容;
23.在历史数据下,审核人员在审核单平台的文章时,在多平台上获取相似内容,获取多平台上相似内容的发布时间,生成各发布人员的时间发布规律;
24.对任一账号m,获取m历史数据下的优先发布内容的任一平台a与多平台相似内容的发布时间的时间差值,记为集合t={t1、t2、

、tn};
25.以n+1作为时间规律预测结果,建立公式如下:
[0026][0027]
其中,t
n+1
代表下一次的预测时间差值;ωi为预测截距;γi为预测斜率;记为新增期数,即n+1时,i为历史数据期数;
[0028][0029][0030]
其中,分别代表在移动的数据组数为u组时的一次移动平均值与二次移动平均值;u代表参与移动的数据组数;
[0031]
任一账号m在任一平台a优先发布内容后,获取预测时间差值;
[0032]
获取多平台上相似内容的发布时间,计算真实时间差值;
[0033]
构建阈值,若存在预测时间差值与真实时间差值的绝对值,超出阈值,则判定当前为异常操作,将结果反馈至审核人员端口。
[0034]
根据上述技术方案,所述评论管理模型包括:
[0035]
获取u个用户在s篇文章内容下的评论数据,建立矩阵:
[0036][0037]
其中,r代表自媒体受众
‑‑
评论
‑‑
文章内容矩阵;代表自媒体受众i
θ
对文章内容jq发表的评论,其中1≤θ≤u、1≤q≤s;
[0038]
在目前的自媒体中,搬运现象已成为一个难以把控的现象,其不同于抄袭,其往往会通过删改字节,更换段落等等方式逃避抄袭的检测,导致先发布人员内容被整理删改后,遭到搬运,因此本技术从评论内容出发,利用两个自媒体受众用户的评论内容实现文章搬运的检测,对当前“融梗”、“抄梗”等现象进行分析审核;
[0039]
根据矩阵r计算得出任意两个自媒体受众i
θ1
,i
θ2
的欧几里得距离
[0040][0041]
构建相似度模型:
[0042][0043]
其中,q代表两个自媒体受众i
θ1
,i
θ2
共同评论过的文章内容数量;sim(i
θ1
,i
θ2
)代表两个自媒体受众i
θ1
,i
θ2
对文章内容的评论相似度;
[0044]
分别获取两个自媒体受众i
θ1
,i
θ2
对任两篇文章的评论内容,获取评论关键点字节,以余弦相似度对字节语义进行分析,并设置相似度阈值,若存在两个评论的字节语义的相似度超出相似度阈值,则获取两篇文章的发布时间,判断发布较晚的文章存在搬运,反馈至审核人员端口。
[0045]
基于区块链的自媒体数据管理系统,该系统包括发布端口、审核端口、区块链存储端口;
[0046]
所述发布端口连接发布人员数据端口,用于反馈数据至发布人员;所述审核端口连接审核人员数据端口,用于反馈至审核人员;所述区块链存储端口用于存储数据,且区块链存储端口分别与发布端口、审核端口相连接,发布端口、审核端口通过密钥调取数据;
[0047]
所述发布端口包括标题管理模块、推荐模块;所述审核端口包括内容审核模块、搬运分析模块、
[0048]
所述标题管理模块用于获取多平台发布器下的多平台自媒体历史数据,构建标题管理模型;所述推荐模块用于生成智能调节标题需求反馈至发布人员端口;所述内容审核
模块用于构建内容管理模型,在多平台上获取相似内容,利用发布时间判断是否出现抄袭,并将结果反馈至审核人员端口;所述搬运分析模块用于构建评论管理模型,获取评论内容,构建相似度对比,分析是否出现搬运,并将结果反馈至审核人员端口。
[0049]
根据上述技术方案,所述标题管理模块包括数据获取子模块、标题管理子模块;
[0050]
所述数据获取子模块用于获取多平台发布器下的多平台自媒体历史数据;所述标题管理子模块用于对获取多平台发布器下的多平台自媒体历史数据进行分析,预测当前标题的文章阅读量;
[0051]
所述多平台自媒体历史数据包括多平台标题数据;所述多平台标题数据包括标题字数、标题格式、标题中心位置、文章阅读量。
[0052]
根据上述技术方案,所述推荐模块包括预测结果读取子模块、需求反馈子模块;
[0053]
所述预测结果读取子模块用于读取标题管理模块生成的预测当前标题的文章阅读量;所述需求反馈子模块用于在预测当前标题的文章阅读量不满足阈值时,生成智能调节标题需求反馈至发布人员端口。
[0054]
根据上述技术方案,所述内容审核模块包括时间发布规律审核子模块、异常情况反馈子模块;
[0055]
所述时间发布规律审核子模块用于根据历史数据获取发布人员的时间发布规律,计算预测发布时间;所述异常情况反馈子模块用于判断实际发布时间与预测发布时间的差值是否满足阈值,若不满足,则反馈至审核人员端口。
[0056]
根据上述技术方案,所述搬运分析模块包括包括评论内容获取子模块、搬运分析子模块;
[0057]
所述评论内容获取子模块用于获取多个用户在多篇文章内容下的评论数据,构建评论管理模型;所述搬运分析子模块用于构建相似度对比,分析是否出现搬运,并将结果反馈至审核人员端口。
[0058]
根据上述技术方案,所述区块链存储模块包括区块链记录子模块、区块链调用子模块;
[0059]
所述区块链记录子模块用于存储数据;所述区块链调用子模块用于设置密钥,同时分别与发布端口、审核端口相连接,发布端口、审核端口通过密钥调取数据。
[0060]
与现有技术相比,本发明所达到的有益效果是:本发明利用发布端口连接发布人员数据端口,反馈数据至发布人员;利用审核端口连接审核人员数据端口,反馈至审核人员;利用区块链存储端口用于存储数据,且区块链存储端口分别与发布端口、审核端口相连接,发布端口、审核端口通过密钥调取数据;利用标题管理模块获取多平台发布器下的多平台自媒体历史数据,构建标题管理模型;利用推荐模块生成智能调节标题需求反馈至发布人员端口;利用内容审核模块用于构建内容管理模型,在多平台上获取相似内容,利用发布时间判断是否出现抄袭,并将结果反馈至审核人员端口;利用搬运分析模块构建评论管理模型,获取评论内容,构建相似度对比,分析是否出现搬运,并将结果反馈至审核人员端口;本发明能够实现在当前的自媒体乱象环境下,对数据的隐私存储,同时对文章内容的发布过程进行审核与监控,既能够帮助发布人员获取最大曝光量,也能够有效打击抄袭、搬运等不尊重劳动成果的现象,维护网络环境。
附图说明
[0061]
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
[0062]
图1是本发明基于区块链的自媒体数据管理系统及方法的流程示意图。
具体实施方式
[0063]
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0064]
请参阅图1,在本实施例中:
[0065]
设置多平台发布器为融媒宝,发布人员利用融媒宝编辑内容后进行多平台发布;
[0066]
获取多平台发布器下的多平台自媒体历史数据,构建标题管理模型,生成智能调节标题需求反馈至发布人员端口,所述多平台发布器指可将一篇自媒体数据同时发布在多个社交平台的中间件;
[0067]
获取多平台发布器下的多平台自媒体历史数据,所述多平台自媒体历史数据包括多平台标题数据;
[0068]
所述多平台标题数据包括标题字数、标题格式、标题中心位置、文章阅读量;
[0069]
所述标题格式指标题发布时的行数量;
[0070]
所述标题中心位置指文章重点内容在标题上体现的位置;所述标题上体现的位置包括前、中、后三种,将标题按照字节数均分为3份,分别记为标题前、中、后位置,无法整分的将余数记入标题后位置;获取文章重点内容字节数在标题前、中、后位置所占比例,所述标题中心位置为文章重点内容字节数在标题前、中、后位置所占比例最大的位置;若存在相同比例情况,则按照标题前位置、标题中位置、标题后位置的顺序为优先级进行划分;
[0071]
例如在本实施例中,以“自媒体多账号发布工具大全,快来看看”标题为例:
[0072]
则标题字数为17字节、标题格式为一行式,文章重点内容为自媒体多账号发布工具,因此标题中心位置为标题前位置;
[0073]
以标题字数、标题格式、标题中心位置为自变量,以文章阅读量为因变量,构建线性模型:
[0074]
ma=k1*x1+k2*x2+k3*x3+β
[0075]
其中,ma代表文章a的文章阅读量的归一化数据;k1、k2、k3分别代表标题字数、标题格式、标题中心位置的线性回归参数;x1、x2、x3分别代表标题字数、标题格式、标题中心位置的归一化数据;β记为误差因子,受到各平台注册用户的年龄影响;
[0076]
构建各平台的文章阅读量预警值,发现存在ma低于预警值,则反馈智能调节标题需求至发布人员端口,发布人员对标题进行调节,满足其高于预警值后进行发布,可更大概率获得高曝光量;
[0077]
构建内容管理模型,在多平台上获取相似内容,利用发布时间判断是否出现抄袭,并将结果反馈至审核人员端口;
[0078]
在多平台发布器发布文章时,以单平台优先发布的方式进行发布;
[0079]
在历史数据下,审核人员在审核单平台的文章时,在多平台上获取相似内容,获取多平台上相似内容的发布时间,生成各发布人员的时间发布规律;
[0080]
对任一账号m,获取m历史数据下的优先发布内容的任一平台a与多平台相似内容的发布时间的时间差值,记为集合t={t1、t2、

、tn};
[0081]
例如,在本实施例中,任意账号m其总是在单平台发布5分钟后,陆续在其他平台发布,因此其时间规律即为5分钟左右,通过多重数据分析,可逐渐增进精准度;
[0082]
以n+1作为时间规律预测结果,建立公式如下:
[0083][0084]
其中,t
n+1
代表下一次的预测时间差值;ωi为预测截距;γi为预测斜率;记为新增期数,即n+1时,i为历史数据期数;
[0085][0086][0087]
其中,分别代表在移动的数据组数为u组时的一次移动平均值与二次移动平均值;u代表参与移动的数据组数;
[0088]
任一账号m在任一平台a优先发布内容后,获取预测时间差值;
[0089]
获取多平台上相似内容的发布时间,计算真实时间差值;
[0090]
构建阈值,若存在预测时间差值与真实时间差值的绝对值,超出阈值,则判定当前为异常操作,将结果反馈至审核人员端口。
[0091]
构建评论管理模型,获取评论内容,构建相似度对比,分析是否出现搬运,并将结果反馈至审核人员端口;
[0092]
所述评论管理模型包括:
[0093]
获取u个用户在s篇文章内容下的评论数据,建立矩阵:
[0094][0095]
其中,r代表自媒体受众
‑‑
评论
‑‑
文章内容矩阵;代表自媒体受众i
θ
对文章内容jq发表的评论,其中1≤θ≤u、1≤q≤s;
[0096]
根据矩阵r计算得出任意两个自媒体受众i
θ1
,i
θ2
的欧几里得距离
[0097]
[0098]
构建相似度模型:
[0099][0100]
其中,q代表两个自媒体受众i
θ1
,i
θ2
共同评论过的文章内容数量;sim(i
θ1
,i
θ2
)代表两个自媒体受众i
θ1
,i
θ2
对文章内容的评论相似度;
[0101]
分别获取两个自媒体受众i
θ1
,i
θ2
对任两篇文章的评论内容,获取评论关键点字节,以余弦相似度对字节语义进行分析,并设置相似度阈值,若存在两个评论的字节语义的相似度超出相似度阈值,则获取两篇文章的发布时间,判断发布较晚的文章存在搬运,反馈至审核人员端口。
[0102]
构建区块链存储模块,利用区块链存储模块对发布数据、审核数据进行存储,并设置密钥,允许通过密钥调用数据。
[0103]
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
[0104]
最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1