一种基于概念格的科普主题及核心知识提取方法

文档序号:37158145发布日期:2024-02-26 17:23阅读:14来源:国知局
一种基于概念格的科普主题及核心知识提取方法

本发明涉及粒计算中的形式概念分析,具体涉及一种基于概念格的科普主题及核心知识提取方法。


背景技术:

1、伴随着移动互联网技术的发展,知识的表现形式愈发多样,例如视频、文本、图片和歌曲等,客观上养成了读者“碎片化”的学习习惯。碎片化学习具有数字化时代的特征,首先是灵活度高,不受时间和地点的限制。其次,碎片化学习针对性强,学习者可重点选择自己更希望学习的那部分内容。第三,碎片化学习的学习效率高,由于单个碎片内容的学习时间较短,保障了读者的学习兴趣。面对当前知识碎片化的现象,如何系统地、个性化地为人们科普知识成为了当今亟待解决的问题。

2、概念格是一种数学工具和概念分析的方法,可用于处理和分析数据、信息和知识。其核心思想是将数据或知识表示为一个概念的网络结构,其中包括对象和属性。该网络以表格或矩阵的形式呈现,其中行代表对象,列代表属性。每个格子中的元素表示对象是否具有特定属性。通过分析该网络结构,可以识别出不同的概念,即对象和属性之间的关联关系。事实上,形式概念分析可用于知识提取。形式背景可为知识提取提供坚实的基础,并将科普主题和核心知识以结构化的方式表示。另一方面,形式概念分析有助于系统性地提取和分析关键知识,并且使得知识提取更加精确和可靠,进而为科普和教育提供有力的支持。

3、决策研究是多学科联手进行的综合探讨活动,在信息科学、管理科学、系统科学、行为科学乃至心理学方面,决策研究都有一席之地。一般来说,带有决策的数据信息比没有决策的数据更能吸引人们的注意力。一方面,带有决策的数据能够全面地体现各种因素之间的联系,潜藏着内在的等待我们去发掘的规律。另一方面,人类认知世界的主要目的之一就是进行预测和决策,只有在原始积累知识的基础上获得能够指导后续生活、科研和创造的普遍规律或者导向,人类才能取得更大的进步。所以,希望通过带有决策的数据来获取更多有价值的信息,特别是与决策规则相关的信息。

4、然而目前的推荐方法通常不具备形式概念分析所具备的系统性和层次性,以及缺乏决策研究对知识的深度挖掘和综合理解,导致推荐的结果具有片面性和局限性。其次,这些推荐方法往往过于依赖标签,即推荐性能高度依赖于准确和全面的标签信息,以致于在标签不准确或不充分时,推荐系统的鲁棒性会急剧下降,从而可能降低用户体验和推荐质量。


技术实现思路

1、有鉴于此,本发明提供了一种基于概念格的科普主题及核心知识提取方法,用以至少解决现有技术中推荐模型的性能过度依赖正确标签的问题。

2、为了实现上述目的,本发明采用如下技术方案:

3、一种基于概念格的科普主题及核心知识提取方法,包括以下步骤:

4、s1.获取科普主题作为对象集o={o1,o2,...,on},并获取各科普主题相应的核心知识作为属性集a={a1,a2,...,am},同时获取各科普主题内容受众人群作为标签集d={d1,d2,...,dr};其中,n、m和r均大于0;

5、s2.构建决策形式背景f=(o,a,ioa,d,iod),其中,ioa为对象集o和属性集a上的二元关系,若ioa(oi,aj)=1,表示对象oi拥有属性aj;反之若ioa(oi,aj)=0,则表示对象oi不拥有属性aj;iod则表示对象集o和属性集d上的二元关系,若iod(oi,dj)=1,表示对象oi的受众人群为dj;反之若iod(oi,dj)=0,则表示对象oi的受众人群不为dj;

6、s3.从决策形式背景中选取部分子集作为决策形式子背景;

7、s4.在决策形式子背景(o′,a,io′a)和决策形式子背景(o′,d,io′d)上根据概念格定义分别构建概念格l(o′,a,io′a)和l(o′,d,io′d);

8、s5.利用概念格l(o′,a,io′a)和l(o′,d,io′d)通过增量法分别构建形式背景(o,a,ioa)和l(o,d,iod)的概念格;

9、s6.根据决策规则定义获取非平凡决策规则,并将所有符合条件的非平凡决策规则放入规则集r,视为完成规则和知识提取。

10、优选的,s5中获取概念格l(o,a,ioa)的具体内容包括:

11、若对概念格l(o′,a,io′a)新增一个对象oi,其中对象且则对概念格l(o′,a,io′a)中原有的概念(x,b)变化满足以下情况:

12、(1)如果其中f(oi)表示对象oi所拥有的属性,则概念(x,b)不更新,b为空集除外;

13、(2)如果b∩f(oi)=b,则概念(x,b)将更新为(x∪{oi},b);

14、(3)在且b∩f(oi)≠b的情况下,如果oi之外没有对象oj满足则借助概念(x,b)产生一个新的概念(x∪{oi},b∩f(oi));

15、(4)如果对任意j<i均不满足则对象oi自己产生一个新的概念({oi},f(oi));

16、通过连续地增加对象,最终获得形式背景(o,a,ioa)的概念格l(o,a,ioa)。

17、优选的,s5中获取概念格l(o,d,iod)的具体内容包括:

18、若对概念格l(o′,d,iod)新增一个对象oi,其中对象且则对概念格l(o′,d,iod)中原有的概念(y,c)变化满足以下情况:

19、(1)如果其中f(oi)表示对象oi所拥有的属性,则概念(y,c)不更新,c为空集除外;

20、(2)如果c∩f(oi)=c,则概念(y,c)将更新为(y∪{oi},c);

21、(3)在且c∩f(oi)≠c的情况下,如果oi之外没有对象oj满足则借助概念(y,c)产生一个新的概念(y∪{oi},c∩f(oi));

22、(4)如果对任意j<i均不满足则对象oi自己产生一个新的概念({oi},f(oi));

23、通过连续地增加对象,最终获得形式背景(o,d,iod)的概念格l(o,d,iod)。

24、优选的,s6中根据决策规则定义获取非平凡决策规则的具体内容包括:对于(x,b)∈l(o,a,ioa)和(y,c)∈l(o,d,iod),如果则称b→c为一条决策规则,如果x,y,b,c都非空,则b→c称为一条非平凡决策规则。

25、经由上述的技术方案可知,与现有技术相比,本发明公开提供了一种基于概念格的科普主题及核心知识提取方法,该技术将具有以下有益效果:

26、形式概念分析有助于识别多样性和准确性的概念,从而更好地满足用户的需求,它可以通过在概念格中表示不同的概念来提供更多的多样性。基于形式概念分析的决策规则是基于概念格构建的,具有清晰的层次结构,更容易被分析和解释,有助于避免矛盾性的决策;此外,由于其考虑了概念之间的多层次关系,因此还能够更好地适应多变和复杂的情境,尤其是在数据量较少时,依旧能提供相当可观的规则数量,这使得模型可以广泛应用在数据量相对较少的数据中。另外,基于决策形式背景的决策规则更具通用性和适应性,可以通过构造相似度等指标简单地应用在诸如推荐模型等领域。最为重要的是,基于决策形式背景生成的决策规则较多,不易受到标签不准确或不全面的影响,因此与现有技术相比,本发明具有更高鲁棒性,在诸如推荐模型等领域会拥有更高的性能表现。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1