一种多标签学习资源关联度定量计算方法

文档序号:10580193阅读:154来源:国知局
一种多标签学习资源关联度定量计算方法
【专利摘要】本发明公开了一种多标签学习资源关联度定量计算方法,1)学习资源语义化模型的建立;2)学习资源的相似性、相关性评估;3)多标签学习资源学习资源间相似度、相关度计算。本发明本文通过分析多知识点标引学习资源的结构特点,从学习资源间包含相同知识点的重合度计算相似度;从异同知识点间的语义、结构等属性计算相关度,从而形成学习资源间的关联度定量评估和计算方法,为学习资源的关联分析和关联检索奠定了研究基础。
【专利说明】
-种多标签学习资源关联度定量计算方法
技术领域
[0001] 本发明设及混凝±桥面板技术领域,更具体地说设及一种多标签学习资源关联度 定量计算方法。
【背景技术】
[0002] 本发明属于关联度评估及定量计算的一种方法,本专利主要设及对象为多知识点 标引的学习资源W及教育领域知识本体等。利用资源关联度、相似性评估W及相关性评估 等方法,将教育领域中教材、习题集、试题、试卷、教学视频、录音等不同类型的资源,利用知 识点进行标注,通过分析多知识点标引学习资源的结构特点,从学习资源间包含相同知识 点的重合度计算相似度;从异同知识点间的语义、结构等属性计算相关度,从而形成学习资 源间的关联度定量评估和计算方法。
[0003] 随着IT技术在教育教学领域中的广泛应用,互联网上积累了各种类型的数字化教 学资源,例如试题、试卷、录音、动画、教学视频、课件等,形成了大小不一的各类教育教学资 源库,但是现有的技术并未实现将运些资源进行高效的整合与相互关联,而现有的研究主 要集中在本体概念、词语、文本的相似度或相关度方面,关于知识点关联度相关计算方法相 对匿乏。本文若要实现对多标签学习资源关联度定量计算,首先需要将学习资源的语义进 行建模,其次明确怎样对学习资源的相似性、相关性进行评估,最后完成多标签学习资源学 习资源间相似度、相关度计算。

【发明内容】

[0004] 为解决上述技术问题,本发明提供一种多标签学习资源关联度定量计算方法。
[0005] 为了实现上述技术目的,本发明采取如下技术方案:一种多标签学习资源关联度 定量计算方法,其特征在于:其计算方法如下: 1) 明确学习资源的多标签属性: 贝1J,其形式化描述为:7?= [{(知,瓜),(知,瓜),……,(缸,先)},缸年0] 其中:Ki表示资源R包含的知识点i;Ai表示知识点i在资源帥的权重; 2) 学习资源的语义建模: 将学习资源的语义建模框架分为学习资源层、语义描述层、教育本体层; 其中,语义描述层对学习资源的语义信息进行了描述,是对跨媒体形态的异构学习资 源的抽象; 教育本体层描述了教育领域中固有的概念W及概念之间的关联; 给定本体库的关系集合巧日知识点集合片不失一般性,对任意关系C形成的有向无环 图,可表示为知化Ce),其中Aj, fe,…,AwG伪本体知识结点,<缸,仁〉G Cc为本体知识 结点i和J之间的关系属性; 当两个知识点间直接关联时,两者之间的路径可W表示为: path(Cc,缸,Aj')=< 缸,仁'〉,其中,< 缸,仁'〉GCc; 当两个知识点间接关联时,两者之间的路径可W表示为: 恥 ki, kn)二 <ki, h,---, kn>,其中 <ki, h〉,<k2, ks〉,…,<kn-i, kn>ECc; 3) 相似性评估: 学习资源的相似性评估,从形式化上,多知识点标签表现为学习资源模型的分量,两 个学习资源在多知识点标签上的"重合"部分,即相同知识点,直接预示了学习资源之间在 内容上的语义相似性,用集合Ke表示;另一方面,相同知识点的A?分量部分,则进一步体现了 对应知识点对学习资源的权重; 其中,学习资源相似性计算公式如下: SinAri,r2)二 Simeiri,r2) * Weieiri,r2) 其中,况化(17,〇)£[0,1]表示相同知识点的数目占总标注知识点数目的比例;/^立6 (17,〇) G [0,1],表示相同知识点在总标注资源中的综合权重; 4) 相关性评估: 将从资源间异同知识点在本体库中保持直接关联关系及间接关联关系两个方面计算 学习资源相关度,计算公式如下: Rel(ri,r2)二 Rel(Kdi而2) 其中,TfeJ体yj,估?;G [0,1]表示基于异同知识点标签的语义相关度; 5) 多标签学习资源的相似度计算: 相同知识点占总标注知识点比例的资源相似度计算如下:
其中,化btm幼资源n与n相同知识点的个数掀舶班错为资源ri与含所有知 识点个数。
[0006] 知识点对资源的权重,假设(心片,)为标注资源n与O相同知识点对,并且片在资 源n与O中的权重为(儿,儿),则资源中相同知识点的综合权重相计算如下:
其中,W(勒表示资源n与r冲相同知识点的编号。
[0007] 6)多标签学习资源的知识点间相关度计算: 多标签学习资源的相关度,考察资源间异同知识点在知识点本体库中的相关程度; 对教育领域知识本体库O及关系集巧日知识点集片知识点片和相关度计算存在两种 情况,分别为缸和存在直接关联和存在间接关联; 7)学习资源间相关度计算: 对于多知识点标签资源n和通过映射知识点的相关度到资源间的相关度,映射公 式如下:
其中,尼为仅在资源r域r冲标注的知识点集;函数distO定义知识点标签心,W和心心 的语义距离,用欧氏距离公式计算。 r 00081 而伞n維向冨 r'化1 1 k" , kin)与 n 化21 , k22 , , k2n)间的欧氏距离:c/j.st=
进一步地,步骤6的直接关联和间接关联计算如下:其中{( Ai E爲or(Aj' EKd2, kiEKeUKdiYU (I)直接关联,即$path(Cc,Ai,Aj') 当知识点<缸,直接关联,即$path (Ce,缸,仁')=<缸,仁〉ECe;
函数,缸,Aj)描述在特定的关系条件 下,两知识本体之间的关联度;由于不同的关系的语义含义的差别,函数7?6山心,片,A,)的定 义也会不同; 首先定义Afe tajR/(A)函数如下: MetaKUiCc,k) = {<k,ki~> \ SpathiCc,k,ki) MmiCc,ki)=Q A<k,k/> E Ce) 其中,0D(Cc,A)表示知识本体A的度; 对于不同的语义关系,计算公式为:
公式中,湯为衰减系数。当C分别为蕴含、层次、兄弟、依赖关系时,参数湯取0.8、0.85、 0.9、0.95,W保证知识点间路径扩散到3条后,仍然有0.5、0.6、0.7、0.8 W上的相关度。
[0009] (2)间接关联,即$path(仿,缸,Aj') 当知识点缸,间接关联;$path(Ge,缸,仁〇=<缸,缸4,..?,心。,心。4,..?,仁W,仁〉,其中 ^ki, ki+i〉,…,^ki+ti, ki+ti+i〉,…,^kj-I, kjy E Ce; 公式中货%知识本体最大路径长度,mJ'nU)为知识点缸,在知识本体库中的最短路径 长度。
[0010] 本发明的技术特点和效果为:学习资源语义化模型的建立; 学习资源所蕴含的知识点之间存在复杂的关联,此外,学习资源具有海量、独立和变化 快等特点,无法从资源层面有效描述资源间的关联关系,因此,需要将学习资源的语义进行 建模。本文学习资源的语义模型框架分为学习资源层、语义描述层、教育本体层3个部分。 [001。 1、学习资源的相似性、相关性评估; 对于学习资源,两个概念在词形、语义上可能完全不同,即没有公共特性,但是在实际 应用中,常常由于两者是关联出现或具有外在联系,两者之间是相关的。所W在计算过程 中,除了考虑上下位关系外,还应对其他类型进行考虑,故需要对学习资源的相似性、相关 性评进行估。
[001^ 2、多标签学习资源学习资源间相似度、相关度计算。
[0013]根据领域本体的相关理论和方法,教育领域的知识点、知识体系可W形成教育领 域知识本体。教育领域的知识体系的内部结构特点,W及知识点之间存在的各类关联关系, 则为知识点间的相似性和相关性评估方法的设计提供了思路。因此结合教育领域知识本 体,研究多标签学习资源的关联度评估方法,具有重要意义。
[0014] 本文通过分析多知识点标引学习资源的结构特点,从学习资源间包含相同知识点 的重合度计算相似度;从异同知识点间的语义、结构等属性计算相关度,从而形成学习资源 间的关联度定量评估和计算方法,为学习资源的关联分析和关联检索奠定了研究基础。
【附图说明】
[0015] 图1是本发明学习资源语义化模型结构图。
[0016] 图2是本发明知识本体库的结构图。
[0017] 图3本发明资源相关度考察对象的结构图。
【具体实施方式】
[0018] 为了使本发明的目的、技术方案及优点更加清楚明白,W下结合附图及实施例,对 本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用W解释本发明,并 不用于限定本发明。
[0019] 请参照图1,本发明提供本专利的目的是将互联网上积累的各种类型的数字化教 学资源,例如试题、试卷、录音、动画、教学视频、课件等具体相似知识点的资源进行关联,希 望最大程度的衡量学习资源的内涵,同时为定量刻画学习资源之间的关联程度提供依据。
[0020] 本专利的计算方法步骤如下: 第一步:明确学习资源的多标签属性。
[0021] 为了明确该学习资源与知识点在语义内容上的关联程度,给教师、学生提供个性 化的学习服务及资源的关联检索。但学习资源蕴含了一个或者多个知识点,因此,为了有 效、准确传递学习资源的知识蕴含信息,往往需要对学习资源进行标引,运时,学习资源便 具有了多标签属性。
[0022] 鉴于此,本文提出了多知识点标签的学习资源的概念,其形式化描述为: R= [{( ki, Ai),{ k2, A2),......,(仁,先)},仁年 0] 其中:斯隶示资源施含的知识点i;先隶示知识点i在资源7?中的权重(知识点在资源中 的重要程度在本文称为权重)。
[0023] 第二步:学习资源的语义建模。
[0024] 学习资源所蕴含的知识点之间存在复杂的关联,此外,学习资源具有海量、独立和 变化快等特点,无法从资源层面有效描述资源间的关联关系,因此,将学习资源的语义建模 框架分为学习资源层、语义描述层、教育本体层3个部分,如图1左部所示。其中,语义描述层 对学习资源的语义信息进行了描述,是对跨媒体形态的异构学习资源的抽象,具体描述形 式如图1右部所示。教育本体层描述了教育领域中固有的概念W及概念之间的关联。
[0025] 给定本体库的关系集合巧日知识点集合片不失一般性,对任意关系C形成的有向无 环图,可表示为&=化Ce),其中Aj,杉,…,Awg伪本体知识结点,<仁,G Cc为本体知 识结点i和J之间的关系属性。
[0026] 当两个知识点间直接关联时,两者之间的路径可W表示为: ki, kj)=< ki, kj >,某中,< ki, kj >ECc', 当两个知识点间接关联时,两者之间的路径可W表示为: 恥 ki, kn)二 <ki, h,---, kn>,其中 <ki, h〉,<k2, ks〉,…,<kn-i, kn>ECc', 第=步:相似性评估。
[0027] 学习资源的相似性评估,从形式化上,多知识点标签表现为学习资源模型的仁'分 量。两个学习资源在多知识点标签上的"重合"部分,即相同知识点,直接预示了学习资源之 间在内容上的语义相似性,用集合Ke表示;另一方面,相同知识点的A?分量部分,则进一步体 现了对应知识点对学习资源的权重。
[0028] 依据上述讨论,学习资源相似性计算公式如下: SinAri,r2)二 Simeiri,r2) * Weieiri,r2) 其中,况化(17,〇)£[0,1]表示相同知识点的数目占总标注知识点数目的比例;/^立6 (17,〇) G [0,1],表示相同知识点在总标注资源中的综合权重。
[0029] 第四步:相关性评估。
[0030] 学习资源的相关性评估,重点从资源间不同知识点间的语义相关度进行计算。
[0031] 从形式化上,学习资源之间在上的"非重合"部分,实际也可能存在间接的语义 关系,运种关系可通过教育领域知识本体库进行本体推理而计算出来,用集合估表示。
[0032] 学习资源本体库中,学习资源之间的关联关系,显性给出了学习资源之间的关联 性及其关联的定量程度,可W用于学习资源关联度的衡量。
[0033] 本文将从资源间异同知识点在本体库中保持直接关联关系及间接关联关系两个 方面计算学习资源相关度,计算公式如下: Rel(ri,r2)二 Rel(Kdi而2) 其中,TfeJ体yj,估?;G [0,1]表示基于异同知识点标签的语义相关度。
[0034] 第五步:多标签学习资源的相似度计算。
[0035] 相同知识点占总标注知识点比例的资源相似度计算如下:
其中,化1为资源打与O相问知识点的个数,刃资源rj与1:?包曾所有知识点个数。
[0036] 知识点对资源的权重,假设(片,片,)为标注资源n与O相同知识点对,并且片在资 源n与O中的权重为(儿,儿),则资源中相同知识点的综合权重相计算如下:
其中,ic/(載)表不资源n与O中相问知识点的编号。
[0037] 第六步:多标签学习资源的知识点间相关度计算 多标签学习资源的相关度,考察资源间异同知识点在知识点本体库中的相关程度。
[003引对教育领域知识本体库O及关系集巧日知识点集片知识点仁和仁相关度计算存在两 种情况,分别为和仁存在直接关联和存在间接关联。现将两种情况的计算方法总结如下, 其啼 WkiEKdi, kjEKeUKd2)w[kjEKd2, kiEKeUKdiVU (I)直接关联,即$path(Cc,仁,仁') 当知识点<仁,直接关联,即$pa1:h(Cc,仁,Aj') 二, kj〉ECe;
)函数,片,Aj)描述在特定的关系条件 下,两知识本体(主要是知识点)之间的关联度。由于不同的关系的语义含义的差别,函数 TfeJck,缸,仁?)的定义也会不同。
[0039] 首先定义#6(3足£/(0函数如下: Me化 KlKCc,k) = {<k,ki'>\%path(Cc,k,ki) ;\m(Cc,ki)=Q;\<k, ki>ECc} 其中,0D(Cc,A)表示知识本体A的度。
[0040] 对于不同的语义关系,计算公式为:
公式中,湯为衰减系数。当C分别为蕴含、层次、兄弟、依赖关系时,参数湯取0.8、0.85、 0.9、0.95,W保证知识点间路径扩散到3条后,仍然有0.5、0.6、0.7、0.8 W上的相关度。
[0041 ] (2)间接关联,即$path(仿,仁,Aj') 当知识点仁,Aj'间接关联;$path(Gc, Ai,仁')=< Ai,Aiw,...,Ai+。,Aiwj,...,Ajw, kj〉,英夺处i,ki+i〉,...,^ ki+ti, ki+ti+i〉,...,处ECcoiVd) 公式(10)中货%知识本体最大路径长度,mJ'nU)为知识点Ai,仁在知识本体库中的最短 路径长度。
[0042]第屯步:学习资源间相关度计算 对于多知识点标签资源n和r?,通过映射知识点的相关度到资源间的相关度,映射公 式如下:
其中,枯为仅在资源n或中标注 的知识点集;函数dist()定义知识点标签心,W和心,的语义距离,用欧氏距离公式计算。 [00创两个n维向量打化ll,kl2,…,kin)与n化21,k22,…,k2n)间的欧氏距离:
O
[0044] 因此本发明1、为了有效、准确传递学习资源的知识蕴含信息,往往需要对学习资 源进行标引,学习资源便具有了多标签属性。本文提出了多知识点标签的学习资源的概念。
[0045] 2、学习资源所蕴含的知识点之间存在复杂的关联,此外,学习资源具有海量、独立 和变化快等特点,无法从资源层面有效描述资源间的关联关系,因此,本文将学习资源的语 义建模框架分为学习资源层、语义描述层、教育本体层3个部分,并给出模型图。具体从资源 层面有效描述资源间关联关系。
[0046] 3、针对知识点间接、直接关联时,给出路径表示方法。
[0047] 4、从多标签学习资源自身特点出发,相似性计算重点考虑资源间包含相同知识点 的个数和相同知识点在两个资源中的权重;相关度计算重点考虑资源间异同知识点间的关 耳关关系。
[0048] 5、面对不同知识点,考察资源间异同知识点在知识点本体库中的相关程度(包括 直接关联和间接关联)。
[0049] 6、面对不同学习资源,对多知识点标签资源n和通过映射知识点的相关度到资 源间的相关度,进行学习资源间相关度计算。
[0050] 正确评估学习资源的关联度,主要从资源的相似度和相关度入手,在实际应用中 具有广泛的应用前景。本文在了解教育领域本体库和学习资源本体描述模型的基础下,面 向学习资源查询与检索、个性化推荐W及资源库的更新维护等应用场景,研究了学习资源 的多知识点标引形式,详细分析了影响学习资源相似性和相关性的主要因素,提出了基于 多知识点标签综合评价学习资源间的相似度和相关度的方法,并给出了相应的定量计算公 式。运些计算公式严格依据客观数据进行推理计算,从而使得计算的主观性大大减少,提高 了计算的准确性。
[0051] 其中,学习资源的标注结果如下 学习資
部分教育领域的知识本体的关系属性定义
W上所述仅为本发明的较佳实施例而已,并不用W限制本发明,凡在本发明的精神和 原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
【主权项】
1. 一种多标签学习资源关联度定量计算方法,其特征在于:其计算方法如下: 1) 明确学习资源的多标签属性: 贝1J,其形式化描述为:友=[{(幻,A),( Λ?),......,(女i, A')},fc'在0] 其中:K i表示资源R包含的知识点i ; A i表示知识点i在资源R中的权重; 2) 学习资源的语义建模: 将学习资源的语义建模框架分为学习资源层、语义描述层、教育本体层; 其中,语义描述层对学习资源的语义信息进行了描述,是对跨媒体形态的异构学习资 源的抽象; 教育本体层描述了教育领域中固有的概念以及概念之间的关联; 给定本体库的关系集合αρ知识点集合a不失一般性,对任意关系c形成的有向无环 图,可表示为&=U,Cc),其中女1,权…,l/i/e伪本体知识结点,<fc·,为本体知识 结点i和J之间的关系属性; 当两个知识点间直接关联时,两者之间的路径可以表示为: pathlCc, ki,kj)=〈 ki,kj >,其中,〈ki,kj ~>已 C。·, 当两个知识点间接关联时,两者之间的路径可以表示为: pathXGc,ki,kn) = <ki,k2,···,kn〉,实中<ki,k2>,<k2,k3>,…入 kn-i,kt^ECc·, 3) 相似性评估: 学习资源的相似性评估,从形式化上,多知识点标签表现为学习资源模型的h分量,两 个学习资源在多知识点标签上的"重合"部分,即相同知识点,直接预示了学习资源之间在 内容上的语义相似性,用集合Ke表示;另一方面,相同知识点的儿分量部分,则进一步体现了 对应知识点对学习资源的权重; 其中,学习资源相似性计算公式如下: Sim(n,r2) = Sime(ri,r2) * Weie(ri,r2) 其中,5?/^(η,e [〇,1 ]表示相同知识点的数目占总标注知识点数目的比例;;feie (ri,ri?) e [〇,1],表示相同知识点在总标注资源中的综合权重; 4) 相关性评估: 将从资源间异同知识点在本体库中保持直接关联关系及间接关联关系两个方面计算 学习资源相关度,计算公式如下: Rel(ri,r2) = Rel(Kdi,Kd2) 其中,[〇, 1]表示基于异同知识点标签的语义相关度; 5) 多标签学习资源的相似度计算: 相同知识点占总标注知识点比例的资源相似度计算如下:其中,i?Co u/3 ?为资源r 1与相同知识点的个数,为资源ri与包含所有知 识点个数; 知识点对资源的权重,假设(fc,fc,)为标注资源?与β相同知识点对,并且幻在资源ri与 β中的权重为(儿,儿,),则资源中相同知识点的综合权重相计算如下:其中,ic/( A)表示资源D与β中相同知识点的编号; 6)多标签学习资源的知识点间相关度计算: 多标签学习资源的相关度,考察资源间异同知识点在知识点本体库中的相关程度; 对教育领域知识本体库0及关系集_知识点集Α知识点MPb相关度计算存在两种情 况,分别为h和b存在直接关联和存在间接关联; 7 )学习资源间相关度计算: 对于多知识点标签资源D和β,通过映射知识点的相关度到资源间的相关度,映射公式 如下:其中Α为仅在资源?或r冲标注的知识点集;函数dist()定义知识点标签和心^ 的语义距离,用欧氏距离公式计算; 两个η维向量_T2(kii,ki2,…,kin)与(k2i,k22,…,k2n)间的欧氏距离:c/is2.根据权利要求1所述的一种多标签学习资源关联度定量计算方法,其特征在于:步骤 6的直接关联和间接关联计算如下:其中{ Ui ^兄/1,幻(岛· e几β, h el U Kdl)}·. (1) 直接关联,即$path(Cc,fc',Aj') 当知识点<fc',岛'>直接关联,即$path(Cc,fc',岛')=〈fc,岛'> ECc; TtWKfc·,D=岛'))函数岛')描述在特定的关系条件下, 两知识本体之间的关联度;由于不同的关系的语义含义的差别,函数幻)的定义 也会不同; 首先定义函数如下: Me taKU{ Cc,k) = { <k, ki> \ %path(Cc,k,ki) A〇O(Cc,ki)=0 A<k, ki? e Cc\ 其中,OD(G,幻表示知识本体础勺度; 对于不同的语义关系,计算公式为:公式中,f为衰减系数; 当c分别为蕴含、层次、兄弟、依赖关系时,参数遂取0.8、0.85、0.9、0.95,以保证知识点 间路径扩散到3条后,仍然有0.5、0.6、0.7、0.8以上的相关度; (2) 间接关联,即Spathl;^,^,^ 当知识点Uj'间接关联;$path ((?c,Uj')=〈女i,fc'+i,…,女如,女如+2,…,Ajw,Aj'>,其中 ^ki, ki+iy, * * *, ^ki+n, ki+n+iy j * * * j ^kj-i, kjy ^Cc X 公式中沒为知识本体最大路径长度,《i/3( I)为知识点hh在知识本体库中的最短路径 长度。
【文档编号】G06F17/30GK105956144SQ201610314413
【公开日】2016年9月21日
【申请日】2016年5月13日
【发明人】吴雷, 阮怀伟, 昌磊, 孙智骁
【申请人】安徽教育网络出版有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1