课程匹配方法、系统、计算机设备和存储介质与流程

文档序号:23221007发布日期:2020-12-08 15:03阅读:95来源:国知局
课程匹配方法、系统、计算机设备和存储介质与流程
本发明涉及数据处理
技术领域
,特别是涉及课程匹配方法、系统、计算机设备和存储介质。
背景技术
:企业员工的培训对于大大小小的企业而言,都是至关重要的一个环节:这一环节关系着企业文化和价值观的重塑。当前大部分员工的培训往往是由企业人力资源部门进行统筹规划,由于人力成本和时间的限制,往往存在着以下问题:1)培训项目比较单一,一般只有对新员工的入职培训,而缺乏长期的培养和学习;2)针对性较差,很难有千人千面的课程设计,无法针对性的根据员工的专业知识基础和当前的项目工作需求等,做出设计。以上这些问题的存在,往往会导致培训效果差,培训的目的难以达到。而我们发现,这些问题归根到底是课程推荐方式过度依赖人力所导致的,而由于人力资源部门不可能面面俱到,不了解所有员工的背景和当前的岗位等,所以课程的设计和推荐不能及时,准确,具有针对性。技术实现要素:基于此,本发明提供了一种课程匹配方法、系统、计算机设备和存储介质,以解决不能对信息进行自动化的挖掘和分析,从而自动化的给出千人千面的课程个性化推荐的问题。为实现上述目的,本发明提供一种基于nlp技术的课程匹配方法,所述课程匹配方法包括:获取企业课程库,并获取所述企业课程库中的课程关键词;接收员工的工作报告,并采用关键词挖掘模型挖掘工作报告的员工关键词;采用相似度算法计算课程关键词和员工关键词的匹配值;根据匹配值自动向员工推荐匹配值高的课程。优选的,所述采用相似度算法计算课程关键词和员工关键词的匹配值之前还包括:接收设定的员工关键词的权重;根据员工关键词的权重选取有效的员工关键词。优选的,所述员工关键词包括岗位关键词、工作内容关键词、评价关键词和指标关键词,所述岗位关键词和工作内容关键词的权重要高于评价关键词和指标关键词的权重。优选的,所述采用相似度算法计算课程关键词和员工关键词的匹配值的步骤包括:采用相似度算法计算课程关键词和员工关键词的相似值;将员工关键词权重乘以相似度计算的相似值,得到匹配值。优选的,所述采用关键词挖掘模型挖掘工作报告的员工关键词的步骤包括:对训练样本集进行预处理,得到序列化标注模型所需的bio输入数据格式;采用序列化标注模型对每个序列进行特征提取,获得每个序列对应的文本的语义特征;使用softmax分类器对所获得的文本的语义特征进行分类,对所述模型进行训练和测试,得到bio格式的输出数据;将bio格式的输出数据进行后处理,得到员工关键词。优选的,所述根据匹配值自动向员工推荐匹配值高的课程之后,将课程匹配结果上传至区块链中,以使得所述区块链对所述课程匹配结果进行加密存储。为实现上述目的,本发明还提供了一种基于nlp技术的课程匹配系统,所述课程匹配系统包括:课程关键词挖掘模块,用于获取企业课程库,并获取所述企业课程库中的课程关键词;员工关键词挖掘模块,用于接收员工的工作报告,并采用关键词挖掘模型挖掘工作报告的员工关键词;计算模块,用于采用相似度算法计算课程关键词和员工关键词的匹配值;匹配模块,用于根据匹配值自动向员工推荐匹配值高的课程。优选的,所述系统还包括权重模块,所述权重模块用于接收设定的员工关键词的权重并根据员工关键词的权重选取有效的员工关键词;所述计算模块中,所述采用相似度算法计算课程关键词和员工关键词的匹配值的步骤包括:采用相似度算法计算课程关键词和员工关键词的相似值;将员工关键词权重乘以相似度计算的相似值,得到匹配值。为实现上述目的,本发明还提供了一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行如上所述课程匹配方法的步骤。为实现上述目的,本发明还提供了一种计算机存储介质,存储有计算机可读指令,所述计算机可读指令被处理器执行时实现如上所述课程匹配方法的步骤。上述本发明提供了一种课程匹配方法、系统、计算机设备和存储介质,其中,所述课程匹配方法通过获取企业课程库,并获取所述企业课程库中的课程关键词;接收员工的工作报告,并采用关键词挖掘模型挖掘工作报告的员工关键词;采用相似度算法计算课程关键词和员工关键词的匹配值;根据匹配值自动向员工推荐匹配值高的课程。因此,本发明能够基于现有数据,运用nlp技术,能够对信息进行自动化的挖掘和分析,从而自动化的给出千人千面的课程个性化推荐。附图说明图1为一个实施例中提供的课程匹配方法的实施环境图;图2为一个实施例中计算机设备的内部结构框图;图3为一个实施例中课程匹配方法的流程图;图4为一个实施例中采用关键词挖掘模型挖掘员工关键词的流程图;图5为一个实施例中员工关键词设置权重的流程图;图6为一个实施例中计算课程关键词和员工关键词的匹配值的流程图;图7为一个实施例中优化课程匹配方法的流程图;图8为一个实施例中课程匹配系统的示意图;图9为一个实施例中课程匹配系统的另一示意图;图10为一个实施例中的计算机设备的结构示意图;图11为一个实施例中的存储介质的结构示意图。具体实施方式为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。可以理解,本申请所使用的术语“第一”、“第二”等可在本文中用于描述各种元件,但这些元件不受这些术语限制。这些术语仅用于将第一个元件与另一个元件区分。图1为一个实施例中提供的基于nlp技术的课程匹配方法的实施环境图,如图1所示,在该实施环境中,包括计算机设备110和终端设备120。计算机设备110可以为用户使用的电脑等计算机设备,计算机设备110上安装有基于nlp技术的课程匹配系统。当计算时,用户可以在计算机设备110依照基于nlp技术的课程匹配方法进行匹配值的计算,并通过终端设备120通知员工已匹配的课程。需要说明的是,计算机设备110可以为智能手机、平板电脑、笔记本电脑、台式计算机等;终端设备120主要为智能手机、平板电脑、笔记本电脑、台式计算机,基于nlp技术的课程匹配系统为安装于终端设备120的app或应用程序。关于计算机设备110和终端设备120的描述,并不局限于此。图2为一个实施例中计算机设备的内部结构示意图。如图2所示,该计算机设备包括通过系统总线连接的处理器、非易失性存储介质、存储器和网络接口。其中,该计算机设备的非易失性存储介质存储有操作系统、数据库和计算机可读指令,数据库中可存储有控件信息序列,该计算机可读指令被处理器执行时,可使得处理器实现一种基于nlp技术的课程匹配方法。该计算机设备的处理器用于提供计算和控制能力,支撑整个计算机设备的运行。该计算机设备的存储器中可存储有计算机可读指令,该计算机可读指令被处理器执行时,可使得处理器执行一种基于nlp技术的课程匹配方法。该计算机设备的网络接口用于与终端连接通信。本领域技术人员可以理解,图2中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。如图3所示,在一个实施例中,提出了一种基于nlp技术的课程匹配方法,该课程匹配方法可以应用于上述计算机设备110和显示设备120中,具体可以包括以下步骤:步骤31,获取企业课程库,并获取所述企业课程库中的课程关键词。具体的,企业需要准备一个企业课程库,并预先对企业课程库中的每一门课程进行关键词抽取和设定。例如课程《ppt制作技巧和常用模板》,可以给定课程关键词:ppt、制作、模板、技巧,等。如果课程比较多,也可以从课程字幕、课程ppt等里面,用自然语言处理的技术,抽取其中文本的课程关键词进行课程的关键词设定。更具体的,由于中文没有采用英文里面单词之间天然的空格隔开,因此,需要用到一些基础nlp技术将语言片段切分成一个个独立的词语,常用的中文分词工具有ansj、jieba、百度或哈工大的分词工具包等。分词之后,所述课程关键词采用tf-idf、term-weighting等工具进行抽取。具体的,一般课程都会自带关键词,如果课程没有自带关键词,会通过tf-idf、term-weighting等工具进行关键词抽取,该等工具已经很成熟了,可以很好的进行课程关键词抽取和设定。具体的,以tf-idf为例说明如何提取课程关键词,tf-idf(termfrequency–inversedocumentfrequency)是一种用于信息检索与数据挖掘的常用加权技术,常用于挖掘文章中的关键词,而且算法简单高效,常被工业用于最开始的文本数据清洗。tf-idf有两层意思,一层是"词频"(termfrequency,缩写为tf),另一层是"逆文档频率"(inversedocumentfrequency,缩写为idf)。假设我们现在有一篇长文叫做《量化系统架构设计》,词频高在文章中往往是停用词,如“的”、“是”、“了”等,这些在文档中最常见但对结果毫无帮助,是需要过滤掉的词,用tf可以统计到这些停用词并把它们过滤。当高频词过滤后就只需考虑剩下的有实际意义的词。但这样又会遇到了另一个问题,我们可能发现“量化”、“系统”、“架构”这三个词的出现次数一样多。这是不是意味着,作为关键词,它们的重要性是一样的?事实上,“系统”应该在其他文章比较常见,所以在关键词排序上,“量化”和“架构”应该排在“系统”前面,这个时候就需要idf,idf会给常见的词较小的权重,它的大小与一个词的常见程度成反比。当有tf和idf后,将这两个词相乘,就能得到一个词的tf-idf的值。某个词在文章中的tf-idf越大,那么一般而言这个词在这篇文章的重要性会越高,所以通过计算文章中各个词的tf-idf,由大到小排序,排在最前面的几个词,就是该文章的关键词。进一步的,课程关键词的抽取是一门门课程逐个进行的,不能批量进行,以保证正确性,完成抽取后以打标签的形式进行课程的关键词设定。进一步的,如果课程介绍等内容缺失,可以:1)如果是视频格式,可以将视频文件中的字幕进行文字抽取,整理成文本格式;2)如果有ppt格式的课件,可以将ppt课件中的文字抽取,整理成文本格式。所述整理成文本格式是方便用关键词抽取工具进行课程关键词抽取处理。步骤32,接收员工的工作报告,并采用关键词挖掘模型挖掘工作报告的员工关键词。具体的,企业准备好课程库的大数据之后,将对企业员工的工作报告进行收集。一般来说,企业都有要求员工定期做一个书面的总结和报告。在数字化普及的今天,大部分的总结和报告都以文字的形式储存在企业的数据库里,因此,这一数据不难拿到。作为一个补充的实施例,如果有的企业并没有要求员工定期提供总结和报告,则可以对员工进行属性设定,以配合员工关键词的挖掘。进一步的,员工关键词包括:工作内容关键词、岗位关键词、评价关键词和指标关键词。实际情况中,主要用到的是岗位关键词和工作内容关键词,其他两类关键词只起到辅助的作用。根据实际情况,在某些小企业中,由于人数的限制,可能只采用岗位关键词和工作内容关键词两类进行匹配,在大型企业中,可能四类关键词都会采用,并以岗位关键词和工作内容关键词为主,其他两类关键词为辅。在一个实施例中,假如工作内容关键词、岗位关键词、评价关键词和指标关键词各有相关的员工关键词,课程经过相似度计算后,有若干门课程的课程关键词可以与工作内容关键词、岗位关键词、评价关键词和指标关键词相对应,如果只挑选一门课程进行学习,那么将重点挑选与工作内容关键词、岗位关键词相对应的课程进行学习。进一步的,企业也可以对员工关键词根据不同类型(如工作内容关键词、岗位关键词、评价关键词和指标关键词四类)和含义(正面评价、负面评价、kpi值等词性的关键词)设置权重,不同企业的权重设置存在不同,权重的计算过程将在后续具体描述。进一步的,所述评价关键词是指带有正面评价、负面评价等词性的关键词;所述指标关键词是指与企业kpi指标有关的关键词。进一步的,在员工的工作报告中,挖掘出以上四类关键信息,这些关键信息能够全面、充分的提供员工的岗位、基础及需求等信息。为了挖掘这些信息,可以采用序列化标注的手段,如采用bert模型,使用的预训练模型来源为google的bert中文版本预训练模型,能够挖掘出更准确的信息,分类效果也比较好。请参考图4,所述采用关键词挖掘模型挖掘工作报告的员工关键词的具体过程为:将标注好的语料作为训练样本集输入预置的序列化标注模型,如bert中文预训练模型,进行训练,得到带有关键词标注的数据,具体步骤为:s41、对训练样本集进行预处理,得到序列化标注模型所需的bio输入数据格式。具体的,bio体系是分为“begin”、“inside”和“outside”这些标注,按照序列标注的格式对原始文本数据的每一个字片段进行标注,得到数以千计的第一语料。例如,“销售技能系列培训完成率达到90%,未完成目标”可以标注为:“销,b-工作内容”、“售,i-工作内容”、“技,i-工作内容”、“能,i-工作内容”、“系o”、“列o”、“培,b-工作内容”、“训,i-工作内容”、“完,b-工作内容”、“成,i-工作内容”、“率,i-工作内容”、“达o”、“到o”、“9,b-指标”、“0,i-指标”、“%,i-指标”、“,o”、“未,b-评价”、“完,i-评价”、“成,i-评价”、“目,i-评价”、“标,i-评价”。s42、采用序列化标注模型对每个序列进行特征提取,获得每个序列对应的文本的语义特征;需要说明的是,bert模型的核心模块是transformer,transformer的关键部分是attention机制,而且是多层注意力和位置嵌入,常用的bert模型是12层attention及24层的,本实施例采用12层的attention机制来提取更深层次的文本语义特征。s43、使用softmax分类器对所获得的文本的语义特征进行分类,对所述模型进行训练和测试,得到bio格式的输出数据;s44、将bio格式的输出数据进行后处理,得到员工关键词。具体的,以上述例句为例,得到的员工关键词结果为:工作内容关键词:销售技能、培训、完成率;指标关键词:90%;评价关键词:未完成目标。此外,岗位关键词是从岗位名称中抽取出来的,使用一些正则匹配规则即可。比如:xx区xx城市xx分部第x营业区销售助理,得到岗位关键词是:营业区,销售。进一步的,所述岗位关键词可能存在特别的应用,在一些比较大型的企业和集团,可能存在同一个工作内容关键词,却存在完全不同的学习要求,这种情况的出现主要是由于岗位的不同。针对这种情况,企业可采用岗位关键词来进一步甄选课程。例如:在某公司的员工a和员工b的工作报告中都出现了“销售”这一关键词,但是,员工a的岗位关键词是“电销”,员工b的岗位关键词是“分销”,那么同样的销售工作,显然需要推荐不同的学习课程。那么比较实用的操作步骤是:在工作内容匹配出来的课程结果基础上,进行岗位的匹配,所述匹配的方法是采用jaccard相似度的计算方法,jaccard相似度的计算方法将在步骤33中进一步说明。步骤33,采用相似度算法计算课程关键词和员工关键词的匹配值。具体的,课程关键词与员工关键词的匹配,是指每一个员工关键词都要和每一个课程关键词进行计算,这里可以用jaccard相似度的计算方法,如进一步的,举例进行相似度计算的说明,如果赵四员工的工作报告中的一个关键词是“财务”;x课程关键词是“行政”;那么,a=“财”、“务;b=行”、“政”;那么|a∩b|=0;|a∪b=4;j(a,b)=0;相似度为0。同样的,如果赵四员工的工作报告中的一个关键词是“财务”;x课程关键词是“财会”;那么,a=“财”、“务;b=财”、“会”;那么|a∩b|=1;|a∪b=3;j(a,b)=0.33相似度为0.33。所述“0”和“0.33”都是课程关键词和员工关键词的匹配值。当然,如果员工关键词为“财务”,课程关键词也为“财务”,那相似度计算的匹配值为1。步骤34,根据匹配值自动向员工推荐匹配值高的课程。进一步参考步骤33的案例,经过步骤33的相似度计算,如果两门课程的匹配值一个是“0”,一个是“0.33”,显然要推荐匹配值为“0.33”的课程给赵四员工。进一步的,如果赵四员工可匹配的课程比较多,我们可以提前设定一个匹配值的阈值,即可以将阈值设定为“0.33”,大于或等于“0.33”的课程才是推荐给赵四员工的课程,以实现自动化的过程。针对步骤31至步骤34,进一步列举完整案例进行说明。员工张三有一份工作报告:财务助理张三:今天完成了组内人员三月份的差旅报销工作,收集整理了所有人的发票,但是由于银行系统问题,10%员工报销款项未到账,未按时完成。其中,从工作报告中提取的四类关键词分别如下:工作内容关键词:报销工作、发票、报销款项、银行系统;岗位关键词为:财务助理;评价关键词为:未按时完成->负面评价;指标关键词为:10%。通过员工关键词的分析,可以从负面评价得到员工张三报销工作完成欠佳,可能需要培训这个信息。根据员工张三报告中挖掘到的信息,我们给员工进行有针对性的课程推荐,从课程库里面找到《财务报销相关流程和应对处理》课程,该课程包含课程关键词:报销、发票、银行系统等,经过采用相似度算法计算课程关键词和员工关键词的匹配值,发现所述匹配值较高,因此,将该门课程推荐给张三。上述案例不仅工作内容关键词和岗位关键词有较高相关度,且评价关键词也起到重要的辅助作用,能进一步确定员工张三急需学习的课程。进一步的,类似于评价关键词,对于指标关键词来说,有的企业可能有比较统一的kpi要求。比如说,需要财务报销完成率达到98%以上。那么,对所有出现了“财务报销”这类关键词的员工进行指标筛选,如果低于98%,则类似于“负面评价”,给“财务报销”一个比较高的关键词权重。请参考图5,在一个实施例中,所述步骤32“收集员工的工作报告,采用关键词挖掘模型挖掘工作报告的员工关键词”之后步骤33“采用相似度算法计算课程关键词和员工关键词的匹配值”之前,还包括:s51、接收设定的员工关键词的权重;s52、根据员工关键词的权重选取有效的员工关键词。具体的,员工关键词之间可以设置优先级,采用关键词挖掘模型抽取出员工关键词之后,一般还可以用tf-idf或者term-weighting等工具进行计算以得到员工关键词的权重。具体的,以tf-idf为例,tf-idf的计算公式为:tf-idf=tf*idf=(词频除以文章总词数)*(总文件数目除以包含该词语的文件的数目,再将得到的商取对数得到)。例如,“培训”一词在某员工的某次报告中出现了3次,该报告一共有30个词,那么出现了“培训”一词的员工报告一共有1000份,而总员工数量为2万,那么其中,分母+1是为了避免出现分母为0的情况。进一步的,tf-idf=tf*idf=0.1*1.3=0.13,0.13为权重的值。根据步骤32中s21中的案例:“销售技能系列培训完成率达到90%,未完成目标”,根据我们举例出现的三个词:“销售技能”、“培训”、“完成率”,tf-idf的计算出的权重的值分别为0.35、0.13和0.05,其中,0.35和0.05都是根据假设情况的计算得到的权重的值,在此不再举例列出具体计算过程。那么,最重要的词则是“销售技能”,次重要的词是“培训”。在本实施例中,之所以采用tf-idf工具计算了权重,是因为tf-idf的作用是为了计算词的重要性,一般来讲,词的频次越高,重要性越高,而出现该词的文件数目越多,该词的重要性越低。例如“培训”一词,虽然出现了很多次,但是很多员工的工作任务中都有这个词,那么这个词的特殊性就不够,导致该词的重要性降低,能进一步选取有效的员工关键词。在一个实施例中,通过计算权重还可以去掉关键词挖掘模型误差产生的错误关键词,所述错误关键词是指不完整的关键词,例如“财务助理”这个关键词,显示是“财务助”,为不完整关键词。在通过tf-idf计算时,由于是错误关键词,出现的权重就特别低,可对这些权重特别低的关键词进行自动检查,设定一个阈值,低于多少权重值对应的员工关键词需要自动删除。在一个实施例中,所述员工关键词包括岗位关键词、工作内容关键词、评价关键词和指标关键词,所述岗位关键词和工作内容关键词的权重要高于评价关键词和指标关键词的权重。请参考图6,在一个实施例中,所述采用相似度算法计算课程关键词和员工关键词的匹配值的步骤包括:s61、采用相似度算法计算课程关键词和员工关键词的相似值;s62、将员工关键词权重乘以相似度计算的相似值,得到匹配值。具体的,在课程推荐和学习的优先级上,是按照员工关键词的权重以及课程关键词和员工关键词的相似值的这两个量化指标计算的。更具体的,员工关键词权重与相似度计算结合形成的计算方案:匹配值=员工关键词权重*相似值。还是以步骤32中s21中的案例为例,将该员工的每一个关键词和课程a和b的每一个关键词依次进行jaccard相似度计算,只保留相似度最大的词,如下表格所示:表1-匹配值课程a课程b培训1*0.130.5*0.13销售技能0.5*0.351*0.35完成率0.3*0.050.6*0.05从表1中结果可以看到,两门课程匹配值最高的都是“销售技能”,进一步的,课程b的相似值更高,最后结果也更匹配,所以这里选择推荐的课程是课程b。根据以上案例可以看到,与课程a最匹配的关键词是“培训”,但由于“培训”本身关键词的权重低,导致这个词的重要性降低,也就是说,我们更倾向于推荐含有更重要的关键词“销售技能”的课程。请参考图7,在一个实施例中,在完成一次课程匹配之后,可能过了一个季度,企业需要再进行一次课程匹配,匹配过程包括:s71、收集和分析员工的课程学习情况,记录员工不感兴趣的课程;s72、在重复步骤31至步骤34时,屏蔽员工不感兴趣的课程。本实施例是一个优化的技术方案,需收集员工看到推荐课程之后的行为,比如是否点开课程、课程学习时间等,再通过分析这些数据,判断课程推荐的合适程度,用于进一步优化员工课程的匹配。实际中,由于员工每年或每季度都要进行员工总结,在重复步骤31至步骤34时,对于员工不感兴趣的课程,系统可以进行自动屏蔽,在下一轮的课程匹配过程中,将不会出现员工不感兴趣的课程,以进一步优化基于nlp技术的课程匹配方法。进一步的,还可以考虑去掉员工已学过的课程,避免出现重复推荐的过程。在一个可选的实施方式中,还可以:将所述基于nlp技术的课程匹配方法的结果上传至区块链中。具体地,基于所述基于nlp技术的课程匹配方法的结果得到对应的摘要信息,具体来说,摘要信息由所述基于nlp技术的课程匹配方法的结果进行散列处理得到,比如利用sha256s算法处理得到。将摘要信息上传至区块链可保证其安全性和对用户的公正透明性。用户可以从区块链中下载得该摘要信息,以便查证所述基于nlp技术的课程匹配方法的结果是否被篡改。本示例所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。如图8所示,本发明还提供了一种基于nlp技术的课程匹配系统,所述课程匹配系统包括课程关键词挖掘模块20、员工关键词挖掘模块30、计算模块40和匹配模块50。所述课程关键词挖掘模块20,用于获取企业课程库,并获取所述企业课程库中的课程关键词;所述员工关键词挖掘模块30,用于接收员工的工作报告,并采用关键词挖掘模型挖掘工作报告的员工关键词;所述计算模块40,用于采用相似度算法计算课程关键词和员工关键词的匹配值;所述匹配模块50,用于根据匹配值自动向员工推荐匹配值高的课程。请参考图9,在一个实施例中,所述课程匹配系统还包括权重模块60,所述权重模块60用于接收设定的员工关键词的权重并根据员工关键词的权重选取有效的员工关键词。在一个实施例中,所述计算模块40中,所述采用相似度算法计算课程关键词和员工关键词的匹配值的步骤包括:采用相似度算法计算课程关键词和员工关键词的相似值;将员工关键词权重乘以相似度计算的相似值,得到匹配值。请参考图10,图10为本发明实施例的设备的结构示意图。如图10所示,该设备200包括处理器201及和处理器201耦接的存储器202。存储器202存储有用于实现上述任一实施例所述基于nlp技术的课程匹配方法的程序指令。处理器201用于执行存储器202存储的程序指令。其中,处理器201还可以称为cpu(centralprocessingunit,中央处理单元)。处理器201可能是一种集成电路芯片,具有信号的处理能力。处理器201还可以是通用处理器、数字信号处理器(dsp)、专用集成电路(asic)、现成可编程门阵列(fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。参阅图11,图11为本发明实施例的计算机存储介质的结构示意图。本发明实施例的计算机存储介质存储有计算机可读指令,所述计算机可读指令被处理器执行时实现如上所述步骤,即计算机介质存储有能够实现上述所有方法的程序文件301,其中,该程序文件301可以以软件产品的形式存储在上述存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本申请各个实施方式所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质,或者是计算机、服务器、手机、平板等终端设备。本发明提供了一种课程匹配方法、系统、计算机设备和存储介质,其中,所述课程匹配方法通过获取企业课程库,并获取所述企业课程库中的课程关键词;接收员工的工作报告,并采用关键词挖掘模型挖掘工作报告的员工关键词;采用相似度算法计算课程关键词和员工关键词的匹配值;根据匹配值自动向员工推荐匹配值高的课程。因此,本发明能够基于现有数据,运用nlp技术,能够对信息进行自动化的挖掘和分析,从而自动化的给出千人千面的课程个性化推荐。此外,整个系统模型耗时比较短,适合各种类型大小的企业使用。需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1