题目生产方法、装置和电子设备与流程

文档序号:26139834发布日期:2021-08-03 14:23阅读:86来源:国知局
题目生产方法、装置和电子设备与流程

本发明属于教育技术领域,特别适用于在线教育,更具体的是涉及一种题目生产方法、装置、电子设备和计算机可读介质。



背景技术:

随着现代信息技术的发展以及教育市场的需求,在线教育作为一种新兴的教育理念,正在被不断推广和普及。在线教学给教师和学生带来了极大的便利,通过在线教育,教师可以在家里进行教学,学生也可以在家里同步进行听课和考试等。现有技术中,用户遇到不会的题目或需要验证自己做的题目答案是否准确,可以通过教育类app搜索对应的题目和答案,但是会出现搜索不到相同甚至相近题目的情况,导致用户无法在第一时间获取到正确答案,为了使后续其他用户搜索相同题目时能搜索到该题目,需要在第一时间生产出该题目,因此,如何实时筛选并生产出用户搜索的热门题目成为要解决的技术问题。



技术实现要素:

(一)要解决的技术问题

本发明旨在解决如何实时筛选出用户搜索的热门题目以满足用户的需求的技术问题。

(二)技术方案

为解决上述技术问题,本发明的一方面提出一种题目生产方法,包括:

获取设定时段内各用户用于搜索题目的题目信息项,以及,根据所述题目信息项在题目库中进行匹配获得的匹配结果;

计算所述题目信息项与对应的所述匹配结果的匹配度,并根据所述匹配度从各题目信息项中筛选出匹配度低于第一预设阈值的题目信息项作为候选题目信息项;

对所述候选题目信息项进行聚类,以将相似的题目信息项归类为同一信息项簇,并从所述聚类形成的多个信息项簇中,筛选出包含的题目信息项数量高于第二预设阈值的信息项簇;

根据筛选出的信息项簇中的题目信息进行题目加工以生成符合入库要求的标准化题目。

根据本发明的优选实施方式,所述计算一个时段内的题目信息项与对应所述实时匹配结果的匹配度进一步包括:

使用机器学习模型计算所述题目信息项与对应的所述匹配结果的相似度,将该相似度作为所述匹配度。

根据本发明的优选实施方式,所述题目信息项和所述匹配结果均包括文本信息;

所述相似度的计算包括:将所述题目信息项和所述匹配结果的文本信息分别转化为特征向量,将所述特征向量输入机器学习模型计算相似度。

根据本发明的优选实施方式,对所述候选题目信息项进行聚类之前,所述题目生产方法还包括:

从所述候选题目信息项中去除因用户上传的题目信息项不合格导致的所述匹配度低于第一预设阈值的题目。

根据本发明的优选实施方式,所述对所述候选题目信息项进行聚类包括:

预分类:将所述候选题目信息项中的文本信息转化为特征向量,根据所述特征向量的相似度,将相似的特征向量对应的候选题目信息项归为一个集合,从而得到多个包含相似候选题目信息项的集合;

聚类:对预分类得到的每个集合中的候选题目信息项进行聚类。

根据本发明的优选实施方式,所述对候选题目信息项进行聚类包括:

以每个所述候选题目信息项作为顶点,两个所述候选题目信息项间的相似度作为边,当两个所述候选题目信息项间的相似度高于预设的第一阈值时,将所述候选题目信息项对应的顶点相连,形成连通图;

根据预设规则计算所述候选题目信息项间的连通图,将每个连通图作为一个信息项簇。

根据本发明的优选实施方式,采用查集算法计算候选题目信息项的连通图;

可选地,根据所述设定时段长度设置所述第二预设阈值。

根据本发明的优选实施方式,所述对筛选出的信息项簇中的题目信息进行题目加工以生成标准化题目,进一步包括:

根据预定规则从所述信息项簇中筛选出适用于题目生产的所述题目信息项,基于筛选出的所述题目信息项进行题目加工,以生成标准化题目;

可选地,所述预定规则包括文本信息完整度指标。

根据本发明的优选实施方式,基于同一信息项簇的多个题目信息项生产题目。

本发明第二方面提出一种题目生产装置,包括:

题目获取模块,用于获取设定时段内各用户用于搜索题目的题目信息项,以及,根据所述题目信息项在题目库中进行匹配获得的匹配结果;

题目筛选模块,用于计算所述题目信息项与对应的所述匹配结果的匹配度,并根据所述匹配度从各题目信息项中筛选出匹配度低于第一预设阈值的题目信息项作为候选题目信息项;

题目分类模块,用于对所述候选题目信息项进行聚类,以将相似的题目信息项归类为同一信息项簇,并从所述聚类形成的多个信息项簇中,筛选出包含的题目信息项数量高于第二预设阈值的信息项簇;

题目生产模块,用于根据筛选出的信息项簇中的题目信息进行题目加工以生成符合入库要求的标准化题目。

本发明第三方面提出一种电子设备,包括处理器和存储器,所述存储器用于存储计算机可执行程序,当所述计算机程序被所述处理器执行时,所述处理器执行所述的方法。

本发明第四方面还提出一种计算机可读介质,存储有计算机可执行程序,所述计算机可执行程序被执行时,实现所述的方法。

(三)有益效果

本发明通过计算用户搜索的题目与题库匹配的题目间的相似度,判断题库匹配的题目是否准确,并将一段时间内所有匹配不准确的题目进行聚类,从中筛选出用户搜索次数较多的题目进行生产并存入题库,当其他用户搜索相同题目时便可从题库中匹配正确的题目反馈给用户,可以在资源有限的情况下准确生产出多数用户所需的题目,提升了题目生产效率,同时满足了用户需求,提升了用户学习效率和搜索体验。

附图说明

图1是本发明一个实施例的一种题目生产方法流程示意图;

图2a是本发明一个实施例的用户搜索题目示意图;

图2b是本发明一个实施例的用户搜索后题库匹配结果示意图;

图2c是本发明另一个实施例的用户搜索题目示意图;

图3是本发明一个实施例的一种题目生产装置示意图;

图4是本发明的一个实施例的电子设备的结构示意图;

图5是本发明的一个实施例的计算机可读记录介质的示意图。

具体实施方式

在对于具体实施例的介绍过程中,对结构、性能、效果或者其他特征的细节描述是为了使本领域的技术人员对实施例能够充分理解。但是,并不排除本领域技术人员可以在特定情况下,以不含有上述结构、性能、效果或者其他特征的技术方案来实施本发明。

附图中的流程图仅是一种示例性的流程演示,不代表本发明的方案中必须包括流程图中的所有的内容、操作和步骤,也不代表必须按照图中所显示的顺序执行。例如,流程图中有的操作/步骤可以分解,有的操作/步骤可以合并或部分合并,等等,在不脱离本发明的发明主旨的情况下,流程图中显示的执行顺序可以根据实际情况改变。

附图中的框图一般表示的是功能实体,并不一定必然与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理单元装置和/或微控制器装置中实现这些功能实体。

各附图中相同的附图标记表示相同或类似的元件、组件或部分,因而下文中可能省略了对相同或类似的元件、组件或部分的重复描述。还应理解,虽然本文中可能使用第一、第二、第三等表示编号的定语来描述各种器件、元件、组件或部分,但是这些器件、元件、组件或部分不应受这些定语的限制。也就是说,这些定语仅是用来将一者与另一者区分。例如,第一器件亦可称为第二器件,但不偏离本发明实质的技术方案。此外,术语“和/或”、“及/或”是指包括所列出项目中的任一个或多个的所有组合。

为解决上述技术问题,本发明提出一种题目生产方法,学生在遇到不会的题目或想要验证自己的答案是否准确时,将该题目上传到app客户端,可以通过电子设备对题目拍照后上传图片,也可以手动输入题目文本信息上传,由于拍照后上传图片相较于手动输入题目文本更方便快捷,绝大多数用户上传的是拍照后的图片,因此本发明实施例以拍照形式为例来说明。但本领域技术人员可以理解的是,用户搜索的具体形式并不影响本发明技术方案的实现。

客户端在收到用户上传的题目图片后,实时通过ocr技术识别出图片中的文本信息、题目类别信息,若题目为图形题,还能识别出图形题中的图形信息,并结合语义从文本信息中识别出题目信息项。题目信息项指题目的特征或其表述,可以用来在题库或网络中检出题目,例如可以包括文本信息中的关键词,如特征字段等根据题目信息项在题库中进行实时匹配,获得目前题库中与之最相近的题目。由于题目的时效性,用户搜索的题目与最后题库中匹配到的题目不一定相同,这样反馈给用户的题目可能并不是用户想要的,因此不能满足用户的要求,这时就需要尽快生产出用户搜索热度高的题目,以使后续能满足用户的搜索需求。

题目生产人手有限,一般需要先筛选出用户搜索频率高的题目进行生产。本发明提供的题目生产方法,在生产题目时,首先获取一段时间内各用户搜索的题目,比较每个搜索的题目与对应的在题库中的匹配结果间的相似度,在用户搜索的题目中筛选出与匹配结果相似度较低,不满足用户要求的,对这些题目进行聚类,聚类的结果会将这段时间内用户搜索的题目中相同或相似度很高的题目归类到同一个簇中,从这些簇中选出包含题目数量较多的几个簇,生产出簇中的题目并存入题库中。

为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明作进一步的详细说明。

图1是本发明一个是实施例的一种题目生产方法流程示意图。

如图1所示,本方法包括:

s101、获取设定时段内各用户用于搜索题目的题目信息项,以及,根据所述题目信息项在题目库中进行匹配获得的匹配结果。

本步骤获取一个特定时段内所有用户所有拍照搜索(后称拍搜)的题目的题目信息,以便从中选出搜索热度高的题目。本步骤还获取用户拍搜题目对应的匹配结果,以便判断出/筛选出那些匹配程度低的题目,即找出那些拍搜后在资源库中搜索不到相同或相近的题目。

举例而言,用户对题目拍照后将图片上传到客户端,客户端接收到包含题目的图片后,将该图片传送到服务器,服务器利用ocr技术识别图片中的题目信息项,包括题目的文本信息、图形信息等,可以利用ocr技术将图片中的文本信息以行为单位形成多个行结构,服务器对相邻行结构进行拼接,根据上下文预测哪些行结构属于同一道题目,并将识别出的完整题目的题目信息项提取出来,若一张拍照图片中包含多道题目,也可以将每道题目分别识别出来,提取每道题目的题目信息项。

在提取图片中题目的题目信息项后,根据题目信息项在题目库中进行实时匹配,将题目信息项输入搜索模型,搜索模型从题目库(题库或资源库)中筛选出与用户搜索的题目信息项相似度最高的题目,将该题目的题目信息项作为检索的实时匹配结果通过客户端反馈给用户。这时,就有可能题目库(题库或资源库)中不存在与用户想搜的题目相同或一直的题目,表现为返回的实时匹配结果与用户想搜的题目匹配度较低,例如低于第一阈值。因此,可以基于用户想搜的题目与返回的匹配结果的匹配度来筛选出用户想搜但搜不到的题目。

另外,上面拍搜时,当识别出用户拍照的图片中包含多道题目时,首先通过客户端向用户展示所包含的多道题目,用户选择确认其中要搜索的一道题目,在确认提交后服务器根据用户确认的题目在题目库中匹配并反馈给用户。

由于从用户搜索题目到服务器反馈给用户题目的过程是在线实时完成的,且检索耗时极短,故进行相似度匹配时所用的搜索模型算法最好具备实时性。

s102、计算所述题目信息项与对应的所述匹配结果的匹配度,并根据所述匹配度从各题目信息项中筛选出匹配度低于第一预设阈值的题目信息项作为候选题目信息项。

本步骤根据匹配度筛选出用户想搜但搜不到的题目。当所述题目信息项与对应的匹配结果的匹配度低于第一预设阈值时,即表明没有检索到相同或相似的题目。此处的相似指检索到的题目能解决用户获取答案、解析等的需求,能使用户满意。设定时间段内可能存在很多题目待生产,但服务提供商生产力有限,因此,将这些不能满足用户需求、需要生产或修改的题目作为候选/备选的,从中选出是用户搜索热点的题目,优先安排生产搜索频次高的题目。

本方案首先需要设置时间周期,例如以一天或两天为一个时段。例如,设定时段为一天,服务器获取一天内全部用户搜索的题目,提取每道题目的题目信息项,以及与每道题目对应的服务器反馈的实时匹配结果,将每道题目的题目信息项和对应的实时匹配结果输入训练好的匹配度模型,可以输出该题目与实时匹配结果间的匹配度。

在本发明实施例中,通过计算用户搜索题目的题目信息项与实时匹配结果间的相似度,将计算得到的相似度作为匹配度,并预先设置第一预设阈值,当用户搜索题目的题目信息项与实时匹配结果间匹配度低于第一预设阈值时,便可判定服务器反馈给用户的题目不准确,例如将第一预设阈值设置为99.5%,也就是说当用户搜索题目的题目信息项与实时匹配结果间相似度低于99.5%时,即判定服务器反馈的实时匹配结果并不满足用户需求,通过此方法将一天内所有用户搜索的题目中不满足用户需求的题目筛选出来。第一预设阈值可以由本领域技术人员根据经验和/实验结果等实际情况确定,本实施例不做限定。

上述匹配度模型进行相似度匹配可以由服务器在后台离线完成,相较于搜索模型的精度更高,所用的算法更复杂。

图2a是本发明一个实施例的用户搜索的题目示意图,图2b是本发明一个实施例中用户搜索后题库返回的匹配结果示意图。如图2a所示,用户通过拍照上传了一张包含题目的图片,服务器通过对图片识别后提取该题目的题目信息项,然后通过搜索模型在题目库中搜索相似的题目,搜索出的题目如图2b所示。后续匹配度模型可以提取图2a题目信息项中包含参数的语句,例如8折、节省200元、实际用了多少元等,匹配时,图2b的题目信息项中包含参数的语句有8折、节省16元、实际用了多少元等,结合题目信息项的语义对比二者的相似度,得出相似度低于99.5%,判定图2b中的题目不满足用户搜索的需求,将图2a中的题目对应的题目信息项作为候选题目信息项。

本发明实施例中的匹配度模型可以使用二分类梯度提升决策树(gbdt,gradientboostingdecisiontree)模型来计算两道题目间的相似度。

在一些实施例中,在筛选出不满足用户需求的题目后,还对这些题目再次筛选,从这些题目中筛选出符合生产要求的题目(即去除因拍的照片不合格导致搜索不到的题目)。可选地,可以将这些题目的题目信息项输入神经网络模型,判断每道题目的题目信息项是否完整,由于会出现用户拍照角度或者对焦不对导致图片不清晰或没有将完整题目拍出来,所以出现服务器在题目库中搜索相同题目时搜索不到的情况,故需要例如通过神经网络模型判断题目是否完整,如选择题无选项,应用题只有题干没有问题等都属于题目不完整的情况,在不满足用户需求的题目中去除这类题目不满足生产要求的(这类题目可能已有答案,只是没检索出来)。本步骤通过神经网络模型筛选出满足生产要求的题目后,将这些题目的题目信息项作为候选题目信息项。

即优选的,还可以从所述候选题目信息项中去除因用户上传的题目信息项不合格导致的所述匹配度低于第一预设阈值的题目,确保后续进行聚类的题目的完整性。

s103、对所述候选题目信息项进行聚类,以将相似的题目信息项归类为同一信息项簇,并从所述聚类形成的多个信息项簇中,筛选出包含的题目信息项数量高于第二预设阈值的信息项簇。

例如,可将一天内筛选出的候选题目信息项进行聚类,计算这些候选题目信息项间的相似度,根据相似度将候选题目信息项分成不同的信息项簇。信息项簇中包含的候选题目信息项数量大的即代表这类题目的搜索频次高,是热点题目。

由于用户每天的搜索量巨大,一天内会产生数以千万计的候选题目信息项,若计算任意两个候选题目信息项间的相似度,计算规模巨大,会消耗大量的人力物力,因此在优选地,对候选题目信息项聚类前,首先对候选题目信息项进行预分类。

预分类:将所述候选题目信息项中的文本信息转化为特征向量,根据所述特征向量的相似度,将相似的特征向量对应的候选题目信息项归为一个集合,从而得到多个包含相似候选题目信息项的集合,后续聚类时对每个集合中的候选题目信息项进行聚类。

具体方式可以为:将候选题目信息项进行向量化,通过利用word2vec算法模型将候选题目信息项中的文本信息转化为特征向量,每个候选题目信息项对应一个特征向量,将所有的特征向量保存在向量库中,在对其中一个候选题目信息项进行预分类时,可以使用特征搜索引擎从向量库中搜索与该候选题目信息项对应的特征向量相似的所有特征向量,这里可以通过计算特征向量的内积来判断相似度,这样特征搜索引擎会在10毫秒以内得出与搜索的特征向量相似度高的所有特征向量,相似度的精度约为80%,也就是说若两个特征向量间的相似度高于80%,则特征搜索引擎会将这两个特征向量分为一类,以此方法将一天内所有的候选题目信息项进行预分类,分为多个集合。

在对候选题目信息项进行预分类后得到多个包含候选题目信息项的集合,对每个集合中的候选题目信息项进行聚类,可以使用上述实施例中的匹配度模型来计算两个候选题目信息项间的相似度。

在计算出所有集合中每两个候选题目信息项间的相似度后,根据相似度使用并查集算法计算候选题目信息项的连通图,以每个候选题目信息项作为顶点,两个候选题目信息项间的相似度作为边,若两个候选题目信息项间的相似度高于预设的第一阈值,则将这两个顶点相连,以此形成连通图。根据连通图形成信息项簇,其中每个连通图对应一个信息项簇,且同一个信息项簇内的候选题目信息项相同。

由于形成的信息项簇数量很多,且会出现有的信息项簇中仅包含一个候选题目信息项,为了提高资源利用率,优选的首先检测每个信息项簇中包含的候选题目信息项的数量,将其中数量高于第二预设阈值的信息项簇筛选出来,作为待生产信息项簇,优先生产待生产信息项簇中的候选题目信息项对应的题目。也可以按照包含候选题目信息项的数量对所有的信息项簇进行排序,优先生产前若干个包含候选题目信息项的数量较多的信息项簇中的题目。

第二预设阈值的大小根据设定的时间周期的长度确定,例如将时间段设为一天,则可以将第二预设阈值设为1000,也就是说如果一天内搜索同一道题目的次数大于1000次,则可优先生产该题目。

以此方法筛选出的题目为用户搜索次数较多的题目,优先生产这些题目提升了题目生产效率,同时满足了用户需求,提升了用户学习效率和搜索体验。

s104、根据筛选出的信息项簇中的题目信息进行题目加工以生成符合入库要求的标准化题目。

由于筛选出的待生产信息项中均包含多个候选题目信息项,需要设定规则确定以其中的哪一个候选题目信息项为基础进行生产。例如,规则可以为:服务器将每个待生产信息项簇中的文本信息完整度进行判定,文本信息完整度包括题干和问题是否完成,是否存在无用的冗余信息,以此规则设置文本信息完整度模型,将待生产信息项簇中的每个候选题目信息项的文本信息输入该模型,会得到该候选题目信息项的文本信息完整度评分。

另外,还可结合其他影响题目生产的因素进行综合性评分判定,候选题目信息项对应的照片是否清晰等。

图2c是本发明另一个实施例的用户搜索题目示意图,结合图2a,两个图中的题目为同一个待生产信息项簇中的题目,但是图2c中包含了大量的冗余信息(手写答案),故图2c的候选题目信息项评分会低于图2a的候选题目信息项评分,因此以图2a的候选题目信息项作为基础进行题目生产,将该候选题目信息项进行题目加工成成标准化题目和对应的解析和答案。

可以基于同一信息项簇的多个题目信息项生产题目。例如有的题目信息项不全但题目照片清晰,有的题目信息项全,文本识别好,但图形部分不完整等等,可以基于这些题目综合起来生产题目,效率更高。

优选的,为了确保作为基础题目的候选题目信息项信息的完整性最高,可以在对一个待生产信息项簇中的候选题目信息项进行评分后,以分数最高的一个候选题目信息项作为主项,以评分前几位的候选题目信息项作为辅助项,综合后形成完整的文本信息,将该文本信息作为基础题目进行生产。

综上,最后筛选出的信息项簇中的题目信息一是搜索频次高,另外是比较适合作为基础来生产标准化题目。标准化题目一般需要满足入库要求,至少包括题目和答案,能满足用户基本需求。

本领域技术人员可以理解,实现上述实施例的全部或部分步骤被实现为由计算机数据处理设备执行的程序(计算机程序)。在该计算机程序被执行时,可以实现本发明提供的上述方法。而且,所述的计算机程序可以存储于计算机可读存储介质中,该存储介质可以是磁盘、光盘、rom、ram等可读存储介质,也可以是多个存储介质组成的存储阵列,例如磁盘或磁带存储阵列。所述的存储介质不限于集中式存储,其也可以是分布式存储,例如基于云计算的云存储。

下面描述本发明的装置实施例,该装置可以用于执行本发明的方法实施例。对于本发明装置实施例中描述的细节,应视为对于上述方法实施例的补充;对于在本发明装置实施例中未披露的细节,可以参照上述方法实施例来实现。

图3是本发明一个是实施例的一种题目生产装置,如图3所示,该装置200包括:

题目获取模块201,用于获取设定时段内各用户用于搜索题目的题目信息项,以及,根据所述题目信息项在题目库中进行匹配获得的匹配结果;

题目筛选模块202,用于计算所述题目信息项与对应的所述匹配结果的匹配度,并根据所述匹配度从各题目信息项中筛选出匹配度低于第一预设阈值的题目信息项作为候选题目信息项;

题目分类模块203,用于对所述候选题目信息项进行聚类,以将相似的题目信息项归类为同一信息项簇,并从所述聚类形成的多个信息项簇中,筛选出包含的题目信息项数量高于第二预设阈值的信息项簇;

题目生产模块204,用于根据筛选出的信息项簇中的题目信息进行题目加工以生成符合入库要求的标准化题目。

其中,题目筛选模块202还用于使用机器学习模型计算所述题目信息项与对应的所述匹配结果的相似度,将该相似度作为所述匹配度;可选地,所述题目信息项和所述匹配结果均包括文本信息;所述相似度的计算包括:将所述题目信息项和所述匹配结果的文本信息分别转化为特征向量,将所述特征向量输入机器学习模型计算相似度。对所述候选题目信息项进行聚类之前,题目筛选模块202还用于从所述候选题目信息项中去除因用户上传的题目信息项不合格导致的所述匹配度低于第一预设阈值的题目。

题目分类模块203还包括:预分类模块,用于将所述候选题目信息项中的文本信息转化为特征向量,根据所述特征向量的相似度,将相似的特征向量对应的候选题目信息项归为一个集合,从而得到多个包含相似候选题目信息项的集合;聚类模块:用于对预分类得到的每个集合中的候选题目信息项进行聚类。可以以每个所述候选题目信息项作为顶点,两个所述候选题目信息项间的相似度作为边,当两个所述候选题目信息项间的相似度高于预设的第一阈值时,将所述候选题目信息项对应的顶点相连,形成连通图;根据预设规则计算所述候选题目信息项间的连通图,将每个连通图作为一个信息项簇;可选地,采用并查集算法计算候选题目信息项的连通图;可选地,根据所述设定时段长度设置所述第二预设阈值。

题目生产模块204还用于根据预定规则从所述信息项簇中筛选出适用于题目生产的所述题目信息项,基于筛选出的所述题目信息项进行题目加工,以生成标准化题目;可选地,所述预定规则包括文本信息完整度指标。

题目生产模块204基于同一信息项簇的多个题目信息项生产题目。

图4是本发明的一个实施例的电子设备的结构示意图,该电子设备包括处理器和存储器,所述存储器用于存储计算机可执行程序,当所述计算机程序被所述处理器执行时,所述处理器执行题目生产方法。

如图4所示,电子设备以通用计算设备的形式表现。其中处理器可以是一个,也可以是多个并且协同工作。本发明也不排除进行分布式处理,即处理器可以分散在不同的实体设备中。本发明的电子设备并不限于单一实体,也可以是多个实体设备的总和。

所述存储器存储有计算机可执行程序,通常是机器可读的代码。所述计算机可读程序可以被所述处理器执行,以使得电子设备能够执行本发明的方法,或者方法中的至少部分步骤。

所述存储器包括易失性存储器,例如随机存取存储单元(ram)和/或高速缓存存储单元,还可以是非易失性存储器,如只读存储单元(rom)。

可选的,该实施例中,电子设备还包括有i/o接口,其用于电子设备与外部的设备进行数据交换。i/o接口可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。

应当理解,图4显示的电子设备仅仅是本发明的一个示例,本发明的电子设备中还可以包括上述示例中未示出的元件或组件。例如,有些电子设备中还包括有显示屏等显示单元,有些电子设备还包括人机交互元件,例如按扭、键盘等。只要该电子设备能够执行存储器中的计算机可读程序以实现本发明方法或方法的至少部分步骤,均可认为是本发明所涵盖的电子设备。

图5是本发明的一个实施例的计算机可读记录介质的示意图。如图5所示,计算机可读记录介质中存储有计算机可执行程序,所述计算机可执行程序被执行时,实现本发明上述的题目生产方法。所述计算机可读存储介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读存储介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、rf等等,或者上述的任意合适的组合。

上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该计算机可读介质实现如下功能:获取设定时段内各用户用于搜索题目的题目信息项,以及,根据所述题目信息项在题目库中进行匹配获得的匹配结果;计算所述题目信息项与对应的所述匹配结果的匹配度,并根据所述匹配度从各题目信息项中筛选出匹配度低于第一预设阈值的题目信息项作为候选题目信息项;对所述候选题目信息项进行聚类,以将相似的题目信息项归类为同一信息项簇,并从所述聚类形成的多个信息项簇中,筛选出包含的题目信息项数量高于第二预设阈值的信息项簇;根据筛选出的信息项簇中的题目信息进行题目加工以生成符合入库要求的标准化题目。

可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如java、c++等,还包括常规的过程式程序设计语言—诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(lan)或广域网(wan),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。

通过以上对实施方式的描述,本领域的技术人员易于理解,本发明可以由能够执行特定计算机程序的硬件来实现,例如本发明的系统,以及系统中包含的电子处理单元、服务器、客户端、手机、控制单元、处理器等。本发明也可以由执行本发明的方法的计算机软件来实现。但需要说明的是,执行本发明的方法的计算机软件并不限于由一个或特定个的硬件实体中执行,其也可以是由不特定具体硬件的以分布式的方式来实现,例如计算机程序执行的某些方法步骤可以在移动客户端执行,另一部分可以在智能表、智能识别笔等中执行。对于计算机软件,软件产品可以存储在一个计算机可读的存储介质(可以是cd-rom,u盘,移动硬盘等)中,也可以分布式存储于网络上,只要其能使得电子设备执行根据本发明的方法。

综上所述,本发明可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(dsp)等通用数据处理设备来实现根据本发明实施例中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。

以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,应理解的是,本发明不与任何特定计算机、虚拟装置或者电子设备固有相关,各种通用装置也可以实现本发明。以上所述仅为本发明的具体实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1