检索方法、设备及存储介质与流程

文档序号:31175953发布日期:2022-08-17 10:08阅读:78来源:国知局
检索方法、设备及存储介质与流程

1.本技术涉及大数据领域,尤其涉及一种检索方法、设备及存储介质。


背景技术:

2.用户在阅读过程中,会遇到阅读信息中存在一些冷僻或不认识的名词、人物、地点、故事等,或者正好对阅读信息很感兴趣,想进一步了解阅读信息的详情。
3.一般地,常规操作是用户先停止阅读,并打开搜索软件工具,甚至是打开另一终端设备,来检索其想获取的信息,然而,通过这种方式来检索信息,导致检索时的便利性非常低。


技术实现要素:

4.本技术的主要目的在于提供一种检索方法、设备及存储介质,旨在解决如何提高检索时的便利性的技术问题。
5.为实现上述目的,本技术提供一种检索方法,所述方法包括:
6.获取用户的阅读信息及用户信息;
7.根据所述用户信息确定所述用户的用户需求信息;
8.若所述阅读信息中存在与所述用户需求信息匹配的待检索信息,则检索所述待检索信息,得到目标检索结果。
9.示例性的,所述用户信息为用户指令信息,所述用户需求信息为用户预期检索信息,所述根据所述用户信息确定所述用户的用户需求信息,包括:
10.提取预设指令信息中的用户预期检索信息;
11.所述若所述阅读信息中存在与所述用户需求信息匹配的待检索信息,则检索所述待检索信息,得到目标检索结果,包括:
12.若所述阅读信息中存在所述用户预期检索信息,则确定所述用户预期检索信息为待检索信息,并检索所述待检索信息,得到目标检索结果。
13.示例性的,所述用户信息为用户阅读习惯信息,所述用户需求信息为用户阅读水平,所述若所述阅读信息中存在与所述用户需求信息匹配的待检索信息,则检索所述待检索信息,得到目标检索结果,包括:
14.若所述阅读信息中存在知识水平大于所述用户阅读水平的待检索信息,则检索所述待检索信息,得到目标检索结果。
15.示例性的,所述用户信息为用户知识点测试分数,所述用户需求信息为用户阅读水平,所述根据所述用户信息确定所述用户的用户需求信息,包括:
16.输出第一等级的知识点测试题,并获取所述用户完成所述第一等级的知识点测试题后的用户知识点测试分数;
17.若所述用户知识点测试分数小于预设分数,则确定所述用户阅读水平为所述第一等级;
18.若所述用户知识点测试分数大于或等于所述预设分数,则更新所述知识点测试题为第二等级的知识点测试题,并获取所述用户完成所述第二等级的知识点测试题后的用户知识点测试分数,直至所述用户在完成知识点测试题后的用户知识点测试分数小于所述预设分数;所述第二等级的知识点测试题是基于所述第一等级的知识点测试题确定的。
19.示例性的,所述若所述阅读信息中存在与所述用户需求信息匹配的待检索信息,则检索所述待检索信息,得到目标检索结果,包括:
20.对所述阅读信息进行分词处理,得到多个第一检索关键词;
21.基于标签属性组,分别计算每一个第一检索关键词与所述用户对应的场景化环境因素信息的相似度;所述标签属性组是对所述多个第一检索关键词进行标签化处理得到的;
22.从所述多个第一检索关键词中,选取相似度大于预设相似度的多个第二检索关键词;
23.基于第一预设权重,为所述多个第二检索关键词的相似度进行加权计算,得到所述多个第二检索关键词的场景化分值;
24.基于所述场景化分值,从所述多个第二检索关键词中选取第三检索关键词;
25.若所述第三检索关键词中存在知识水平大于所述用户阅读水平的待检索信息,则检索所述待检索信息,得到目标检索结果。
26.示例性的,所述检索所述待检索信息,得到目标检索结果,包括:
27.检索所述待检索信息,得到初始检索结果;
28.获取提供所述初始检索结果的信息源的信息要素;
29.基于所述信息要素,计算所述信息源的可靠性分值;
30.基于所述可靠性分值,从所述初始检索结果中选取目标检索结果;所述目标检索结果的可靠性分值大于或等于预设可靠性分值。
31.示例性的,所述信息要素包括备案信息和评级信息,所述可靠性分值至少包括可信度分值,所述基于所述信息要素,计算所述信息源的可靠性分值,包括:
32.基于所述备案信息和第二预设权重,计算所述信息源的第一子可信度分值;
33.基于所述评级信息和第三预设权重,计算所述信息源的第二子可信度分值;
34.基于第四预设权重、所述第一子可信度分值和所述第二子可信度分值,计算所述信息源的可信度分值。
35.示例性的,所述信息要素包括搜索引擎信息和知识百科信息,所述可靠性分值至少包括专业性分值,所述基于所述信息要素,计算所述信息源的可靠性分值,包括:
36.基于所述搜索引擎信息和第五预设权重,计算所述信息源的第一子专业性分值;
37.基于所述知识百科信息和第六预设权重,计算所述信息源的第二子专业性分值;
38.基于第七预设权重、所述第一子专业性分值和所述第二子专业性分值,计算所述信息源的专业性分值。
39.此外,为实现上述目的,本技术还提供一种检索设备,所述检索设备包括存储器、处理器和存储在所述存储器上并可在所述处理器上运行的检索程序,所述检索程序被所述处理器执行时实现如上所述的检索方法的步骤。
40.此外,为实现上述目的,本技术还提供一种计算机可读存储介质,所述计算机可读
存储介质上存储有检索程序,所述检索程序被处理器执行时实现如上所述的检索方法的步骤。
41.与现有技术中,用户先停止阅读,并打开搜索软件工具,甚至是打开另一终端设备,来检索其想获取的信息,导致检索时的便利性非常低相比,本技术通过获取用户的阅读信息及用户信息,并根据用户信息确定用户需求信息,从而根据用户需求信息针对性地从阅读信息中匹配得到待检索信息,由此检索得到目标检索结果。可以理解,目标检索结果是与用户需求信息相对应的,即目标检索结果是满足用户的检索需求的,这使得用户在需要检索其想获取的信息时,无需进行打开搜索软件工具,甚至是打开另一终端设备的繁琐操作,即可得到其想获取的信息,因此,本技术提高了检索时的便利性。
附图说明
42.图1是本技术检索方法第一实施例的流程示意图;
43.图2是本技术实施例方案涉及的硬件运行环境的结构示意图。
44.本技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
45.应当理解,此处所描述的具体实施例仅仅用以解释本技术,并不用于限定本技术。
46.本技术提供一种检索方法,参照图1,图1为本技术检索方法第一实施例的流程示意图。
47.本技术实施例提供了检索方法的实施例,需要说明的是,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。检索方法可应用于终端(例如移动终端、个人计算机等)或服务器中。为了便于描述,以下省略执行主体描述检索方法的各个步骤。
48.检索方法包括:
49.步骤s10,获取用户的阅读信息及用户信息。
50.示例性的,阅读信息包括新闻、文章、博客等。
51.示例性的,用户信息包括用户指令信息、用户阅读习惯信息或用户知识点测试分数。
52.步骤s20,根据所述用户信息确定所述用户的用户需求信息;
53.步骤s30,若所述阅读信息中存在与所述用户需求信息匹配的待检索信息,则检索所述待检索信息,得到目标检索结果。
54.示例性的,检索的工具包括搜索软件、搜索引擎等,相应的,检索结果由该工具提供。
55.示例性的,待检索信息包括含有人名、地名、国家名、植物名、前沿技术名等的词语、句子或段落。可以理解,待检索信息即为用户可能想要进一步了解其详情的信息,此外,阅读信息中除了待检索信息外,还有与待检索信息相关的信息以及与待检索信息无关的信息。
56.示例性的,目标检索结果可以通过预设输出方式进行输出,预设输出方式包括文本阅读模式下的输出方式和朗读阅读模式下的输出方式。对于文本阅读模式下的输出方
式,若识别到用户的阅读环境为夜晚或弱光,则采用柔(低亮度)文本提醒方式;若识别到用户的阅读环境为白天,则采用高亮度文本提醒方式;若识别到终端外接耳机模式,则增加语音提示方式。对于朗读阅读模式下的输出方式,若识别到用户的阅读环境为夜晚或弱光,则采用弱音、柔音提醒方式;若识别到用户的阅读环境为白天,则采用正常语音提醒方式;若识别到用户的阅读环境为噪音环境,则采用加强语音提醒方式。
57.此外,由于目标检索结果一般为多个,在输出目标检索结果后,还可以输出提示信息。该提示信息可以通过将信息点关键字或段落设置背景色、字体或增加诸如符号标记等,来提醒用户当前输出的目标检索结果;或者是周期性发出弱音铃声直到指定次数或用户主动要求关闭本次提醒等、或采用智能语音合成技术直接插播有关信息提示音的简要信息(例如此处“xxx”有3条相关提示)。
58.对于上述提示信息,可以提供多种操作方式供用户呼出、终端或关闭该提示信息,在文本阅读模式下,该多种操作方式包括连续三次敲击终端、直接点击提示符号或加背景色的关键词和段落,或语音指令等;在语音朗读模式下,该多种操作方式包括连续三次敲击终端或语音指令等。
59.示例性的,在用户信息为用户指令信息时,用户需求信息为用户预期检索信息,所述根据所述用户信息确定所述用户的用户需求信息,包括:
60.步骤a,提取预设指令信息中的用户预期检索信息。
61.示例性的,预设指令信息包括手势指令信息、语音指令信息和振动指令信息(由用户用手指敲击终端产生)。
62.对于手势指令信息,其为:在终端处于文本阅读模式下,用户选中词语、句子或段落,并滑动了预设图标(例如一个问好、文字“搜索”等);对于振动指令信息,其为:在终端处于语音朗读模式下,且正在朗读某个词语、句子或段落时,识别到用户连续敲击终端两次或三次等;对于语音指令信息,其为:在终端处于文本阅读模式或语音朗读模式下,识别到用户输入语音指令(例如“想知道xxx“、“xxx是什么”、“详细说下xxx”)。
63.可以理解,用户预期检索信息即为上述手势指令信息对应的用户选中词语、句子或段落,或者是上述振动指令信息对应的朗读的某个词语、句子或段落,又或者是上述语音指令信息对应的“xxx”。
64.步骤b,所述若所述阅读信息中存在与所述用户需求信息匹配的待检索信息,则检索所述待检索信息,得到目标检索结果,包括:若所述阅读信息中存在所述用户预期检索信息,则确定所述用户预期检索信息为待检索信息,并检索所述待检索信息,得到目标检索结果。
65.若阅读信息中未存在与用户需求信息匹配的待检索信息,则继续获取新的用户需求信息,并从阅读信息中确定是否存在与新的用户需求信息匹配的待检索信息。
66.可以理解,用户预期检索信息为用户输入的需要检索的信息,因此,通过将用户预期检索信息作为待检索信息,从而减少得到目标检索结果能够提高检索的准确性。
67.示例性的,所述用户信息为用户阅读习惯信息,所述用户需求信息为用户阅读水平,所述若所述阅读信息中存在与所述用户需求信息匹配的待检索信息,则检索所述待检索信息,得到目标检索结果,包括:
68.步骤c,若所述阅读信息中存在知识水平大于所述用户阅读水平的待检索信息,则
检索所述待检索信息,得到目标检索结果。
69.示例性的,上述通过用户预期检索信息来检索的过程为:被动接收的用户输入的相关指令,并基于该相关指令进行检索。除此之外,还可以是主动确定待检索信息,并基于该待检索信息来进行检索。具体地,自动根据用户的用户阅读习惯信息分析用户阅读水平,并在阅读信息中存在知识水平大于用户阅读水平的待检索信息时,对该待检索信息进行检索。
70.示例性的,所述用户信息为用户知识点测试分数,所述用户需求信息为用户阅读水平,所述根据所述用户信息确定所述用户的用户需求信息,包括:
71.步骤d,输出第一等级的知识点测试题,并获取所述用户完成所述第一等级的知识点测试题后的用户知识点测试分数;
72.步骤e,若所述用户知识点测试分数小于预设分数,则确定所述用户阅读水平为所述第一等级;
73.步骤f,若所述用户知识点测试分数大于或等于所述预设分数,则更新所述知识点测试题为第二等级的知识点测试题,并获取所述用户完成所述第二等级的知识点测试题后的用户知识点测试分数,直至所述用户在完成知识点测试题后的用户知识点测试分数小于所述预设分数;所述第二等级的知识点测试题是基于所述第一等级的知识点测试题确定的。
74.知识点测试题包括多个等级,即除第一等级、第二等级外,还包括第三等级、第四等级等,各等级的知识点测试题的知识点之间存在关联。例如第一等级的知识点测试题包括第一知识点的测试题、第二知识点的测试题和第三知识点的测试题;对于其下一等级即第二等级的知识点测试题,包含多个知识点的测试题,例如存在编号为1-9的9个知识点的测试题,其中,1-3的知识点与第一知识点相关,4-6的知识点与第二知识点相关,7-9的知识点与第三知识点相关,知识点之间的关联可以是领域相同、种类相同等。
75.需要说明的是,通过知识点之间的关联来确定各等级的知识点测试题的目的在于更好地、更准确地测试用户阅读水平。其中,知识点测试题的等级的划分依据为知识点测试题的难易程度,例如知识点测试题库中包括第一等级、第二等级和第三等级的知识点测试题库,其中,第一等级的知识点测试题最简单,第三等级的知识点测试题最难。
76.示例性的,知识点测试题的知识点可以通过人工增加或者是采用爬虫技术收集,并增加至相应等级的知识点测试题中。
77.示例性的,对于知识点测试题的生成,其过程为先对每一个知识点做内部关键词的提炼,其中,内部关键词的数量决定知识点的测评策略;通过爬虫技术获取关键词的相关近似关键词、反义关键词,分别赋予内部关键词、相似关键词和反义关键词由高到低的分值,可以理解,内部关键词、相似关键词和反义关键词为该知识点对应的知识点测试题的三个选项。
78.示例性的,测评策略包括在内部关键词的数量大于或等于预设的内部关键词的数量时,采用选取多个内部关键词的模式;在内部关键词的数量小于预设的内部关键词的数量时,采用选取单个内部关键词的模式。
79.需要说明的是,在用户首次使用检索的功能时,需要进行至少一次知识水平测评,并将测评结果数据作为用户阅读水平的评估结果。随着用户的持续使用,后续可以以友好
方式引导用户主动进行更多次数的测试评估,后续评估都是基于已有测评数据,在已评估的知识触点组(一等级的知识点测试题)的各知识点上延展到下一个知识触点组并进行知识水平测评,在得到新测评结果后,更新生成用户的新的用户阅读水平。
80.可以理解,上述测评方式实现了随时、渐进、增量、少量、多次、低侵扰的方式,对用户的用户阅读水平进行自我迭代评估更新,由此实现了更加全面和准确地反映用户阅读水平。
81.示例性的,预设分数可以根据需要进行设置,本实施例不作具体限定。
82.示例性的,所述若所述阅读信息中存在与所述用户需求信息匹配的待检索信息,则检索所述待检索信息,得到目标检索结果,包括:
83.步骤g,对所述阅读信息进行分词处理,得到多个第一检索关键词。
84.示例性的,分词处理可通过现有技术来实现,具体可通过“结巴分词”、“nlpir”等分词工具来实现。
85.步骤h,基于标签属性组,分别计算每一个第一检索关键词与所述用户对应的场景化环境因素信息的相似度;所述标签属性组是对所述多个第一检索关键词进行标签化处理得到的。
86.示例性的,标签属性组包括与第一检索关键词的语境相关的多个标签属性,标签属性包括人、事、物、时间、地点等。
87.示例性的,场景化环境因素包括强实时性状态、弱实时性状态和阅读状态等。
88.示例性的,强实时性状态包括内部因素(例如身体状况、精神状态、思维活跃度等)和外部因素。其中,外部因素包括设备/平台相关因素(例如设备/平台型号、性能状态、可用性状态等)和环境相关因素(例如气候、气温状况、环境音、光线、场所类型、时间等)等。
89.示例性的,弱实时性状态包括用户阅读习惯(例如作息习性、学习习性、工作习性、休闲习性等)和用户关系(例如家庭关系、亲友关系等)等。
90.示例性的,阅读状态包括阅读语境(阅读信息所在文本的上下文语境,例如如散步闲聊、正式会议、职业沟通、投资咨询等)和阅读切入状态(即用户以何种状态下进行阅读,例如阅读前在看视频、运动等)
91.示例性的,场景化环境因素可以通过向量矩阵模型构建的场景化环境因素集合来表现,可以理解,场景化环境因素集合包括多个场景化环境因素对应的向量。
92.需要说明的是,场景化环境因素表征了用户在阅读时的画像,通过用户的实时画像来选取待检索信息,实现了以用户为中心的检索方式进行检索,即在检索的过程中关联了与用户紧密相关的场景化环境因素,可以使待检索信息更加贴近用户此时的检索需求,即提高检索结果的准确性。
93.需要说明的是,场景化环境因素一般为多个,对于每一个场景化环境因素,均需要分别计算第一检索关键词与该场景化环境因素的相似度。例如场景化环境因素包括精神状态、职业沟通和阅读前在看视频,其中,精神状态对应的相似度为80%、职业沟通对应的相似度为78%、阅读前在看视频对应的相似度为60%,则此时的相似度包括这三个相似度。
94.示例性的,相似度可以通过现有技术计算得到,其体现了第一检索关键词与场景化环境因素的拟合程度,拟合程度与相似度成正相关。
95.步骤i,从所述多个第一检索关键词中,选取相似度大于预设相似度的多个第二检
索关键词。
96.示例性的,预设相似度可以根据需要自行设置,本实施例不作具体限定。
97.可以理解,第二检索关键词有较大概率是满足用户的检索的需求方向的。
98.需要说明的是,第一检索关键词一般为多个词,对于每一个第一检索关键词,都需要比对相似度,并将所有第一检索关键词中相似度大于预设相似度的第一检索关键词作为第二检索关键词。
99.步骤j,基于第一预设权重,为所述多个第二检索关键词的相似度进行加权计算,得到所述多个第二检索关键词的场景化分值。
100.示例性的,第一预设权重为经验值,可以根据需要进行设置,本实施例不作具体限定。
101.需要说明的是,相似度的数量与第一预设权重的数量相同,在相似度包括多个时,第一预设权重也包括多个,即场景化分值为第二检索关键词的每一个相似度和其相应的第一预设权重的乘积的均值。例如第二检索关键词包括相似度1、相似度2和相似度3,其中,相似度1为80%、相似度2为78%、相似度3为60%,相似度1对应的第一预设权重为0.3、相似度2对应的第一预设权重为0.5、相似度3对应的第一预设权重为0.2,则场景化分值为(80%
×
0.3+78%
×
0.5+60%
×
0.2)/(0.3+0.5+0.2)=24%+39%+12%=75%。
102.步骤k,基于所述场景化分值,从所述多个第二检索关键词中选取第三检索关键词。
103.示例性的,从第二检索关键词中选取第三检索关键词的选取方式包括超过指定分值、取分值排名的前n个和/或随机样本抽取等,例如选取方式为超过指定分值和随机样本抽取,场景化分值包括90分、80分、85分、75分、78分和70分,指定分值为80分,则超过80分的场景化分值为90分、80分和85分,随机样本抽取得到80分和85分,则第三检索关键词为80分对应的第二检索关键词和85分对应的第二检索关键词。
104.步骤l,若所述第三检索关键词中存在知识水平大于所述用户阅读水平的待检索信息,则检索所述待检索信息,得到目标检索结果。
105.可以理解,第三检索关键词中知识水平小于或等于用户阅读水平的检索关键词是无需为用户检索的,因此,不将该部分的第三检索关键词作为待检索信息,从而提高了检索的准确性。
106.示例性的,所述检索所述待检索信息,得到目标检索结果,包括:
107.步骤m,检索所述待检索信息,得到初始检索结果;
108.步骤n,获取提供所述初始检索结果的信息源的信息要素;
109.步骤o,基于所述信息要素,计算所述信息源的可靠性分值。
110.信息源为网站,即初始检索结果为每一个网站反馈的与待检索信息相关的信息,其中,每一个网站均有自身的信息要素。
111.示例性的,所述信息要素包括备案信息和评级信息,所述可靠性分值至少包括可信度分值,所述基于所述信息要素,计算所述信息源的可靠性分值,包括:
112.步骤o1,基于所述备案信息和第二预设权重,计算所述信息源的第一子可信度分值。
113.示例性的,备案信息包括许可证书信息、工商信息、安全认证、单位性质、历史备案
记录等。
114.在计算第一子可信度分值之前,需要计算每一个备案信息的备案分值,该备案分值通过备案信息的信息完整度来计算,例如一信息源的备案信息为工商信息和安全认证,工商信息的信息完整度为70%、安全认证的信息完整度为60%。
115.第一子可信度分值通过每一个备案信息与其相对应第二预设权重计算得到,例如一信息源的备案信息为工商信息和安全认证,工商信息的信息完整度为70%、安全认证的信息完整度为60%,其中,工商信息对应的第二预设权重为0.5、安全认证对应的第二预设权重为0.5,则第一子可信度分值为(70%
×
0.5+60%
×
0.5)/(0.5+0.5)=65%。
116.示例性的,第二预设权重为经验值,可以根据需要进行设置,本实施例不作具体限定。
117.步骤o2,基于所述评级信息和第三预设权重,计算所述信息源的第二子可信度分值。
118.示例性的,评级信息包括总排名分值、行业排名分值和地区排名分值等。需要说明的是,第二子可信度分值的计算过程与第一子可信度分值的计算过程基本相同,在此不再赘述。
119.步骤o3,基于第四预设权重、所述第一子可信度分值和所述第二子可信度分值,计算所述信息源的可信度分值。
120.备案信息由域名信息备案系统提供,域名信息备案系统包括多个,每一个域名信息备案系统均有自身的权重;相应的,评级信息由评级网站提供,评级信息由评级网站包括多个,每一个评级网站均有自身的权重。因此,第四预设权重包括多个域名信息备案系统的权重和多个评级网站的权重。例如域名信息备案系统包括备案信息1、备案信息2和备案信息3,评级网站包括评级信息1、评级信息2和评级信息3;其中,备案信息1为80%、备案信息2为78%、备案信息3为60%,评级信息1为80%、评级信息2为78%和评级信息3为70%;备案信息1对应的第四预设权重为0.1、备案信息2对应的第四预设权重为0.2、备案信息3对应的第四预设权重为0.2,评级信息1对应的第四预设权重为0.3、评级信息2对应的第四预设权重为0.1和评级信息3对应的第四预设权重为0.1,则可信度分值为(80%
×
0.1+78%
×
0.2+60%
×
0.2+80%
×
0.3+78%
×
0.1+70%
×
0.1)/(0.1+0.2+0.2+0.3+0.1+0.1)=8%+15.6%+12%+24%+7.8%+7%=74.4%。
121.示例性的,第四预设权重为经验值,可以根据需要进行设置,本实施例不作具体限定。
122.示例性的,所述信息要素包括搜索引擎信息和知识百科信息,所述可靠性分值至少包括专业性分值,所述基于所述信息要素,计算所述信息源的可靠性分值,包括:
123.步骤o4,基于所述搜索引擎信息和第五预设权重,计算所述信息源的第一子专业性分值;
124.步骤o5,基于所述知识百科信息和第六预设权重,计算所述信息源的第二子专业性分值;
125.步骤o6,基于第七预设权重、所述第一子专业性分值和所述第二子专业性分值,计算所述信息源的专业性分值。
126.示例性的,搜索引擎信息包括网站建站时间、专业性、站点规模、主关键词等;知识
百科信息包括词条更新频率、合作伙伴、品牌价值、财报数据、所获荣誉等。
127.示例性的,搜索引擎信息的搜索引擎分值由其在其他搜索引擎中的排名确定,例如存在三个搜索引擎,其网站建站时间分别为1994年、1996年和1998年,则可以分别确定三者的搜索引擎分值为80分、70分和60分,具体的时间与分值之间的关系可以根据需要进行设置,本实施例不作具体限定。需要说明的是,其他搜索引擎信息的具体实施方式与网站建站时间的具体实施方式基本相同,在此不再赘述。
128.相应的,知识百科信息的知识百科分值同样可以由其在知识百科类网站中的排名确定,具体实施方式与上述搜索引擎信息的具体实施方式基本相同,在此不再赘述。
129.相应的专业性分值的计算方式的具体实施方式与上述可信度分值的计算方式的具体实施方式基本相同,在此不再赘述。
130.步骤p,基于所述可靠性分值,从所述初始检索结果中选取目标检索结果;所述目标检索结果的可靠性分值大于或等于预设可靠性分值。
131.从检索结果中选取可信度分值大于或等于预设可信度分值且专业性分值大于或等于预设专业性分值的目标检索结果,其中,预设可靠性分值包括预设可信度分值和预设专业性分值。
132.示例性的,预设可信度分值和预设专业性分值可以根据需要自行设置,本实施例不作具体限定。
133.需要说明的是,为避免一信息源中备案信息和评级信息的数量过少或者是搜索引擎信息和知识百科信息的数量过少、甚至缺失导致的可靠性分值出现较大偏差而不够准确。在计算信息源的可靠性分值时,引入加权平衡因子,具体为:当一信息源中备案信息和评级信息的数量,和搜索引擎信息和知识百科信息的数量的总数量小于预设数量时,补入加权平衡因子(预设的信息要素和相应的权重)。
134.与现有技术中,用户先停止阅读,并打开搜索软件工具,甚至是打开另一终端设备,来检索其想获取的信息,导致检索时的便利性非常低相比,本技术通过获取用户的阅读信息及用户信息,并根据用户信息确定用户需求信息,从而根据用户需求信息针对性地从阅读信息中匹配得到待检索信息,由此检索得到目标检索结果。可以理解,目标检索结果是与用户需求信息相对应的,即目标检索结果是满足用户的检索需求的,这使得用户在需要检索其想获取的信息时,无需进行打开搜索软件工具,甚至是打开另一终端设备的繁琐操作,即可得到其想获取的信息,因此,本技术提高了检索时的便利性。
135.此外,用户在阅读的过程中遇到知识盲区而无法便捷地得到解惑时,会容易产生一种“不知其所以然”的混沌感,因此存在检索该知识盲区的相关内容,从而达到解惑的目的,然而中断接收过程去检索信息也极易被其他诸如弹窗广告、即时通讯等信息诱惑而导致阅读注意力涣散,因此,本技术还帮助用户集中了注意力。
136.此外,本技术还提供一种检索装置,所述装置包括:
137.获取模块,用于获取用户的阅读信息及用户信息;
138.确定模块,用于根据所述用户信息确定所述用户的用户需求信息;
139.检索模块,用于若所述阅读信息中存在与所述用户需求信息匹配的待检索信息,则检索所述待检索信息,得到目标检索结果。
140.示例性的,所述用户信息为用户指令信息,所述用户需求信息为用户预期检索信
息,所述确定模块具体用于:
141.提取预设指令信息中的用户预期检索信息;
142.所述检索模块具体用于:
143.若所述阅读信息中存在所述用户预期检索信息,则确定所述用户预期检索信息为待检索信息,并检索所述待检索信息,得到目标检索结果。
144.示例性的,所述用户信息为用户阅读习惯信息,所述用户需求信息为用户阅读水平,所述检索模块具体用于:
145.若所述阅读信息中存在知识水平大于所述用户阅读水平的待检索信息,则检索所述待检索信息,得到目标检索结果。
146.示例性的,所述用户信息为用户知识点测试分数,所述用户需求信息为用户阅读水平,所述确定模块具体用于:
147.输出第一等级的知识点测试题,并获取所述用户完成所述第一等级的知识点测试题后的用户知识点测试分数;
148.若所述用户知识点测试分数小于预设分数,则确定所述用户阅读水平为所述第一等级;
149.若所述用户知识点测试分数大于或等于所述预设分数,则更新所述知识点测试题为第二等级的知识点测试题,并获取所述用户完成所述第二等级的知识点测试题后的用户知识点测试分数,直至所述用户在完成知识点测试题后的用户知识点测试分数小于所述预设分数;所述第二等级的知识点测试题是基于所述第一等级的知识点测试题确定的。
150.示例性的,所述检索模块具体用于:
151.对所述阅读信息进行分词处理,得到多个第一检索关键词;
152.基于标签属性组,分别计算每一个第一检索关键词与所述用户对应的场景化环境因素信息的相似度;所述标签属性组是对所述多个第一检索关键词进行标签化处理得到的;
153.从所述多个第一检索关键词中,选取相似度大于预设相似度的多个第二检索关键词;
154.基于第一预设权重,为所述多个第二检索关键词的相似度进行加权计算,得到所述多个第二检索关键词的场景化分值;
155.基于所述场景化分值,从所述多个第二检索关键词中选取第三检索关键词;
156.若所述第三检索关键词中存在知识水平大于所述用户阅读水平的待检索信息,则检索所述待检索信息,得到目标检索结果。
157.示例性的,所述检索模块具体用于:
158.检索所述待检索信息,得到初始检索结果;
159.获取提供所述初始检索结果的信息源的信息要素;
160.基于所述信息要素,计算所述信息源的可靠性分值;
161.基于所述可靠性分值,从所述初始检索结果中选取目标检索结果;所述目标检索结果的可靠性分值大于或等于预设可靠性分值。
162.示例性的,所述信息要素包括备案信息和评级信息,所述可靠性分值至少包括可信度分值,所述检索模块具体用于:
163.基于所述备案信息和第二预设权重,计算所述信息源的第一子可信度分值;
164.基于所述评级信息和第三预设权重,计算所述信息源的第二子可信度分值;
165.基于第四预设权重、所述第一子可信度分值和所述第二子可信度分值,计算所述信息源的可信度分值。
166.示例性的,所述信息要素包括搜索引擎信息和知识百科信息,所述可靠性分值至少包括专业性分值,所述检索模块具体用于:
167.基于所述搜索引擎信息和第五预设权重,计算所述信息源的第一子专业性分值;
168.基于所述知识百科信息和第六预设权重,计算所述信息源的第二子专业性分值;
169.基于第七预设权重、所述第一子专业性分值和所述第二子专业性分值,计算所述信息源的专业性分值。
170.本技术检索装置具体实施方式与上述检索方法各实施例基本相同,在此不再赘述。
171.此外,本技术还提供一种检索设备。如图2所示,图2是本技术实施例方案涉及的硬件运行环境的结构示意图。
172.需要说明的是,图2即可为检索设备的硬件运行环境的结构示意图。
173.如图2所示,该检索设备可以包括:处理器2001,例如cpu,存储器2005,用户接口2003,网络接口2004,通信总线2002。其中,通信总线2002用于实现这些组件之间的连接通信。用户接口2003可以包括显示屏(display)、输入单元比如键盘(keyboard),可选用户接口2003还可以包括标准的有线接口、无线接口。网络接口2004可选的可以包括标准的有线接口、无线接口(如wi-fi接口)。存储器2005可以是高速ram存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器2005可选的还可以是独立于前述处理器2001的存储装置。
174.可选地,检索设备还可以包括rf(radio frequency,射频)电路,传感器、音频电路、wifi模块等等。
175.本领域技术人员可以理解,图2中示出的检索设备结构并不构成对检索设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
176.如图2所示,作为一种计算机存储介质的存储器2005中可以包括操作系统、网络通信模块、用户接口模块以及检索程序。其中,操作系统是管理和控制检索设备硬件和软件资源的程序,支持检索程序以及其它软件或程序的运行。
177.在图2所示的检索设备中,用户接口2003主要用于连接终端,与终端进行数据通信,如接收终端发送的用户信令数据;网络接口2004主要用于后台服务器,与后台服务器进行数据通信;处理器2001可以用于调用存储器2005中存储的检索程序,并执行如上所述的检索方法的步骤。
178.本技术检索设备具体实施方式与上述检索方法各实施例基本相同,在此不再赘述。
179.此外,本技术实施例还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有检索程序,所述检索程序被处理器执行时实现如上所述的检索方法的步骤。
180.本技术计算机可读存储介质具体实施方式与上述检索方法各实施例基本相同,在此不再赘述。
181.此外,为实现上述目的,本技术还提供一种计算机程序产品,包括:计算机程序,所述计算机程序被处理器执行时实现如上所述的检索方法的步骤。
182.本技术计算机程序产品具体实施方式与上述检索方法各实施例基本相同,在此不再赘述。
183.需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
184.上述本技术实施例序号仅仅为了描述,不代表实施例的优劣。
185.通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中,包括:若干指令用以使得一台终端设备(可以是手机,计算机,服务器,设备,或者网络设备等)执行本技术各个实施例所述的方法。
186.以上仅为本技术的优选实施例,并非因此限制本技术的专利范围,凡是利用本技术说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本技术的专利保护范围内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1