信息处理方法、装置、计算机设备及存储介质与流程

文档序号:29622391发布日期:2022-04-13 13:37阅读:110来源:国知局
信息处理方法、装置、计算机设备及存储介质与流程

1.本技术实施例涉及计算机技术领域,特别涉及一种信息处理方法、装置、计算机设备及存储介质。


背景技术:

2.自然语言处理在学术研究和实际应用中都具有重大意义,而自然语言处理最广泛的实际应用就是各种形式的问答,目前的问答过程通常是针对问题信息进行搜索,然后从搜索得到的文档中抽取能够回答该问题信息的片段作为候选答案信息,最后再判断该候选答案信息的正确性。
3.相关技术中,直接获取问题信息与候选答案信息之间的匹配度,根据该匹配度确定该候选答案信息的正确性,从而确定最终的答案信息。但是这种方式仅考虑了问题信息与候选答案信息之间的关联关系,所依据的信息较少,从而导致所确定的答案信息的准确性较差。


技术实现要素:

4.本技术实施例提供了一种信息处理方法、装置、计算机设备及存储介质,提高了确定的答案信息的准确性。所述技术方案如下:
5.一方面,提供了一种信息处理方法,所述方法包括:
6.基于问题信息和候选答案信息获取第一分类特征,所述第一分类特征至少表示所述候选答案信息的语义信息;
7.获取所述问题信息对应的证据信息的证据特征,所述证据信息用于提供所述候选答案信息为所述问题信息的答案信息的证据;
8.基于所述第一分类特征与所述证据特征之间的关联度,调整所述证据特征,得到第二分类特征;
9.基于所述第一分类特征和所述第二分类特征进行分类,得到所述候选答案信息对应的分类结果,所述分类结果指示所述候选答案信息是否为所述问题信息的答案信息。
10.可选地,所述证据信息包括多个证据片段,
11.所述第二提取网络中的特征提取层,用于分别获取所述多个证据片段对应的证据片段特征;
12.所述第二提取网络中的注意力层,用于基于所述多个证据片段对应的证据权重,分别调整多个证据片段特征,所述证据权重指示所述证据片段的重要程度;
13.所述注意力层,还用于对调整后的多个证据片段特征进行拼接,得到所述证据特征。
14.可选地,所述第二处理子模型中的第二提取网络,还用于获取所述问题信息的问题特征;
15.所述第二处理子模型中的第三注意力网络,用于对所述问题特征和所述证据特征
进行匹配,得到所述证据信息对应的第二置信度,所述第二置信度表示所述证据信息作为所述问题信息的证据的可信程度;
16.所述第三注意力网络,还用于基于所述第二置信度,调整所述证据特征。
17.可选地,所述信息处理模型的训练过程包括:
18.获取样本问题信息、样本候选答案信息、样本证据信息和所述样本候选答案信息对应的样本分类结果;
19.调用所述信息处理模型,对所述样本问题信息、所述样本候选答案信息和所述样本证据信息进行处理,得到所述样本候选答案信息对应的预测分类结果;
20.基于所述样本分类结果和所述预测分类结果,训练所述信息处理模型。
21.另一方面,提供了一种信息处理装置,所述装置包括:
22.第一特征获取模块,用于基于问题信息和候选答案信息获取第一分类特征,所述第一分类特征至少表示所述候选答案信息的语义信息;
23.第二特征获取模块,用于获取所述问题信息对应的证据信息的证据特征,所述证据信息用于提供所述候选答案信息为所述问题信息的答案信息的证据;
24.第一特征调整模块,用于基于所述第一分类特征与所述证据特征之间的关联度,调整所述证据特征,得到第二分类特征;
25.分类模块,用于基于所述第一分类特征和所述第二分类特征进行分类,得到所述候选答案信息对应的分类结果,所述分类结果指示所述候选答案信息是否为所述问题信息的答案信息。
26.可选地,所述装置还包括:
27.相似度获取模块,用于获取多个所述候选答案信息中每两个所述候选答案信息之间的答案相似度;
28.第二特征调整模块,用于对于每个候选答案信息,基于所述候选答案信息对应的多个答案相似度和所述多个候选答案信息中除所述候选答案信息之外的其他候选答案信息对应的第一分类特征,获取第三分类特征;
29.所述分类模块,用于对于每个候选答案信息,基于所述候选答案信息对应的所述第一分类特征、所述第二分类特征和所述第三分类特征进行分类,得到所述分类结果。
30.可选地,所述分类模块,用于:
31.对所述第一分类特征和所述第三分类特征进行融合,得到融合后的分类特征;
32.对所述第一分类特征、所述第三分类特征和所述融合后的分类特征进行拼接,得到所述候选答案信息的第四分类特征;
33.基于所述第二分类特征和所述第四分类特征进行分类,得到所述分类结果。
34.可选地,所述第二特征调整模块,包括:
35.归一化单元,用于对所述多个答案相似度进行归一化,得到归一化后的多个答案相似度;
36.调整单元,用于基于所述归一化后的多个答案相似度,对所述多个候选答案信息中除所述候选答案信息之外的其他候选答案信息对应的第一分类特征进行加权处理,得到所述第三分类特征。
37.可选地,所述分类模块,用于:
38.根据所述证据信息对应的第一置信度,对所述第二分类特征进行加权处理,得到加权后的第二分类特征,所述第一置信度是指所述证据信息的可信程度;
39.基于所述第一分类特征和所述加权后的第二分类特征进行分类,得到所述分类结果。
40.可选地,所述证据信息包括多个证据片段,所述装置还包括:置信度获取模块,用于:
41.获取所述多个证据片段中每两个证据片段之间的片段相似度;
42.对于每个证据片段,基于所述证据片段对应的多个片段相似度,确定所述证据片段对应的片段置信度;
43.对所述多个证据片段对应的片段置信度进行拼接,得到所述第一置信度。
44.可选地,所述证据信息包括多个证据片段,所述第二特征获取模块,用于:
45.分别获取所述多个证据片段对应的证据片段特征;
46.基于所述多个证据片段对应的证据权重,分别调整多个证据片段特征,所述证据权重指示所述证据片段的重要程度;
47.对调整后的多个证据片段特征进行拼接,得到所述证据特征。
48.可选地,所述第二特征获取模块,用于:
49.获取所述问题信息的问题特征;
50.对所述问题特征和所述证据特征进行匹配,得到所述证据信息对应的第二置信度,所述第二置信度表示所述证据信息作为所述问题信息的证据的可信程度;
51.基于所述第二置信度,调整所述证据特征。
52.可选地,所述分类模块,用于:
53.对所述第一分类特征和所述第二分类特征进行融合,得到融合后的分类特征;
54.对所述第一分类特征、所述第二分类特征和所述融合后的分类特征进行拼接,得到所述候选答案信息的第五分类特征;
55.基于所述第五分类特征进行分类,得到所述分类结果。
56.可选地,所述第一特征获取模块,用于:
57.对所述问题信息和所述候选答案信息进行组合,得到组合信息;
58.对所述组合信息进行特征提取,得到所述第一分类特征。
59.可选地,所述装置还包括:答案获取模块,用于:
60.基于所述问题信息和与所述问题信息含义相同的其他问题信息进行搜索;
61.从搜索得到的信息中抽取所述候选答案信息。
62.可选地,信息处理模型包括第一处理子模型、第二处理子模型和分类子模型,
63.所述第一处理子模型,用于基于所述问题信息和所述候选答案信息获取所述第一分类特征;
64.所述第二处理子模型,用于获取所述问题信息对应的证据信息的证据特征;
65.所述第二处理子模型,还用于基于所述第一分类特征与所述证据特征之间的关联度,调整所述证据特征,得到所述候选答案信息的所述第二分类特征;
66.所述分类子模型,用于基于所述第一分类特征和所述第二分类特征进行分类,得到所述候选答案信息对应的分类结果。
67.可选地,所述第一处理子模型中的第一注意力网络,用于获取多个所述候选答案信息中每两个所述候选答案信息之间的答案相似度;
68.所述第一注意力网络,还用于对于每个候选答案信息,基于所述候选答案信息对应的多个答案相似度和所述多个候选答案信息中除所述候选答案信息之外的其他候选答案信息对应的第一分类特征,获取第三分类特征;
69.所述分类子模型,还用于对于每个候选答案信息,基于所述候选答案信息对应的所述第一分类特征、所述第二分类特征和所述第三分类特征进行分类,得到所述分类结果。
70.可选地,所述分类子模型中的融合网络,用于根据所述证据信息对应的第一置信度,对所述第二分类特征进行加权处理,得到加权后的第二分类特征,所述第一置信度是指所述证据信息的可信程度;
71.所述分类子模型中的分类网络,用于基于所述第一分类特征和所述加权后的第二分类特征进行分类,得到所述分类结果。
72.可选地,所述证据信息包括多个证据片段,所述第二处理子模型中的自注意力网络,用于:
73.获取所述多个证据片段中每两个证据片段之间的片段相似度;
74.对于每个证据片段,基于所述证据片段对应的多个片段相似度,确定所述证据片段对应的片段置信度;
75.对所述多个证据片段对应的片段置信度进行拼接,得到所述第一置信度。
76.可选地,所述第一处理子模型中的第一提取网络,用于基于所述问题信息和所述候选答案信息获取所述第一分类特征;
77.所述第二处理子模型中的第二提取网络,用于获取所述问题信息对应的证据信息的证据特征;
78.所述第二处理子模型中的第二注意力网络,用于基于所述第一分类特征与所述证据特征之间的关联度,调整所述证据特征,得到所述候选答案信息的所述第二分类特征。
79.可选地,所述证据信息包括多个证据片段,
80.所述第二提取网络中的特征提取层,用于分别获取所述多个证据片段对应的证据片段特征;
81.所述第二提取网络中的注意力层,用于基于所述多个证据片段对应的证据权重,分别调整多个证据片段特征,所述证据权重指示所述证据片段的重要程度;
82.所述注意力层,还用于对调整后的多个证据片段特征进行拼接,得到所述证据特征。
83.可选地,所述第二处理子模型中的第二提取网络,还用于获取所述问题信息的问题特征;
84.所述第二处理子模型中的第三注意力网络,用于对所述问题特征和所述证据特征进行匹配,得到所述证据信息对应的第二置信度,所述第二置信度表示所述证据信息作为所述问题信息的证据的可信程度;
85.所述第三注意力网络,还用于基于所述第二置信度,调整所述证据特征。
86.可选地,所述信息处理模型的训练过程包括:
87.获取样本问题信息、样本候选答案信息、样本证据信息和所述样本候选答案信息
对应的样本分类结果;
88.调用所述信息处理模型,对所述样本问题信息、所述样本候选答案信息和所述样本证据信息进行处理,得到所述样本候选答案信息对应的预测分类结果;
89.基于所述样本分类结果和所述预测分类结果,训练所述信息处理模型。
90.另一方面,提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条计算机程序,所述至少一条计算机程序由所述处理器加载并执行,以实现如上述方面所述的信息处理方法所执行的操作。
91.另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一条计算机程序,所述至少一条计算机程序由处理器加载并执行,以实现如上述方面所述的信息处理方法所执行的操作。
92.另一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现上述方面所述的信息处理方法所执行的操作。
93.本技术实施例提供的技术方案带来的有益效果至少包括:
94.本技术实施例提供的技术方案,在确定候选答案信息的正确性的过程中,引入了问题信息对应的证据信息,将该证据信息作为证明该候选答案信息是否能够为该问题信息的答案信息的证据,从而基于候选答案信息对应的第一分类特征与证据信息的证据特征之间的关联度,调整证据特征得到的第二分类特征不仅能够体现该证据信息本身的语义信息,还能够体现证据信息对该候选答案信息的支持程度,从而基于第一分类特征和第二分类特征进行分类时,能够考虑到证据信息的影响,以得到更加准确的分类结果,提高了确定的答案信息的准确性。
附图说明
95.为了更清楚地说明本技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术实施例的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
96.图1是本技术实施例提供的一种实施环境的示意图;
97.图2是本技术实施例提供的一种信息处理方法的流程图;
98.图3是本技术实施例提供的一种信息处理方法的流程图;
99.图4是本技术实施例提供的一种信息处理方法的流程图;
100.图5是本技术实施例提供的一种信息处理方法的流程图;
101.图6是本技术实施例提供的一种信息处理方法的流程图;
102.图7是本技术实施例提供的一种信息处理模型的示意图;
103.图8是本技术实施例提供的一种第一处理子模型的示意图;
104.图9是本技术实施例提供的一种第二处理子模型的示意图;
105.图10是本技术实施例提供的一种分类子模型的示意图;
106.图11是本技术实施例提供的一种信息处理方法的流程图;
107.图12是本技术实施例提供的一种信息处理方法的流程图;
108.图13是本技术实施例提供的一种信息处理方法的示意图;
109.图14是本技术实施例提供的一种信息处理方法的流程图;
110.图15是本技术实施例提供的一种信息处理方法的示意图;
111.图16是本技术实施例提供的一种信息处理装置的结构示意图;
112.图17是本技术实施例提供的一种终端的结构示意图;
113.图18是本技术实施例提供的一种服务器的结构示意图。
具体实施方式
114.为使本技术实施例的目的、技术方案和优点更加清楚,下面将结合附图对本技术实施方式作进一步地详细描述。
115.可以理解,本技术所使用的术语“第一”、“第二”等可在本文中用于描述各种概念,但除非特别说明,这些概念不受这些术语限制。这些术语仅用于将一个概念与另一个概念区分。举例来说,在不脱离本技术的范围的情况下,可以将第一排列顺序称为第二排列顺序,将第二排列顺序称为第一排列顺序。
116.本技术所使用的术语“至少一个”、“多个”、“每个”、“任一”等,至少一个包括一个、两个或两个以上,多个包括两个或两个以上,每个是指对应的多个中的每一个,任一是指多个中的任意一个。举例来说,多个分类特征包括3个分类特征,而每个分类特征是指这3个分类特征中的每一个分类特征,任一是指这3个分类特征中的任意一个,可以是第一个,可以是第二个,也可以是第三个。
117.为了便于理解本技术实施例,先对本技术实施例涉及到的关键词进行解释:
118.问答(question answering,qa):对于用户给出的问题信息,通过检索语料库、知识图谱或问答知识库返回简洁、准确的、与该问题信息匹配的答案信息。问答系统可分为基于结构化数据的问答系统、基于文本的问答系统以及基于问答对的问答系统,例如,基于结构化数据的问答系统为kbqa(knowledge base question answering,基于知识库问答),基于文本的问答系统为mrc(machine reading comprehension,机器阅读理解),基于问答对的问答系统为faq(frequently asked questions,经常问到的问题)问答系统。
119.阅读理解:利用算法使计算机设备理解文本语义并回答相关问题的技术,常见问题类型有填空题、多项选择题、问答题等。在基于文本的问答系统中,通常采用片段抽取式的阅读理解技术,从问题相关的文档中抽取出连续的片段作为候选答案。
120.人工智能(artificial intelligence,ai)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
121.人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习、自动驾驶、智慧交通等几大方向。
122.自然语言处理(nature language processing,nlp)是计算机科学领域与人工智
能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,所以它与语言学的研究有着密切的联系。自然语言处理技术通常包括文本处理、语义理解、机器翻译、机器人问答、知识图谱等技术。
123.机器学习(machine learning,ml)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、示教学习等技术。
124.随着人工智能技术研究和进步,人工智能技术在多个领域展开研究和应用,例如常见的智能家居、智能穿戴设备、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、无人机、机器人、智能医疗、智能客服、车联网、自动驾驶、智慧交通等,相信随着技术的发展,人工智能技术将在更多的领域得到应用,并发挥越来越重要的价值。
125.本技术实施例提供的方案涉及人工智能的自然语言处理、机器学习等技术,通过调用信息处理模型,对问题信息、候选答案信息和证据信息进行处理,以得到候选答案信息对应的分类结果,从而确定该候选答案信息是否能够作为该问题信息的答案信息。
126.本技术实施例提供的信息处理方法由计算机设备执行,该计算机设备为终端,该终端为手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表、车载终端或者其他类型的终端,或者,该计算机设备为服务器。可选地,该服务器是独立的物理服务器,或者是多个物理服务器构成的服务器集群或者分布式系统,或者是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、cdn(content delivery network,内容分发网络)、以及大数据和人工智能平台等基础云计算服务的云服务器。
127.或者,本技术实施例提供的信息处理方法由终端和服务器交互执行。图1是本技术实施例提供的一种实施环境的示意图。参见图1,该实施环境包括终端101和服务器102。终端101和服务器102之间通过无线或者有线网络连接。终端101上安装由服务器102提供服务的目标应用,终端101能够通过该目标应用实现例如信息搜索、数据传输等功能。可选地,目标应用为终端101操作系统中的目标应用,或者为第三方提供的目标应用。例如,目标应用为配置有问答系统的搜索应用,该搜索应用具有问题搜索功能,当然,该搜索应用还能够具有其他功能,例如,下载功能、分享功能等。
128.用户能够通过该终端101输入问题信息,通过目标应用向服务器102发送用户输入的问题信息,服务器102到该问题信息之后,基于该问题信息获取对应的候选答案信息和证据信息,并基于该证据信息和问题信息,确定候选答案信息是否能够作为该问题信息的答案信息。可选地,服务器102能够向终端101返回候选问题信息的候选答案信息,终端101展示该候选答案信息;或者服务器102直接向终端101返回最终确定的答案信息,终端101展示该答案信息。
129.图2是本技术实施例提供的一种信息处理方法的流程图。本技术实施例的执行主
体为计算机设备。参见图2,该方法包括以下步骤:
130.201、计算机设备基于问题信息和候选答案信息获取第一分类特征。
131.计算机设备获取问题信息和该问题信息对应的候选答案信息,为了便于后续确定该候选答案信息是否能够作为该问题信息的答案信息,基于该问题信息和候选答案信息进行特征提取,得到该第一分类特征,该第一分类特征至少表示该候选答案信息的语义信息。
132.另外,由于该第一分类特征是基于问题信息和候选答案信息获取的,在获取该第一分类特征是考虑该问题信息和候选答案信息之间的关联关系的情况下,该第一分类特征还能够表示该问题信息和该候选答案信息之间的关联关系。
133.202、计算机设备获取问题信息对应的证据信息的证据特征。
134.其中,证据信息用于提供候选答案信息为问题信息的答案信息的证据。计算机设备对该证据信息进行特征提取,得到该证据特征,该证据特征表示该证据信息的语义信息。
135.203、计算机设备基于第一分类特征与证据特征之间的关联度,调整证据特征,得到第二分类特征。
136.其中,关联度表示该第一分类特征与该证据特征之间的相关程度,该关联度越大,表示候选答案信息与证据信息越相似,也就说明,该候选答案信息能够作为问题信息的答案信息的可能性越大;该关联度越小,表示候选答案信息与证据信息相差越大,也就说明,该候选答案信息能够作为问题信息的答案信息的可能性越小。然后基于关联度调整证据特征,得到第二分类特征,该第二分类特征表示证据信息对候选答案信息的支持程度。
137.204、计算机设备基于第一分类特征和第二分类特征进行分类,得到候选答案信息对应的分类结果,该分类结果指示候选答案信息是否为问题信息的答案信息。
138.由于第一分类特征和第二分类特征能够体现候选答案信息与问题信息之间的关联关系,候选答案信息与证据信息之间的相关程度,因此基于该第一分类特征和第二分类特征进行分类,即可得到该候选答案信息对应的分类结果,从而确定该候选答案信息是否为该问题信息的答案信息。
139.本技术实施例提供的方法,在确定候选答案信息的正确性的过程中,引入了问题信息对应的证据信息,将该证据信息作为证明该候选答案信息是否能够为该问题信息的答案信息的证据,从而基于候选答案信息对应的第一分类特征与证据信息的证据特征之间的关联度,调整证据特征得到的第二分类特征不仅能够体现该证据信息本身的语义信息,还能够体现证据信息对该候选答案信息的支持程度,从而基于第一分类特征和第二分类特征进行分类时,能够考虑到证据信息的影响,以得到更加准确的分类结果,提高了确定的答案信息的准确性。
140.上述图2的实施例仅是简单介绍了在确定答案信息的过程中,利用证据信息作为证据,确定候选答案信息是否能够作为问题信息的答案信息的过程。下面通过图3所示的实施例对信息处理过程进行详细说明。
141.图3是本技术实施例提供的一种信息处理方法的流程图。本技术实施例的执行主体为计算机设备。参见图3,该方法包括以下步骤:
142.301、计算机设备获取问题信息对应的候选答案信息和证据信息。
143.其中,问题信息为用户输入的信息,计算机设备获取到用户输入的问题信息之后,基于该问题信息搜索对应的候选答案信息和证据信息。其中,该问题信息为文本、语音或其
他形式。可选地,用户通过键盘输入问题文本;或者用户语音输入问题语音,在用户输入问题语音的情况下,计算机设备能够直接基于该问题语音进行搜索,或者也能够将问题语音转换为对应的问题文本,然后基于问题文本进行搜索。相同的,候选答案信息和证据信息为文本、语音或其他形式。
144.本技术实施例中,候选答案信息和证据信息的搜索途径不同。其中,该候选答案信息是在特定的问答系统中进行搜索得到的,而证据信息是在公共的搜索应用上进行搜索得到的。
145.在一种可能实现方式中,计算机设备基于问题信息进行搜索,从搜索得到的信息中抽取候选答案信息。其中,搜索得到的信息可以为一段文本、一篇文章或者是其他形式。由于搜索得到的信息中可能还包含与该问题信息无关的其他信息,因此对该搜索得到的信息进行进一步处理,抽取出候选答案信息,例如,对于一篇文章,利用单文档mrc(machine reading comprehension,机器阅读理解)的方式,对该文章进行阅读理解,确定该文章中与问题文本相关的文本片段,将确定的文本片段抽取出来,作为该问题信息的候选答案信息。当然,还能够采用其他方式从搜索得到的信息中抽取候选答案信息,本技术实施例对抽取候选答案信息的方式不做限定。
146.可选地,由于同一个问题可能存在多种表述方式,在仅采用一种表述方式进行搜索时,可能会遗漏一些信息,因此,本技术实施例中针对同一问题信息,还会获取与该问题信息含义相同的其他问题信息,然后基于问题信息和与问题信息含义相同的其他问题信息进行搜索,从搜索得到的信息中抽取候选答案信息。例如,问题信息为“为什么晚上不睡觉对身体危害很大”,与该问题信息含义相同的其他问题信息可以为“为什么熬夜对身体有危害”,或者“晚上不睡觉会对身体造成哪些危害”等。
147.可选地,用户在该问答系统中输入问题信息,通过该问答系统搜索得到对应的候选答案信息。以医学领域为例,该问答系统为专门用于搜索医学知识的问答系统。
148.在一种可能实现方式中,计算机设备基于问题信息在公共的搜索应用上进行搜索,将出现在该搜索应用的首页的多个信息中,排列在前n位的信息作为证据信息。
149.需要说明的是,计算机设备能够基于问题信息搜索得到对应的多个候选答案信息,本技术实施例仅是以多个候选答案信息中的任一候选答案信息为例进行说明。
150.302、计算机设备基于问题信息和候选答案信息获取第一分类特征。
151.本技术实施例中,基于问题信息和候选答案信息获取的第一分类特征至少表示候选答案信息的语义信息。其中,候选答案信息的语义信息是指该候选答案信息的含义。该第一分类特征能够采用向量、矩阵或其他形式表示。
152.在一种可能实现方式中,计算机设备对问题信息和候选答案信息进行组合,得到组合信息,对组合信息进行特征提取,得到第一分类特征。其中,该第一分类特征表示候选答案信息的语义信息、问题信息的语义信息以及问题信息与候选答案信息之间的关联关系。
153.例如,问题信息和候选答案信息的组合方式为:[cls]问题信息[sep]候选答案信息[sep],或者[cls]候选答案信息[sep]问题信息[sep]。其中,[sep]为分隔符号,便于后续处理过程中,根据该分隔符号来区分问题信息和候选答案信息,[cls]是一个特殊标记符号,该特殊标记符号能够汇集问题信息和候选答案信息的整体语义信息。
[0154]
303、计算机设备获取证据信息的证据特征。
[0155]
本技术实施例中,计算机设备对证据信息进行特征提取,得到该证据信息的证据特征,该证据特征表示该证据信息的语义信息。其中,该证据特征能够采用向量、矩阵或其他形式表示。
[0156]
在一种可能实现方式中,该证据信息包括多个证据片段,这多个证据片段中可能部分证据片段重要程度较高,另一部分证据片段重要程度较低,那么在获取证据信息的证据特征时,更多的是需要考虑重要程度较高的证据片段。因此计算机设备分别获取多个证据片段对应的证据片段特征,基于多个证据片段对应的证据权重,分别调整多个证据片段特征,该证据权重指示证据片段的重要程度,对调整后的多个证据片段特征进行拼接,得到证据特征。其中,基于证据权重调整证据片段特征能够突出重要程度较高的证据片段,使拼接得到的证据特征包含更多的重要程度较高的证据片段的特征。
[0157]
可选地,采用下述公式一,获取每个证据片段对应的证据权重:
[0158][0159]
其中,scoref表示证据片段m的证据权重,softmax(
·
)为激活函数,w为可学习的矩阵,em表示证据片段m的证据片段特征,表示证据片段m的证据片段特征的转置矩阵,α1为参考参数。其中,w∈r
l
×h,l表示证据片段的数量,h表示证据片段特征的维度,r
l
×h表示l
×
h的矩阵。
[0160]
或者,能够将上述公式一中的替换为em。
[0161]
采用下述公式二,对获取的证据片段进行调整:
[0162][0163]
其中,表示调整后的证据片段特征,scoref表示证据片段m的证据权重,em表示调整前的证据片段特征。
[0164]
304、计算机设备对问题信息的问题特征和证据特征进行匹配,得到证据信息对应的第二置信度。
[0165]
由于证据信息也是从网络上搜索得到的信息,无法保证该证据信息时完全准确的,因此在基于证据特征对第一分类特征进行调整之前,还需要确定该证据信息作为问题信息的证据的可信程度。
[0166]
其中,问题特征是对问题信息进行特征提取得到的,第二置信度表示证据信息作为问题信息的证据的可信程度。
[0167]
可选地,采用下述公式三,获取第二置信度:
[0168][0169]
其中,scoree表示第二置信度,softmax(
·
)为激活函数,q表示问题特征,表示证据特征,表示证据特征的转置矩阵,α2表示参考参数。
[0170]
或者,能够将上述公式三中的替换为
[0171]
305、计算机设备基于第二置信度,调整证据特征,得到调整后的证据特征。
[0172]
由于第二置信度能够标识证据信息作为问题信息的证据的可信程度,则该第二置
信度越大,表示该证据信息越可信,此时基于该第二置信度调整证据特征,使调整后的证据特征能够进一步强化该证据信息的语义信息;该第二置信度越小,表示该证据信息越不可信,此时基于该第二置信度调整证据特征,使调整后的证据特征能够弱化该证据信息的语义信息。从而使后续基于证据特征进行处理时,能够使该证据特征能够更加准确地发挥证据的作用。
[0173]
可选地,采用下述公式四,调整该证据特征:
[0174][0175]
其中,表示调整后的证据特征,scoree表示第二置信度,表示调整前的证据特征的转置矩阵。
[0176]
或者,能够将上述公式四中的替换为
[0177]
需要说明的是,步骤204-步骤205是可选地,在另一实施例中,通过上述步骤203得到证据特征之后,可直接执行步骤206。
[0178]
306、计算机设备基于第一分类特征与证据特征之间的关联度,调整证据特征,得到第二分类特征。
[0179]
其中,关联度表示该第一分类特征与该证据特征之间的相关程度,该关联度越大,表示候选答案信息与证据信息越相似,也就说明,该候选答案信息能够作为问题信息的答案信息的可能性越大;该关联度越小,表示候选答案信息与证据信息相差越大,也就说明,该候选答案信息能够作为问题信息的答案信息的可能性越小。
[0180]
然后基于关联度调整证据特征,得到第二分类特征,该第二分类特征表示证据信息的语义信息和证据信息对候选答案信息的支持程度。其中,该关联度越大,则第二分类特征中与该候选答案信息相关的语义信息越明显,后续在分类过程中,越能够证明候选答案信息与该证据信息相关。该关联度越小,则第二分类特征中与该候选答案信息相关的语义信息越不明显,候选在分类过程中,越无法证明候选答案信息与该证据信息相关。
[0181]
可选地,采用下述公式五,计算第一分类特征与证据特征之间的关联度:
[0182][0183]
其中,scorea表示关联度,softmax(
·
)为激活函数,表示候选答案信息i对应的第一分类特征,表示候选答案信息i,表示证据特征的转置矩阵,α3表示参考参数。
[0184]
或者,能够将上述公式五中的替换为
[0185]
采用下述公式六,调整第一分类特征:
[0186][0187]
其中,表示候选答案信息i对应的第二分类特征,scorea表示关联度,表示证据特征的转置矩阵。
[0188]
或者,能够将上述公式六中的替换为
[0189]
307、计算机设备基于第一分类特征和第二分类特征进行分类,得到候选答案信息
对应的分类结果。
[0190]
其中,分类结果指示候选答案信息是否为问题信息的答案信息。可选地,分类结果采用0和1表示,在分类结果为1时,表示该候选答案信息为该问题信息的答案信息,在分类结果为0时,表示该候选答案信息不是该问题信息的答案信息。或者分类结果采用概率表示,在概率大于阈值的情况下,表示该候选答案信息为该问题信息的答案信息,在概率小于阈值的情况下,表示该候选答案信息不是该问题信息的答案信息。例如阈值为0.7、0.8或其他数值。
[0191]
在一种可能实现方式中,计算机设备对第一分类特征和第二分类特征进行拼接,得到拼接后的分类特征,对该拼接后的分类特征进行分类,得到该分类结果。
[0192]
在另一种可能实现方式中,计算机设备对第一分类特征和第二分类特征进行融合,得到融合后的分类特征;对第一分类特征、第二分类特征和融合后的分类特征进行拼接,得到候选答案信息的第五分类特征;基于第五分类特征进行分类,得到分类结果。其中,融合后的分类特征能够强化候选答案信息中与证据信息相同的部分信息对应的语义信息,后续基于第五分类特征进行分类时,能够凸显该候选答案信息中能够得到证据信息支持的语义信息,从而使得到的分类结果更加准确。
[0193]
在另一种可能实现方式中,计算机设备根据证据信息对应的第一置信度,对第二分类特征进行加权处理,得到加权后的第二分类特征;基于第一分类特征和加权后的第二分类特征进行分类,得到分类结果。其中,第一置信度是指证据信息的可信程度,即仅考虑该证据信息本身的可信程度,该第一置信度越大,表示该证据信息越可信,该第一置信度越小,表示该证据信息越不可信。加权后的第二分类特征由于考虑了该证据信息的可信程度,因此能够强化该第二分类特征中可信的证据信息,后续基于该加权后的第二分类特征进行分类时,能够凸显该证据信息中可信的那部分信息的语义信息,从而使得到的分类结果更加准确。
[0194]
可选地,根据证据信息中的证据片段的出现频率,确定第一置信度。但是,由于两个证据片段虽然表述方式不完全相同,但是可能表示的意思是一样的,因此,为了避免这种情况下将两个证据片段看作不同的证据片段,本技术实施例中,通过计算两个证据片段之间的片段相似度,确定这两个证据片段是否能够看作同一证据片段。计算机设备获取多个证据片段中每两个证据片段之间的片段相似度;对于每个证据片段,基于证据片段对应的多个片段相似度,确定证据片段对应的片段置信度;对多个证据片段对应的片段置信度进行拼接,得到第一置信度。
[0195]
可选地,采用下述公式七,获取该多个片段相似度:
[0196][0197]
其中,scorec表示多个片段相似度,表示证据特征,表示证据特征的转置矩阵,α4表示参考参数。由于证据特征是由多个证据片段特征拼接得到的,因此直接将与相乘即可得到多个片段相似度。
[0198]
或者,公式七能够表示为:
[0199]
[0200]
其中,score
mg
表示证据片段m与证据片段g之间的片段相似度,表示证据片段m的证据片段特征,表示证据片段g的证据片段特征。
[0201]
可选地,对于多个片段相似度求均值,得到对应的片段置信度,对多个片段之心都进行拼接得到第一置信度。
[0202]
例如,采用下述公式八,获取第一置信度:
[0203]
公式八:score
confidence
=sigmoid(mean(scorec))
[0204]
其中,score
confidence
表示第一置信度,sigmoid(
·
)为激活函数,mean(scorec)表示对多个片段相似度求均值。由于scorec包含了全部片段相似度,因此求均值无需再进行拼接。
[0205]
本技术实施例提供的方法,在确定候选答案信息的正确性的过程中,引入了问题信息对应的证据信息,将该证据信息作为证明该候选答案信息是否能够为该问题信息的答案信息的证据,从而基于候选答案信息对应的第一分类特征与证据信息的证据特征之间的关联度,调整证据特征得到的第二分类特征不仅能够体现该证据信息本身的语义信息,还能够体现证据信息对该候选答案信息的支持程度,从而基于第一分类特征和第二分类特征进行分类时,能够考虑到证据信息的影响,以得到更加准确的分类结果,提高了确定的答案信息的准确性。
[0206]
并且,本技术实施例中,基于第二置信度对证据特征进行调整,在证据信息可信的情况下,能够进一步强化该证据信息的语义信息;在证据信息不可信的情况下,能够弱化该证据信息的语义信息,从而使基于证据特征进行处理时,能够使该证据特征能够更加准确地发挥证据的作用。
[0207]
上述图3所示的实施例介绍了在考虑证据信息对答案信息的影响,对候选答案信息进行分类过程。在另一实施例中,参见图4,在问题信息具有多个候选答案信息的情况下,对于每个候选答案信息,考虑其他候选答案信息对该候选答案信息的影响,对候选答案信息进行分类。
[0208]
图4是本技术实施例提供的一种信息处理方法的流程图。本技术实施例的执行主体为计算机设备。参见图4,该方法包括以下步骤:
[0209]
401、计算机设备获取问题信息对应的多个候选答案信息。
[0210]
步骤401中获取候选答案信息的实施方式与上述步骤301中获取候选答案信息的实施方式同理,在此不再赘述。
[0211]
402、计算机设备基于问题信息和多个候选答案信息,获取多个第一分类特征。
[0212]
步骤402中获取第一分类特征的实施方式与上述步骤302中获取第一分类特征的实施方式同理,在此不再赘述。
[0213]
403、计算机设备获取多个候选答案信息中每两个候选答案信息之间的答案相似度。
[0214]
本技术实施例中,计算机设备对于每两个候选答案信息,对每两个候选答案信息对应的第一分类特征进行匹配,得到该每两个候选答案信息之间的答案相似度。两个候选答案信息之间的答案相似度越高,表示其中一个候选答案信息能够得到另一个候选答案信息的支持。
[0215]
可选地,对于每两个候选答案信息,采用下述公式九,获取答案相似度:
[0216][0217]
其中,i表示候选答案信息i,j表示候选答案信息j,s
i,j
表示候选答案信息i和候选答案信息j之间的答案相似度,表示候选答案信息i对应的第一分类特征,表示候选答案信息i对应的第一分类特征的转置矩阵,表示候选答案信息j对应的第一分类特征。
[0218]
上述公式九中,在i=j的情况下,答案相似度为0,而在其他情况下,按照的方式求取答案相似度。
[0219]
或者,能够将上述公式九中的替换为或者,能够将上述公式九中的替换为表示候选答案信息j对应的第一分类特征的转置矩阵。
[0220]
404、计算机设备对于任一候选答案信息,基于该候选答案信息对应的多个答案相似度和多个候选答案信息中除该候选答案信息之外的其他候选答案信息对应的第一分类特征,获取第三分类特征。
[0221]
对于任一候选答案信息,考虑其他候选答案信息对该候选答案信息的影响,其他候选答案信息与该候选答案信息越相似,表示该候选答案信息越能够得到其他候选答案信息的支持,后续在确定该候选答案信息的分类结果时,能够依据其他候选答案信息,对该候选答案信息进行分类。其中,第三分类特征是基于其他候选答案信息对应的第一分类特征和多个答案相似度得到的,该第三分类特征中包含了其他候选答案信息中与该候选答案信息相同的语义信息。
[0222]
在一种可能实现方式中,计算机设备对多个答案相似度进行归一化,得到归一化后的多个答案相似度;基于归一化后的多个答案相似度,对多个候选答案信息中除候选答案信息之外的其他候选答案信息对应的第一分类特征进行加权处理,得到第三分类特征。
[0223]
可选地,采用下述公式十,对多个答案相似度进行归一化:
[0224][0225]
其中,α
i,j
表示候选答案信息i和候选答案信息j对应的归一化后的答案相似度,n表示候选答案信息的总数量,k表示候选答案信息k,e表示自然对数底数,和表示基于自然对数底数表示的答案相似度,表示对n个基于自然对数底数表示的答案相似度进行求和。
[0226]
可选地,采用下述公式十一,基于归一化后的多个答案相似度,对多个第一分类特征进行加权处理:
[0227][0228]
其中,表示候选答案信息i对应的第三分类特征,α
i,j
表示候选答案信息i和候选答案信息j对应的归一化后的答案相似度,表示候选答案信息j对应的第一分类特
征。
[0229]
405、计算机设备对于任一候选答案信息,基于该候选答案信息对应的第一分类特征和第三分类特征进行分类,得到该候选答案信息对应的分类结果。
[0230]
在一种可能实现方式中,计算机设备对第一分类特征和第三分类特征进行拼接,得到拼接后的分类特征,对该拼接后的分类特征进行分类,得到该分类结果。
[0231]
在另一种可能实现方式中,计算机设备对第一分类特征和第三分类特征进行融合,得到融合后的分类特征;对第一分类特征、第三分类特征和融合后的分类特征进行拼接,得到候选答案信息的第六分类特征;基于第六分类特征进行分类,得到分类结果。其中,融合后的分类特征能够强化候选答案信息中与其他候选答案信息相同的部分信息对应的语义信息,后续基于第六分类特征进行分类时,能够凸显该候选答案信息中能够得到其他候选答案信息支持的语义信息,从而使得到的分类结果更加准确。
[0232]
需要说明的是,图4所示的实施例中仅是以获取多个候选答案信息中的任一候选答案信息对应的分类结果为例进行说明,在另一实施例中,对于该多个候选答案信息中的每个候选答案信息,均能够采用上述实施方式获取对应的分类结果。
[0233]
本技术实施例提供的方法中,在确定候选答案信息的正确性的过程中,引入了多个候选答案信息,多个候选答案信息能够相互作为证据证明其中某个候选答案信息是否能够为该问题信息的答案信息,从而基于每两个候选答案信息之间的答案相似度,得到的第三分类特征包含了其他候选答案信息中与该候选答案信息相同的语义信息,从而基于第一分类特征和第三分类特征进行分类时,考虑了多个候选答案信息之间的影响,能够得到更加准确的分类结果,提高了确定的答案信息的准确性。
[0234]
上述图3和图4的实施例对于多个候选答案信息中的任一候选答案信息,分别考虑了证据信息和除该候选答案信息之外的其他候选答案信息的影响,参见图5,在另一实施例中,能够同时考虑证据信息和除该候选答案信息之外的其他候选答案信息的影响。基于上述步骤301-步骤306得到第二分类特征,基于上述步骤401-步骤404得到第三分类特征之后,执行步骤501。
[0235]
501、计算机设备基于该候选答案信息对应的第一分类特征、第二分类特征和第三分类特征进行分类,得到候选答案信息对应的分类结果。
[0236]
在一种可能实现方式中,计算机设备对第一分类特征和第三分类特征进行融合,得到融合后的分类特征;对第一分类特征、第三分类特征和融合后的分类特征进行拼接,得到候选答案信息的第四分类特征;基于第二分类特征和第四分类特征进行分类,得到分类结果。例如,第四分类特征为表示为:
[0237][0238]
其中,表示第四分类特征,表示候选答案信息i对应的第一分类特征,表示候选答案信息i对应的第三分类特征,表示第一分类特征和第三分类特征融合后的分类特征。
[0239]
在另一种可能实现方式中,计算机设备对第一分类特征和第二分类特征进行融合,得到融合后的分类特征;对第一分类特征、第二分类特征和融合后的分类特征进行拼接得到候选答案信息的第五分类特征;基于第三分类特征和第五分类特征进行分类,得到分
类结果。例如,第五分类特征为表示为:
[0240][0241]
其中,表示第五分类特征,表示候选答案信息i对应的第一分类特征,表示候选答案信息i对应的第二分类特征,表示第一分类特征和第二分类特征融合后的分类特征。
[0242]
在另一种可能实现方式中,计算机设备对第一分类特征和第三分类特征进行融合,得到融合后的分类特征,对第一分类特征、第三分类特征和融合后的分类特征进行拼接,得到候选答案信息的第四分类特征;对第一分类特征和第二分类特征进行融合,得到融合后的分类特征,对第一分类特征、第二分类特征和融合后的分类特征进行拼接得到候选答案信息的第五分类特征;基于第四分类特征和第五分类特征进行分类,得到分类结果。
[0243]
可选地,上述第五分类特征中包含第二分类特征,则能够基于第一置信度,对第五分类特征进行加权处理,得到加权处理后的第五分类特征,基于第四分类特征和加权后的第五分类特征进行分类,得到分类结果。
[0244]
可选地,对第四分类特征和加权后的第五分类特征进行融合,将融合后的分类特征确定为该候选答案信息对应的、最终的分类特征,基于该融合后的分类特征进行分类,得到分类结果。
[0245]
例如,采用下述公式十二,对第四分类特征和加权后的第五分类特征进行融合:
[0246][0247]
其中,gi表示第四分类特征和加权后的第五分类特征融合后的分类特征,表示第四分类特征,表示第五分类特征,score
confidence
表示第一置信度。
[0248]
在另一种可能实现方式中,计算机设备根据证据信息对应的第一置信度,对第二分类特征进行加权处理,得到加权后的第二分类特征;基于第一分类特征、加权后的第二分类特征和第三分类特征进行分类,得到分类结果。
[0249]
另外,在一种可能实现方式中,在分类结果为概率表示的情况下,对于多个候选答案信息,计算机设备分别得到每个候选答案信息对应的分类结果,从多个候选答案信息中确定了多个答案信息的情况下,还能够根据概率大小,从多个答案信息中确定一个最准确的答案信息。
[0250]
需要说明的是,上述实施例中仅是以计算机设备为执行主体为例进行说明,在另一实施例中,能够由终端和服务器交互执行,终端获取用户输入的问题信息,将问题信息发送给服务器,由服务器执行上述实施例以得到分类结果,确定该问题信息的答案信息,然后将答案信息返回给终端,终端展示该答案信息。例如,答案信息能够以文本形式进行显示,也能够以语音形式播放。
[0251]
需要说明的是,上述步骤301-步骤306和步骤401-步骤404能够同时执行,或者能够先执行步骤301-步骤306,再执行步骤401-步骤404,或者能够先执行步骤401-步骤404,再执行步骤301-步骤306,本技术实施例对其执行的先后顺序不做限定。
[0252]
本技术实施例的整体流程参见图6,首先,基于问题信息进行检索得到的信息进行抽取,得到多个候选答案信息,并在网络上进行知识爬取得到证据信息,对证据信息进行语
义编码得到证据特征,基于多个候选答案信息进行编码得到多个第一分类特征,针对每个候选答案信息,基于证据信息和对应的第一分类特征进行比较(答案证据比较),以及对多个第一分类特征进行比较(多答案比较),根据两个比较的结果进行结果分类,得到每个候选答案信息对应的分类结果。
[0253]
本技术实施例提供的方法中,在确定候选答案信息的正确性的过程中,引入了问题信息对应的证据信息,将该证据信息作为证明该候选答案信息是否能够为该问题信息的答案信息的证据,从而基于候选答案信息对应的第一分类特征与证据信息的证据特征之间的关联度,调整证据特征得到的第二分类特征不仅能够体现该证据信息本身的语义信息,还能够体现证据信息对该候选答案信息的支持程度;并且,还引入了多个候选答案信息,多个候选答案信息能够相互作为证据证明其中某个候选答案信息是否能够为该问题信息的答案信息,从而基于每两个候选答案信息之间的答案相似度,得到的第三分类特征包含了其他候选答案信息中与该候选答案信息相同的语义信息,从而基于第一分类特征、第二分类特征和第三分类特征进行分类时,考虑了证据信息的影响和多个候选答案信息之间的影响,能够得到更加准确的分类结果,提高了确定的答案信息的准确性。
[0254]
另外,在一些实施例中,计算机设备能够调用信息处理模型,对问题信息、候选答案信息和证据信息进行处理,得到候选答案信息对应的分类结果。下面先对信息处理模型的结构进行说明。
[0255]
参见图7所示的信息处理模型的示意图。该信息处理模型包括第一处理子模型701、第二处理子模型702和分类子模型703。第一处理子模型701、第二处理子模型702和分类子模型703相互连接。
[0256]
在一种可能实现方式中,参见图8,该第一处理子模型701包括第一提取网络711和第一注意力网络721。其中,第一提取网络711与第一注意力网络721连接,该第一提取网络711用于基于问题信息和候选答案信息获取第一分类特征,该第一注意力网络721用于获取多个候选答案信息中每两个候选答案信息之间的答案相似度,对于每个候选答案信息,该第一注意力网络721还用于基于候选答案信息对应的多个答案相似度和多个候选答案信息中除候选答案信息之外的其他候选答案信息对应的第一分类特征,获取第三分类特征。
[0257]
在一种可能实现方式中,参见图9,该第二处理子模型702包括第二提取网络712、第二注意力网络722和第三注意力网络732。其中,第二提取网络712、第二注意力网络722和第三注意力网络732依次连接,第二提取网络712用于获取问题信息对应的证据信息的证据特征,第二注意力网络722用于基于第一分类特征与证据特征之间的关联度,调整证据特征,得到候选答案信息对应的第二分类特征,第三注意力网络732用于对问题特征和证据特征进行匹配,得到证据信息对应的第二置信度,基于该第二置信度,调整证据特征。
[0258]
可选地,第二提取网络712包括特征提取层和注意力层。其中,特征提取层与注意力层连接,该特征提取层用于分别获取多个证据片段对应的证据片段特征;注意力层用于基于多个证据片段对应的证据权重,分别调整多个证据片段特征,对调整后的多个证据片段特征进行拼接,得到证据特征。
[0259]
可选地,该第二处理子模型702还包括自注意力网络742,该自注意力网络742与第二提取网络712连接,该自注意力网络742用于获取多个证据片段中每两个证据片段之间的片段相似度;对于每个证据片段,基于证据片段对应的多个片段相似度,确定证据片段对应
的片段置信度;对多个证据片段对应的片段置信度进行拼接,得到第一置信度。
[0260]
在一种可能实现方式中,参见图10,该分类子模型703包括融合网络713和分类网络723。其中,融合网络713和分类网络723连接,融合网络713至少用于根据证据信息对应的第一置信度,对第二分类特征进行加权处理,得到加权后的第二分类特征;分类网络723,用于基于第一分类特征和加权后的第二分类特征进行分类,得到分类结果。
[0261]
基于上述图7-图10所示的信息处理模型的模型结构,参见图11,调用该信息处理模型对问题信息、候选答案信息和证据信息进行处理,得到候选答案信息对应的分类结果。图11是本技术实施例提供的一种信息处理方法的流程图。本技术实施例的执行主体为计算机设备。参见图11,该方法包括以下步骤:
[0262]
1101、计算机设备调用第一处理子模型,基于问题信息和候选答案信息获取第一分类特征。
[0263]
在一种可能实现方式中,计算机设备调用该第一提取网络,基于问题信息和候选答案信息获取第一分类特征。
[0264]
1102、计算机设备调用第二处理子模型,获取问题信息对应的证据信息的证据特征。
[0265]
在一种可能实现方式中,计算机设备调用第二提取网络,获取问题信息对应的证据信息的证据特征。
[0266]
可选地,计算机设备调用特征提取层,分别获取多个证据片段对应的证据片段特征;调用注意力层,基于多个证据片段对应的证据权重,分别调整多个证据片段特征,对调整后的多个证据片段特征进行拼接,得到证据特征。
[0267]
1103、计算机设备调用第二处理子模型,基于第一分类特征与证据特征之间的关联度,调整证据特征,得到第二分类特征。
[0268]
在一种可能实现方式中,计算机设备调用第二注意力网络,基于第一分类特征与证据特征之间的关联度,调整证据特征,得到候选答案信息的第二分类特征。
[0269]
在一种可能实现方式中,计算机设备调用第三注意力网络对问题特征和证据特征进行匹配,得到证据信息对应的第二置信度,基于第二置信度,调整证据特征,得到调整后的证据特征。
[0270]
1104、计算机设备调用分类子模型,基于第一分类特征和第二分类特征进行分类,得到候选答案信息对应的分类结果,该分类结果指示候选答案信息是否为问题信息的答案信息。
[0271]
在一种可能实现方式中,计算机设备调用融合网络根据证据信息对应的第一置信度,对第二分类特征进行加权处理,得到加权后的第二分类特征;调用分类网络基于第一分类特征和加权后的第二分类特征进行分类,得到分类结果。
[0272]
可选地,计算机设备调用注意力网络获取多个证据片段中每两个证据片段之间的片段相似度;对于每个证据片段,基于证据片段对应的多个片段相似度,确定证据片段对应的片段置信度;对多个证据片段对应的片段置信度进行拼接,得到第一置信度。
[0273]
步骤1101-步骤1104的实施方式与上述实施例中步骤302-步骤307的实施方式同理,在此不再赘述。
[0274]
本技术实施例提供的方法,在确定候选答案信息的正确性的过程中,引入了问题
信息对应的证据信息,将该证据信息作为证明该候选答案信息是否能够为该问题信息的答案信息的证据,从而基于候选答案信息对应的第一分类特征与证据信息的证据特征之间的关联度,调整证据特征得到的第二分类特征不仅能够体现该证据信息本身的语义信息,还能够体现证据信息对该候选答案信息的支持程度,从而调用信息处理模型,基于第一分类特征和第二分类特征进行分类时,考虑了证据信息的影响,能够得到更加准确的分类结果,提高了确定的答案信息的准确性。
[0275]
与上述图4所示的实施例类似的,本技术实施例中能够调用信息处理模型,在问题信息具有多个候选答案信息的情况下,对于每个候选答案信息,考虑其他候选答案信息对该候选答案信息的影响,对候选答案信息进行分类。图12是本技术实施例提供的一种信息处理方法的流程图。本技术实施例的执行主体为计算机设备。参见图12,该方法包括以下步骤:
[0276]
1201、计算机设备调用第一处理子模型,基于问题信息和多个候选答案信息,获取多个第一分类特征。
[0277]
在一种可能实现方式中,计算机设备调用第一提取网络,基于问题信息和候选答案信息获取第一分类特征。
[0278]
1202、计算机设备调用第一处理子模型,获取多个候选答案信息中每两个候选答案信息之间的答案相似度。
[0279]
在一种可能实现方式中,计算机设备调用第一注意力网络,获取多个候选答案信息中每两个候选答案信息之间的答案相似度。
[0280]
1203、计算机设备调用第一处理子模型,对于任一候选答案信息,基于该候选答案信息对应的多个答案相似度和多个候选答案信息中除该候选答案信息之外的其他候选答案信息对应的第一分类特征,获取第三分类特征。
[0281]
在一种可能实现方式中,对于每个候选答案信息,计算机设备调用第一注意力网络,基于候选答案信息对应的多个答案相似度和多个候选答案信息中除候选答案信息之外的其他候选答案信息对应的第一分类特征,获取第三分类特征。
[0282]
1204、计算机设备调用分类子模型,对于任一候选答案信息,基于该候选答案信息对应的第一分类特征和第三分类特征进行分类,得到该候选答案信息对应的分类结果。
[0283]
步骤1201-步骤1204的实施方式与上述实施例中步骤402-步骤405的实施方式同理,在此不再赘述。
[0284]
本技术实施例提供的方法,在确定候选答案信息的正确性的过程中,引入了多个候选答案信息,多个候选答案信息能够相互作为证据证明其中某个候选答案信息是否能够为该问题信息的答案信息,从而基于每两个候选答案信息之间的答案相似度,得到的第三分类特征包含了其他候选答案信息中与该候选答案信息相同的语义信息,从而调用信息处理模型,基于第一分类特征和第三分类特征进行分类时,考虑了多个候选答案信息之间的影响,能够得到更加准确的分类结果,提高了确定的答案信息的准确性。
[0285]
与上述图5所示的实施例类似的,本技术实施例中,基于上述步骤1101-步骤1103得到第二分类特征,基于上述步骤1201-步骤1203得到第三分类特征之后,计算机设备还能够调用分类子模型,基于该候选答案信息对应的第一分类特征、第二分类特征和第三分类特征进行分类,得到候选答案信息对应的分类结果。
[0286]
以问题信息具有3个候选答案信息为例,参见图13,将每个候选答案信息分别与问题信息进行拼接,将拼接后的三个组合信息输入至第一处理子模型中的第一提取网络,调用该第一提取网络分别对三个组合信息进行编码,得到三个第一分类特征和然后将和输入至第一注意力网络,由第一注意力网络,对和进行处理,得到每个候选答案信息对应的第三分类特征和同时,将问题信息和证据信息分别输入至第二处理子模型中的第二提取网络,调用该第二提取网络,分别得到问题信息的问题特征和证据信息的证据特征然后将证据特征输入至第三注意力网络,调用第三注意力网络对问题特征和证据特征进行匹配,得到证据信息对应的第二置信度,基于该第二置信度,调整证据特征,得到调整后的证据特征(在图13中由三个证据片段特征表示),然后将调整后的证据特征和三个第一分类特征和输入至第二注意力网络,得到每个候选答案信息对应的第二分类特征和之后,将三个第一分类特征、三个第二分类特征和三个第三分类特征输入至分类子模型,分别得到每个候选答案信息对应的分类结果。
[0287]
另外,在使用上述实施例中的信息处理模型在使用之前需要进行训练,能够由上述计算机设备进行训练,也能够由其他计算机设备进行训练,本技术实施例对训练该信息处理模型的设备不做限定。
[0288]
计算机设备获取样本问题信息、样本候选答案信息、样本证据信息和样本候选答案信息对应的样本分类结果;调用信息处理模型,对样本问题信息、样本候选答案信息和样本证据信息进行处理,得到样本候选答案信息对应的预测分类结果;基于样本分类结果和预测分类结果,训练信息处理模型。
[0289]
可选地,采用下述损失函数,训练该信息处理模型:
[0290]
l=-(y
·
logp+(1-y)
·
log(1-p))
[0291]
其中,l表示损失值,p表示预测分类结果,y表示样本分类结果。
[0292]
在一种可能实现方式中,计算机设备对样本问题信息和样本候选答案信息进行组合,得到样本组合信息,调用信息处理模型,对样本问题信息、样本组合信息和样本证据信息进行处理,得到样本候选答案信息对应的预测分类结果。
[0293]
需要说明的一点是,上述训练过程仅是以一次训练为例进行说明,在另一实施例只能够,能够对信息处理模型进行多次迭代训练。
[0294]
需要说明的另一点是,上述一次训练过程中的样本答案信息为一个或多个。
[0295]
上述实施例中所示的信息处理方法,能够应用于多种场景下,例如应用于医学场景、考试场景、智慧交通场景或其他场景。下面以医学场景为例,参见图14,该方法由计算机设备执行,对信息处理过程进行说明。
[0296]
1401、获取医学问题信息对应的多个候选医学答案信息和医学证据信息。
[0297]
1402、基于医学问题信息和多个候选医学答案信息,分别获取多个候选医学答案信息对应的第一分类特征。
[0298]
1403、获取医学证据信息的证据特征和医学问题的问题特征。
[0299]
1404、对问题特征和证据特征进行匹配,得到医学证据信息对应的第二置信度。
[0300]
1405、基于第二置信度,调整证据特征,得到调整后的证据特征。
[0301]
1406、基于第一分类特征与证据特征之间的关联度,调整证据特征,得到第二分类特征。
[0302]
1407、获取多个候选医学答案信息中每两个候选医学答案信息之间的答案相似度。
[0303]
1408、对于每个候选医学答案信息,基于该候选医学答案信息对应的多个答案相似度和多个候选医学答案信息中除该候选医学答案信息之外的其他候选医学答案信息对应的第一分类特征,获取第三分类特征。
[0304]
1409、基于每个候选医学答案信息对应的第一分类特征、第二分类特征和第三分类特征进行分类,得到每个候选医学答案信息对应的分类结果。
[0305]
在一种可能实现方式中,用户能够在医学问答系统中输入医学问题信息,然后计算机设备通过该医学问答系统对输入的医学问题信息进行搜索,分别得到多个候选医学答案信息和医学证据信息。
[0306]
上述步骤1401-步骤1409的实施方式与上述图3、图4和图5所示的实施方式同理,在此不再赘述。
[0307]
另外,为了说明本技术实施例提供的信息处理方法的准确性,将本技术实施例提供的信息处理方法(下表中采用本方法表示),与现有技术中仅考虑一个候选答案信息的信息处理方法(下表中采用baseline表示)进行对比,参见表1:
[0308]
表1
[0309][0310]
从上述表1中能够看出,本方法相比于baseline,在保证答案信息正确的召回基础上,尽可能提高判断为正确答案的准确率(+12%)。
[0311]
又例如,参见图15所示的示意图,医学问题信息为“每天下午发低烧是怎么回事”,采用baseline将低烧的治疗方案(候选医学答案信息)“对于低烧的话,临床上一般是不赞成采取药物来降温的,发烧在38度以下的话,建议可以多引用热一点的开水
…”
,确定为了该医学问题信息的医学答案信息,本技术实施例提供的方法搜索了相关的医学证据信息“每天发低烧主要有以下几种原因:首先需要排除感染的因素所引起的
……
,也不能排除结核、肿瘤等相关的因素”、“每天发低烧很有可能是由于病毒感染所致,还有可能是因为体内有细菌
……”
、“每天下午都会低烧,首先需要考虑是否有结核杆菌感染
……
,最后应考虑是否有非感染性疾病”、“发烧的原因有很多,可分为感染性发烧和非感染性发烧”和“在每天出现低烧症状,一般与患有慢性传染性疾病、代谢性疾病有关”。本技术实施例中,引入的医学证据信息中各个证据片段之间是相似的,因此该医学证据信息的可信程度较高,且该医学证据信息与医学问题信息也是相关的,而医学证据信息与候选医学答案信息之间的关联度却很低,因此采用本技术实施例提供的信息处理方法来判断的话,即可确定该候选医学答案信息是错误答案。
[0312]
图16是本技术实施例提供的一种信息处理装置的结构示意图。参见图16,该装置包括:
[0313]
第一特征获取模块1601,用于基于问题信息和候选答案信息获取第一分类特征,该第一分类特征至少表示该候选答案信息的语义信息;
[0314]
第二特征获取模块1602,用于获取该问题信息对应的证据信息的证据特征,该证据信息用于提供该候选答案信息为该问题信息的答案信息的证据;
[0315]
第一特征调整模块1603,用于基于该第一分类特征与该证据特征之间的关联度,调整该证据特征,得到第二分类特征;
[0316]
分类模块1604,用于基于该第一分类特征和该第二分类特征进行分类,得到该候选答案信息对应的分类结果,该分类结果指示该候选答案信息是否为该问题信息的答案信息。
[0317]
本技术实施例提供的装置,在确定候选答案信息的正确性的过程中,引入了问题信息对应的证据信息,将该证据信息作为证明该候选答案信息是否能够为该问题信息的答案信息的证据,从而基于候选答案信息对应的第一分类特征与证据信息的证据特征之间的关联度,调整证据特征得到的第二分类特征不仅能够体现该证据信息本身的语义信息,还能够体现证据信息对该候选答案信息的支持程度,从而基于第一分类特征和第二分类特征进行分类时,能够考虑到证据信息的影响,以得到更加准确的分类结果,提高了确定的答案信息的准确性。
[0318]
可选地,该装置还包括:
[0319]
相似度获取模块,用于获取多个该候选答案信息中每两个该候选答案信息之间的答案相似度;
[0320]
第二特征调整模块,用于对于每个候选答案信息,基于该候选答案信息对应的多个答案相似度和该多个候选答案信息中除该候选答案信息之外的其他候选答案信息对应的第一分类特征,获取第三分类特征;
[0321]
该分类模块1604,用于对于每个候选答案信息,基于该候选答案信息对应的该第一分类特征、该第二分类特征和该第三分类特征进行分类,得到该分类结果。
[0322]
可选地,该分类模块1604,用于:
[0323]
对该第一分类特征和该第三分类特征进行融合,得到融合后的分类特征;
[0324]
对该第一分类特征、该第三分类特征和该融合后的分类特征进行拼接,得到该候选答案信息的第四分类特征;
[0325]
基于该第二分类特征和该第四分类特征进行分类,得到该分类结果。
[0326]
可选地,该第二特征调整模块,包括:
[0327]
归一化单元,用于对该多个答案相似度进行归一化,得到归一化后的多个答案相似度;
[0328]
调整单元,用于基于该归一化后的多个答案相似度,对该多个候选答案信息中除该候选答案信息之外的其他候选答案信息对应的第一分类特征进行加权处理,得到该第三分类特征。
[0329]
可选地,该分类模块1604,用于:
[0330]
根据该证据信息对应的第一置信度,对该第二分类特征进行加权处理,得到加权
后的第二分类特征,该第一置信度是指该证据信息的可信程度;
[0331]
基于该第一分类特征和该加权后的第二分类特征进行分类,得到该分类结果。
[0332]
可选地,该证据信息包括多个证据片段,该装置还包括:置信度获取模块,用于:
[0333]
获取该多个证据片段中每两个证据片段之间的片段相似度;
[0334]
对于每个证据片段,基于该证据片段对应的多个片段相似度,确定该证据片段对应的片段置信度;
[0335]
对该多个证据片段对应的片段置信度进行拼接,得到该第一置信度。
[0336]
可选地,该证据信息包括多个证据片段,该第二特征获取模块1602,用于:
[0337]
分别获取该多个证据片段对应的证据片段特征;
[0338]
基于该多个证据片段对应的证据权重,分别调整多个证据片段特征,该证据权重指示该证据片段的重要程度;
[0339]
对调整后的多个证据片段特征进行拼接,得到该证据特征。
[0340]
可选地,该第二特征获取模块1602,用于:
[0341]
获取该问题信息的问题特征;
[0342]
对该问题特征和该证据特征进行匹配,得到该证据信息对应的第二置信度,该第二置信度表示该证据信息作为该问题信息的证据的可信程度;
[0343]
基于该第二置信度,调整该证据特征。
[0344]
可选地,该分类模块1604,用于:
[0345]
对该第一分类特征和该第二分类特征进行融合,得到融合后的分类特征;
[0346]
对该第一分类特征、该第二分类特征和该融合后的分类特征进行拼接,得到该候选答案信息的第五分类特征;
[0347]
基于该第五分类特征进行分类,得到该分类结果。
[0348]
可选地,该第一特征获取模块1602,用于:
[0349]
对该问题信息和该候选答案信息进行组合,得到组合信息;
[0350]
对该组合信息进行特征提取,得到该第一分类特征。
[0351]
可选地,该装置还包括:答案获取模块,用于:
[0352]
基于该问题信息和与该问题信息含义相同的其他问题信息进行搜索;
[0353]
从搜索得到的信息中抽取该候选答案信息。
[0354]
可选地,信息处理模型包括第一处理子模型、第二处理子模型和分类子模型,
[0355]
该第一处理子模型,用于基于该问题信息和该候选答案信息获取该第一分类特征;
[0356]
该第二处理子模型,用于获取该问题信息对应的证据信息的证据特征;
[0357]
该第二处理子模型,还用于基于该第一分类特征与该证据特征之间的关联度,调整该证据特征,得到该候选答案信息的该第二分类特征;
[0358]
该分类子模型,用于基于该第一分类特征和该第二分类特征进行分类,得到该候选答案信息对应的分类结果。
[0359]
可选地,该第一处理子模型中的第一注意力网络,用于获取多个该候选答案信息中每两个该候选答案信息之间的答案相似度;
[0360]
该第一注意力网络,还用于对于每个候选答案信息,基于该候选答案信息对应的
多个答案相似度和该多个候选答案信息中除该候选答案信息之外的其他候选答案信息对应的第一分类特征,获取第三分类特征;
[0361]
该分类子模型,还用于对于每个候选答案信息,基于该候选答案信息对应的该第一分类特征、该第二分类特征和该第三分类特征进行分类,得到该分类结果。
[0362]
可选地,该分类子模型中的融合网络,用于根据该证据信息对应的第一置信度,对该第二分类特征进行加权处理,得到加权后的第二分类特征,该第一置信度是指该证据信息的可信程度;
[0363]
该分类子模型中的分类网络,用于基于该第一分类特征和该加权后的第二分类特征进行分类,得到该分类结果。
[0364]
可选地,该证据信息包括多个证据片段,该第二处理子模型中的自注意力网络,用于:
[0365]
获取该多个证据片段中每两个证据片段之间的片段相似度;
[0366]
对于每个证据片段,基于该证据片段对应的多个片段相似度,确定该证据片段对应的片段置信度;
[0367]
对该多个证据片段对应的片段置信度进行拼接,得到该第一置信度。
[0368]
可选地,该第一处理子模型中的第一提取网络,用于基于该问题信息和该候选答案信息获取该第一分类特征;
[0369]
该第二处理子模型中的第二提取网络,用于获取该问题信息对应的证据信息的证据特征;
[0370]
该第二处理子模型中的第二注意力网络,用于基于该第一分类特征与该证据特征之间的关联度,调整该证据特征,得到该候选答案信息的该第二分类特征。
[0371]
可选地,该证据信息包括多个证据片段,
[0372]
该第二提取网络中的特征提取层,用于分别获取该多个证据片段对应的证据片段特征;
[0373]
该第二提取网络中的注意力层,用于基于该多个证据片段对应的证据权重,分别调整多个证据片段特征,该证据权重指示该证据片段的重要程度;
[0374]
该注意力层,还用于对调整后的多个证据片段特征进行拼接,得到该证据特征。
[0375]
可选地,该第二处理子模型中的第二提取网络,还用于获取该问题信息的问题特征;
[0376]
该第二处理子模型中的第三注意力网络,用于对该问题特征和该证据特征进行匹配,得到该证据信息对应的第二置信度,该第二置信度表示该证据信息作为该问题信息的证据的可信程度;
[0377]
该第三注意力网络,还用于基于该第二置信度,调整该证据特征。
[0378]
可选地,该信息处理模型的训练过程包括:
[0379]
获取样本问题信息、样本候选答案信息、样本证据信息和该样本候选答案信息对应的样本分类结果;
[0380]
调用该信息处理模型,对该样本问题信息、该样本候选答案信息和该样本证据信息进行处理,得到该样本候选答案信息对应的预测分类结果;
[0381]
基于该样本分类结果和该预测分类结果,训练该信息处理模型。
[0382]
上述所有可选技术方案,可以采用任意结合形成本技术的可选实施例,在此不再一一赘述。
[0383]
需要说明的是:上述实施例提供的信息处理装置在处理信息时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将计算机设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的信息处理装置与信息处理方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
[0384]
本技术实施例还提供了一种计算机设备,该计算机设备包括处理器和存储器,存储器中存储有至少一条计算机程序,该至少一条计算机程序由处理器加载并执行,以实现上述实施例的信息处理方法所执行的操作。
[0385]
可选地,该计算机设备提供为终端。图17是本技术实施例提供的一种终端1700的结构示意图。终端1700包括有:处理器1701和存储器1702。
[0386]
处理器1701可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器1701可以采用dsp(digital signal processing,数字信号处理)、fpga(field-programmable gate array,现场可编程门阵列)、pla(programmable logic array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器1701也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称cpu(central processing unit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器1701可以集成有gpu(graphics processing unit,图像处理器),gpu用于负责显示屏所需要显示的内容的渲染和绘制。在一些实施例中,处理器1701还可以包括ai(artificial intelligence,人工智能)处理器,该ai处理器用于处理有关机器学习的计算操作。
[0387]
存储器1702可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器1702还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器1702中的非暂态的计算机可读存储介质用于存储至少一条计算机程序,该至少一条计算机程序用于被处理器1701所执行以实现本技术中方法实施例提供的信息处理方法。
[0388]
在一些实施例中,终端1700还可选包括有:外围设备接口1703和至少一个外围设备。处理器1701、存储器1702和外围设备接口1703之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口1703相连。具体地,外围设备包括:射频电路1704、显示屏1705、摄像头组件1706、音频电路1707、定位组件1708和电源1709中的至少一种。
[0389]
外围设备接口1703可被用于将i/o(input/output,输入/输出)相关的至少一个外围设备连接到处理器1701和存储器1702。在一些实施例中,处理器1701、存储器1702和外围设备接口1703被集成在同一芯片或电路板上;在一些其他实施例中,处理器1701、存储器1702和外围设备接口1703中的任意一个或两个可以在单独的芯片或电路板上实现,本实施例对此不加以限定。
[0390]
射频电路1704用于接收和发射rf(radio frequency,射频)信号,也称电磁信号。射频电路1704通过电磁信号与通信网络以及其他通信设备进行通信。射频电路1704将电信
号转换为电磁信号进行发送,或者,将接收到的电磁信号转换为电信号。可选地,射频电路1704包括:天线系统、rf收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路1704可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于:万维网、城域网、内联网、各代移动通信网络(2g、3g、4g及5g)、无线局域网和/或wifi(wireless fidelity,无线保真)网络。在一些实施例中,射频电路1704还可以包括nfc(near field communication,近距离无线通信)有关的电路,本技术对此不加以限定。
[0391]
显示屏1705用于显示ui(user interface,用户界面)。该ui可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏1705是触摸显示屏时,显示屏1705还具有采集在显示屏1705的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器1701进行处理。此时,显示屏1705还可以用于提供虚拟按钮和/或虚拟键盘,也称软按钮和/或软键盘。在一些实施例中,显示屏1705可以为一个,设置在终端1700的前面板;在另一些实施例中,显示屏1705可以为至少两个,分别设置在终端1700的不同表面或呈折叠设计;在另一些实施例中,显示屏1705可以是柔性显示屏,设置在终端1700的弯曲表面上或折叠面上。甚至,显示屏1705还可以设置成非矩形的不规则图形,也即异形屏。显示屏1705可以采用lcd(liquid crystal display,液晶显示屏)、oled(organic light-emitting diode,有机发光二极管)等材质制备。
[0392]
摄像头组件1706用于采集图像或视频。可选地,摄像头组件1706包括前置摄像头和后置摄像头。前置摄像头设置在终端的前面板,后置摄像头设置在终端的背面。在一些实施例中,后置摄像头为至少两个,分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种,以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及vr(virtual reality,虚拟现实)拍摄功能或者其它融合拍摄功能。在一些实施例中,摄像头组件1706还可以包括闪光灯。闪光灯可以是单色温闪光灯,也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合,可以用于不同色温下的光线补偿。
[0393]
音频电路1707可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波,并将声波转换为电信号输入至处理器1701进行处理,或者输入至射频电路1704以实现语音通信。出于立体声采集或降噪的目的,麦克风可以为多个,分别设置在终端1700的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器1701或射频电路1704的电信号转换为声波。扬声器可以是传统的薄膜扬声器,也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时,不仅可以将电信号转换为人类可听见的声波,也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中,音频电路1707还可以包括耳机插孔。
[0394]
定位组件1708用于定位终端1700的当前地理位置,以实现导航或lbs(location based service,基于位置的服务)。定位组件1708可以是基于美国的gps(global positioning system,全球定位系统)、中国的北斗系统、俄罗斯的格雷纳斯定位系统或欧盟的伽利略定位系统的定位组件。
[0395]
电源1709用于为终端1700中的各个组件进行供电。电源1709可以是交流电、直流电、一次性电池或可充电电池。当电源1709包括可充电电池时,该可充电电池可以是有线充
电电池或无线充电电池。有线充电电池是通过有线线路充电的电池,无线充电电池是通过无线线圈充电的电池。该可充电电池还可以用于支持快充技术。
[0396]
本领域技术人员可以理解,图17中示出的结构并不构成对终端1700的限定,可以包括比图示更多或更少的组件,或者组合某些组件,或者采用不同的组件布置。
[0397]
可选地,该计算机设备提供为服务器。图18是本技术实施例提供的一种服务器的结构示意图,该服务器1800可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(central processing units,cpu)1801和一个或一个以上的存储器1802,其中,存储器1802中存储有至少一条计算机程序,该至少一条计算机程序由处理器1801加载并执行以实现上述各个方法实施例提供的方法。当然,该服务器还可以具有有线或无线网络接口、键盘以及输入输出接口等部件,以便进行输入输出,该服务器还可以包括其他用于实现设备功能的部件,在此不做赘述。
[0398]
本技术实施例还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有至少一条计算机程序,该至少一条计算机程序由处理器加载并执行,以实现上述实施例的信息处理方法所执行的操作。
[0399]
本技术实施例还提供了一种计算机程序产品,该计算机程序产品包括计算机程序,该计算机程序被处理器执行时实现上述实施例的信息处理方法所执行的操作。
[0400]
在一些实施例中,本技术实施例所涉及的计算机程序可被部署在一个计算机设备上执行,或者在位于一个地点的多个计算机设备上执行,又或者,在分布在多个地点且通过通信网络互连的多个计算机设备上执行,分布在多个地点且通过通信网络互连的多个计算机设备可以组成区块链系统。
[0401]
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,该程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
[0402]
以上仅为本技术实施例的可选实施例,并不用以限制本技术实施例,凡在本技术实施例的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本技术的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1