本文中所讨论的实施方式涉及存储介质、数据库构建方法和信息处理设备。
背景技术:
1、近年来,神经网络(nn)在诸如语法分析和图像识别的领域中被积极地使用。例如,使用深度学习(dl)显著地提高了语法分析和图像识别的准确度。
2、在许多类型的当前机器学习中,通过使用对应于任务的训练数据来执行训练。同时,当人执行语法分析或图像识别时,除了针对每个任务的训练之外,人还通过使用“常识”来做出确定。因此,使用常识在机器学习中也被认为是有用的。
3、作为相关技术中常识使用的基础技术,存在一种将nn和超维计算(hdc)结合的技术,hdc是一种专注于大脑中信息表示的非冯诺依曼计算技术。这使得能够从常识数据库(db)中获取和使用常识并且将知识表达为语法分析和图像识别中的超维向量(hv)。
4、图12是示出常识db的示例的图。常识db是图形格式的常识集合,并且被表示为分别具有三元组作为元素的集合。例如,常识db的格式是(“主语”,“谓语”,“宾语”)。“主语”表示要成为主语的事物,“宾语”表示要成为宾语的事物,以及“谓语”表示这些事物之间的关系。例如,图12的图形5包括三元组,例如(“人类”,“能够”,“绘制”)和(“绘制”,“与之相关”,“图片”)。要登记在常识db中的数据被手动地收集。
5、美国专利第10740398号和日本公开特许公报第2013-175097号被公开为相关技术。
技术实现思路
1、[技术问题]
2、然而,在上面描述的相关技术中,存在无法通过使用已经构建的常识db来构建新图形的问题。
3、由于在相关技术的常识db中手动地收集数据,因此存在在常识db中发生数据遗漏或丢失的情况。因此,优选的是,基于现有常识db和新获取知识来自动地获取新常识。
4、根据一个方面,本公开内容的目的是提供一种能够通过使用已经构建的常识db来构建新图形的数据库构建程序、数据库构建方法和信息处理设备。
5、[问题的解决方案]
6、根据实施方式的一方面,一种存储有数据库构建程序的非暂态计算机可读存储介质,该数据库构建程序使至少一个计算机执行处理,该处理包括:分析输入图像或文本以生成包括限定多个第一词类与多个第二词类之间的关系的多个子图形的语义表示;从存储在数据库中的多个子图形中提取与包括在语义表示的多个子图形中的第一词类有关系的第三词类;生成包括多个子图形的第一知识,在多个子图形中用第三词类替换了语义表示的多个子图形中的第一词类;以及将基于语义表示和数据库通过从包括在第一知识中的多个子图形中去除矛盾子图形而获得的剩余子图形登记在数据库中。
7、[发明的有益效果]
8、可以通过使用已经构建的常识db来构建新图形。
1.一种存储有数据库构建程序的非暂态计算机可读存储介质,所述数据库构建程序使至少一个计算机执行处理,所述处理包括:
2.根据权利要求1所述的非暂态计算机可读存储介质,其中,
3.根据权利要求2所述的非暂态计算机可读存储介质,其中,
4.根据权利要求3所述的非暂态计算机可读存储介质,其中,所述指定包括:
5.一种用于计算机执行处理的数据库构建方法,所述处理包括:
6.一种信息处理设备,包括: