信息处理装置、信息处理方法、信息处理装置用程序和记录介质的制作方法

文档序号:6532440阅读:95来源:国知局
信息处理装置、信息处理方法、信息处理装置用程序和记录介质的制作方法
【专利摘要】取得作为基础的基本词、将该基本词作为被修饰语的复合词、用于对该复合词进行分类的分类项目、与作为用于对该复合词进行分类的线索的特征有关的特征信息(S10、S11、S12、S13),使用预先生成的分类模型和所取得的特征信息,将包含基本词的复合词分配给所取得的分类项目(S14、S15),根据基本词取得包含与基本词相关联的多个要素的基本词关联信息(S16),根据该分类结果,将所取得的基本词关联信息中包含的要素中的至少一部分分别分类到分类项目中的任意一方(S17),输出该分类后的基本词关联信息(网页40、50、51)(S18)。
【专利说明】信息处理装置、信息处理方法、信息处理装置用程序和记录介质
【技术领域】
[0001]本发明涉及生成网页的信息处理装置、信息处理方法、信息处理装置用程序和记录介质的【技术领域】。
【背景技术】
[0002]以往,公知有一览显不基于检索关键字的检索结果并显不在网页等中的检索系统。例如,在专利文献I中公开了如下的商品检索方法:以一览显示的方式观看通过关键字检索而检索到的商品的图像,容易对商品彼此进行比较。
[0003]现有技术文献
[0004]专利文献
[0005]专利文献1:日本特开2002-318814号公报
【发明内容】

[0006]发明要解决的课题
[0007]但是,在专利文献I这样的现有技术中,在通过某个检索关键字(例如“自行车”)检索商品等的情况下,不仅是作为主体的商品,还混合存在有其附属品(例如“自行车用头盔、自行车用灯”)等,有时得到用户很难观看的检索结果。进而,在希望根据规定主题自动生成专属网页的情况下,也可能导致作为主体的商品和附属品等混合存在而成为用户很难观看的网页。
[0008]本发明是鉴于这种问题而完成的,其课题的一例的目的在于,提供能够进行用户易于观看的显示的信息处理装置等。
[0009]用于解决课题的手段
[0010]为了解决上述课题,第I方面的发明是一种信息处理装置,其特征在于,具有:基本词取得单元,其取得作为基础的基本词;复合词取得单元,其从复合词存储单元取得将由所述基本词取得单元取得的基本词作为被修饰语的复合词;分类项目取得单元,其参照分类项目存储单元取得用于对由所述复合词取得单元取得的复合词进行分类的分类项目;特征信息取得单元,其参照特征信息存储单元取得特征信息,该特征信息与作为用于对由所述复合词取得单元取得的复合词进行分类的线索的特征有关;复合词分类单元,其使用预先生成的分类模型和针对由所述复合词取得单元取得的复合词而由所述特征信息取得单元取得的特征信息,将包含所述基本词的所述复合词分配给由所述分类项目取得单元取得的分类项目;基本词关联信息取得单元,其根据所述基本词取得包含与基本词相关联的多个要素的基本词关联信息;基本词关联信息分类单元,其根据所述复合词分类单元的分类结果,将由所述基本词关联信息取得单元取得的基本词关联信息中包含的要素中的至少一部分分别分类到所述分类项目中的任意一方;以及输出单元,其输出由所述基本词关联信息分类单元进行分类后的基本词关联信息。[0011 ] 因此,根据分类项目对基本词关联信息进行分类,所以,与分类项目一起整理基本词关联信息的混合存在,能够进行用户易于观看的显示。
[0012]第2方面的发明在第I方面的信息处理装置中,其特征在于还具有:特征矢量生成单元,其针对复合词,使用特征信息生成该复合词的特征矢量;学习用复合词取得单元,其取得学习用的复合词;学习用分类项目取得单元,其取得与由所述学习用复合词取得单元取得的学习用的复合词对应的学习用的分类项目;以及分类模型构建单元,其使用由所述特征矢量生成单元从由所述学习用复合词取得单元取得的学习用的复合词生成的该学习用的复合词的特征矢量和由所述学习用分类项目取得单元取得的学习用的分类项目进行机器学习,构建所述分类模型,所述特征矢量生成单元针对由所述复合词取得单元取得的复合词,使用所述特征信息生成该复合词的特征矢量,所述复合词分类单元使用由所述分类模型构建单元构建的分类模型和由所述复合词取得单元取得的复合词的特征矢量,将包含所述基本词的所述复合词分配给所述分类项目。
[0013]该情况下,能够通过机器学习而高精度地实现用于进行用户易于观看的显示的分类模型。具体而言,通过使用机器学习,与利用试探性学习的情况相比,能够考虑各种特征,所以,能够实现高精度,能够在分类中有效活用各种信息。
[0014]第3方面的发明在第I方面的信息处理装置中,其特征在于还具有修饰语部分取得单元,该修饰语部分取得单元取得所述复合词的针对所述基本词的修饰语部分,所述特征信息存储单元存储将各个所述分类项目和规定的词关联起来的分类辞典,所述特征信息取得单元参照所述特征信息存储单元取得将各个所述分类项目和规定的词关联起来的分类辞典,所述复合词分类单元使用利用所述特征信息存储单元中存储的分类辞典而预先生成的分类模型和针对由所述修饰语部分取得单元取得的修饰语部分的所述特征信息,将包含所述基本词的所述复合词分配给所述分类项目。
[0015]该情况下,根据分类项目对基本词关联信息进行了分类,所以,与分类项目一起整理基本词关联信息的混合存在,能够进行用户易于观看的显示。进而,能够通过分类辞典而高效地将复合词分配给分类项目。
[0016]第4方面的发明在第3方面的信息处理装置中,其特征在于还具有后缀取得单元,该后缀取得单元从由所述修饰语部分取得单元取得的修饰语部分取得后缀,所述复合词分类单元使用利用所述特征信息存储单元中存储的分类辞典而预先生成的分类模型和针对除了由所述后缀取得单元取得的后缀以外的所述修饰语部分的所述特征信息,将包含所述基本词的所述复合词分配给所述分类项目。
[0017]该情况下,能够通过规定规则而高效地将复合词分配给分类项目。
[0018]第5方面的发明在第3方面或第4发明的信息处理装置中,其特征在于还具有分类辞典生成单元,该分类辞典生成单元根据规定的词在规定的存储单元中出现的出现数来决定各个所述分类项目与该规定的词之间的关联,或者,通过从规定的存储单元中提取适合于与各个所述分类项目对应的提取模式的该规定的词来决定各个所述分类项目与该规定的词之间的关联,生成所述分类辞典。
[0019]该情况下,能够构建适合于规定数据库等规定存储单元的分类辞典。
[0020]第6方面的发明在第I方面?第5方面中的任意一个方面的信息处理装置中,其特征在于还具有:分类项目输出单元,其为了使用户从通过所述复合词分类单元分配了所述复合词的分类项目中选择特定的分类项目,将分配了所述复合词的分类项目输出到用户终端装置;以及用户选择结果取得单元,其从所述用户终端装置取得所述分类项目的选择结果,所述基本词关联信息分类单元根据所述复合词分类单元的分类结果,将通过由所述用户选择结果取得单元取得的所述分类项目的选择结果和所述基本词而取得的基本词关联信息中包含的要素中的至少一部分分别分类到所述分类项目中的任意一方。
[0021]该情况下,能够进行用户易于观看与用户选择对应的用户期望的信息的显示。
[0022]第7方面的发明在第I方面?第6方面中的任意一个方面的信息处理装置中,其特征在于,所述基本词取得单元从用户终端装置取得检索关键字作为所述基本词,所述基本词关联信息取得单元取得根据所述检索关键字进行检索的检索结果,所述基本词关联信息分类单元根据所述复合词分类单元的分类结果,将由所述基本词关联信息取得单元检索到的检索结果中包含的要素中的至少一部分分别分类到所述分类项目中的任意一方。
[0023]该情况下,根据用户输入的检索关键字,能够进行用户易于观看用户探寻的信息的显示。
[0024]第8方面的发明在第I方面?第7方面中的任意一个方面的信息处理装置中,其特征在于还具有:复合词候选生成单元,其从所述基本词生成所述复合词的候选;以及复合词决定单元,其从所述候选中决定所述复合词,所述复合词取得单元取得由所述复合词决定单元决定的复合词。
[0025]该情况下,能够根据所生成的候选生成更加适当的复合词。
[0026]第9方面的发明在第8方面的信息处理装置中,其特征在于,所述复合词决定单元求出将由所述复合词候选生成单元生成的复合词的候选包含在商品的说明书中经营该商品的经营店的数量,根据该经营店的数量决定所述复合词。
[0027]该情况下,能够生成在购物网站上和网络上通用使用的更加适当的复合词。
[0028]第10方面的发明在第8方面或第9发明的信息处理装置中,其特征在于,所述复合词决定单元根据所述基本词在规定的存储单元中出现的出现数,决定所述复合词。
[0029]该情况下,能够根据在购物网站上和网络上通用使用的基本词生成更加适当的复合词。
[0030]第11方面的发明在第8方面?第10方面中的任意一个方面的信息处理装置中,其特征在于,所述复合词决定单元根据将由所述复合词候选生成单元生成的复合词的候选作为检索关键字的检索的符合件数,决定所述复合词。
[0031]该情况下,能够决定在购物网站上和网络上通用使用的复合词,能够生成更加适当的复合词。
[0032]第12方面的发明在第8方面?第11方面中的任意一个方面的信息处理装置中,其特征在于,所述复合词候选生成单元组合所述基本词和与该基本词不同的词,生成所述候选。
[0033]该情况下,能够生成更加适当的复合词。并且,组合基本词和其他词而生成多个复合词的候选,能够根据该候选而缩小为更加适当的复合词。
[0034]第13方面的发明在第I方面?第12方面中的任意一个方面的信息处理装置中,其特征在于还具有:检索结果取得单元,其取得将所述基本词作为检索关键字的第I检索结果和将所述复合词作为检索关键字的第2检索结果;以及检索结果信息生成单元,其生成检索结果信息,使得在显示单元的画面上区别显示由所述检索结果取得单元取得的所述第I检索结果中的至少一部分和第2检索结果。
[0035]该情况下,能够减少通过检索关键字检索到的检索对象的混合存在并进行显示。
[0036]第14方面的发明在第13方面的信息处理装置中,其特征在于,所述检索结果信息生成单元生成检索结果信息,使得显示从所述第I检索结果中除去所述第2检索结果的部分后的检索结果,作为所述第I检索结果中的至少一部分。
[0037]该情况下,第I检索结果和第2检索结果不会混合存在,容易注意到第2检索结果的关联商品。并且,用户容易注意到基于复合词的检索结果。
[0038]第15方面的发明是一种信息处理装置的信息处理方法,该信息处理装置进行信息处理,该信息处理方法的特征在于包括:基本词取得步骤,取得作为基础的基本词;复合词取得步骤,从复合词存储单元取得将所述基本词取得步骤中取得的基本词作为被修饰语的复合词;分类项目取得步骤,参照分类项目存储单元取得用于对所述复合词取得步骤中取得的复合词进行分类的分类项目;特征信息取得步骤,参照特征信息存储单元取得与作为用于对所述复合词取得步骤中取得的复合词进行分类的线索的特征有关的特征信息;复合词分类步骤,使用预先生成的分类模型和针对所述复合词取得步骤中取得的复合词而在所述特征信息取得步骤中取得的特征信息,将包含所述基本词的所述复合词分配给所述分类项目取得步骤中取得的分类项目;基本词关联信息取得步骤,根据所述基本词取得包含与基本词相关联的多个要素的基本词关联信息;基本词关联信息分类步骤,根据所述复合词分类步骤的分类结果,将所述基本词关联信息取得步骤中取得的基本词关联信息中包含的要素中的至少一部分分别分类到所述分类项目中的任意一方;以及输出步骤,输出所述基本词关联信息分类步骤中进行分类后的基本词关联信息。
[0039]第16方面的发明是一种信息处理装置用程序,其特征在于,其使计算机作为以下单元进行工作:基本词取得单元,其取得作为基础的基本词;复合词取得单元,其从复合词存储单元取得将由所述基本词取得单元取得的基本词作为被修饰语的复合词;分类项目取得单元,其参照分类项目存储单元取得用于对由所述复合词取得单元取得的复合词进行分类的分类项目;特征信息取得单元,其参照特征信息存储单元取得与作为用于对由所述复合词取得单元取得的复合词进行分类的线索的特征有关的特征信息;复合词分类单元,其使用预先生成的分类模型和针对由所述复合词取得单元取得的复合词而由所述特征信息取得单元取得的特征信息,将包含所述基本词的所述复合词分配给由所述分类项目取得单元取得的分类项目;基本词关联信息取得单元,其根据所述基本词取得包含与基本词相关联的多个要素的基本词关联信息;基本词关联信息分类单元,其根据所述复合词分类单元的分类结果,将由所述基本词关联信息取得单元取得的基本词关联信息中包含的要素中的至少一部分分别分类到所述分类项目中的任意一方;以及输出单元,其输出由所述基本词关联信息分类单元进行分类后的基本词关联信息。
[0040]第17方面的发明是一种以计算机可读取的方式记录了信息处理装置用程序的记录介质,其特征在于,该信息处理装置用程序使计算机作为以下单元进行工作:基本词取得单元,其取得作为基础的基本词;复合词取得单元,其从复合词存储单元取得将由所述基本词取得单元取得的基本词作为被修饰语的复合词;分类项目取得单元,其参照分类项目存储单元取得用于对由所述复合词取得单元取得的复合词进行分类的分类项目;特征信息取得单元,其参照特征信息存储单元取得与作为用于对由所述复合词取得单元取得的复合词进行分类的线索的特征有关的特征信息;复合词分类单元,其使用预先生成的分类模型和针对由所述复合词取得单元取得的复合词而由所述特征信息取得单元取得的特征信息,将包含所述基本词的所述复合词分配给由所述分类项目取得单元取得的分类项目;基本词关联信息取得单元,其根据所述基本词取得包含与基本词相关联的多个要素的基本词关联信息;基本词关联信息分类单元,其根据所述复合词分类单元的分类结果,将由所述基本词关联信息取得单元取得的基本词关联信息中包含的要素中的至少一部分分别分类到所述分类项目中的任意一方;以及输出单元,其输出由所述基本词关联信息分类单元进行分类后的基本词关联信息。
[0041]发明效果
[0042]根据本发明,根据分类项目对基本词关联信息进行分类,所以,与分类项目一起整理基本词关联信息的混合存在,能够进行用户易于观看的显示。
【专利附图】

【附图说明】
[0043]图1是示出本发明的实施方式的信息处理系统的概要结构例的示意图。
[0044]图2是示出图1的信息处理服务器的概要结构的一例的框图。
[0045]图3是示出图2的学习用数据库中存储的数据的一例的示意图。
[0046]图4是示出图2的查询记录数据库中存储的查询记录的一例的示意图。
[0047]图5是示出图1的店铺终端装置的概要结构的一例的框图。
[0048]图6是示出图1的用户终端装置的概要结构的一例的框图。
[0049]图7是示出图1的信息处理服务器中的模型构建的动作例的流程图。
[0050]图8是示出图1的信息处理服务器的第I实施方式的动作例的流程图。
[0051]图9是示出基于图1的信息处理服务器的检索结果的一例的示意图。
[0052]图10是示出图1的信息处理服务器中的分类辞典的构建的动作例的流程图。
[0053]图11是示出图1的信息处理服务器中的分类辞典的构建的动作例的流程图。
[0054]图12是示出图1的信息处理服务器中的分类辞典的构建的动作例的流程图。
[0055]图13是示出图1的信息处理服务器中的分类辞典的构建的动作例的流程图。
[0056]图14是示出图1的信息处理服务器中的分类辞典的构建的动作例的流程图。
[0057]图15是示出图1的信息处理服务器的第2实施方式的动作例的流程图。
[0058]图16是示出图15的复合词的取得的子进程的流程图。
[0059]图17是示出图16的复合词的候选生成的子进程的流程图。
[0060]图18是示出图16的复合词的决定的子进程的流程图。
[0061]图19是示出图15的复合词的分配的子进程的流程图。
[0062]图20是示出基于图1的信息处理服务器的显示的变形例的示意图。
[0063]图21是示出基于图1的信息处理服务器的显示的变形例的示意图。
【具体实施方式】
[0064]下面,参照附图对本发明的实施方式进行说明。另外,以下说明的实施方式是针对信息处理系统应用本发明的情况下的实施方式。[0065][1.信息处理系统的结构和功能概要]
[0066]首先,使用图1对本发明的一个实施方式的信息处理系统的结构和概要功能进行说明。
[0067]图1是示出本实施方式的信息处理系统I的概要结构例的示意图。
[0068]如图1所示,信息处理系统I具有为了运营购物网站而设置的信息处理服务器10(信息处理装置的一例)、对购物网站提供商品的店的店铺终端装置20、以及在购物网站上购物的用户的用户终端装置30。
[0069]信息处理服务器10、店铺终端装置20和用户终端装置30能够经由网络3,例如在通信协议中使用TCP/IP等而相互收发数据。另外,网络3例如由因特网、专用通信线路(例如CATV (Community Antenna Television)线路)、移动通信网(包含基站等)和网关等构建。信息处理服务器10还经由网络3而与外部的检索服务器5连接。检索服务器5提供检索的网页 API (Application Programing Interface)等。
[0070]店铺终端装置20是对购物网站提供商品的出店方的计算机。出店方在店铺终端装置20中登记要经营的商品。店铺终端装置20具有网页浏览器功能,显示要经营的商品
坐寸ο
[0071]用户终端装置30是在购物网站上购入商品的用户的计算机。用户终端装置30具有网页浏览器功能,在用户检索商品时,将检索查询发送到信息处理服务器10,或在网页浏览器的画面中显示检索结果和广告。
[0072][2.信息处理服务器和各终端装置的结构和功能]
[0073](2.1信息处理服务器10的结构和功能)
[0074]接着,使用图2?图4对信息处理服务器10的结构和功能进行说明。
[0075]图2是示出信息处理服务器10的概要结构的一例的框图。图3是示出学习用数据库中存储的数据的一例的示意图。图4是示出查询记录数据库中存储的查询记录的一例的示意图。
[0076]如图2所示,信息处理服务器10具有通信部11、存储部12、输入输出接口部13、系统控制部14。而且,系统控制部14和输入输出接口部13经由系统总线15连接。
[0077]通信部11与网络3连接,对与店铺终端装置20或用户终端装置30之间的通信状态进行控制。
[0078]存储部12 (存储单元的一例)例如由硬盘驱动等构成,存储操作系统和服务器程序等各种程序、由HTML等置标语言等记述的网页的文件等。另外,各种程序例如可以从其他服务器装置等经由网络3取得,也可以记录在记录介质中经由驱动装置读入。
[0079]并且,在存储部12中构建有作为规定的存储单元的一例的商品数据库12a (以下设为“商品DB12a”。)、店铺数据库12b (以下设为“店铺DB12b”。)、会员数据库12c (以下设为“会员DB12c”。)、存储了复合词的复合词数据库12d (以下设为“复合词DB12d”。)、存储了用于对复合词进行分类的分类项目的分类项目数据库12e (以下设为“分类项目DB12e”。)、存储了用于获得存在特定意思关系的单词等的提取模式的字典式句法模式(LSP =Lexico-Syntactic Pattern)数据库 12f (以下设为“LSP/DB12f ”。)、存储了后缀的后缀数据库12g (以下设为“后缀DB12g”。)、用于将词分类到规定的分类项目的作为辞典的分类辞典数据库12h (以下设为“分类辞典DB12h”。)、存储了用于进行机器学习的数据的学习用数据库12i (以下设为“学习用DB12i”。)、存储了检索中使用的检索关键字等的查询记录数据库12j (以下设为“查询记录DB12j”。)等。这里,字典式句法模式(LSP)是用于获得存在特定意思关系的词的提取1?式。
[0080]在商品DB12a中,与用于识别商品的识别符即商品ID相关联地存储有商品名、种类、商品的图像、说明书和商品介绍的摘要等商品信息、广告信息等。并且,在商品DB12a中,还与商品ID相关联地存储有经营商品的经营店的店铺ID。进而,在商品DB12a中存储有由HTML、XML等置标语言等记述的商品网页的文件等。并且,在商品DB12a中构建有检索用的数据库,以使得能够通过检索关键字来检索商品。
[0081]在店铺DB12b中登记有经营店的店铺ID、名称、住址、电话号码、经营店经营的商品的商品信息等的店铺信息。能够根据店铺ID而按照每个出店方来判别这种店铺信息。经营店经营的商品的商品ID和店铺ID相关联地存储在店铺DB12b中。
[0082]在会员DB12c中登记有登记为会员 的用户(购物网站的利用者)的用户ID、名称、住址、电话号码、邮件地址、职业、兴趣、购买历史、用户关心的主题和风格等的用户信息。并且,在会员DB12c中登记有用户从用户终端装置30登录购物网站时所需要的用户ID、登录ID和密码。这里,登录ID和密码是登录处理(用户的认证处理)中使用的登录信息。
[0083]在复合词DB12d (复合词存储单元的一例)中存储有由作为基础的基本词(主辞(head))和修饰语(modifier)构成的复合词。基本词是“自行车” “头盔” “包” “衣柜” “围裙”这样的表示具体事物的名词(以下为具体名词)。当参照下述所示的实施例叙述更具体的例子时,在假设了商品检索的情况下,基本词是检索关键字,在假设了后述商品专集页的生成的情况下,基本词是表示“自行车” “床”等希望组成专集的商品的单词。另一方面,修饰语是“儿童” “小孩用” “搪瓷制” “日本制” “带灯” “连衣裙型” “防水”等容易修饰具体名词的词。根据修饰语对这种由修饰语和基本词构成的复合词进行分类。在本实施例的情况下,复合词被捕捉为复合名词,所以,具体而言,是如“电动自行车”这样与“名词+具体名词”的模式一致的复合名词(compound noun)、如“儿童用自行车”这样与“名词+后缀+具体名词”的模式一致的复合名词。在“名词+具体名词”的模式的情况下,“名词”成为修饰语,基本词的“具体名词”成为被修饰语(modifiee)(具体而言,在“电动自行车”的情况下,作为名词的“电动”为修饰语,作为具体名词的“自行车”为基本词),在“名词+后缀+具体名词”的模式的情况下,“名词+后缀”成为修饰语,基本词的“具体名词”成为被修饰语(具体而言,在“儿童用自行车”的情况下,作为名词的“儿童”和作为后缀的“用”为修饰语,作为具体名词的“自行车”为基本词)。即,在上述中,提出了将“自行车”视为基本词的情况下的例子。并且,在复合词DB12d中相关联地存储有基本词和复合词。
[0084]另外,可以使用上述模式,针对商品DB12a的商品名、商品说明书等商品信息生成复合词。在取出名词时,可以使用词素解析器,进行将词类(part-of-speech)为未知词和记号-字母的词素作为名词、将词类为名词-后缀、名词-数字的词素视为名词的处理。进而,为了去除作为噪声的词,可以缩小为规定数以上的用作检索关键字的复合词。
[0085]并且,可以根据基本词、其他词和后缀,按照“基本词+其他词”、“其他词+基本词”、“基本词+后缀+其他词”和“其他词+后缀+基本词”的模式生成复合词。
[0086]在分类项目DB12e (分类项目存储单元的一例)中存储有用于对复合词进行分类的分类项目。例如,作为分类项目,举出表示商品等将什么样的用户作为对象的“用户”(User)、表示将什么作为利用对象的“对象”(Target)、表示商品等的使用目的等的“目的”(Purpose)、表示商品等的功能的“功能”(Function)、表示是附属品的“附属品”(Accessory)、表示商品等的形状的“形状(形)”(Figure)、表示商品等的产地的“场所”(Location)、表示商品等的销售方等的“公司名”(Company)、表示商品的原材料的“原材料”(Material)、表示商品等的设计的“设计”(Design)等。进而,作为分类项目,举出“尺寸”、“环境”、“加工”、“使用方法”、“规格”、“性质”、“状态”等。对各分类项目附加分类项目ID,各分类项目被存储在分类项目DB12e中。另外,分类项目表示复合词中的基本词(主辞)与修饰语之间成立的意思的关系(semantic relation)。
[0087]在LSP/DB12f (特征信息存储单元的一例)中存储有字典式句法模式,该字典式句法模式存储了用于获得存在与各分类项目对应的意思的关系的单词对的提取模式。作为字典式句法模式的一例,在将H作为基本词、将M作为修饰语的情况下,举出“M用H”、“带M的H”、“M型H”、“M制H”、“M产H”、“M柄H”等。进而,作为字典式句法模式的一例,举出“M的 H” (H of M)、“M 中的 H” (H in M)、“M 用的 H” (H for the purpose of M)、“带有 M 的Η”、“M制的H”、“带M的H”、“Μ原材料的H”、“掺有M的H”、“用M制造的H,,、“M尺寸的H”、“例如 M 等的 H” (“H such as M”)、“H 是 M 的一部分” (“H is a part of M”)等。另外,作为意思的关系,“H such as Μ”是上位下位关系(hyponymy relations)的一例,“H is apart of M”是部分全体关系的一例。
[0088]进而,作为字典式句法模式的一例,关于词X,举出“X先生”(Mr.X)、“X用”、“面向X”、“对X”、“X型”、“带X功能”、“X这样的形式”、“X等的形式”、“X产”、“X公司”、“X制”、“品牌x”、“生产商x”、“x这样的原材料”等。
[0089]并且,也可以按照不同关系对字典式句法模式进行分类。例如,字典式句法模式“X用”、“面向X”和“对X”被分类到用户关系,字典式句法模式“带X功能”被分类到功能关系,字典式句法模式“X型”、“X这样的形式”和“X等的形式”被分类到形状关系,字典式句法模式“X产”被分类到地名关系,字典式句法模式“X公司”、“X制”、“品牌的X”和“生产商的X”被分类到公司名关系、字典式句法模式“X这样的原材料”被分类到原材料关系。
[0090]在后缀DB12g (特征信息存储单元的一例)中,作为后缀(suffix)的文字,存储有“用” “带” “制” “产” “型” “盘” “版” “柄” “色”等。例如,后缀的文字如“自行车用头盔”那样用于生成复合词。另外,在英语的情况下,除了 “helmet for bicycle”中的“for”以夕卜,还举出“with” “in” “for the purpose of” “made in” “made of” “produced in”等,作为与上述后缀相当的表现。
[0091]另外,后缀(suffix)是位于基本词与其他词之间的中间字符串的一例,是位于复合词的针对基本词的修饰语部分的接尾部分的词。例如,在基本词H和其他词X的情况下,举出复合词“X用H”、“带X的H,,、“X制H”等中的修饰语部分“X用”、“带X,,、“X制”的后缀部分“用”、“带”、“制”作为后缀的文字。并且,在英语的情况下,举出复合词“H for X”、“H with X”、“H in X”、“H for the purpose of X”、“H made in X”、“H made of X”、“Hproduced in X”等中的修饰语部分“with X,,、“in X,,、“for the purpose of X,,、“made inX,,、“made of X,,、“produced in X” 的 “with,,、“in,,、“for the purpose of,,、“made in,,、“made of'“produced in”等,作为与上述后缀相当的表现。
[0092]在分类辞典DB12h (特征信息存储单元的一例)中记录有与用户有关的词的用户词辞典、与对象物有关的词的物品词辞典、与功能有关的词的功能词辞典、与形状有关的词的形状词辞典、与产地和地名等有关的词的场所词辞典、与公司名或品牌名等有关的词的公司名词辞典、与原材料有关的词的原材料词辞典等辞典。
[0093]在用户词辞典中存储有“长辈”、“少年”、“婴儿”、“用户”、“男性”这样的表示人的
词。在求解“用户”的分类项目时使用用户词辞典。
[0094]在物品词辞典中存储有“美白美容液”、“头饰”、“色纸”这样的表示物品的词。在求解“对象”的分类项目、“附属品”的分类项目、“形状”的分类项目时使用物品词辞典。
[0095]在功能词辞典中存储有“除臭”、“耐震”、“尺寸调整”、“保持”这样的表示功能的词。在求解“功能”的分类项目时使用功能词辞典。
[0096]在形状词辞典中存储有“月牙”、“椭圆”这样的表示形状的词。在求解“形状”的分类项目时使用形状词辞典。
[0097]在场所词辞典中存储有“东京”、“广岛”、“意大利”、“罗马”这样的表示地名的词。在求解“场所”的分类项目时使用场所词辞典。
[0098]在公司名词辞典中存储有表示公司名、品牌名的词。在求解“公司名”的分类项目时使用公司名词辞典。
[0099]在原材料词辞典中存储有“革”、“橡胶”、“玻璃”、“纸”这样的表示原材料的词。在求解“原材料”的分类项目时使用原材料词辞典。
[0100]并且,如日语词素解析系统那样,分类辞典DB12h还具有进行各语言中的词的分类的词素解析系统的辞典。分类辞典DB12h还具有集中了表示人的表现的辞典,以判定词是否表示人。进而,分类辞典DB12h还具有与各语言的从属有关的数据库,在该数据库中存在有单词或词组的出现频度等的数据。
[0101]接着,如图3所示,在学习用DB12i (分类项目存储单元的一例)中相关联地存储有分类项目、与分类项目对应的字典式句法模式、学习用的复合词。在学习用DB12i中,在各学习用的复合词中存储有与作为主辞的基本词(图中下线部)和修饰语部分有关的信息。
[0102]在查询记录DB12j中,在商品DB12a中存储有用户在检索中使用的检索关键字。如图4所示,在查询记录DB12j中,与在检索中使用的检索关键字一起,还对所使用的件数进行计数并存储。进而,如图4所示,在检索中使用的检索关键字为“头盔自行车”的情况下,将“头盔”作为基本词,将“自行车”作为其他词,通过这些基本词和其他词的组合,将检索关键字存储在查询记录DB12j中。另外,在检索中使用的检索关键字为“头盔”的情况下,仅存储基本词。并且,在检索中使用的检索关键字为“自行车头盔”的情况下,也可以将“头盔”作为基本词,将“自行车”作为其他词,整理并存储在查询记录DB12 j中。
[0103]LSP/DB12f、后缀DB12g、分类辞典DB12h形成存储有与作为用于对复合词进行分类的线索的特征有关的特征信息的特征信息数据库(以下设为“特征信息DB102”。)(特征信息存储单元的一例)。在特征信息DB102中,作为构建分类模型所需要的特征信息,还存储有修饰语的字符串、词类、意思等级名。
[0104]特征是用于将复合词分类到分类项目中的任意一方的线索,是表示复合词的特征的要素。作为与特征有关的特征信息的一例,举出适合的字典式句法模式、登记有修饰语部分的分类词辞典、修饰语部分的字符串、修饰语部分的词类、修饰语部分末尾的后缀、修饰语部分所属的意思等级等。根据这些特征信息,能够对复合词赋予特征。另外,在取得意思等级时,利用分类词汇表等的现有的词典的信息。
[0105]在特征信息DB102中存储有特征矢量的原型。特征矢量是将复合词的特征量作为值的多维的矢量(特征量矢量)。特征矢量例如通过由特征矢量的字典式句法模式部、特征矢量的修饰部、特征矢量的词类部、特征矢量的后缀部、特征矢量的意思等级部构成的特征矢量的原型构成。
[0106]特征矢量的字典式句法模式部对应于各字典式句法模式,例如占据规定的字典式句法模式数的维量。字典式句法模式部的各维的部分对应于各个字典式句法模式。
[0107]特征矢量的修饰部对应于修饰语的各字符串,例如占据修饰语的字符串的规定种类数的维量。修饰部的各维部分对应于各个字符串。
[0108]特征矢量的词类部对应于修饰语的词类,例如占据修饰语的规定词类数的维量。词类部的各维的部分对应于各个词类。
[0109]特征矢量的后缀部对应于修饰语末尾的后缀,例如占据后缀的规定种类数的维量。另外,在没有后缀的情况下,假设为NULL。后缀部的各维的部分对应于各个后缀。
[0110]特征矢量的意思等级部对应于分类词汇表中的意思等级,例如占据意思等级的规定分类数的维量。意思等级部的各维的部分对应于各个意思等级。这里,分类词汇表是根据意思对词进行分类并整理的词典。分类词汇表存储在特征信息DB102中。
[0111]对特征矢量的原型应用复合词,求出特征矢量的成分的特征值即特征矢量的各部的特征值,由此,求出复合词的特征矢量。该特征矢量的原型也是特征信息的一例。
[0112]这里,针对复合词使用特征信息例如是指,为了引出表示复合词的特征的要素的信息,在复合词中使用特征信息。作为针对复合词使用特征信息的一例,举出针对复合词使用特征矢量并在特征矢量中展开而求出各成分的情况;针对复合词使用“用” “带”等的后缀并判定复合词中是否存在“用”等后缀的情况;针对复合词使用字典式句法模式并从复合词中提取匹配于字典式句法模式的规定的词或字符串、判定复合词是否匹配于字典式句法模式的情况;针对复合词使用分类辞典并判定复合词的规定部分的词或字符串是否存在于分类辞典中的情况等。
[0113]输入输出接口部13进行通信部11和存储部12与系统控制部14之间的接口处理。
[0114]系统控制部14 由 CPU (Central Processing Unit)14a、R0M (Read Only Memory)14b、RAM (Random Access Memory) 14c (存储单元的一例)等构成。而且,系统控制部14作为复合词分类单元等进行工作,通过由CPU14a读出R0M14b或存储部12中存储的各种程序并执行,将复合词分配给分类项目。
[0115](2.2店铺终端装置20的结构和功能)
[0116]接着,使用图5对店铺终端装置20的结构和功能进行说明。
[0117]图5是示出店铺终端装置20的概要结构的一例的框图。
[0118]如图5所示,作为计算机进行工作的店铺终端装置20例如是个人计算机、包含智能手机的便携型无线电话机、PDA等的便携终端,具有通信部21、存储部22、显示部23、操作部24、输入输出接口部25、系统控制部26。而且,系统控制部26和输入输出接口部25经由系统总线27连接。
[0119]通信部21通过网络3对与信息处理服务器10等的通信进行控制。另外,在店铺终端装置20是便携终端装置的情况下,为了与网络3的移动通信网连接,通信部21具有无线通信功能。
[0120]存储部22例如由硬盘驱动等构成,存储操作系统、网页浏览器的程序、网页浏览器用工具条的程序等。
[0121]显示部23 (显示单元的一例)例如由液晶显示元件或EL (Electro Luminescence)元件等构成。
[0122]操作部24例如由键盘和鼠标等构成。用户通过操作部24输入响应。另外,在显示部23是触摸面板这样的触摸开关方式的显示面板的情况下,操作部24取得用户接触或接近的显示部23的位置信息。
[0123]输入输出接口部25是通信部21和存储部22与系统控制部26之间的接口。
[0124]系统控制部26例如具有CPU26a、R0M26b、RAM26c。系统控制部26由CPU26a读出R0M26b、RAM26c、存储部22中存储的各种程序并执行。例如,系统控制部26执行网页浏览器的程序而作为网页浏览器进行工作。
[0125](2.3用户终端装置30的结构和功能)
[0126]接着,使用图6对用户终端装置30的结构和功能进行说明。
[0127]图6是示出用户终端装置30的概要结构的一例的框图。
[0128]如图6所示,作为计算机进行工作的用户终端装置30例如与店铺终端装置20同样,是个人计算机、包含智能手机的便携型无线电话机、PDA等的便携终端,具有通信部31、存储部32、显示部33 (显示单元的一例)、操作部34、输入输出接口部35、系统控制部36。而且,系统控制部36和输入输出接口部35经由系统总线37连接。另外,用户终端装置30的结构和功能与店铺终端装置20的结构和功能大致相同,所以省略详细说明。另外,在显示部33中,通过网页浏览器显示用于检索商品的网页和检索结果的网页。
[0129][3.信息处理系统的第I实施方式的动作]
[0130]接着,使用图7?图9对本发明的I实施方式的信息处理系统I的第I实施方式的动作进行说明。
[0131]图7是示出信息处理服务器10中的模型构建的动作例的流程图。图8是示出信息处理服务器10的第I实施方式的动作例的流程图。图9是示出信息处理服务器10的检索结果的一例的示意图。
[0132](3.1信息处理服务器中的分类模型构建的动作例)
[0133]首先,使用图7对分类模型构建的动作例进行说明。
[0134]如图7所示,信息处理服务器10取得学习用的复合词(步骤SI)。具体而言,信息处理服务器10的系统控制部14参照存储部12的学习用DB12i取得学习用的复合词。进而,系统控制部14从学习用DB12i取得学习用的复合词的基本词和修饰语部。例如,如图3所示,系统控制部14取得“马甲”作为复合词的基本词,取得“皮草”作为修饰语部。
[0135]这样,信息处理服务器10作为取得学习用的复合词的学习用复合词取得单元的一例进行工作。
[0136]接着,信息处理服务器10取得学习用的分类项目(步骤S2)。具体而言,信息处理服务器10的系统控制部14从存储部12的学习用DB12i取得学习用的分类项目。例如,如图3所示,系统控制部14取得复合词“皮草马甲”的分类项目“材料”。
[0137]这样,信息处理服务器10作为学习用分类项目取得单元的一例进行工作,其参照分类项目存储单元取得与由学习用复合词取得单元取得的学习用的复合词对应的学习用的分类项目。
[0138]接着,信息处理服务器10取得特征信息(步骤S3)。具体而言,信息处理服务器10的系统控制部14参照特征信息DB102取得特征矢量的原型。系统控制部14取得由上述特征矢量的字典式句法模式部、特征矢量的修饰部、特征矢量的词类部、特征矢量的后缀部、特征矢量的意思等级部构成的特征矢量的原型。
[0139]接着,信息处理服务器10针对复合词,使用特征信息计算特征矢量(步骤S4)。具体而言,信息处理服务器10的系统控制部14针对复合词,使用特征矢量的原型计算包含基本词的复合词的特征矢量的各成分,在特征矢量中展开复合词。
[0140]例如,在求解特征矢量的字典式句法模式部的成分的情况下,系统控制部14针对学习用的复合词的基本词(例如“马甲”)和修饰语部分(例如“皮草”)生成匹配了各成分的字典式句法模式的复合词(例如“皮草的马甲”、“皮草制马甲、…”)。另外,复合词如“竞走用短袜”那样成为修饰语部分“竞走用”,但是,将省略后缀“用”的“竞走”作为M,生成匹配了字典式句法模式的复合词。
[0141]作为字典式句法模式,如图3所示,使用与分类项目对应的全部字典式句法模式。另外,也可以不使用图 3所示的全部字典式句法模式,而限定为与学习用的复合词所属的各分类项目对应的字典式句法模式。而且,系统控制部14检索在规定数据库中是否存在规定数以上的所生成的各复合词,如果存在规定数以上,则设与该字典式句法模式对应的成分为“1”,如果不存在规定数以上,则设与该字典式句法模式对应的成分为“O”。另外,该规定数可以是将所生成的复合词作为检索关键字而使用检索服务器5的情况下的符合件数、商品DB 12a中的符合件数。
[0142]在求解特征矢量的修饰部的成分的情况下,系统控制部14将学习用的复合词的修饰语部分匹配于修饰语的各字符串,设匹配的部位的成分为“ 1”,设未匹配的部位的成分为 “O,,。
[0143]在求解特征矢量的词类部的成分的情况下,系统控制部14使用词素解析、与词类有关的数据库等判定学习用的复合词的修饰语部分的词类。系统控制部14设相应于该词类的部位的成分为“ I ”,设不相应于该词类的部位的成分为“O”。
[0144]在求解特征矢量的后缀部的成分的情况下,系统控制部14提取位于学习用的复合词的修饰语部分的末尾或开头的词。系统控制部14判定提取出的词对应于特征矢量的后缀部的哪个后缀,设相应的后缀的成分为“ 1”,设不相应的后缀的成分为“O”。
[0145]在求解特征矢量的意思等级部的成分的情况下,系统控制部14参照分类词汇表,判定学习用的复合词的修饰语部分属于哪个意思等级,设相应的意思等级的成分为“ 1”,设不相应的意思等级的成分为“O”。
[0146]这样,计算每个学习用的复合词的特征矢量。
[0147]接着,信息处理服务器10使用特征矢量和学习用的分类项目进行机器学习,构建分类模型(步骤S5)。具体而言,信息处理服务器10的系统控制部14将计算出的各特征矢量作为输入,将学习用的分类项目作为正解(教师数据),进行机器学习,构建分类模型。作为机器学习(machine learning)的方法,例如举出 MIRA (Margin Infused RelaxedAlgorithm)、决定树、组合多个SVM (Support vector machine)的方法。另外,分类模型由权重函数、权重的矩阵等表现。分类模型还通过权重函数等与复合词的特征矢量(输入)之积而输出包含基本词的复合词的分类结果。
[0148]这样,信息处理服务器10作为分类模型构建单元的一例进行工作,其使用由特征矢量生成单元从由学习用复合词取得单元取得的学习用的复合词应用特征信息生成的该学习用的复合词的特征矢量、以及由学习用分类项目取得单元取得的学习用的分类项目,进行机器学习,构建用于将包含基本词的复合词分配给分类项目的分类模型。
[0149](3.2信息处理系统中的检索结果分类的动作例)
[0150]接着,使用图8和图9说明使用所构建的分类模型对检索结果进行分类的动作例。
[0151]首先,探寻商品的用户在用户终端装置30的显示部33中显示的商品检索用的网页上输入例如“头盔”。当点击该网页的检索按钮时,用户终端装置30将检索关键字发送到信息处理服务器10。
[0152]如图8所示,信息处理服务器10取得基本词(步骤S10)。具体而言,信息处理服务器10的系统控制部14从用户终端装置30接收检索关键字,临时存储在作为存储单元的一例的存储部12或RAM14c中,从存储部12或RAM14c取得该接收到的检索关键字作为基本词。另外,信息处理服务器10也可以取得购物网站中的上位排序的关键字作为基本词。并且,信息处理服务器10也可以取得与专集相关联的规定基本词,以组成专集页。
[0153]这样,信息处理服务器10作为取得作为基础的基本词的基本词取得单元的一例进行工作。并且,信息处理服务器10作为基本词取得单元的一例进行工作,其从用户终端装置取得检索关键字作为基本词。
[0154]接着,信息处理服务器10取得复合词(步骤S11)。具体而言,信息处理服务器10的系统控制部14参照作为复合词存储单元的一例的复合词DB12d,取得与所取得的基本词相关联的复合词。例如,系统控制部14取得与基本词“头盔”相关联的“儿童用头盔”、“自行车用头盔”这样的复合词。另外,从复合词中去除基本词而得到的部分是“儿童用”、“自行车用”这样的修饰语部。并且,复合词也可以是基本词自身。
[0155]这样,信息处理服务器10作为复合词取得单元的一例进行工作,其从复合词存储单元取得将由基本词取得单元取得的基本词作为被修饰语的复合词。
[0156]接着,信息处理服务器10取得分类项目(步骤S12)。具体而言,信息处理服务器10的系统控制部14参照分类项目DB12e取得规定的分类项目(例如“用户”、“对象”、“目的”、“功能”、“附属品”、“形状”、“场所”、“公司名”、“原材料”、“设计”)。
[0157]这样,信息处理服务器10作为分类项目取得单元的一例进行工作,其从分类项目存储单元取得用于对由复合词取得单元取得的复合词进行分类的分类项目。
[0158]接着,信息处理服务器10取得特征信息(步骤S13)。具体而言,信息处理服务器10的系统控制部14如步骤S3那样,参照特征信息DB102取得特征矢量的原型。
[0159]这样,信息处理服务器10作为特征信息取得单元的一例进行工作,其参照特征信息存储单元取得与作为用于对由复合词取得单元取得的复合词进行分类的线索的特征有关的特征信息。
[0160]接着,信息处理服务器10针对复合词,使用特征信息计算特征矢量(步骤S14)。具体而言,信息处理服务器10的系统控制部14如步骤S4那样,针对包含基本词的复合词,使用特征信息计算特征矢量。[0161]这样,信息处理服务器10作为特征矢量生成单元的一例进行工作,其针对复合词,使用特征信息生成该复合词的特征矢量。
[0162]接着,信息处理服务器10使用分类模型和特征矢量,将各复合词分配给分类项目(步骤S15)。具体而言,信息处理服务器10的系统控制部14如步骤S4那样,计算各复合词的特征矢量的各成分。而且,系统控制部14针对步骤S5中构建的分类模型,使用各复合词的特征矢量,将各复合词分配给分类项目。例如,“儿童用头盔”、“成人用头盔”等被分配给分类项目“用户”,“自行车用头盔”、“摩托车用头盔”等被分配给分类项目“对象”,“防灾用头盔”、“棒球用头盔”等被分配给分类项目“目的”。另外,不匹配于规定的分类项目的复合词成为“其他”的分类。另外,信息处理服务器10也可以使用分类模型将基本词自身分配给分类项目。
[0163]这样,信息处理服务器10作为复合词分类单元的一例进行工作,其使用预先生成的分类模型和针对由复合词取得单元取得的复合词而由特征信息取得单元取得的特征信息,将包含基本词的复合词分配给由分类项目取得单元取得的分类项目。并且,信息处理服务器10作为复合词分类单元的一例进行工作,其使用由分类模型构建单元构建的分类模型和由复合词取得单元取得的复合词的特征矢量,将包含基本词的复合词分配给分类项目。
[0164]接着,信息处理服务器10进行基于基本词的检索(步骤S16)。具体而言,信息处理服务器10的系统控制部14参照商品DB12a,将基本词作为检索关键字进行检索,取得符合检索的商品名、商品图像等的检索结果(基本词关联信息的一例)。另外,基本词关联信息包含检索结果的要素、组成专集页时的各个专集对象这样的要素。例如,作为要素,举出各个检索结果对象、专集对象,在商品检索的情况下,举出符合规定检索关键字的检索的各个商品等。并且,信息处理服务器10的系统控制部14也可以经由网络3而通过检索服务器5取得检索结果。并且,信息处理服务器10也可以取得与和专集相关的规定基本词相关联的基本词关联信息,以组成专集页。例如,在“自行车”的专集的情况下,预先取得与“自行车”相关联的希望销售的商品的商品名(基本词关联信息的一例)。或者,也可以设将这些商品名作为检索关键字的检索结果为基本词关联信息。
[0165]这样,信息处理服务器10作为基本词关联信息取得单元的一例进行工作,其根据基本词取得包含与基本词相关联的多个要素的基本词关联信息。并且,信息处理服务器10作为基本词关联信息取得单元的一例进行工作,其取得根据检索关键字进行检索的检索结果O
[0166]接着,信息处理服务器10对检索结果进行分类(步骤S17)。具体而言,信息处理服务器10的系统控制部14对符合检索的商品名和分类后的复合词进行比较,分配与该商品名相同或类似的复合词的分类项目。然后,系统控制部14按照分配的分类项目对检索结果进行分类。例如,如图9所示,在网页40中,在关联商品区域41中设有与各分类项目对应的分类项目区域42。在分类项目区域42中附加分类项目名42a,配置检索结果的各商品的图像42b。在各图像42b的下方附近附加复合词的修饰语部分的名称42c。另外,未匹配于规定分类项目的商品名的检索结果或分类项目相应于“其他”的商品名的检索结果显示在检索结果区域43中。
[0167]在根据检索对象的文本取得复合词的情况下,可以仅仅是在步骤S17中进行分类,但是,在检索对象的文本和复合词的取得方(源)不同的情况下,虽然存在分类项目,但是也可能不对检索结果进行分类,所以,可以不显示这样的分类项目。
[0168]系统控制部14生成由这种HTML等记述的网页40。
[0169]另外,关于分类项目区域42中的图像的排列顺序,如后述式(6)所示,可以按照基本词、后缀和其他词的函数即得分的值进行排列。系统控制部14针对复合词“儿童用头盔” “成人用头盔”…计算式(6)的得分,在各分类项目区域42中显示与式(6)的得分的上位5位的复合词有关的信息。
[0170]这样,信息处理服务器10作为基本词关联信息分类单元的一例进行工作,其根据复合词分类单元的分类结果,将由基本词关联信息取得单元取得的基本词关联信息中包含的要素中的至少一部分分别分类到分类项目中的任意一方。并且,信息处理服务器10作为基本词关联信息分类单元的一例进行工作,其根据复合词分类单元的分类结果,将由基本词关联信息取得单元检索到的检索结果中包含的要素中的至少一部分分别分类到分类项目中的任意一方。
[0171]另外,信息处理服务器10也可以取得基于基本词的检索结果(将基本词作为检索关键字的第I检索结果的一例)和基于各复合词的检索结果(将复合词作为检索关键字的第2检索结果的一例),在关联商品区域41中显示基于各复合词的检索结果(第2检索结果的一例),在检索结果区域43中显示从基于基本词的检索结果(第I检索结果的一例)中删除与基于复合词的检索结果相同的部分而得到的检索结果(第I检索结果中的至少一部分的一例)。具体而言,信息处理服务器10在第I检索结果和第2检索结果中对检索中符合的检索结果的各要素(各个商品等)进行比较,从第I检索结果的各要素中删除与第2检索结果的各要素相同的要素。
[0172]例如, 信息处理服务器10对检索结果的各要素的URL (Uniform ResourceLocator)或商品名等进行比较,删除相同的要素,由此,从检索关键字“头盔”的检索结果中去除检索关键字为“儿童用头盔”和“自行车用头盔”等的复合词的检索结果。另外,在取得第I检索结果时,根据基本词生成在检索中去除各复合词的检索式并进行检索,也可以省略该处理。进而,信息处理服务器10将复合词“儿童用头盔”的检索结果中第一个符合的商品图像、复合词“成人用头盔”的检索结果中第一个符合的商品图像等作为图像42b,配置在关联商品区域41中。当点击图像42b或修饰语部分的名称42c时,也可以显示基于各复合词的检索结果的上位10件等。并且,作为复合词的一例,如与基本词相关联的关联词中的“儿童用头盔”那样,将具有后缀的关联词设为带类型的关联词(typed related-word)。
[0173]并且,如图9所示,信息处理服务器10也可以生成由HTML等记述的网页40(检索结果信息的一例),以区分第I检索结果的一部分(检索结果区域43)和第2检索结果(关联商品区域41)并显示在用户终端装置30的显示部33中。第I检索结果的一部分(检索结果区域43)和第2检索结果(关联商品区域41)在网页40中显示在区分后的区域中。
[0174]这样,信息处理服务器10作为检索结果取得单元的一例进行工作,其取得将基本词作为检索关键字的第I检索结果和将复合词作为检索关键字的第2检索结果。并且,信息处理服务器10作为检索结果信息生成单元的一例进行工作,其生成检索结果信息,使得在显示单元的画面上区分显示由检索结果取得单元取得的第I检索结果中的至少一部分和第2检索结果。并且,信息处理服务器10作为检索结果信息生成单元的一例进行工作,其生成检索结果信息,以显示从第I检索结果中除去第2检索结果的部分后的检索结果,作为第I检索结果中的至少一部分。
[0175]接着,信息处理服务器10输出检索结果(步骤S18)。具体而言,信息处理服务器10的系统控制部14将与网页40有关的信息作为检索结果发送到用户终端装置30。然后,用户终端装置30的系统控制部36接收检索结果信息,在显示部33中显示图9这样的网页40。
[0176]这样,信息处理服务器10作为输出单兀的一例进行工作,其输出由基本词关联信息分类单元分类后的基本词关联信息。
[0177]以上,根据本实施方式,取得作为基础的基本词(例如检索关键字)、将该基本词作为被修饰语的复合词、用于对该复合词进行分类的分类项目、与作为用于对该复合词进行分类的线索的特征有关的特征信息(例如特征矢量的原型),使用预先生成的分类模型(通过机器学习而构建的分类模型)和特征信息(例如针对复合词使用特征矢量的原型计算出的特征矢量),将包含基本词的复合词分配给分类项目,根据基本词取得包含与基本词相关联的多个要素的基本词关联信息(例如取得基于检索关键字的检索结果),根据该分类结果将基本词关联信息中包含的要素中的至少一部分分别分类到所述分类项目中的任意一方,输出该分类后的基本词关联信息,由此,由于根据分类项目对基本词关联信息进行分类,所以,与分类项目一起整理基本词关联信息的混合存在,能够进行用户易于观看的显示。
[0178]在取得学习用的复合词,取得与所取得的学习用的复合词对应的学习用的分类项目,使用根据所取得的学习用的复合词而生成的该学习用的复合词的特征矢量和学习用的分类项目,进行机器学习,构建分类模型,针对所取得的复合词,使用特征信息生成该复合词的特征矢量,使用所构建的分类模型和所取得的复合词的特征矢量,将包含基本词的复合词分配给分类项目的情况下,能够通过机器学习而高精度地实现用于进行用户易于观看的显示的分类模型。具体而言,通过使用机器学习,与利用试探性学习的情况相比,能够考虑各种特征,所以,能够实现高精度,能够在分类中有效活用各种信息。
[0179]在使用户从分配了复合词的分类项目中选择特定的分类项目,所以,将分配了复合词的分类项目输出到用户终端装置30,从用户终端装置30取得分类项目的选择结果,根据分类结果对通过所取得的分类项目的选择结果和基本词取得的基本词关联信息进行分类的情况下,能够进行用户易于观看与用户选择对应的用户期望的信息的显示。
[0180]在从用户终端装置30取得检索关键字作为基本词,根据检索关键字进行检索并取得检索结果,根据分类结果,按照分类项目对检索到的检索结果进行分类的情况下,根据用户输入的检索关键字,能够进行用户易于观看用户探寻的信息的显示。
[0181]并且,取得将基本词作为检索关键字的第I检索结果和将所生成的复合词作为检索关键字的第2检索结果,生成网页40 (检索结果信息的一例),以使得在显示部33的画面上区分显示所取得的第I检索结果中的至少一部分和第2检索结果,由此,能够减少通过检索关键字检索到的检索对象的混合存在情况并进行显示。
[0182]在生成检索结果信息,以显示从第I检索结果中去除第2检索结果的部分而得到的检索结果,作为第I检索结果中的至少一部分的情况下,第I检索结果和第2检索结果不会混合存在,容易注意到第2检索结果的关联商品。并且,用户容易注意到基于复合词的检索结果。[0183][4.信息处理系统的第2实施方式的动作]
[0184]接着,使用附图对信息处理系统的第2实施方式的动作进行说明。另外,针对与所述第I实施方式相同或对应的部分使用相同标号,仅对不同的结构和动作进行说明。其他实施方式和变形例也同样。
[0185](4.1信息处理服务器中的分类辞典的生成的动作例)
[0186]首先,作为本发明的信息处理系统的第2实施方式的动作,使用图10?图14对分类辞典的生成的动作例进行说明。
[0187]图10?图14是示出信息处理服务器10中的各分类辞典的构建的动作例的流程图。
[0188](4.1.1用户词辞典的生成)
[0189]首先,使用图10对用户词辞典的生成进行说明。
[0190]如图10所示,信息处理服务器10从查询记录中取得匹配于规定字典式句法模式的关键字和种类ID(步骤S20)。具体而言,信息处理服务器10的系统控制部14参照LSP/DB12f,取得用户关系的字典式句法模式“X用”和“面向X”。然后,系统控制部14参照查询记录DB12j,取得匹配于这些字典式句法模式的关键字和该关键字所属的种类的种类ID。
[0191]接着,信息处理服务器10提取与“人”相应的关键字(步骤S21)。具体而言,信息处理服务器10的系统控制部14从所取得的关键字中提取与字典式句法模式的词X相应的词。然后,系统控制部14根据集中了表示人的表现的辞典,判定词X是否表示人(“人”)(例如,通过辞典的词和词X的匹配是否一致来进行判定)。例如,在“男性用”的情况下,词X为“男性”,“男性”登记在上述辞典中,所以,判定为“人”。这样,在系统控制部14判定为词X表示“人”的情况下,通过采用包含词X的原本的关键字,从匹配于字典式句法模式的关键字中提取与“人”相应的关键字。然后,系统控制部14将与“人”相应的关键字和种类ID关联起来存储在存储部12中。
[0192]接着,信息处理服务器10提取种类中出现规定数以上的关键字(步骤S22)。具体而言,信息处理服务器10的系统控制部14参照存储部12,根据种类ID对某个关键字在种类中出现的出现数进行计数。然后,系统控制部14提取出现数为规定数以上的关键字。
[0193]接着,信息处理服务器10将关键字登记在分类辞典中(步骤S23 )。具体而言,信息处理服务器10的系统控制部14例如将提取出的“长辈”、“少年”、“婴儿”、“用户”、“男性”这样的关键字登记在分类辞典DB12h的用户词辞典中。
[0194](4.1.2物品词辞典的生成)
[0195]接着,使用图11对物品词辞典的生成进行说明。
[0196]如图11所示,信息处理服务器10从查询记录中取得关键字(步骤S24)。具体而言,信息处理服务器10的系统控制部14参照查询记录DB12j取得关键字。
[0197]接着,信息处理服务器10计算生命性得分(步骤S25)。具体而言,信息处理服务器10的系统控制部14在查询记录DB12j中提取出现规定数以上的关键字X。然后,系统控制部14参照与分类辞典DB12h的从属有关的数据库,如式(I)那样计算生命性得分(Score#anim (X))。
[0198]Score#anim (X)
[0199]=# (X,“力'”,,“ W,)/ {# (X,“力'”,,“ U,,)+# (X,“力'”,,“*冬”)}[0200]…(I)
[0201]这里,# (X,a,b)是在与分类辞典DB12h的从属有关的数据库中的“Xab”出现频度。例如,“X 石”这样的短语是在与从属有关的数据库中出现几次的值。
[0202]生命性(animacy)是一种语法种类,是指名词、代名词等的指示对象所具有的作为生物的性质。
[0203]关于日语,在生命性较高的词、例如“X=儿童”的情况下,“儿童 石”的出现频度比“儿童# 的出现频度高。并且,在生命性较低的词、例如“X=椅子”的情况下,“椅子# h石”的出现频度比“椅子# 石”的出现频度高。因此,在生命性较高的词的情况下,# (X,“力'”,,“ H ”)的值较高,Score#anim (X)的值也较高。
[0204]关于英语,在生命性较高的词、例如“X=man”的情况,“the man’s face ”的出现频度比“the face of the man”的出现频度高。并且,在生命性较低的词、例如“X=clock”的情况下,“the face of the clock”的出现频度比“the clock’s face”的出现频度高。
[0205]在英语的情况下,与式(I)对应的式成为下式。
[0206]Score#anim (X)
[0207]=# (X,“,s,,,K)/{# (X,“,s,,,K)+# (X, “of”,K)}
[0208]...(2)
[0209]这里,K是“face”那样的规定的词。另外,利用各语言的特征计算与生命性有关的得分即可。
[0210]接着,信息处理服务器10计算买卖得分(步骤S26)。具体而言,信息处理服务器10的系统控制部14在查询记录DB12j中,针对出现规定数以上的关键字X,参照与分类辞典DB12h的从属有关的数据库,如式(3)那样计算买卖得分(Score#sell&buy (X))。
[0211]Score#sell&buy (X)
[0214]“X f買)”或“X全売石”这样的与买卖有关的短语在与从属有关的数据库中出现得越多,买卖得分的值越高。
[0215]在英语的情况下,系统控制部14根据式(4)计算买卖得分即可。
[0216]Score#sell&buy (X)
[0217]={# (“sell,,,X)+# (“buy,,,X) }/# (X)...(4)
[0218]另外,也可以代替“buy”或者与“buy”一起使用“purchase”。并且,利用各语言的特征计算与买卖有关的得分即可。
[0219]接着,信息处理服务器10计算物品得分(步骤S27)。具体而言,信息处理服务器10的系统控制部14根据生命性得分和买卖得分,按照式(5)计算物品得分Scoreitobj (X)0
[0220]Score#obj (X)= (l-Score#anim (X)) XScore#sell&buy (X)
[0221]…(5)
[0222]如式(5)所示,生命性得分越低、买卖得分越高,则物品得分的值越高。
[0223]接着,信息处理服务器10提取物品得分为规定以上的关键字(步骤S28)。具体而言,信息处理服务器10的系统控制部14保留所取得的关键字中的物品得分为规定以上的
关键字。[0224]接着,信息处理服务器10将关键字登记在分类辞典中(步骤S29 )。具体而言,信息处理服务器10的系统控制部14例如将提取出的“美白美容液”、“头饰”、“色纸”这样的关键字登记在分类辞典DB12h的物品词辞典中。
[0225]以上,通过图11的处理生成物品词辞典。
[0226](4.1.3功能词辞典的生成)
[0227]接着,使用图12对功能词辞典的生成进行说明。
[0228]如图12所示,信息处理服务器10从查询记录中提取匹配于规定字典式句法模式的关键字(步骤S30)。具体而言,信息处理服务器10的系统控制部14参照LSP/DB12f,取得功能关系的字典式句法模式“带X功能”。然后,系统控制部14参照查询记录DB12j,取得匹配于这些字典式句法模式的关键字。
[0229]接着,信息处理服务器10提取出现频度为规定数以上的关键字(步骤S31)。具体而言,信息处理服务器10的系统控制部14关于所取得的各关键字“带X功能”,在商品DB12a中的出现频度为规定数以上的情况下,保留为登记在分类辞典中的关键字。
[0230]接着,信息处理服务器10登记在分类辞典中(步骤S32 )。具体而言,信息处理服务器10的系统控制部14例如将提取出的“除臭”、“耐震”、“尺寸调整”这样的关键字登记在分类辞典DB12h的功能词辞典中。这样,生成功能词辞典。
[0231](4.1.4形状词辞典和原材料词辞典的生成)
[0232]接着,使用图13对形状词辞典和原材料词辞典的生成进行说明。
[0233]首先,对形状词辞典的生成进行说明。
[0234]如图13所示,信息处理服务器10从查询记录中取得匹配于规定后缀的关键字(步骤S33)。具体而言,信息处理服务器10的系统控制部14参照后缀DB12g取得后缀“型”。然后,系统控制部14参照查询记录DB12 j取得匹配于“X型”的关键字。
[0235]接着,信息处理服务器10提取规定数据库中出现的关键字(步骤S34)。具体而言,信息处理服务器10的系统控制部14参照LSP/DB12f取得字典式句法模式“X这样的形式”、“X等的形式”和“X等的形式”。然后,系统控制部14针对匹配于后缀的模式“X型”的关键字,将适合于应用了字典式句法模式的“X这样的形式”、“X等的形式”和“X等的形式”的关键字作为检索关键字,发送到检索服务器5,保留符合件数为规定数以上的情况下的关键字。
[0236]然后,信息处理服务器10将关键字登记在分类辞典中(步骤S35 )。具体而言,信息处理服务器10的系统控制部14例如将提取出的“月牙”、“椭圆”这样的关键字登记在分类辞典DB12h的形状词辞典中。这样,生成形状词辞典。
[0237]接着,同样使用图13对原材料词辞典的生成进行说明。
[0238]首先,信息处理服务器10从查询记录中取得匹配于规定后缀的关键字(步骤S33)。具体而言,信息处理服务器10的系统控制部14参照后缀DB12g取得后缀“制”。然后,系统控制部14参照查询记录DB12j取得匹配于“X制”的关键字。并且,信息处理服务器10的系统控制部14参照LSP/DB12f,取得字典式句法模式“X这样的原材料”、“X等的原材料”和“X等的原材料”。然后,系统控制部14针对匹配于后缀的模式“X制”的关键字,将适合于应用了字典式句法模式的“X这样的原材料”、“X等的原材料”和“X等的原材料”的关键字作为检索关键字,发送到检索服务器5,保留符合件数为规定数以上的情况下的关键字。
[0239]接着,信息处理服务器10将关键字登记在分类辞典中(步骤S35)。具体而言,系统控制部14将提取出的“革”、“橡胶”、“玻璃”这样的关键字登记在分类辞典DB12h的原材料词辞典中。这样,生成原材料词辞典。
[0240]另外,代替检索服务器5中的检索,也可以是商品DB 12a中的检索。
[0241](4.1.5场所词辞典和公司名词辞典的生成)
[0242]接着,使用图14对场所词辞典和公司名词辞典的生成进行说明。
[0243]如图14所示,信息处理服务器10从查询记录中取得匹配于规定后缀的关键字(步骤S36)。具体而言,信息处理服务器10的系统控制部14参照后缀DB12g,在场所词辞典的情况下,取得后缀“产”,在公司名词的情况下,取得后缀“公司”和“制”。然后,在场所词辞典的情况下,系统控制部14参照查询记录DB12j取得匹配于“X产”的关键字。在公司名词辞典的情况下,系统控制部14参照查询记录DB12j取得匹配于“X公司”的关键字。
[0244]另外,在公司名词辞典的情况下,系统控制部14也可以取得匹配于“X制”的关键字,进而保留匹配于“品牌的X” “品牌x”、“生产商的x”、“生产商X”的关键字。或者,系统控制部14也可以取得匹配于“X制”的关键字,将“品牌的X” “品牌x”、“生产商的x”、“生产商X”作为检索关键字,保留符合件数为规定数以上的情况下的关键字。
[0245]接着,信息处理服务器10将关键字登记在分类辞典中(步骤S37)。具体而言,例如,在场所词辞典的情况下,信息处理服务器10的系统控制部14将提取出的“东京”、“广岛”、“意大利”这样的关键字登记在分类辞典DB12h的场所词辞典中。在公司名词辞典的情况下,系统控制部14将提取出的公司名、品牌名、商品名的关键字登记在分类辞典DB12h的公司名词辞典中。由此生成公司名词辞典。另外,在本实施方式中称为“公司名词辞典”,但是,虽说是公司名词,也将包含品牌名等的词统称为公司名词。
[0246]如上所述,信息处理服务器10作为分类辞典生成单元的一例进行工作,其根据规定的词在规定数据库中出现的出现数来决定分类项目和该规定的词之间的关联,或者,通过从规定数据库中提取适合于与该分类项目对应的提取模式的该规定的词来决定分类项目和该规定的词之间的关联,生成分类辞典。
[0247](4.2信息处理系统中的检索结果分类的动作例)
[0248]接着,使用图15对信息处理系统中的检索结果分类的第2实施方式的动作例进行说明。
[0249]图15是示出信息处理服务器10的第2实施方式的动作例的流程图。
[0250]信息处理服务器10如步骤SlO那样取得基本词(步骤S50)。
[0251]接着,信息处理服务器10取得复合词(步骤S51)。具体而言,信息处理服务器10的系统控制部14根据所取得的基本词,按照复合词的取得的子进程,从存储部12或RAM14c取得复合词。另外,关于复合词的取得,在复合词的取得的子进程中进行详细说明。并且,也可以如步骤Sll那样,信息处理服务器10参照复合词DB12d取得与所取得的基本词相关联的复合词。
[0252]这样,信息处理服务器10作为复合词取得单元的一例进行工作,其取得由复合词决定单元决定的复合词。并且,信息处理服务器10作为复合词取得单元的一例进行工作,其取得将由基本词取得单元取得的基本词作为被修饰语的复合词。[0253]接着,信息处理服务器10如步骤S12那样取得分类项目(步骤S52)。
[0254]接着,信息处理服务器10取得与后缀和分类辞典有关的信息(步骤S53)。具体而言,信息处理服务器10的系统控制部14参照特征信息DB102,取得在使用分类辞典预先生成的分类模型中如何使用后缀、分类辞典等的特征信息的与后缀和分类辞典有关的信息。另外,关于使用分类辞典预先生成的分类模型,在复合词的分配的子进程中进行详细说明。
[0255]这样,信息处理服务器10作为特征信息取得单元的一例进行工作,其参照特征信息存储单元取得与作为用于对由复合词取得单元取得的复合词进行分类的线索的特征有关的特征信息。并且,信息处理服务器10作为特征信息取得单元的一例进行工作,其参照特征信息存储单元取得将各个分类项目和规定的词关联起来的分类辞典。
[0256]接着,信息处理服务器10从复合词中取得针对基本词的修饰语部分(步骤S54)。具体而言,在基本词为“头盔”、复合词为“儿童用头盔”的情况下,信息处理服务器10的系统控制部14取得“儿童用”这样的修饰语部分。
[0257]这样,信息处理服务器10作为修饰语部分取得单元的一例进行工作,其取得针对复合词的基本词的修饰语部分。
[0258]接着,信息处理服务器10从修饰语部分取得后缀(步骤S55)。具体而言,在修饰语部分为“儿童用”的情况下,信息处理服务器10的系统控制部14取得后缀“用”。
[0259]这样,信息处理服务器10作为后缀取得单元的一例进行工作,其从由修饰语部分取得单元取得的修饰语部分中取得后缀。
[0260]接着,信息处理服务器10使用利用分类辞典预先生成的分类模型和针对修饰语部分的特征信息,将复合词分配给分类项目(步骤S56)。如步骤S15那样,例如,“儿童用头盔”、“成人用头盔”等的复合词被分配给分类项目“用户”。另外,关于复合词的分配,在复合词的分配的子进程中进行详细说明。
[0261]并且,信息处理服务器10作为复合词分类单元的一例进行工作,其使用预先生成的分类模型和针对由复合词取得单元取得的复合词而由特征信息取得单元取得的特征信息,将包含基本词的复合词分配给由分类项目取得单元取得的分类项目。并且,信息处理服务器10作为复合词分类单元的一例进行工作,其使用利用特征信息存储单元中存储的分类辞典预先生成的分类模型和针对由修饰语部分取得单元取得的修饰语部分的特征信息,将包含基本词的复合词分配给分类项目。
[0262]接着,信息处理服务器10如步骤S16那样进行基于基本词的检索(步骤S57)。
[0263]接着,信息处理服务器10如步骤S17那样对检索结果进行分类(步骤S58)。
[0264]接着,信息处理服务器10如步骤S18那样输出检索结果(步骤S59)。
[0265](4.3复合词的取得的子进程)
[0266]接着,使用图16对复合词的取得的子进程进行说明。
[0267]图16是示出复合词的取得的子进程的流程图。
[0268]接着,信息处理服务器10取得其他词(步骤S60)。具体而言,信息处理服务器10的系统控制部14参照查询记录DB12j取得与基本词一起使用的其他词。在基本词为“头盔”的情况下,信息处理服务器10的系统控制部14参照查询记录DB12j,取得“儿童”、“自行车”、“防灾”等作为其他词。
[0269]接着,信息处理服务器10生成复合词的候选(步骤S61 )。具体而言,信息处理服务器10的系统控制部14通过生成复合词的候选的子进程处理,组合基本词和其他词,生成与基本词相关联的复合词的候选。所生成的复合词的候选存储在存储部12或RAM14c中。这里,作为复合词的例子,生成“儿童用头盔” “自行车用头盔” “带自行车的头盔”等组合了基本词和其他词而得到的复合词的候选。另外,关于复合词的候选的生成,在复合词的候选的生成的子进程中进行详细说明。
[0270]接着,信息处理服务器10从候选中决定复合词(步骤S62)。具体而言,信息处理服务器10的系统控制部14从所生成的复合词的候选中计算针对各复合词的候选的得分,决定具有规定值以上的得分的复合词。在“儿童用头盔”和“自行车用头盔”的得分高于规定值、“带自行车的头盔”的得分低于规定值的情况下,决定“儿童用头盔”和“自行车用头盔”作为复合词。然后,系统控制部14将所决定的复合词临时存储在作为存储单元的一例的存储部12或RAMHc中。另外,关于复合词的决定,在复合词决定的子进程中进行详细说明。
[0271]在子进程结束后,信息处理服务器10进行步骤S52的处理。
[0272](4.4复合词的候选的生成的子进程)
[0273]接着,使用图17对复合词的候选的生成的子进程进行说明。
[0274]图17是示出复合词的候选的生成的子进程的流程图。
[0275]如图17所示,信息处理服务器10取得后缀(步骤S65 )。具体而言,信息处理服务器10的系统控制部14参照后缀DB12g,读出“用” “带” “制” “产” “型” “盘” “版” “柄” “色”等,作为后缀的文字(中间文字的一例)。
[0276]接着,信息处理服务器10根据基.本词、其他词以及后缀生成复合词的候选(步骤S66)。具体而言,信息处理服务器10的系统控制部14参照后缀DB12g,生成组合了所读出的后缀的文字、基本词和其他词的复合词的候选。这些后缀的文字设置在基本词与其他词之间,生成复合词的候选。例如,在基本词为“头盔”、其他词为“自行车”的情况下,作为复合词的例子,生成“自行车用头盔”、“带自行车的头盔”、“自行车制头盔”、…、“头盔用自行车”、…、“头盔制自行车”等。此时,如“头盔用自行车”那样,通过基本词、后缀的文字、其他词的排列而生成复合词的候选。生成其他词为“自行车”以外的“头盔用灯”、“带灯的头盔”、…、“儿童用头盔”等。
[0277]在子进程结束后,信息处理服务器10进行步骤S62的处理。这样,信息处理服务器10作为根据基本词生成复合词的候选的复合词候选生成单元的一例进行工作。并且,信息处理服务器10作为组合基本词和其他词而生成候选的复合词候选生成单元的一例进行工作。信息处理服务器10作为组合基本词和与该基本词不同的词而生成候选的复合词候选生成单元的一例进行工作。并且,信息处理服务器10作为通过设置在基本词与其他词之间的中间文字而生成候选的复合词候选生成单元的一例进行工作。
[0278](4.5复合词的决定的子进程)
[0279]接着,使用图18对复合词的决定的子进程进行说明。
[0280]图18是示出复合词的决定的子进程的流程图。
[0281]如图18所示,信息处理服务器10确定复合词的候选(步骤S70)。具体而言,信息处理服务器10的系统控制部14从步骤S61中生成并存储在存储部12或RAM14C中的复合词的候选中,依次确定一个复合词的候选(例如“自行车用头盔”)。
[0282]接着,信息处理服务器10计算查询记录中的基本词和其他词的出现频度(步骤S71)。具体而言,信息处理服务器10的系统控制部14参照查询记录DB12j,计算基本词和其他词一起出现的出现频度Nkl,k2。这里,kl表示基本词,k2表示其他词。例如,如图4所示,在基本词“头盔”、其他词“自行车”的情况下,信息处理服务器10的系统控制部14从查询记录DB12j中读出基本词“头盔”、其他词“自行车”的件数的数据,设为出现频度Nkl,k2。
[0283]接着,信息处理服务器10求解将复合词的候选包含在商品说明中的经营店的数量(步骤S72)。具体而言,信息处理服务器10的系统控制部14参照商品DB12a,确定在商品说明中使用所确定的复合词的候选(例如“自行车用头盔”)的商品或复合词的候选的商品,求解商品ID。然后,信息处理服务器10的系统控制部14参照店铺DB12b,根据商品ID,对经营复合词的候选的商品或在商品说明中使用复合词的候选的经营店进行计数,计算经营店的数量Mkl,s,k2。这里,s是“用” “带” “制” “产” “型” “盘” “版” “柄” “色”等的后缀、“for” “with” “in”等的前置词、“for the purpose of”等的功能性表现。
[0284]接着,信息处理服务器10根据出现频度和经营店的数量计算得分(步骤S73)。具体而言,信息处理服务器10的系统控制部14根据出现频度队⑶和经营店的数量Mkl,s,k2,按

[0285]Score (kl, s, k2) =1g (Nkl k2) X log (Mkl s k2)
[0286]…(6)
[0287]计算作为基本词、后缀和其他词的函数的得分Score (kl, s, k2)。
[0288]接着,信息处理服务器10判定得分是否为规定值以上(步骤S74)。具体而言,信息处理服务器10的系统控制部14判定计算出的得分Score是否为规定以上。这里,在基本词kl和其他词k2是检索商品的用户在检索中经常使用的词、复合词(kl,s,k2)是在各经营店中经常使用的词的情况下,得分Score (kl,s,k2)示出较高的值。并且,log (Nkl,k2)表示商品需求侧的状态,log (Mkl,s,k2)表示商品供给侧的状态。
[0289]接着,在得分不是规定以上的情况下(步骤S74:否),信息处理服务器10删除复合词的候选(步骤S75)。具体而言,信息处理服务器10的系统控制部14在得分Score(kl,s,k2)低于规定值的情况下,视为该复合词的候选不适于复合词,从存储部12或RAM14c中删除。
[0290]在得分为规定以上的情况下(步骤S74:是),信息处理服务器10不删除所确定的复合词的候选,转移到步骤S76的处理。
[0291]这样,信息处理服务器10作为从候选中决定复合词的复合词决定单元的一例进行工作。并且,信息处理服务器10作为复合词决定单元的一例进行工作,其求解将由复合词候选生成单元生成的复合词的候选包含在商品的说明书中来经营该商品的经营店的数量,根据该经营店的数量决定复合词。并且,信息处理服务器10作为根据基本词在规定数据库中出现的出现数来决定复合词的复合词决定单元的一例进行工作。并且,信息处理服务器10作为复合词决定单元的一例进行工作,其根据将由复合词候选生成单元生成的复合词的候选作为检索关键字的检索的符合件数,决定复合词。
[0292]接着,信息处理服务器10判定是否确定了全部候选(步骤S76)。具体而言,信息处理服务器10的系统控制部14判定是否确定了存储部12或RAM14C中存储的全部复合词的候选。在未确定全部候选的情况下(步骤S76:否),信息处理服务器10转移到步骤S70的处理。[0293]在确定了全部候选的情况下(步骤S76:是),结束子进程的处理,信息处理服务器10进行步骤S52的处理。
[0294](4.6复合词的分配的子进程)
[0295]接着,使用图19对复合词的分配的子进程进行说明。
[0296]图19是示出复合词的分配的子进程的流程图。
[0297]另外,该复合词的分配的子进程使用试探求解的规则(发现的规则)。该规则是使用分类辞典预先生成的分类模型的一例,是预先生成的基于规则的分类模型。
[0298]如图19所示,信息处理服务器10判定后缀是否是“用”(步骤S80)。具体而言,作为使用针对所取得的修饰语部分的特征信息的一例,信息处理服务器10的系统控制部14判定在步骤S55中取得的后缀(所取得的修饰语部分的一例)是否与后缀“用”(特征信息的一例)相应。例如,在基本词为“头盔”、复合词为“儿童用头盔”或“自行车用头盔”的情况下,由于后缀是“用”,所以,与后缀“用”相应。在基本词为“头盔”、复合词为“带灯的头盔”的情况下,由于后缀为“带”,所以不与后缀“用”相应。
[0299]在后缀为“用”的情况下(步骤S80:是),信息处理服务器10判定除了后缀以外的修饰语部分的词是否存在于用户词辞典中(步骤S81)。具体而言,作为使用针对所取得的修饰语部分的特征信息的一例,信息处理服务器10的系统控制部14参照分类辞典DB12h的用户词辞典(特征信息的一例),判定除了后缀以外的修饰语部分的词是否存在于辞典中。
[0300]在除了后缀以外的修饰语部分的词存在于用户词辞典中的情况下(步骤S81:是),信息处理服务器10将分配对象的复合词分配给分类项目“用户”。例如,在除了后缀以外的修饰语部分为“儿童”的情况下,由于存在于用户词辞典中,所以,复合词“儿童用头盔”被分配给分类项目“用户”。
[0301]在除了后缀以外的修饰语部分的词不存在于用户词辞典中的情况下(步骤S81:否),信息处理服务器10判定除了后缀以外的修饰语部分的词是否存在于物品词辞典中(步骤S82)。具体而言,作为使用针对所取得的修饰语部分的特征信息的一例,信息处理服务器10的系统控制部14参照分类辞典DB12h的物品词辞典(特征信息的一例),判定除了后缀以外的修饰语部分的词是否存在于辞典中。
[0302]在除了后缀以外的修饰语部分的词存在于物品词辞典中的情况下(步骤S82:是),信息处理服务器10将复合词分配给分类项目“对象”。例如,在除了后缀以外的修饰语部分为“自行车”的情况下,由于存在于物品词辞典中,所以,复合词“自行车用头盔”被分配给分类项目“对象”。
[0303]在除了后缀以外的修饰语部分的词不存在于物品词辞典中的情况下(步骤S82:否),信息处理服务器10将复合词分配给分类项目“目的”。例如,在复合词“防灾用头盔”的情况下,由于“防灾”不存在于物品词辞典中,所以,复合词“防灾用头盔”被分配给分类项目“目的”。
[0304]在后缀不是“用”的情况下(步骤S80:否),信息处理服务器10判定后缀是否是“带”(步骤S83)。具体而言,作为使用针对所取得的修饰语部分的特征信息的一例,信息处理服务器10的系统控制部14判定步骤S55中取得的后缀是否与后缀“带”(特征信息的一例)相应。
[0305]在后缀是“带”的情况下(步骤S83:是),信息处理服务器10判定除了后缀以外的修饰语部分的词是否存在于功能词辞典中(步骤S84)。具体而言,作为使用针对所取得的修饰语部分的特征信息的一例,信息处理服务器10的系统控制部14参照分类辞典DB12h的功能词辞典(特征信息的一例),判定除了后缀以外的修饰语部分的词是否存在于辞典中。
[0306]在除了后缀以外的修饰语部分的词存在于功能词辞典中的情况下(步骤S84:是),信息处理服务器10将分配对象的复合词分配给分类项目“功能”。
[0307]在除了后缀以外的修饰语部分的词不存在于功能词辞典中的情况下(步骤S84:否),信息处理服务器10判定除了后缀以外的修饰语部分的词是否存在于物品词辞典中(步骤S85)。具体而言,作为使用针对所取得的修饰语部分的特征信息的一例,信息处理服务器10的系统控制部14参照分类辞典DB12h的物品词辞典(特征信息的一例),判定除了后缀以外的修饰语部分的词是否存在于辞典中。
[0308]在除了后缀以外的修饰语部分的词存在于物品词辞典中的情况下(步骤S85:是),信息处理服务器10将复合词分配给分类项目“附属品”。
[0309]在除了后缀以外的修饰语部分的词不存在于物品词辞典中的情况下(步骤S85:否),信息处理服务器10将复合词分配给分类项目“其他”。
[0310]在后缀不是“带”的情况下(步骤S83:否),信息处理服务器10判定后缀是否是“型”(步骤S86)。具体而言,作为使用针对所取得的修饰语部分的特征信息的一例,信息处理服务器10的系统控制部14判定步骤S55中取得的后缀是否与后缀“型”(特征信息的一例)相应。
[0311]在后缀是“型”的情况下(步骤S86:是),作为使用针对所取得的修饰语部分的特征信息的一例,信息处理服务器10判定除了后缀以外的修饰语部分的词是否存在于功能词辞典中、并且不存在于物品词辞典中(步骤S87)。具体而言,信息处理服务器10的系统控制部14参照分类辞典DB12h的功能词辞典,判定是否是登记有除了后缀以外的修饰语部分的词的情况,进而,参照物品词辞典,判定是否是未登记除了后缀以外的修饰语部分的词的情况。即,在除了后缀以外的修饰语部分的词未登记在功能词辞典中的时点,进行“否”的判定。并且,即使除了后缀以外的修饰语部分的词登记在功能词辞典中,在登记在物品词辞典中的情况下,也进行“否”的判定。
[0312]在除了后缀以外的修饰语部分的词存在于功能词辞典中、并且不存在于物品词辞典中的情况下(步骤S87:是),信息处理服务器10将复合词分配给分类项目“功能”。
[0313]在除了后缀以外的修饰语部分的词不存在于功能词辞典中的情况下、或者存在于物品词辞典中的情况下(步骤S87:否),进入步骤S88,作为使用针对所取得的修饰语部分的特征信息的一例,信息处理服务器10参照分类辞典DB12h的形状词辞典,判定除了后缀以外的修饰语部分的词是否是“形状”(步骤S88)。此时,如果除了后缀以外的修饰语部分的词存在于形状词辞典中(步骤S88:是),则信息处理服务器10判定为是“形状”,将复合词分配给分类项目“形状”。另一方面,如果除了后缀以外的修饰语部分的词不存在于形状词辞典中(步骤S88:否),则信息处理服务器10将复合词分配给分类项目“其他”。
[0314]另外,在后缀是“型”、在除了后缀以外的修饰语部分的词中没有与分类项目“其他”相应的词的情况下,也可以不使用形状词辞典,省略步骤S88。该情况下,在除了后缀以外的修饰语部分的词不存在于功能词辞典中的情况下、或者存在于物品词辞典中的情况下(步骤S87:否),信息处理服务器10将复合词分配给分类项目“形状”。[0315]在后缀不是“型”的情况下(步骤S86:否),信息处理服务器10判定后缀是否是“产”(步骤S89)。具体而言,作为使用针对所取得的修饰语部分的特征信息的一例,信息处理服务器10的系统控制部14判定步骤S55中取得的后缀是否与后缀“产”(特征信息的一例)相应。
[0316]在后缀是“产”的情况下(步骤S89:是),信息处理服务器10将复合词分配给分类项目“场所”。
[0317]在后缀不是“产”的情况下(步骤S89:否),信息处理服务器10判定后缀是否是“制”(步骤S90)。具体而言,作为使用针对所取得的修饰语部分的特征信息的一例,信息处理服务器10的系统控制部14判定步骤S55中取得的后缀是否与后缀“制”(特征信息的一例)相应。
[0318]在后缀是“制”的情况下(步骤S90:是),信息处理服务器10判定除了后缀以外的修饰语部分的词是否存在于场所词辞典中(步骤S91)。具体而言,作为使用针对所取得的修饰语部分的特征信息的一例,信息处理服务器10的系统控制部14参照分类辞典DB12h的场所词辞典(特征信息的一例),判定除了后缀以外的修饰语部分的词是否存在于辞典中。
[0319]在除了后缀以外的修饰语部分的词存在于场所词辞典中的情况下(步骤S91:是),信息处理服务器10将分配对象的复合词分配给分类项目“场所”。例如,在复合词为“日本制头盔”的情况下,被分配给分类项目“场所”。
[0320]在除了后缀以外的修饰语部分的词不存在于场所词辞典中的情况下(步骤S91:否),信息处理服务器10判定除了后缀以外的修饰语部分的词是否存在于原材料词辞典中(步骤S92)。具体而言,作为使用针对所取得的修饰语部分的特征信息的一例,信息处理服务器10的系统控制部14参照分类辞典D B12h的原材料词辞典(特征信息的一例),判定除了后缀以外的修饰语部分的词是否存在于辞典中。
[0321]在除了后缀以外的修饰语部分的词存在于原材料词辞典中的情况下(步骤S92:是),信息处理服务器10将复合词分配给分类项目“原材料”。例如,在复合词为“金属制头盔”的情况下,被分配给分类项目“原材料”。
[0322]在除了后缀以外的修饰语部分的词不存在于原材料词辞典中的情况下(步骤S92:否),信息处理服务器10判定除了后缀以外的修饰语部分的词是否存在于公司名词辞典中(步骤S93)。具体而言,作为使用针对所取得的修饰语部分的特征信息的一例,信息处理服务器10的系统控制部14参照分类辞典DB12h的公司名词辞典(特征信息的一例),判定除了后缀以外的修饰语部分的词是否存在于辞典中。
[0323]在除了后缀以外的修饰语部分的词存在于公司名词辞典中的情况下(步骤S93:是),信息处理服务器10将复合词分配给分类项目“公司名”。例如,在复合词为“〇〇公司制头盔”的情况下,被分配给分类项目“公司名”。
[0324]在除了后缀以外的修饰语部分的词不存在于公司名词辞典中的情况下(步骤S93:否),信息处理服务器10将复合词分配给分类项目“其他”。
[0325]在后缀不是“制”的情况下(步骤S90:否),信息处理服务器10判定后缀是否是“柄”(步骤S94)。具体而言,作为使用针对所取得的修饰语部分的特征信息的一例,信息处理服务器10的系统控制部14判定步骤S55中取得的后缀是否与后缀“柄”(特征信息的一例)相应。[0326]在后缀是“柄”的情况下(步骤S94:是),信息处理服务器10将复合词分配给分类项目“设计”。例如,在复合词为“迷彩柄头盔”的情况下,被分配给分类项目“设计”。
[0327]在后缀不是“柄”的情况下(步骤S94:否),信息处理服务器10判定后缀是否是“色”(步骤S95)。具体而言,作为使用针对所取得的修饰语部分的特征信息的一例,信息处理服务器10的系统控制部14判定步骤S55中取得的后缀是否与后缀“色”(特征信息的一例)相应。
[0328]在后缀是“色”的情况下(步骤S95:是),信息处理服务器10将复合词分配给分类项目“设计”。例如,在复合词为“白色头盔”的情况下,被分配给分类项目“设计”。
[0329]在后缀不是“色”的情况下(步骤S95:否),信息处理服务器10将复合词分配给分类项目“其他”。
[0330]当复合词的分配的处理结束后,信息处理服务器10进行步骤S57的处理。这样,信息处理服务器10作为复合词分类单元的一例进行工作,其使用利用分类辞典预先生成的分类模型和针对所取得的修饰语部分的特征信息,将包含基本词的复合词分配给分类项目。
[0331]另外,组合后缀和分类辞典的规则不限于图19,也可以使用其他组合或规则。并且,关于步骤S80、S83、S86、S89、S90、S94、S95的顺序,也可以颠倒顺序。但是,步骤S80?S82、步骤S83?S85、步骤S86?S88、步骤S90?S93的顺序不能变。
[0332]以上,根据本实施方式,取得作为基础的基本词、将该基本词作为被修饰语的复合词、用于对该复合词进行分类的分类项目、与作为用于对该复合词进行分类的线索的特征有关的特征信息(例如与后缀和分类辞典有关的信息),使用预先生成的分类模型(例如图19所示的规则)和所取得的特征信息,将包含基本词的复合词分配给所取得的分类项目(例如,针对复合词使用图19所示的规则,将复合词分配给分类项目),根据基本词取得包含与基本词相关联的多个要素的基本词关联信息(例如取得基于检索关键字的检索结果),根据该分类结果将基本词关联信息中包含的要素中的至少一部分分别分类到所述分类项目中的任意一方,输出该分类后的基本词关联信息,由此,由于根据分类项目对基本词关联信息进行分类,所以,与分类项目一起整理基本词关联信息的混合存在,能够进行用户易于观看的显示。
[0333]在存储将各个分类项目和规定的词关联起来的分类辞典,取得针对复合词的基本词的修饰语部分,参照特征信息数据库102取得将分类项目和规定的词关联起来的分类辞典,使用利用特征信息数据库102中存储的分类辞典预先生成的分类模型和针对所取得的修饰语部分的特征信息,将包含基本词的复合词分配给分类项目的情况下,能够通过分类辞典而高效地将复合词分配给分类项目。
[0334]在从所取得的修饰语部分取得后缀,使用利用特征信息数据库102中存储的分类辞典预先生成的分类模型和针对除了后缀以外的修饰语部分的特征信息,将包含基本词的复合词分配给分类项目的情况下,能够通过规定规则而高效地将复合词分配给分类项目。
[0335]在根据规定的词在商品DB12a等的规定存储单元中出现的出现数来决定各个分类项目和该规定的词之间的关联,或者,通过从规定的存储单元中提取适于与该分类项目对应的提取模式的该规定的词来决定分类项目和该规定的词之间的关联,生成分类辞典的情况下,能够构建适于规定存储单元的分类辞典。[0336]并且,在根据基本词生成复合词的候选并从候选中决定复合词的情况下,能够根据所生成的候选生成更加适当的复合词。
[0337]并且,在求出将所生成的复合词的候选包含在商品的说明书中经营该商品的经营店的数量,根据该经营店的数量决定复合词的情况下,能够生成在由信息处理服务器10运营的购物网站上和网络上通用使用的更加适当的复合词。
[0338]在根据基本词在查询记录DB12j这样的规定的存储单元中出现的出现数(例如出现频度Nkl,k2)来决定复合词的情况下,能够根据在购物网站上和网络上通用使用的基本词生成更加适当的复合词。
[0339]在取得与基本词不同的其他词,组合基本词和其他词来生成复合词的候选的情况下,能够生成更加适当的复合词。组合基本词和其他词而生成多个复合词的候选,能够根据该候选而缩小为更加适当的复合词。进而,当组合基本词、其他词以及中间文字时,能够生成更多的复合词的候选。
[0340]另外,在店铺终端装置20中,在登记商品时,在检查要登记的商品名是否适当或求出关联商品的适当商品名时,能够使用本实施方式。从店铺终端装置20向信息处理服务器10发送基本词,信息处理服务器10在S4中决定复合词。然后,信息处理服务器10将S4中决定的复合词发送到店铺终端装置20。在店铺终端装置20的显示部23中显示复合词。
[0341]另外,在步骤S73中,在计算出现频度Nkl,k2时,作为规定存储单元的一例,代替查询记录DB12j,信息处理服务器10的系统控制部14也可以求出将商品DB12a中的基本词和其他词作为检索关键字(例如“头盔自行车”)的符合件数,设为出现频度Nkl,k2。
[0342]并且,在求解出现频度Nkl,k2和经营店的数Mkl,s,k2时,不限于信息处理服务器10的购物网站,也可以求解网络3上的出现频度和经营店的数量。例如,在网络3上求解经营店的数量的情况下,可以利用“自行车用头盔”检索复合词的候选,对销售商品的URL进行计数。
[0343]并且,在步骤S72中,信息处理服务器10的系统控制部14也可以求出将所生成的复合词的候选作为检索关键字的检索的符合件数。检索的符合件数可以是商品DB12a中的符合件数,也可以是网络3上的符合件数。信息处理服务器10的系统控制部14用该符合件数代替Mkl,s,k2,计算Score (kl, s,k2)。并且,也可以根据该符合件数、出现频度Nkl,k2、经营店的数量Mkl,s,k2来计算Score (kl,s,k2)。
[0344]在根据将所生成的复合词的候选作为检索关键字的检索的符合件数来决定复合词的情况下,能够决定在购物网站上和网络上通用使用的复合词,能够生成更加适当的复合词。
[0345]并且,信息处理服务器10的系统控制部14也可以参照查询记录DB12j,例如从作为基本词而存储的“自行车用头盔” “儿童用头盔”中提取其他词“自行车” “儿童”。
[0346]并且,也可以将包含基本词“头盔”的查询记录DB12j的基本词作为复合词。例如,信息处理服务器10的系统控制部14从基本词“头盔”中提取查询记录DB12j的基本词的区域中存储的“自行车用头盔” “儿童用头盔”作为复合词的候选。
[0347][5.显示的变形例]
[0348]接着,使用图20和图21对显示的变形例进行说明。
[0349]图20和图21是示出基于信息处理服务器10的显示的变形例的示意图。[0350](5.I显示的第I变形例)
[0351]首先,使用图20对显示的第I变形例进行说明。
[0352]如图20所示,信息处理服务器10也可以生成与基本词相关联的专集页即网页50。网页50具有基本词名50a、分类项目名50b、复合词的名称50c、每个商品的图像50d。基本词名50a表不基本词。分类项目名50b表不从多个分类项目中选择出的一个分类项目。复合词的名称50c表不与基本词相关联的复合词。商品的图像50d是和与基本词相关联的复合词对应的商品的图像。
[0353]信息处理服务器10在步骤SlO或步骤S50中,例如取得一个设定的“自行车”作为基本词(基本词名50a)。
[0354]信息处理服务器10在步骤S15或步骤S56中,从分配了与基本词相关联的复合词的分类项目中设定I个分类项目(分类项目名50b)。
[0355]接着,信息处理服务器10根据与所设定的I个分类项目相关联的复合词(复合词的名称50c),如图20所示,针对基本词名50a和分类项目名50b,生成配置有复合词的名称50c和商品的图像50d的网页50。信息处理服务器10在网页50中配置复合词的名称(商品名)50c和商品的图像50d。另外,复合词的名称50c和商品的图像50d对应于基本词关联信息中包含的要素。并且,基本词“自行车”也可以是近义词“脚踏车”。
[0356](5.2显示的第2变形例)
[0357]接着,使用图21对显示的第2变形例进行说明。
[0358]如图21所示,信息处理服务器10也可以生成便携终端用的网页51。信息处理服务器10在步骤SlO或步骤S50中,取得网页51中输入的检索关键字作为基本词。
[0359]在将复合词分配给分类项目后,信息处理服务器10在步骤S16或步骤S57中,根据检索关键字进行检索并取得检索结果。
[0360]信息处理服务器10在步骤S17或步骤S58中,按照不同分类项目生成便携终端用的网页51。在网页51中,按照分类项目(分类项目名51a)配置符合的商品的图像51b。当触摸或敲击商品的图像51b时,显示基于与该分类项目对应的复合词的检索结果。
[0361]如图21所示,在显示部较窄的情况下,能够根据与分类项目对应的复合词对用户示出最大的显示,用户的便利性提高。
[0362]进而,本发明不限于上述各实施方式。上述各实施方式是例示性的,具与本发明的权利要求范围所记载的技术思想实质上相同的结构且发挥相同作用效果的任意的实施方式也包含在本发明的技术范围内。
[0363]标号说明
[0364]1:信息处理系统;3:网络;5:检索服务器;10:信息处理服务器(信息处理装置);12:存储部;12a:商品DB (规定的存储单元);12b:店铺DB (规定的存储单元);12d:复合词DB (复合词存储单元);12e:分类项目DB (分类项目存储单元);12f:LSP/DB (特征信息存储单元);12g:后缀DB (特征信息存储单元);12h:分类辞典DB (特征信息存储单元);121:学习用DB (分类项目存储单元);12j:查询记录DB (规定的存储单元);102:特征信息数据库(特征信息存储单元);14c:RAM ;20:店铺终端装置;30:用户终端装置;40、50、51:网页(基本词关联信息、检索结果信息);41:关联商品区域(第2检索结果);42:分类项目区域;42a、50b:分类项目名;42b、51b:商品的图像;42c:修饰语部分的名称;43:检索结果区域(第I 检索结果的一部);50a:基本词名;50c:复合词的名称。
【权利要求】
1.一种信息处理装置,其特征在于具有: 基本词取得单元,其取得作为基础的基本词; 复合词取得单元,其从复合词存储单元取得将由所述基本词取得单元取得的基本词作为被修饰语的复合词; 分类项目取得单元,其参照分类项目存储单元取得用于对由所述复合词取得单元取得的复合词进行分类的分类项目; 特征信息取得单元,其参照特征信息存储单元取得特征信息,该特征信息与作为用于对由所述复合词取得单元取得的复合词进行分类的线索的特征有关; 复合词分类单元,其使用预先生成的分类模型和由所述特征信息取得单元针对由所述复合词取得单元取得的复合词取得的特征信息,将包含所述基本词的所述复合词分配给由所述分类项目取得单元取得的分类项目; 基本词关联信息取得单元,其根据所述基本词取得包含与基本词相关联的多个要素的基本词关联信息; 基本词关联信息分类单元,其根据所述复合词分类单元的分类结果,将由所述基本词关联信息取得单元取得的基本词关联信息中包含的要素中的至少一部分分别分类到所述分类项目中的任意一方;以及 输出单元,其输出由所述基本词关联信息分类单元进行分类后的基本词关联信息。
2.根据权利要求1所述的信息处理装置,其特征在于还具有: 特征矢量生成单元,其针对复合词,使用特征信息生成该复合词的特征矢量; 学习用复合词取得单元,其取得学习用的复合词; 学习用分类项目取得单元,其取得与由所述学习用复合词取得单元取得的学习用的复合词对应的学习用的分类项目;以及 分类模型构建单元,其使用由所述特征矢量生成单元生成的学习用的复合词的特征矢量和由所述学习用分类项目取得单元取得的学习用的分类项目进行机器学习,构建所述分类模型,其中,该学习用的复合词是由所述学习用复合词取得单元取得的; 所述特征矢量生成单元针对由所述复合词取得单元取得的复合词,使用所述特征信息生成该复合词的特征矢量, 所述复合词分类单元使用由所述分类模型构建单元构建的分类模型和由所述复合词取得单元取得的复合词的特征矢量,将包含所述基本词的所述复合词分配给所述分类项目。
3.根据权利要求1所述的信息处理装置,其特征在于还具有修饰语部分取得单元,该修饰语部分取得单元取得所述复合词的针对所述基本词的修饰语部分, 所述特征信息存储单元存储将各个所述分类项目和规定的词关联起来的分类辞典,所述特征信息取得单元参照所述特征信息存储单元取得将各个所述分类项目和规定的词关联起来的分类辞典, 所述复合词分类单元使用利用所述特征信息存储单元中存储的分类辞典而预先生成的分类模型和针对由所述修饰语部分取得单元取得的修饰语部分的所述特征信息,将包含所述基本词的所述复合词分配给所述分类项目。
4.根据权利要求3所述的信息处理装置,其特征在于还具有后缀取得单元,该后缀取得单元从所述修饰语部分取得单元所取得的修饰语部分取得后缀, 所述复合词分类单元使用利用所述特征信息存储单元中存储的分类辞典而预先生成的分类模型和针对除了由所述后缀取得单元取得的后缀以外的所述修饰语部分的所述特征信息,将包含所述基本词的所述复合词分配给所述分类项目。
5.根据权利要求3或4所述的信息处理装置,其特征在于还具有分类辞典生成单元,该分类辞典生成单元根据规定的词在规定的存储单元中出现的出现数来决定各个所述分类项目与该规定的词之间的关联,或者,通过从规定的存储单元中提取适合于与各个所述分类项目对应的提取模式的该规定的词来决定各个所述分类项目与该规定的词之间的关联,生成所述分类辞典。
6.根据权利要求1?5中的任意一项所述的信息处理装置,其特征在于还具有: 分类项目输出单元,其为了使用户从通过所述复合词分类单元分配了所述复合词的分类项目中选择特定的分类项目,将分配了所述复合词的分类项目输出到用户终端装置;以及 用户选择结果取得单元,其从所述用户终端装置取得所述分类项目的选择结果, 所述基本词关联信息分类单元根据所述复合词分类单元的分类结果,将根据所述基本词和由所述用户选择结果取得单元取得的所述分类项目的选择结果而取得的基本词关联信息中包含的要素中的至少一部分分别分类到所述分类项目中的任意一方。
7.根据权利要求1?6中的任意一项所述的信息处理装置,其特征在于, 所述基本词取得单元从用户终端装置取得检索关键字作为所述基本词, 所述基本词关联信息取得单元取得根据所述检索关键字进行了检索的检索结果, 所述基本词关联信息分类单元根据所述复合词分类单元的分类结果,将由所述基本词关联信息取得单元检索到的检索结果中包含的要素中的至少一部分分别分类到所述分类项目中的任意一方。
8.根据权利要求1?7中的任意一项所述的信息处理装置,其特征在于还具有: 复合词候选生成单元,其由所述基本词生成所述复合词的候选;以及 复合词决定单元,其从所述候选中决定所述复合词, 所述复合词取得单元取得由所述复合词决定单元决定的复合词。
9.根据权利要求8所述的信息处理装置,其特征在于, 所述复合词决定单元求出将由所述复合词候选生成单元生成的复合词的候选包含在商品的说明书中经营该商品的经营店的数量,根据该经营店的数量决定所述复合词。
10.根据权利要求8或9所述的信息处理装置,其特征在于, 所述复合词决定单元根据所述基本词在规定的存储单元中出现的出现数,决定所述复合词。
11.根据权利要求8?10中的任意一项所述的信息处理装置,其特征在于, 所述复合词决定单元根据将由所述复合词候选生成单元生成的复合词的候选作为检索关键字的检索的符合件数,决定所述复合词。
12.根据权利要求8?11中的任意一项所述的信息处理装置,其特征在于, 所述复合词候选生成单元组合所述基本词和不同于该基本词的词,生成所述候选。
13.根据权利要求1?12中的任意一项所述的信息处理装置,其特征在于还具有:检索结果取得单元,其取得将所述基本词作为检索关键字的第I检索结果和将所述复合词作为检索关键字的第2检索结果;以及 检索结果信息生成单元,其生成检索结果信息,使得在显示单元的画面上区别显示由所述检索结果取得单元取得的所述第I检索结果中的至少一部分和第2检索结果。
14.根据权利要求13所述的信息处理装置,其特征在于, 所述检索结果信息生成单元生成检索结果信息,使得显示从所述第I检索结果中除去所述第2检索结果的部分后的检索结果,作为所述第I检索结果中的至少一部分。
15.一种信息处理装置的信息处理方法,该信息处理装置进行信息处理,该信息处理方法的特征在于包括: 基本词取得步骤,取得作为基础的基本词; 复合词取得步骤,从复合词存储单元取得将所述基本词取得步骤中取得的基本词作为被修饰语的复合词; 分类项目取得步骤,参照分类项目存储单元取得用于对所述复合词取得步骤中取得的复合词进行分类的分类项目; 特征信息取得步骤,参照特征信息存储单元取得特征信息,该特征信息与作为用于对所述复合词取得步骤中取得的复合词进行分类的线索的特征有关; 复合词分类步骤,使用预先生成的分类模型和在所述特征信息取得步骤中针对所述复合词取得步骤中取得的复合词取得的特征信息,将包含所述基本词的所述复合词分配给所述分类项目取得步骤中取得的分类项目;` 基本词关联信息取得步骤,根据所述基本词取得包含与基本词相关联的多个要素的基本词关联信息; 基本词关联信息分类步骤,根据所述复合词分类步骤的分类结果,将所述基本词关联信息取得步骤中取得的基本词关联信息中包含的要素中的至少一部分分别分类到所述分类项目中的任意一方;以及 输出步骤,输出所述基本词关联信息分类步骤中进行分类后的基本词关联信息。
16.一种信息处理装置用程序,其特征在于,其使计算机作为以下单元进行工作: 基本词取得单元,其取得作为基础的基本词; 复合词取得单元,其从复合词存储单元取得将由所述基本词取得单元取得的基本词作为被修饰语的复合词; 分类项目取得单元,其参照分类项目存储单元取得用于对由所述复合词取得单元取得的复合词进行分类的分类项目; 特征信息取得单元,其参照特征信息存储单元取得特征信息,该特征信息与作为用于对由所述复合词取得单元取得的复合词进行分类的线索的特征有关; 复合词分类单元,其使用预先生成的分类模型和由所述特征信息取得单元针对由所述复合词取得单元取得的复合词取得的特征信息,将包含所述基本词的所述复合词分配给由所述分类项目取得单元取得的分类项目; 基本词关联信息取得单元,其根据所述基本词取得包含与基本词相关联的多个要素的基本词关联信息; 基本词关联信息分类单元,其根据所述复合词分类单元的分类结果,将由所述基本词关联信息取得单元取得的基本词关联信息中包含的要素中的至少一部分分别分类到所述分类项目中的任意一方;以及 输出单元,其输出由所述基本词关联信息分类单元进行分类后的基本词关联信息。
17.一种以计算机可读取的方式记录了信息处理装置用程序的记录介质,其特征在于,该信息处理装置用程序使计算机作为以下单元进行工作: 基本词取得单元,其取得作为基础的基本词; 复合词取得单元,其从复合词存储单元取得将由所述基本词取得单元取得的基本词作为被修饰语的复合词; 分类项目取得单元,其参照分类项目存储单元取得用于对由所述复合词取得单元取得的复合词进行分类的分类项目; 特征信息取得单元,其参照特征信息存储单元取得特征信息,该特征信息与作为用于对由所述复合词取得单元取得的复合词进行分类的线索的特征有关; 复合词分类单元,其使用预先生成的分类模型和由所述特征信息取得单元针对由所述复合词取得单元取得的复合词取得的特征信息,将包含所述基本词的所述复合词分配给由所述分类项目取得单元取得的分类项目; 基本词关联信息取得单元,其根据所述基本词取得包含与基本词相关联的多个要素的基本词关联信息; 基本词关联信息分类单元,其根据所述复合词分类单元的分类结果,将由所述基本词关联信息取得单元取得的基本词关联信息中包含的要素中的至少一部分分别分类到所述分类项目中的任意一方;以及 输出单元,其输出由所述 基本词关联信息分类单元进行分类后的基本词关联信息。
【文档编号】G06F17/30GK103443792SQ201380000869
【公开日】2013年12月11日 申请日期:2013年1月30日 优先权日:2012年3月12日
【发明者】新里圭司 申请人:乐天株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1