基于用户意图的信息搜索方法以及信息提供方法

文档序号:6595769阅读:270来源:国知局
专利名称:基于用户意图的信息搜索方法以及信息提供方法
技术领域
本发明涉及能够基于自然语言的作为关键字的单词、短语以及句子来提供并搜索信息以及能够基于用户的意图来更为精确地提供并搜索信息的多功能搜索方法及系统。
背景技术
近年来,开发对信息及内容提供者、消费者的扩大以及各种信息提供媒体进行融合的技术的需求正在加大。典型的融合技术的示例可包括对有线和无线广播及通信技术、 综合信息网络服务技术以及便于各个用户层的用户接口技术开发进行融合的融合技术。在该技术的详细内容中,期望开发信息市场技术,以满足信息内容的用户的口味和意图,并通过自动分析特性以及对所提供的内容及信息或将由计算机提供的内容及信息进行语意分析,通过方便和不同的方法来建议和提供信息内容。例如,公开号为10-2006-0043333 的韩国专利申请(SYSTEM AND METHOD FOR DETERMINING INTENTION OF DATA AND RESPONDING TO DATA BASED ON INTENTION)公开了一种便于数据处理的系统。该系统是包括数据管理器和用于接收数据的组件的系统,所述数据管理器用于确定所述数据的意图、基于该意图来至少对数据子集进行重新系统化以及将重新系统化后的数据自动提供给用户。该数据管理器为用于分析所述数据、将所述数据分类成具有相关特征的至少一个组、从至少一个数据组中提取特征以形成数据子集的系统。可选地,所述数据管理器是使用元数据、属性、内容、上下文、关键字、历史、试探法、推理、规则、划分(damarcation)、时间、日期、相关处理成本、相关处理收益以及数据源中的至少一者来促成数据分析的系统,其中至少部分地基于语法结构、语法属性、语言结构以及语言属性来提取所述特征。所述语言特征是包括根据句子生成的单词、根据句子生成的双单词(word bigram)以及根据句子生成的三单词(word trigram)中的至少一者的系统。公开号为2002-0028593 的韩国专利申请(METHOD FOR ISOLATING HARMFUL WORD) 公开了一种用于隔离有害单词(harmful word)的方法,该方法包括允许计算机用户输入会员信息并访问管理服务器,允许计算机用户输入用于注册/传送的信息至所述管理服务器所显示的信息输入屏幕,允许用于将有害单词与管理服务器相隔离的模块确定有害单词是否包含在计算机用户输入的信息中,以及允许管理服务器根据用于隔离有害单词的模块的判断结果来隔离与计算机用户的连接或注册/传送信息。假定所述有害单词指的是行话(jargon)、俚语、涉及性隔离或性格隔离的单词,则公开号为2002-0028593的韩国专利申请包括在所传送的消息不包括这些有害单词时连续执行聊天的处理模块。公开号为的 2002-0028593的韩国专利申请是以聊天中的消息是否包括有害单词为基础的。公开号为10-2006-0062300 的韩国专利申请(MULTISTAGE TEXT FILTERING METHOD FOR ISOLATING HARMFUL SITE)公开了一种用于隔离有害站点的多级文本过滤方法,该方法包括根据淫秽程度及文本将要被用作用于隔离色情站点的数据的所述文本划分为至少一个组,之后对所述文本进行数据库处理;从访问网站收集所述文本;以及通过将所述文本与所述组内的文本进行比较以确定所述访问网站是否被隔离,来执行至少一个多级过滤,从而根据所述文本中的淫秽程度对有害站点进行隔离。公开号为10-2006-0062300 的韩国专利申请(A SYSTEM AND METHOD FOR PROVIDING IMPROVED SPAM MESSAGE FILTERING)公开了一种用于提供垃圾消息过滤的方法,该方法包括无线网络服务器接收将从呼叫方终端传送到用户终端的消息;语料库DB 存储自然语言句子及其附属信息的使用示例,且为大型语言DB(数据库);词汇分析单元检测所述无线网络服务器内的消息的接收,并从包含在接收到的消息中的句子中提取至少一个名词型关键字;语料库搜索装置选择被提取的名词型关键字中的至少一个名词型关键字,并搜索在包含在所述语料库DB的每个用户类别中的每个句子内的垃圾信息使用频率以及在包含在用户类别之外的类别中的句子中的基本使用频率;当至少一个垃圾信息使用频率以及基本使用频率被输入时,概率计算单元计算包含所选名词型关键字的句子被包含于用户类别中的概率;以及过滤控制器控制所述词汇分析单元和语料库搜索装置以使得所述概率计算单元计算每一名词型关键字被包含于垃圾消息内的概率,判断接收到的消息是否为垃圾消息,并将判断结果传送至无线电网络服务器。公开号为10-2008-0000416 的韩国专利申请(FILTERING SYSTEM FOR HARMFUL MES SAGE AND METHOD THEREOF AND RECORDING MEDIUM THEREOF)公开了一种利用用于对网络社区上的有害消息进行过滤的过滤系统来对有害消息进行分类的技术领域。该专利申请提供的方法能够通过提供智能垃圾过滤技术,来在反垃圾市场内实现高的适销性。针对有害消息的过滤系统包括数据库,用于存储接收自客户端的消息;消息接收器,用于接收所述消息;单词提取单元,用于从接收到的消息中提取多个单词;以及评估单元,用于通过使用所提取的单词来判断所述消息是否有害,并将其存储于数据库中,并且所述评估单元使用存储在所述数据库中的单词评估值来判断所述消息是否为有害消息,之后该消息被分类为多个有害消息。注册号为10-0484944 的韩国专禾U (SYSTEM FOR AUTOMATICALLY TAGGING SEMANTICS OF MORPHEME BASED ON LOCAL SYNTAX RELATION AND SEMANTIC CO-OCCURRENCE DICTIONARY)公开了一种基于本地短语关系以及语义共现(cooccurrence)目录的自动语素语义标记系统,该系统包括短句识别器,用于通过使用基本语法生成规则、从属语法规则、电子语素语意目录、语义框架以及经由对原始句子的语素分析生成的可变格短语共现目录,来对短句进行识别;助词格恢复模块,用于通过使用语义框架以及可变格短语语义共现目录,来执行针对助词的格恢复;争议名词(argument noun)语意确定模块,用于通过使用可变格短语语义共现目录来确定争议名词的语意;名词短语语意确定模块,用于通过使用名词短语语意共现目录(由名词/介词/名词以及名词/名词共现信息配置而成)来确定名词短语和复合名词内的名词的语意。自动语素语义标记系统使用语言方面的语法结构信息来使用语法上下文信息(其是比现有的其他语义歧义装置更为精确的共现信息),从而提出了一种用于解决名词的语意歧义的方法。注册号为10-0757951 的韩国专利(SEARCH METHOD USING MORPHEME ANALYZING IN WEB PAGE)公开了一种通过对网页进行语素分析的搜索方法,该方法包括如果客户端用户通过分页式浏览器(tab browser)连接至网站,则将所连接的网站的内容显示给该分页式浏览器;通过由分析服务器对显示至客户端的分页式浏览器的内容执行上下文语素分析,来辨别重复句子或单词的频率;从被识别的单词中选择具有预定频率值或更高频率值的句子及单词作为关键字(即,很重要的单词);输出所选的重要单词作为每一分页式浏览器的标题;对将每一分页式浏览器的标题作为入口网站的查询字进行搜索,并将搜索结果作为每一分页式浏览器的内容进行输出;在分析服务器中,提供信息至客户端(诸如,笔记本、移动电话、PDA等)。该专利利用搜索系统的一种方法论,通过语素处理,来计算句子及单词出现于文本内的次数,将分页式浏览器标题作为关键字进行输出。注册号为10-0691400 的韩国专利(METHOD FOR ANALYZING MORPHEME USING ADDITIONAL INFORMATION AND MORPHEME ANALYZER FOR EXECUTING THE METHOD)公开了一种用于分析语素的方法,该方法包括从索引数据中获取语素分析对象以及与该语素分析对象相关联的附加信息;基于该附加信息,生成关键点(key);以及使用该关键点对语素分析对象执行语素分析。公开号为10-2007-0029389 的韩国专利申请(METHOD AND SYSTEM FOR PROVIDING ADVERTISEMENT SERVICE USING CORE KEYWORD AND RECORD MEDIA RECORDED PROGRAM FOR REALIZING THE SAME)公开了一种记录介质,该记录介质可由数字处理装置读取,且其上实施有命令字,该命令字可由数字处理装置执行以通过使用核心关键字来提供关键字广告服务,包括通过分析内容文本的语素来提取关键字;通过与广告关键字DB服务器进行交互, 确定核心关键字;通过与广告DB服务器进行交互,接收与所述核心关键字相匹配的广告列表;以及将包含于该广告列表内的至少一广告插入至所述内容文本中。公开号为10-2006-0011333 的韩国专利申请(SYSTEM AND METHOD FOR PROVIDING LOCAL INFORMATION BY MESSAGE ANALYSIS)公开了一种用于提供本地信息的系统,该系统包括数据库,用于存储每一区域及商业类型的广告信息;消息识别单元,用于分析存储的短消息或存储的文本消息;语音识别单元,用于分析存储的语音消息;位置信息收集单元, 用于检查订阅者终端的当前位置;服务控制器,用于向消息识别单元及语音识别单元请求与服务订阅者相关的消息是否已被存储,检查接收到的消息分析结果,向位置信息收集单元请求订阅者终端的当前位置信息,以及根据消息分析结果向订阅者终端提供期望的商业类型及区域信息;以及SMS生成单元,用于从数据库搜索信息,将搜索结果添加至短消息中,并将其传送至订阅者终端。公开号为10-2007-0015752 的韩国专利申请(SYSTEM AND METHOD FOR AD TRIGGERING MESSAGING SERVICE BASED ON MOBILE MESSAGING SERVICE)公开了一种用于 AD触发消息服务的系统,该系统包括消息服务器,用于在通过对传送自呼叫方终端的消息进行分析而检测到AD触发标识符时,在将预定AD消息传送至呼叫方终端之后,传送消息内容至接收终端。注册号为10-0775680 的韩国专禾U (METHOD AND SYSTEM FOR PROVIDING ADVERTISEMENT CONTENTS BY USING CHATTING IN MOBILE TERMINAL)公开了一种用于通过无线通信网络来在移动通信终端与服务器之间通过messager (—种聊天软件)收发消息的方法,该方法包括判断连接至服务器的移动通信终端是否从聊天伙伴中选择任何虚拟聊天伙伴;根据移动通信终端的用户偏好信息来在服务器中提取AD内容产品的聊天场景,以根据场景规则来将消息传送至移动通信终端;传送移动通信终端中的针对所述服务器的消息的响应消息;对在服务器内接收到的移动通信终端的消息进行分析,并根据用户的意图以及场景规则来传送请求AD内容信息推荐许可的消息至移动通信终端;当从所述移动通信终端向服务器传送允许AD内容信息推荐的消息时,传送AD内容信息至移动通信终端;以及在服务器内,在传送消息至移动通信终端之前,通过对移动通信终端的消息进行分析,来将messager的特征状态调整成与用户的意图相对应。注册号为10-05974 的韩国专禾U (SYSTEM AND METHOD FOR CLASSIFYING QUESTION BASED ON HYBRID OF INFORMATION SEARCH AND QUESTION ANSWER SYSTEM)公开了一种基于信息搜索及问答系统的混合来对问题进行分类的系统及方法,其包括被问化名(questioned work name)处理器,用于识别包含于所输入问题内的化名;问题语言分析器,用于通过语素分析过程、对象名称识别过程以及单词语意标记过程,来将每一单词转换为语义代码;基于规则的问题分类器,用于通过使用问题的LSP(词汇语法模式)代码以及预定义问题分类规则,来对问题所请求的答案类型进行分类;基于统计的问题分类器,用于通过使用在标记答案类型的学习文档中构建的统计信息,来对问题的LSP代码进行分类; 以及被问答案类型确定器,用于通过使用上述两个分类器的结果,来最终确定用户问题的答案类型。注册号为10-0361166 的韩国专禾U (SYSTEM AND METHOD FOR SEARCHING INFORMATION)公开了一种用于搜索信息的系统及方法,其包括处理装置,该处理装置在数据库(该数据库根据领域来对多个信息进行分类,将代码分配至每一分类领域,并结合每一领域的代码来对表示包含于相应领域内的多个信息的单词进行编码)通过使用通信装置、经由网络访问用户搜索数据之后,当输入表明待搜索的信息或相应信息所属的领域的单词时,对输入单词进行编码,并基于编码后的单词来对数据库进行搜索以搜索与该编码单词相对应的信息。其中存储于数据库内的信息被分类为多个信息区,每一信息区被分配有信息分类代码,该信息分类代码被分类至至少一个详细信息区中,结合相应信息区的信息分类代码来对该详细信息区进行编码,表示相应信息的多个单词内相互之间具有相同或类似语意的单词由同一代码进行存储,以系序(set order)来对每一字代码进行排列。公开号为10-2005-00拟955 的韩国专利申请(SYSTEM AND METHOD FOR ONLINE AD INCLUDING COPY OF ADVERTISER FIT FOR CONTENTS)公开了一种用于进行在线广告的系统及方法,其包括第一存储装置,用于存储将被广告的信息;第二存储装置,用于存储原始内容;至少一个服务器,用于从所述第二存储装置获取原始内容,通过自然语言处理机制对该原始内容进行分析,从所述第一存储装置获取与分析结果相对应的将被广告的信息,并将广告信息中的词性(part)信息插入所述原始内容中;以及第三存储装置,用于通过所述至少一个服务器来对插有广告信息的内容进行存储。注册号为10-0669534 的韩国专利(METHOD AND SYSTEM FOR EXTRACTING SUMMARY OF DOCUMENT BY UTILIZING SENTENCE ABSTRACTION AND ABDUCTION RULES)公开了一种通过使用句子抽象及逆推规则来对文档进行概括的方法,其包括句子输入,用于输入并存储将被概括的文档内容;语法分析,用于对所述步骤内存储的数据的语法进行分析并存储; 句子主要成分提取,用于在该步骤处顺序读取语法数据,并存储本体数据;句子抽象化,用于通过将所述步骤处的本体数据值与识别上限信息(该识别上限信息为针对包含于每一所选主要成分内的语意的预定分类参考)进行比较,将每一所选主要成分理解为抽象语意;主题句选择,用于在所述步骤处读取被存储的值,并将读取的存储值输入至逆推规则程序可移动装置单元中,以选择语法之间具有逆推性的多个主题句,并存储该多个所选主题句的每一识别值;概要写入,用于在所述步骤处读取针对被存储并被选择的主要成分而理解的抽象语意的相应值,并将读取的值作为语法概要句子进行组合和存储;概要句子输出, 用于确定是否存在输出控制信号,如果存在,则在该步骤处通过输出单元的操作来输出并显示存储的数据值。注册号为10-0836878 的韩国专利(APPARATUS AND METHOD FOR ALLOCATION OF SUBJECT OR FIELD IN INFORMATION SEARCH SYSTEM)是用于在信息搜索系统内分配主题或字段的设备,所述信息搜索系统连接至用户终端、网络入口站点、网站,对信息进行搜索并提供搜索到的信息,信息搜索服务器包括搜索引擎,用于基于与查询字或文档相对应的索引字来对文档执行信息搜索;数据库,用于对搜索引擎搜索到的信息进行存储和管理; 同义词匹配单元,用于从存储于所述数据库内的原始句子中提取所述索引字,并通过该索引字执行同义词匹配,以对所述原始句子执行主题或域分配;分众分类(folksonomy)处理器,用于从存储于所述数据库内的定义句子中提取术语,通过提取的术语来分配所述主题并使用分众分类法来分配域。此外,大型信息搜索门户网站(诸如,谷歌、雅虎等)所使用的信息搜索系统是以搜索键类型的“单词”单元为基础的。虽然可执行“短语”输入,但当前技术通过逻辑运算符 (与、或、非)而非通过根据高技术“短语”的语言处理方法来连接基于N元语法的索引键, 以给出搜索结果,从而在改善信息搜索的再生及精确性方面存在局限性。特别地,“移动信息搜索”技术已作为下一代信息搜索领域而崭露头角,并且正在提出并讨论作为“语义网” 技术飞新的网络搜索技术。然而,截至目前为止,并不存在具体的成功示例。

发明内容
本发明被设计为解决上述问题。本发明的目标为提供用于搜索多功能综合信息 (integration information)的方法及系统,该方法及系统能够通过将单词单元用作关键字来扩展信息搜索系统内的短语单元及句子单元内的搜索键,以使信息搜索系统的用户界面更为便利,并且能够执行多功能综合处理(诸如信息的供应、搜索、分类、评估、监视等)。此外,本发明的另一目标为提供一种用于搜索多功能综合信息的方法及系统,该方法及系统能够检测信息搜索者或信息提供者的意图,并基于检测到的意图来提供信息结^ ο为实现上述目标,根据本发明的示例性实施方式,提供一种用于搜索信息的方法, 该方法包括通过使用针对关键字的分析结果来检测搜索者的意图;向所述搜索者提供符合所述搜索者的意图的编辑器;以及对具有与通过所述编辑器的输入项输入的元数据相关联的内容进行搜索。所述用于搜索信息的方法可进一步包括将输入的关键字分离为语意单词;以及对分离后的关键字执行语法分析,其中,对搜索者的意图进行检测可以通过使用执行所述语法分析时的语法分析结果来检测搜索者的意图。所述语法分析的执行可以输出语法表达式来作为语法分析结果,其中,可以通过分析句子内分离后的单词是否具有任何文法关系以及语义关联来获取所述语法表达式。所述语法表达式可为逻辑表达式、修饰-被修饰以及语法列表表达式中的至少一
者ο
所述语法分析的执行可参考语法文法规则字典,以分析句子内分离后的单词是否具有任何文法关系以及语义关联,且所述语法文法规则字典可列有短语结构文法、格文法、 敏感文法(sensitive grammar)以及词汇文法中的至少一者。所述分离可针对每个词性(part)来对所述关键字进行分离。所述分离可通过参考与每个单词的词性相关的信息来针对每个词性对所述关键字进行分离,所述信息以数据库方式存储于语素字典内。所述用于搜索信息的方法可进一步包括提取内容的符合搜索者意图的元数据,其中所述编辑器的提供可提供作为符合搜索者的意图的编辑器的编辑器,在该编辑器中,被提取的元数据成为输入项。所述用于搜索信息的方法可进一步包括通过参考信息提供者的意图来确定用于执行搜索的目录,其中所述搜索可对与所确定的目录相同或相似的目录中的内容进行搜索。所述关键字可为单词单元、短语单元以及句子单元中的任一者。所述搜索可对具有与通过所述编辑器的输入项输入的元数据中的至少一者相同的元数据、或具有与通过所述编辑器的输入项输入的元数据中的至少一者同义的元数据的内容进行搜索。所述用于搜索信息的方法可进一步包括在搜索时将附加服务添加至搜索结果。所述附加服务可为内容上下文认知服务,并且该内容上下文认知服务可包括以下各项中的至少一者导航服务、销售服务、广告服务、教育服务、咨询服务、推荐服务以及行政月艮务(administrative service)。所述编辑器的输入项中的至少一个输入项可以作为通过使用所述关键字生成的实际数据(real data)而被自动输入。所述用于搜索信息的方法可进一步包括通过将输入的元数据与用于配置被搜索内容的元数据进行比较,来分别选择并输出具有高度一致性的内容。根据本发明另一示例性实施方式,提供一种提供用于搜索的信息的方法,该方法包括通过使用针对包含于信息内的文本的分析结果,来检测提供所述信息的信息提供者的意图;将符合所述信息提供者的意图的编辑器提供给用户;以及将对通过所述编辑器的输入项输入的元数据进行整合的内容进行存储。所述提供用于搜索的信息的方法可进一步包括将包含于输入信息内的文本分离成语意单词;以及对分离后的关键字执行语法分析,其中对信息提供者的意图进行检测可以通过使用执行所述语法分析时的语法分析结果来检测提供信息的信息提供者的意图。所述语法分析的执行可以输出语法表达式来作为语法分析结果,其中,可以通过分析句子内分离后的单词是否具有任何文法关系以及语义关联来获取所述语法表达式。所述语法表达式可为逻辑表达式、修饰-被修饰以及语法列表表达式中的至少一者ο所述语法分析的执行可参考语法文法规则字典,以分析句子内分离后的单词是否具有任何文法关系以及语义关联,且所述语法文法规则字典可列有短语结构文法、格文法、 敏感文法以及词汇文法中的至少一者。所述分离可针对每个词性来对所述文本进行分离。
所述分离可通过参考与每个单词的词性相关的信息来将针对每个词性对所述文本进行分离,所述信息以数据库方式存储于语素字典内。所述提供用于搜索的信息的方法可进一步包括提取内容的符合信息提供者的意图的元数据,其中所述编辑器的提供可提供作为符合信息提供者的意图的编辑器的编辑器,在该编辑器中,被提取的元数据成为输入项。所述提供用于搜索的信息的方法可进一步包括通过参考信息提供者的意图来确定存储所述信息的目录,其中内容的存储可以将所述内容存储于所确定的目录内。所述提供用于搜索的信息的方法可进一步包括对包含于针对每一目录划分的内容内的文本进行收集,其中所述检测可使用对收集到的文本的分析结果。根据本发明的另一示例性实施方式,提供一种提供用于搜索的信息的方法,该方法包括对包含于针对每一目录划分的内容内的文本进行收集;通过使用针对收集到的文本的分析结果,来检测提供信息的信息提供者的意图;将符合信息提供者的意图的编辑器提供给用户;以及将对通过所述编辑器的输入项输入的元数据进行整合的内容进行存储。根据本发明的另一示例性实施方式,提供一种用于搜索信息的方法,该方法包括 接收关键字;接收输入所述关键字的搜索者的意图;将符合最终意图的编辑器提供给所述搜索者,所述最终意图整合了针对所述关键字的分析结果以及所述搜索者的意图;以及对具有与通过所述编辑器的输入项输入的元数据相关联的元数据的内容进行搜索。所述用于搜索信息的方法可进一步包括将输入的关键字分离成语意单词;以及对分离后的关键字执行语法分析,其中所述编辑器的提供可使用执行所述语法分析时的语法分析结果。根据本发明的另一示例性实施方式,提供一种提供用于搜索的信息的方法,该方法包括接收信息;接收输入所述信息的信息提供者的意图;将符合最终意图的编辑器提供给所述信息提供者,所述最终意图整合了针对所述信息的分析结果以及所述信息提供者的意图;以及将对通过所述编辑器的输入项输入的元数据进行整合的内容进行存储。所述提供用于搜索的信息的方法可进一步包括将输入的信息分离成语意单词; 以及对分离后的单词执行语法分析,其中所述编辑器的提供可以使用执行所述语法分析时的语法分析结果。如上所述,与现有的将“搜索单词”用作关键字,并通过将逻辑运算符与、或和非的组合用作所述关键字的扩展来搜索其他搜索单词的搜索方法相比,本发明的示例性实施方式可执行“短语”及“句子”级别的搜索,实现了信息的再现性及精确性。进一步地,本发明的示例性实施方式可根据提供者的意图来针对每一目录对信息提供者所提供的信息进行分类及存储,并通过检测信息搜索者的搜索意图来对存储于相应目录内的信息进行搜索,从而通过上下文认知信息供应/搜索提供了经双方同意的/定制的搜索服务。另外,本发明的示例性实施方式还针对每一内容来定义不同的元数据,并采用通过使用基于该元数据生成的编辑器来更为详细地对信息供应及搜索内容进行开发的方法, 从而相比于现有的搜索方法,能够更为方便且精确地执行搜索。此外,本发明的示例性实施方式从搜索者输入的信息来检测搜索者的意图、基于检测到的意图来推导详细的元数据输入以及使用输入的元数据,从而在符合搜索者意图的目录里执行搜索。进一步地,在本发明的示例性实施方式中,信息提供者或搜索者可更为方便地输入元数据,并可在输入哪种类型的元数据方面接收引导,从而提高了输入的方便性。另外,本发明的示例性实施方式可以基于信息提供者的意图来对针对每一目录的相应信息进行划分,且可以对相应的元数据进行匹配和存储。同时,本发明的示例性实施方式可从搜索者输入的信息来检测搜索者的意图,并基于检测到的意图来推导详细元数据的输入,从而可自动输入生成实际数据的元数据。进一步地,本发明的示例性实施方式可直接输入信息提供者及信息搜索者的意图,以更为精确地检测信息提供者及信息搜索者的意图,从而精确地提供并搜索信息。另外,本发明的示例性实施方式可通过使用PC或移动电话等来将候选人的宣传资料发布给投票者,从而可通过使用目前使用成本很低的宣传纸来迅速地提供候选人的宣传资料。


图1为示出了根据本发明示例性实施方式的搜索系统的图示;图2为示出了内容的元数据的图示;图3为示出了韩文语素字典的图示;图4为用于对将短语/句子处理成语素并之后执行语法分析的过程进行解释的图示;图5为用于对根据本发明另一示例性实施方式的搜索方法进行解释的流程图;图6为用于对根据本发明另一示例性实施方式的搜索方法进行解释的流程图;图7为用于对地理导航服务进行解释的图示,该地理导航服务作为存储于附加服务数据库内且生成自附加服务生成器的附加服务的示例,并且是一种上下文认知搜索服务;图8为用于对提供不同于图7所示类型的附加服务的方法进行解释的图示;图9为示出了将信息搜索窗口及信息提供窗口提供在一起的信息提供/搜索窗口的示例的图示;图10为示出了根据本发明另一示例性实施方式的搜索系统的图示;图11和图12为用于对根据本发明另一示例性实施方式的搜索方法进行解释的图示;图13为用于对根据本发明另一示例性实施方式的搜索方法进行解释的图示;图14-图16为用于对图13所示的搜索方法进行附加解释的图示;图17为示出了根据本发明另一示例性实施方式的搜索系统的图示;图18为用于对根据本发明另一示例性实施方式的搜索系统进行解释的图示;图19为用于对根据本发明另一示例性实施方式的搜索系统进行解释的图示;图20为示出了应用于宣传候选人以进行电子投票的示例的图示。参考标记及符号说明101 信息搜索窗口102:关键字输入装置
103 关键字语素处理器104 关键字语法分析器105 搜索者意图检测器106 信息监视器107 用于搜索的元数据提取器108 用于搜索的编辑器109:搜索目录确定装置110 搜索装置111:元数据比较器112:附加服务数据库113:附加服务生成器114:搜索结果生成器115:信息存储单元116:存储目录确定装置117:信息提供编辑器118 信息提供元数据提取器119:元数据 DB120 信息提供者意图检测器121 信息监视器122 信息语法分析器123 语法文法规则字典124 信息语素处理器125 语素字典126 信息输入装置127:信息提供窗口128 信息数据库129 搜索结果显示单元1001 信息搜索窗口1002:关键字输入装置1003 关键字语素处理器1004 关键字语法分析器1005 搜索者意图检测器1006 信息监视器1007 用于搜索的元数据提取器1008 用于搜索的编辑器1009 搜索装置1010:元数据比较器1011 附加服务数据库1012:附加服务生成器
1013 搜索结果生成器1014 信息存储装置1015 信息提供编辑器1016 信息提供元数据提取器1017:元数据 DB1018 内容提供者意图检测器1019 信息监视器1020:语法分析器1021 语法文法规则字典1022:语素处理器1023:语素字典1024:目录内容搜索器1025 :信息081026 搜索结果显示装置1027 搜索目录确定装置1028 存储目录确定装置1701 信息提供/搜索窗口1702:语素处理器1703:语素字典1704 语法分析器1705 语法文法规则字典1706 意图指定器1707 信息监视器1708 信息提供元数据提取器1709 信息提供编辑器1710:存储目录确定装置1711 信息存储装置1712 J^gDB1714 用于搜索的元数据提取器1715 用于搜索的编辑器1716:搜索目录确定装置1717 搜索装置1718:元数据比较器1719 搜索结果生成器1720 搜索结果显示装置1721:附加服务 DB1722:附加服务生成器
具体实施方式
下文中,将参考附图对本发明的示例性实施方式进行描述。图1示出了根据本发明示例性实施方式的搜索系统。构成根据本发明示例性实施方式的搜索系统的块可通过S/W及H/W来实现。此外,构成所述搜索系统的一些块可通过 S/W来实现,而其余的块则可通过H/W来实现。根据本发明示例性实施方式的搜索系统通过上下文认知信息供应/搜索来提供经双方同意的/定制的搜索服务,该服务根据提供者的意图、针对每一目录来对信息提供者提供的信息进行分类和存储,并通过检测信息搜索者的搜索意图来对存储于相应目录内的信息执行搜索。此外,本发明的示例性实施方式还针对每一内容来定义不同的元数据,并采用通过使用基于该元数据生成的编辑器来更为详细地对信息供应及搜索内容进行开发的方法, 从而相比于现有的搜索方法,能够更为方便且精确地执行搜索。在此情况下,所述元数据可为可详细且系统地定义内容的特征(其为信息供应/ 搜索的对象)的数据。例如,“书籍”的元数据指有关书籍的详细信息,诸如书籍名称、作者、出版社、出版年限、价格、主题等。在本发明的示例性实施方式中,可通过具有已定义框架的编辑器来对所述元数据进行输入及确认。可通过表格格式或句子格式来实施所述框架格式。图2为示出了内容的元数据的图示。如图2所示,可以确认,已对所有领域的内容的必要的元数据进行了定义。例如,可以确认,在不动产交易202中,将“销售物品”、“位置""预期价格”、“特征”、
“地铁信息”和“视频信息”等标准化为元数据。图2所示的内容的元数据存储于图1所示的元数据DB 119中。同时,如图1所示,根据示例性实施方式的搜索系统包括信息搜索窗口 101、关键字输入装置102、关键字语素处理器103、关键字语法分析器104、搜索者意图检测器105、 信息监视器106、用于搜索的元数据提取器107、用于搜索的编辑器108、搜索目录确定装置 109、搜索装置110、元数据比较器111、附加服务数据库112、附加服务生成器113、搜索结果生成器114、信息存储装置1115、存储目录确定装置116、信息提供编辑器117、信息提供元数据提取器118、元数据DB 119、信息提供者意图检测器120、信息监视器121、信息语法分析器122、语法文法规则字典123、信息语素处理器124、语素字典125、信息输入装置126、信息提供窗口 127、信息DB 128以及搜索结果显示装置129。信息输入装置1 将用户通过信息提供窗口 127输入的信息传输至信息语素处理器 1240语素字典125以数据库方式对每个单词的词性信息进行存储。此外,语素字典125 对每一单词的扩展信息、同义词信息或外文翻译扩展信息等以数据库方式进行存储。在此情况下,由于对登记于语素字典125内的单词不存在限制,所以还可在该语素字典125内登记其他词性信息(part information)(代词、形容词、后置词或结尾等)。可参考登记于语素字典125内的词性信息来将针对每个词性对文本进行分离,且可使用语义信息来理解内容作者或搜素者的意图。此外,可使用同义词信息来在更宽范围内执行扩展搜索,且可使用外文翻译来执行多语言搜索。
图3示出了登记于语素字典125内的信息,且下面将参考图3对语素字典125进行详细描述。信息语素处理器124以“语义单词”为单元对传输自信息输入装置126的文本进行分离。在此情况下,所述“语义单词”指一个词性。从而,可以理解的是,信息语素处理器 124针对每个词性来将文本进行分离。为此目的,信息语素处理器IM通过参考语素字典125内以数据库方式存储的单词的词性信息,来针对每个词性将文本进行分离。信息语法分析器122基于信息语素处理器124的语素处理结果,对用户输入的信息执行语法分析。该信息语法分析器122在执行语法分析的同时参考语法文法规则字典 123内登记的文法规则。信息提供者意图检测器120使用输出自信息语法分析器122的语法分析结果来检测信息提供者的意图。信息监视器121对信息提供者意图检测器120检测到的信息提供者的意图进行输出,以使得用户可见。为此目的,该信息监视器121可使用图形化工具。信息提供元数据提取器118从元数据DB 119中提取符合信息提供者意图检测器 120检测到的信息提供者意图的内容的元数据。信息提供编辑器117生成编辑器(其中,信息提供元数据提取器118提取的元数据被形成为输入项),并将该编辑器提供给信息提供者。存储目录确定装置116确定信息DB 1 上适于存储所述内容的目录。在此情况下,存储目录确定装置116可通过参考信息提供者意图检测器120检测到的信息提供者的意图来确定所述目录。信息存储装置115将整合了信息提供编辑器117所生成的元数据的内容存储于信息DB 128内。在此情况下,该内容存储于由存储目录确定装置116所确定的目录内。上述组件为用于生成并存储提供所述信息所必须的信息的组件。在下文中,将对当信息搜索者通过输入关键字来请求进行搜索时可通过推导通过搜索意图检测而输入的详细关键字来更为精确地执行搜索的组件进行详细描述。在此情况下,用户输入的关键字的示例可包括单词、短语以及句子。信息搜索窗口 101提供输入窗口,用户可通过该窗口输入关键字,诸如单词、短语或句子。进一步地,关键字输入装置102将用户通过信息搜索窗口 101输入的关键字传输至关键字语素处理器103。关键字语素处理器103以“语义单词”为单元对传输自关键字输入装置102的关键字进行分离。在此情况下,所述“语义单词”指一个词性。从而,可以理解的是,关键字语素处理器103以类似于信息语素处理器124的方式来针对每个词性将关键字进行分离。为此目的,关键字语素处理器103通过参考语素字典125内以数据库方式存储的单词的词性信息,针对每个词性将文本进行分离。关键字语法分析器104基于关键字语素处理器103的语素处理结果,对搜索者输入的关键字执行语法分析。该关键字语法分析器104在执行语法分析的同时,参考语法文法规则字典123。
搜索者意图检测器105使用输出自关键字语法分析器104的语法分析结果来检测搜索者的意图。信息监视器106对搜索者意图检测器105检测到的搜索者意图进行输出,以使得用户可见。为此目的,该信息监视器106可使用图形化工具。用于搜索的元数据提取器107从元数据DB 119中提取符合信息搜索者意图检测器105检测到的搜索者意图的内容的元数据。用于搜索的编辑器108生成编辑器(其中,用于搜索的元数据提取器108提取的元数据被形成为输入项),并将该编辑器提供给搜索者。搜索目录确定装置109确定信息DB 1 上适于搜索所述内容的目录。在此情况下,搜索目录确定装置109可通过搜索者意图检测器105检测到的搜索者的意图来确定所述目录。进一步地,搜索目录确定装置109可另外确定与所确定的目录相类似的目录。这可执行更宽范围的搜索。搜索装置110对信息DB 128内的具有与由用于搜索的编辑器108输入的元数据相同的元数据的内容进行搜索。在此情况下,在搜索目录确定装置109中所确定的目录内执行所述搜索。搜索装置110可执行扩展搜索,该扩展搜索通过将用于搜索的编辑器108输入的元数据替换为同义词来执行所述搜索。进一步地,搜索装置110可搜索在结构及单词方面具有与元数据完全相同的元数据的内容以及仅在结构及单词中的词性方面具有与元数据相同的元数据的内容。换言之, 搜索装置110还可执行相同搜索、部分搜索或相关搜索。元数据比较器111将通过由用于搜索的编辑器108输入的元数据与构成由搜索装置110所搜索的内容的元数据进行比较,并基于比较结果来仅选择和输出具有高度一致性的内容。如上所述,可通过将以表格格式形成的元数据分别进行比较来执行所述比较(确定所述一致性)。附加服务数据库112可存储用于提供适合于搜索者的搜索意图的站点信息或相关广告服务等的单元。附加服务生成器113生成与所述关键字相关的附加服务。为此目的,附加服务生成器113使用存储于附加服务数据库112内的附加服务中的、适合于搜索者的搜索意图的附加服务。附加服务数据库112及附加服务生成器113所提供的附加服务可被实施为内容上下文认知服务。在此情况下,该内容上下文认知服务的示例可包括导航服务、销售服务、广告服务、教育服务、咨询服务、推荐服务、行政服务等。搜索结果生成器114根据与输出自元数据比较器111的搜索结果(内容)的一致性,来添加附加服务生成器113所生成的附加服务。搜索结果显示单元1 通过屏幕输出从搜索结果生成器114生成的添加有附加服务的搜索结果,以将该结果提供给用户。同时,可仅将与搜索结果一致的内容提供给用户,而不提供附加服务。这可以通过下面的方式来实现附加服务生成器113不生成附加服务,或即使附加服务生成器113生成了附加服务,搜索结果生成器114亦不添加所生成的附加服务。
下文中,将参考图3,对上述语素字典125进行详细描述。图3示出了作为语素字典的示例的韩文语素字典。如图3所示,语素字典125被配置成分别列有1)第一列的韩文单词;2)第二列的单词词性信息;3)第三列的单词语义信息;4)第四列的一组同义词(或同意短语)、类似单词和/或代表单词力)第五列的英文翻译;6)第六列的日文翻译;以及7)第七列的中文翻译。通过使用图3所示的语素字典125,可允许信息语素处理器IM将文本作为语素进行处理,并允许关键字语素处理器103将关键字作为语素进行处理。如上所述,语素处理指的是给定句子的元素是否被配置为任何有意义的单词。 例如,当将叫1 ^"Cf (我去学校)”被作为语素进行处理时,划分单词界(例如, “計51+011+外+1_钭”)即为语素处理。在此情况下,所使用的信息(该信息为存储于语素字典125内的词性信息)审查各词性之间的关系,并输出诸如“計JiI /名词+叫/介词+ 7]· /动词+ L /结尾”这样的关系作为处理结果。进一步地,作为语素处理的附带信息,可获得诸如“单词频率”、“句子数量”之类的语言统计值,且可同时输出语义信息、同义词信息、外文翻译。
同时,可对登记于语素字典125内的语义信息进行如下分类
动物/ 频率/ 域名称/2)动词实例行为/立即 /服务等。
1)名词实例
事情/自然/物质/元素/工具/装置/人际关系/社会/罪行人类/植物/数字/抽象/建筑/具体/行为/状态/时间/地点比率/等级/数量/重点/事实/情感/弊端/辱骂/政治/经济/ 思想/人名/食物/邪恶/医药用品等。
组织
化/文化/
‘位置/周期/ 公司名称/区
继续/运动/改变/情感/思考/认知/存在/确定/意外/表达
/目标
3)形容词实例
状态/关系/属性/等级/重点/好的感觉/不好的感觉/选择/邪恶/方面等
4)介词实例
短语I装置/方法I原料
结果I给出结束I接收结束
材料I起因/原因I源/起始点I原点/方向I对象地点I时间I情况I内容I角色I对比I范围/频
率I等级I数量I比率I重点I事实I方面等。5)副词实例I重点I等。6)结尾表示方面的实例过去I当前I未来I否定I可能性I亲密I义务I必需性主张I确定估计I不确定估计/计划I希望I执行I命令I问题
工作I依赖I被动性I利益I谦虚I荣誉称号等。然而,上述分类仅为示例,且可被改变。单词的语意时刻均在变化,从而可根据时
间变化来改变语意分类,而非不变。进一步地,在对语义信息进行分类时,可参考根据同义
18
必然性I请求I需求忠诚I允许I邀请词分类的词汇字典。根据图3所示,1)可以理解的是,“Syng Man lee 125-1”的词性信息为“名词”、语义信息为“人名”、以及同义词信息为“南韩总统”。2)可以理解的是,"Naengmyeon 125-2”的词性信息为“名词”、语义信息为“食品名称”、以及同义词信息为“韩国的代表性面食”。3)可以理解的是,“Carbon Dioxide 125_3”的词性信息为“名词”、语义信息为“有害物质”、以及同义词信息为“二氧化碳,全球变暖”。4)可以理解的是,Meyo 125_4”的词性信息为“结尾”、语义信息为“请求,尊敬”、 以及同义词信息为“命令”。5)可以理解的是,"Nom 125-5"的词性信息为“名词”、语义信息为“谦称”、以及同义词信息为“成员”。可使用所述语义信息及同义词信息来扩大和扩展搜索。例如,当将“Syng Man lee”用作关键字时,还可提供针对“Syng Man lee”的搜索结果以及与“南韩总统”相关的搜索结果。此外,当将“二氧化碳对策”用作关键字时,可进一步提供“有害物质”、“C02对策”、 “全球变暖对策”以及“二氧化碳对策”的搜索结果。类似地,由于语义信息(诸如,“牛肉、猪肉、韩国泡菜”等)为“食物”且同义词信息为“肉”及“蔬菜”,所以可通过使用该语义信息及同义词信息来执行扩展搜索。如上所述,可将词性信息、语义信息以及同义词信息登记于语素字典125内,从而可搜索丰富的信息。下文中,将参考图3,进一步对通过处理短语/句子来对语法进行分析的过程进行描述。所述语法分析为是分析构成句子的每一语意单词是否具有其他构成正确句子的结构的过程。可使用描述自然语言的文法理论来对语法进行分析。描述自然语言的文法理论的示例可包括短语结构文法、格文法、敏感文法或词汇文法等,这些对于文法描述方法而言均是不同的。由于可将文法理论应用至所有语言(诸如英文、韩文、中文或日文等),还可将本实施方式所述的韩文语法分析方法应用至其他语言。将经历图4所示的语素处理401过程的输入句子分离为语意单词单元,并将词性信息添加至每一分离后的单词402。该词性信息变为大约10-12个词性名称,诸如{名词, 代词,数字,形容词,副词,介词,···}等。为了分析每个单词相互之间如何耦合以形成正确的短语、从句以及句子,需要用于每种语言的正确短语、从句以及句子的生成规则403。该规则包含于上述语法文法规则字典123中,从而可从语法文法规则字典123中提取。例如,当文法清楚地表达了 “句子包括主题(名词短语)以及谓语(动词短语),, 这一知识时,S(句子)可被表示为一NP(名词短语)·νΡ(动词短语)。用于短语、从句以及句子的生成规则403即为定义该规则之处。简要描述这些规则1)基于短语、从句以及句子中生成的规则,以单词为单位来定义短语结构文法类型;幻格文法类型及敏感文法类型以单词从句为单位来定义修饰单元与被修饰单元之间的关系;3)词汇文法类型采用VP = cat (动词,基础语意、…,Sub, SEM)类型,且通过被称之为联合的操作来执行各个单词之间的正确耦合。作为具体示例,对短语结构文法规则及处理方法作如下定义(I)S ^ PPV(2) PP — NP当对“来自首尔”的语法进行分析时,生成语素处理结果的单词(首尔/N(名词), 自/P(介词),来Λ(动词)过去)。当执行短语分析时,由于“自首尔”为“NP”,故根据文法规则⑵将“自首尔”的语法分析为“PP(介词短语)”,且由于“来”为动词,故根据文法规则(1)将PP和V分析为“S(句子)”,从而就韩文而言,结果被输出为称之为(来(自首尔))的树状结构公式或列表结构公式。同时,当根据敏感文法规则来对上述示例句子进行分析时,通过被称之为“自首尔 —来”的表达式来输出语法分析关系,其中单词子句“自首尔”修饰单词子句“来”。进一步地,词汇文法类型输出被称之为(来,[谁].[自首尔])的语法分析结果作为语义表达式。本发明可根据文法理论来输出语法分析表达式404中的每一者。因此, 可输出根据词性信息的表达式405、根据语义信息的表达式406以及根据同义词/短语的表达式407。图5示出了用于对根据本发明另一示例性实施方式的搜索方法进行解释的流程图。如图5所示,当用户通过信息提供窗口 127输入“吾卫外普M坤(销售二手车),,时,信息输入装置126将用户输入的信息传输至信息语素处理器124(501)。信息语素处理器IM通过参考语素字典125来针对每个词性将“吾卫^“普^! 4 (销售二手车)”进行分离,并将“销售二手车”输出为“U) (502)。在此情况下,根据语素处理结果,将词性信息及语义信息(名词/ 二手车,,动词/ 销售,结尾/尊敬)一起输出。在此情况下,所述词性信息为名词、动词以及结尾,而所述语义信息为二手车、销售以及尊敬。之后,信息语法分析器122对语素处理结果执行语法分析,并输出结果(二手车一销售)(503)。信息提供者意图检测器120使用输出自信息语法分析器122的语法分析结果来检测信息提供者的意图为“销售二手车”(504)。因此,信息提供元数据提取器118从元数据DB 119中提取适于信息提供者意图的内容的元数据,即“詈卫斗例(二手车交易)” (505)。信息提供编辑器117生成编辑器(其中提取的元数据成为输入项),并将该编辑器提供给信息提供者(506)。最终,信息提供者通过提供的编辑器输入元数据(507)。图5示出了这样一种情况,即将“二手车名称索纳塔”、“变速箱自动”、“年份 2001”、“行驶里程100, 000公里”、“颜色银色”、“预期价格1, 200,000韩元”以及照片信息输入至具体项。存储目录信息装置116确定信息DB 128上适于存储所述内容的目录,并添加目录索引键(二手车,销售)。这将在相应的目录内存储所述内容。同时,除了所述目录索引键 (二手车,销售)之外,存储目录确定装置116还可添加用户ID (508)。进一步地,信息存储装置115将整合了信息提供编辑器117所输入的元数据的内容存储于信息DB 1 内。在此情况下,所述内容被存储于存储目录确定装置116所确定的目录内。以上对根据信息提供者输入的信息来检测用户的意图并基于检测到的意图来推导将被存储为单个内容的详细元数据输入的过程进行了详细描述。下文中,将参考图6对通过使用上述过程所存储的元数据来基于搜索者输入的关键字执行搜索的过程进行描述。图6为用于对根据本发明另一示例性实施方式的搜索方法进行解释的图示。在该示例性实施方式中,当信息搜索者输入关键字时,可检测搜索者的搜索意图,且可以基于检测到的搜索者意图来进行详细且精确的搜索。在此情况下,用户输入的关键字的示例可包括单词、短语以及句子。如图6所示,当用户通过信息搜索窗口首次输入关键字“吾卫外晳Μ斗(购买二手车)”(601)时,关键字语素处理器103针对每个词性来对输入的关键字进行分离,并在将其输出为(吾JI外MlVW 钭)(602)的同时,添加并输出词性信息及语义信息(即,名词/吾卫外,动词/干呻,结尾/尊敬)。之后,信息语法分析器104基于语素处理结果来执行语法分析,并之后输出结果 (二手车一购买)(60 。搜索者意图检测器105使用语法分析结果来检测搜索者的意图为 “二手车一购买”(604)。之后,用于搜索的元数据提取器107从元数据DB 119中提取适于搜索者的意图 “购买二手车”的内容的元数据,且用于搜索的编辑器108生成编辑器(其中用于搜索的元数据提取器107提取的元数据为输入项),并将该编辑器提供给搜索者(605)。结果,搜索者通过提供的编辑器来输入元数据(606)。图6示出了这样一种情况,即将“二手车名称索纳塔”、“变速箱自动”、“年份2001年之后”、“行驶里程低于 100, 000公里”、“颜色银色”、“预期价格1, 200,000韩元或更低”以及“燃料液化气”输入至具体项。搜索目录确定装置109确定信息DB 128上适于搜索所述内容的目录,且搜索装置 110在信息DB 1 中搜索具有与由用于搜索的编辑器108输入的元数据相同的元数据的内容。在搜索目录确定装置109中确定的目录内执行所述搜索。在此情况下,搜索目录确定装置109可通过参考搜索者意图检测器105检测到的搜索者意图来确定所述目录。可另外确定与所确定的目录相类似的目录。这可执行更宽范围的搜索。进一步地,搜索装置110还可执行相同搜索、部分搜索或相关搜索。之后,元数据比较器111将通过用于搜索的编辑器108输入的元数据与构成搜索者110所搜索的内容的元数据进行比较(608)。进一步地,元数据比较器111基于比较结果来仅选择并输出具有高度一致性的内容。到目前,详细描述了根据搜索者输入的信息来检测搜索者的意图、基于检测到的意图来推导详细的元数据输入以及通过使用输入的元数据来在符合搜索者意图的目录中执行所述搜索的过程。
本发明的示例性实施方式可被实施为通过使用常规或标准编辑器来输入元数据。 因此,信息提供者或搜索者可更方便地输入元数据,并且可在输入哪种类型的元数据方面接收引导。因此,可增加输入的方便性。通过使用常规编辑器来输入元数据的形式还可被应用至诸如移动电话或IPTV之类的装置的情形。同时,本发明的示例性实施方式可执行条件搜索,该条件搜索可根据特定条件来限制特定元数据。例如,执行关键字为“120进省叫許营卫許(1,200,000韩元或更低的二手车)”的搜索对应于所述条件搜索。图7为用于对地理导航服务进行解释的图示,该地理导航服务作为存储于附加服务数据库112内且生成自附加服务生成器113的附加服务的示例,并且是一种上下文认知搜索服务。为此目的,图7中假设通过信息搜索窗口 101来输入句子“叫^^ 艾效芒^Hfle]司]厶互眢芒(这附近是否有美味的意大利餐馆)”(701)。语素处理器103以语素形式对输入句子701进行处理,并将其分离成 “叫己祠/赀效/芒/叫砷司/矧厶旦智/芒” (702),之后输出加入了语义信息的
“O〗己詞/名词/当前位置,货效/形容词/食物评价,芒/介词/修饰,O] _司/名词/ 国名,矧厶互名词/餐馆,各/介词/暗示”(703)。之后,关键字语法分析器104对语素处理结果的语法进行分析,且搜索者意图检测器105通过语法分析结果来检测搜索者的意图。具体而言,搜索者意图检测器105分别指示上下文认知单词“芒/芒”的语义信息为“沟μι,,,上下文认知单词“叫e祠”被检测为具有“可以通过GPS确认的当前位置”的语意,且“叫砷司钊厶旦导”被检测为具有要求搜索餐馆数据库的意图。因此,附加服务生成器113通过使用GPS来检测当前位置(704),搜索装置110执行对美味意大利餐馆的搜索(705),附加服务生成器113执行映射(706),并且指示地图 (该地图上显示了当前位置)上被搜索到的美味意大利餐馆的地图被输出(707)。图8为用于对提供不同类型的附加服务的方法进行解释的图示。图8所示的附加服务用于将与包含于文本输出中的特定单词及主题相关的各种附加信息提供作为搜索结果。为此目的,可使用存储于附加服务数据库112内的各种信息,诸如组织信息801、广告信息802、特性信息803、正题主题信息804或公司信息805等,且可以从通过网络相连的其他数据库中获取所述各种信息。图9为示出了将信息搜索窗口及信息提供窗口提供在一起的信息提供/搜索窗口的示例的图示。所示信息提供/搜索窗口中的输入窗口 901为用于输入关键字的窗口,信息提供按钮902为在信息被提供/登记输入至输入窗口 901时使用的按钮,信息搜索按钮 903为用于命令对输入至输入窗口 901的关键字进行信息搜索的按钮。进一步地,提供于底部的按钮904用于设置搜索方法及提供搜索结果的方法。例如,图9中给出的“完整搜索”按钮用于将搜索类型设置为完整搜索,“广告许可”按钮用于允许将与搜索结果相关的广告与搜索结果一起显示,“相关服务提供许可”按钮用于允许在包含于搜索结果内的单词及短语上一起提供附加信息。
还可将图7-9中所给出的实施示例应用于将在以下进行描述的其他示例性实施方式,因此,将在以下进行描述的示例性实施方式将不再重复地描述以上实施的示例。图10为示出了根据本发明另一示例性实施方式的搜索系统的图示。构成根据本发明示例性实施方式的搜索系统的块可通过S/W及H/W来实现。此外,构成所述搜索系统的一些块可通过S/W来实现,而其余的块则可通过H/W来实现。如图10所示,根据本示例性实施方式的搜索系统包括信息搜索窗口 1001、关键字输入装置1002、关键字语素处理器1003、关键字语法分析器1004、搜索者意图检测器 1005、信息监视器1006、用于搜索的元数据提取器1007、用于搜索的编辑器1008、搜索装置 1009、元数据比较器1010、附加服务数据库1011、附加服务生成器1012、搜索结果生成器 1013、信息存储装置1014、信息提供编辑器1015、信息提供元数据提取器1016、元数据DB 1017、信息提供者意图检测器1018、信息监视器1019、语法分析器1020、语法文法规则字典 1021、语素处理器1022、语素字典1023、目录内容搜索器IOM、信息DB 1025、搜索结果显示装置10 、搜索目录确定装置1027以及存储目录确定装置1(^8。目录内容搜索器IOM收集包含于分离自每一目录的内容中的文本。目录内容搜索器IOM收集到的文本被传输至将在以下描述的语素处理器1022。图10示出了工作信息21、大学入学考试信息13、不动产23、金融M、汽车25、电影及游戏沈、购物27、交通信息观、旅游信息四、推荐30等作为在其中存储内容的目录,但还可采用其他目录。语素字典1023可被实施为与图1所示的语素字典125相同的语素字典。语素处理器1022通过参考语素字典1023,针对每个词性将传输自目录内容搜索器IOM的文本进行分离,并输出每个词性。语法分析器1020基于语素处理器1022的语素处理结果,来对包含于内容内的文本执行语法分析。语法分析器1020在执行语法分析的同时,参考语法文法规则字典1021。内容提供者意图检测器1018使用输出自语法分析器1020的语法分析结果来检测内容作者的意图。信息监视器1019输出信息提供者意图检测器1018检测到的信息作者的意图,以使得用户可见。为此目的,信息监视器1019可使用图形化工具。信息提供元数据提取器1016从元数据DB 1017中提取符合信息提供者意图检测器1018检测到的信息提供者意图的内容的元数据。信息提供编辑器1015生成编辑器(其中,信息提供元数据提取器1016提取的元数据被形成为输入项),并将该编辑器提供给信息提供者。存储目录确定装置10 确定信息DB 1025上适于存储所述内容的目录。在此情况下,存储目录确定装置10 可通过参考信息提供者意图检测器1020检测到的内容提供者的意图来确定所述目录。信息存储装置1014将整合了信息提供编辑器1015所生成的元数据的内容存储于信息DB 1025内。在此情况下,所述内容存储于存储目录确定装置10 所确定的目录内。到目前为止所描述的组件用于收集内容,并基于作者的意图来对收集到的内容进行划分及存储。下文中,将对当信息搜索者通过输入关键字来请求进行搜索时可通过推导通过搜索意图检测而输入的详细关键字来更为精确地执行搜索的组件进行详细描述。在此情况下,用户输入的关键字的示例可包括单词、短语以及句子。信息搜索窗口 1001提供输入窗口,用于可通过该输入窗口输入关键字,诸如单词、短语或句子。进一步地,关键字输入装置1002将用户通过信息搜索窗口 1001输入的关键字传输至关键字语素处理器1003。语素处理器1003通过参考语素字典1023,针对每个词性将传输自关键字输入装置1002的关键字进行分离,并输出每个词性。关键字语法分析器1004基于关键字语素处理器1003的语素处理结果,对搜索者输入的关键字执行语法分析。该关键字语法分析器1004在执行语法分析的同时,参考语法文法规则字典1021。搜索者意图检测器1005使用输出自关键字语法分析器1004的语法分析结果来检测搜索者的意图。信息监视器1006对搜索者意图检测器1005检测到的搜索者意图进行输出,以使得用户可见。为此目的,该信息监视器1006可使用图形化工具。用于搜索的元数据提取器1007从元数据DB 1017中提取符合搜索者意图检测器 1005检测到的搜索者意图的内容的元数据。用于搜索的编辑器1008生成编辑器(其中,用于搜索的元数据提取器1007提取的元数据被形成为输入项),并将该编辑器提供给搜索者。搜索目录确定装置1027确定信息DB 1025上适于搜索所述内容的目录。在此情况下,搜索目录确定装置1027可通过参考搜索者意图检测器1005检测到的搜素者的意图来确定所述目录。进一步地,搜索目录确定装置1027可另外确定与所确定的目录相类似的目录。这可执行更宽范围的搜索。搜索者1009对信息DB 1025中的具有与用于搜索的编辑器1008输入的元数据相同的元数据的内容进行搜索。在此情况下,在搜索目录确定装置1027中所确定的目录内执行所述搜索。搜素装置1009可执行扩展搜索,该扩展搜索通过将用于搜索的编辑器1008输入的元数据替换为同义元数据来执行所述搜索。进一步地,搜索装置1009可搜索在结构及单词方面具有与元数据完全相同的元数据的内容以及仅在结构及单词中的词性方面具有与元数据相同的元数据的内容。换言之,搜索装置1009还可执行相同搜索、部分搜索或相关搜索。元数据比较器1010将通过由用于搜索的编辑器1008输入的元数据与构成搜索装置1010所搜索的内容的元数据进行比较,并基于比较结果来仅选择和输出具有高度一致性的内容。如上所述,可通过将以表格格式形成的元数据分别进行比较的方法来执行所述比较(确定所述一致性)。附加服务数据库1011可存储用于提供适合于搜索者的搜索意图的站点信息或相关广告服务等的担忧。附加服务生成器1012生成与搜索键相关的附加服务。为此目的,附加服务生成器 1012使用存储于附加服务数据库1011内的附加服务中的、适合于搜索者的搜索意图的附加服务。附加服务数据库1011及附加服务生成器1012所提供的附加服务可被实施为内容上下文认知服务。在此情况下,该内容上下文认知服务的示例可包括导航服务、销售服务、 广告服务、教育服务、咨询服务、推荐服务等。搜索结果生成器1013根据与输出自元数据比较器1010的搜索结果(内容)的一致性,来添加附加服务生成器1012所生成的附加服务。搜索结果显示装置10 通过屏幕输出从搜索结果生成器1013生成的添加有附加服务的搜索结果,以将该结果提供给用户。同时,可仅将搜索结果及一致性提供给用户,而不提供任何附加服务。这可以通过下面的方式来实现附加服务生成器1012不生成附加服务,或即使附加服务生成器113生成了附加服务,搜索结果生成器1013亦不添加所生成的附加服务。下文中,将参考图11,对考虑了以下情形的过程进行详细描述,该情形为推荐目录 30上列有推荐中国餐馆及第一次生日聚会的体验经历的记录,且该记录作为信息被存储。 图11为用于对根据本发明另一示例性实施方式的搜索方法进行解释的图示。首先,如图IlA所示,目录内容搜索器IOM收集列于推荐目录30上的推荐记录, 并将该推荐记录传输至语素处理器1022。之后,语素处理器1022通过参考语素字典1023来执行语素处理。图IlB示出了语素处理器1022的语素处理结果。之后,语法分析器1020对图IlB执行语法分析。图IlC示出了该语法分析器1020 的语素分析结果。进一步地,内容提供者意图检测器1018基于图IlC来检测提供者的意图。图IlD 示出了内容提供者意图检测器1018检测到的提供者的意图。之后,信息提供元数据提取器1016从元数据DB 1017中提取符合提供者意图的内容的元数据。信息提供编辑器1015生成编辑器(其中,提取的元数据成为输入项),并将该编辑器提供给信息提供者。在图IlD中,符合“第一次生日聚会一地点一推荐”的内容是内容“第一次生日聚会地点提供”。如图IlE所示,信息提供编辑器1015对内容提供者意图检测器1018检测到的内容提供者的意图进行排列。进一步地,信息提供编辑器1015自动将对应的元数据输入至图12A所示的编辑器的每一项中,其中图12B示出了输入结果。存储目录确定装置10 确定信息DB 1025上适于存储所述内容的目录。在此情况下,该存储目录确定装置10 可通过参考内容提供者意图检测器1018检测到的内容提供者的意图来确定所述目录。信息存储装置1014将整合了信息提供编辑器1015所生成的元数据的内容存储于信息DB 1025内。在此情况下,所述内容被存储于存储目录确定装置10 所确定的目录内。根据本发明的示例性实施方式可以基于内容提供者的意图来对针对每一目录的相应信息进行划分,且可以对相应的元数据进行匹配和存储。下文中,将参考图13对通过使用上述过程所存储的元数据来基于信息搜索者输入的关键字执行搜索的过程进行描述。图13为用于对根据本发明另一示例性实施方式的搜索方法进行解释的图示。在该示例性实施方式中,当信息搜索者输入关键字时,可检测搜索者的搜索意图,并可以基于该搜索者的意图来进行详细且精确的搜索。在此情况下,用户输入的关键字的示例可包括单词、短语以及句子。如图13所示,当用户输入通过信息搜索窗口 1001输入关键字“0")租
晉钍赴畀只丨智外导(请推荐这周六值得欣赏的音乐剧),,(1301)时, 关键字语素处理器1003针对每个词性将输入的关键字进行分离,并在输出(这次/星期六 /观看/音乐剧/推荐/期望)(1302)的同时,添加并输出词性信息及语义信息(名词/现在,名词/日期,形容词/好的感觉,名词/音乐剧,名词/推荐,动词/请求)(1303)。之后,关键字语法分析器1004基于语素处理结果来执行语法分析,并之后输出 (这次一星期六,值得一音乐剧,一推荐,一期望)作为结果(1304)。可以理解的是,通过语法分析,示例句子中可存在两个上下文认知信息。一个是作为实际物理数据“所有的星期六”的日期,另一个是作为“意图”的“推荐,请求”。因此,关键字语法分析器1004针对前者执行上下文认知处理,这将在以下进行描述。首先,将对生成“本周六”的上下文认知实际数据的过程进行详细描述。图14示出了指示时间的上下文认知单词,其可列于语素字典1023内。如图14所示,将每个单词的语义信息定义为“过去”、“现在”或“将来”等。图15通过指定“现在时间”的单位为“年”、“月”、“日”、“星期”、“时”、“分”、“秒”,
示出了系统所管理的情况。图16示出了在当天对“本周六”的语言表示进行数量上的计算的方式。换言之, 由于将获得的时间为指示将获得的时间的语言表示中的实际量化时间,当对“本周六”执行语素处理时,根据语义信息“本/当前,周六/星期六”而在系统日历中获得的当前日期为星期三,并且由于当前系统“星期六”为三天之后即“星期三一星期四一星期五一星期六”, 故当将三天加到当前日期2008年11月6日之后,可生成实际数据2008年11月9日。通过上述过程,还可将指示不同于当前时间的时间的语言表示变形为实际数据。 参考图14-16描述的“本周六”的上下文认知实际数据的生成对应于图13中的1306、1307 以及1308。同时,搜索者意图检测器1005使用语法分析结果来将搜素者的意图检测为“音乐剧一推荐一请求”(1308)。之后,用于搜索的元数据提取器1007从元数据DB 1017中提取适于搜索者意图即 “音乐剧推荐请求”的内容的元数据,且用于搜索的编辑器1008生成编辑器(其中,用于搜索的元数据提取器1007提取的元数据为输入项),并将该编辑器提供给搜索者(1311)。在此情况下,履行日期“2008年11月9日”(即所生成的实际日期)被自动输入至编辑器。结果,搜索者通过提供的编辑器来输入元数据(1312)。搜索目录确定装置1027确定信息DB 1025上适于搜索所述内容的目录,且搜索装置1009对信息DB 1025中的具有与用于搜索的编辑器1008所输入的元数据相同的元数据的内容进行搜索(131;3)。该搜索在搜索目录确定装置1027中确定的目录内执行。在此情况下,搜索目录确定装置1027可通过参考搜索者意图检测器1005检测到的搜索者的意图来确定所述目录。可另外确定与所确定的目录相类似的目录。这可执行更宽范围的搜索。
进一步地,搜索装置1009还可执行相同搜索、部分搜索或相关搜索。之后,元数据比较器1010将通过用于搜索的编辑器1008输入的元数据与构成搜索装置1009所搜索的内容的元数据进行比较(1314)。进一步地,元数据比较器1010基于比较结果来仅选择并输出具有高度一致性的内容(1315)。到目前,详细描述了根据搜索者输入的信息来检测搜索者的意图、基于检测到的意图来推导详细的元数据输入、自动输入用于生成实际数据的元数据以及通过使用该元数据来在符合搜索者意图的目录中执行搜索的过程。在到目前为止所描述的示例性实施方式中,通过对输入语言表示进行分析来自动检测信息提供者或信息搜索者的意图。例如,包含诸如“获取、买、购买、给予、请求、询问、寻找”等语言表示的表示被检测为被称为“信息搜索”的意图,因为信息“搜索”的语意在语意中被称为“寻找信息”;而所有包含诸如“卖、销售、提供、给予、呈现”等语言表示的表示均被检测为“信息提供”的意图, 因为信息“提供”的语意在语意中被称为“信息提供”。之后,处理该意图。将在以下进行描述的示例性实施方式采用由信息提供者或信息搜索者直接输入的方法,而非自动检测信息提供者及信息搜索者的意图。这是为了更为精确地检测信息提供者及信息搜索者的意图。图17示出了根据本发明示例性实施方式的搜索系统。构成根据本发明示例性实施方式的搜索系统的块可通过S/W及H/W来实现。此外,构成所述搜索系统的一些块可通过S/W来实现,而其余的块则可通过H/W来实现。如图17所示,根据本发明示例性实施方式的搜索系统包括信息提供/搜索窗口 1701、语素处理器1702、语素字典1703、语法分析器1704、语法文法规则字典1705、意图指定器1706、信息监视器1707、信息提供元数据提取器1708、信息提供编辑器1709、存储目录确定装置1710、信息存储单元1711、信息DB 1712、元数据DB 1713、用于搜索的元数据提取器1714、用于搜索的编辑器1715、搜索目录确定装置1716、搜索装置1717、元数据比较器 1718、搜索结果生成器1719、搜索结果显示单元1720、附加服务数据库1721以及附加服务生成器1722。信息提供/搜索窗口 1701为用于输入将由信息提供者登记的信息或输入由信息搜索者提供的关键字的用户界面。信息提供/搜索窗口 1701提供有输入窗口 1701-1、信息提供按钮1701-2以及信息搜索按钮1701-3。输入窗口 1701-1为用于输入将被提供的信息或关键字的窗口,并且输入窗口 1701-1可输入作为单词、短语或句子的信息及关键字。信息提供按钮1701-2是在提供并登记输入至输入窗口 1701-1的信息时使用的按钮,而信息搜索按钮1701-3是用于命令对输入至输入窗口 1701-1的关键字进行信息搜索的按钮。通过信息提供/搜索窗口 1701输入的信息或关键字被传输至语素处理器1702。语素字典1703可被实施为与图1所示的语素字典125相同的语素字典。语素处理器1702通过参考语素字典1023来针对每个词性将通过信息提供/搜索窗口 1701输入的信息或关键字进行分离,并输出每个词性。语法分析器1704基于语素处理器1702的语素处理结果来对用户的输入信息或关键字执行语法分析。语法分析器1704在执行语法分析的同时,参考登记于语法文法规则字典1705内的文法规则。意图指定器1706提供用于对信息提供者的意图或信息搜索者的意图进行直接指定的用户界面单元,并对语法分析结果所指定的意图进行整合以输出最终意图。信息监视器1707对输出自意图指定器1706的最终意图进行输出,以使得用户可见。为此目的,该信息监视器1707可使用图形化工具。信息提供元数据提取器1708从元数据DB 1713中提取符合输出自意图指定器 1706的信息提供者的最终意图的内容的元数据。信息提供编辑器1709生成编辑器(其中,信息提供元数据提取器1708提取的元数据被形成为输入项),并将该编辑器提供给信息提供者。存储目录确定装置1710确定信息DB 1712上适于存储所述内容的目录。在此情况下,存储目录确定装置1710可通过参考意图指定器1706检测到的信息提供者的最终意图来确定所述目录。信息存储单元1711将整合了信息提供编辑器1709所生成的元数据的内容存储于信息DB 1709内。在此情况下,所述内容存储于存储目录确定装置1710所确定的目录内。用于搜索的元数据编辑器1714从元数据DB 1713中提取符合输出自意图指定器 1706的信息提供者的最终意图的内容的元数据。搜索编辑器1715生成编辑器(其中,用于搜索的元数据提取器1714提取的元数据被形成为输入项),并将该编辑器提供给搜索者。搜索目录确定装置1716确定信息DB 1712上适于搜索所述内容的目录。在此情况下,搜索目录确定装置1716可通过参考输出自意图指定器1706的搜索者的最终意图来确定所述目录。进一步地,搜索目录确定装置1716可另外确定与所确定的目录相类似的目录。这可执行更宽范围的搜索。搜索装置1717对信息DB 1712中的具有与由用于搜索的编辑器1715输入的元数据相同的元数据的内容进行搜索。在此情况下,在搜索目录确定装置1716所确定的目录中执行所述搜索。搜索装置1717可执行扩展搜索,该扩展搜索通过将搜索编辑器1715输入的元数据替换为同义元数据来执行所述搜索。进一步地,搜索装置1717可搜索在结构及单词方面具有与元数据完全相同的元数据的内容以及仅在结构及单词中的词性方面具有与元数据相同的元数据的内容。换言之,搜索装置1717还可执行相同搜索、部分搜索或相关搜索。元数据比较器1718将通过由用于搜索的编辑器1715输入的元数据与构成搜索装置1717所搜索的内容的元数据进行比较,并基于比较结果来仅选择和输出具有高度一致性的内容。如上所述,可通过将以表格格式形成的元数据分别进行比较的方法来执行所述比较(确定所述一致性)。附加服务数据库1721可存储用于提供适合于搜索者的搜索意图的站点信息或相关广告服务等的单元。附加服务生成器1722生成与搜索键相关的附加服务。为此目的,附加服务生成器 1722使用存储于附加服务数据库1721内的附加服务中的、适合于搜索者的搜索意图的附加服务。附加服务数据库1721及附加服务生成器1722所提供的附加服务可被实施为内容上下文认知服务。在此情况下,该内容上下文认知服务的示例可包括导航服务、销售服务、 广告服务、教育服务、咨询服务、推荐服务、行政服务等。搜索结果生成器1719根据与输出自元数据比较器1718的搜索结果(内容)的一致性,来添加附加服务生成器1722所生成的附加服务。搜索结果显示单元1720通过屏幕输出从搜索结果生成器1719生成的添加有附加服务的搜索结果,以将该结果提供给用户。同时,可仅将搜索结果及一致性提供给用户,而不提供附加服务。这可以通过以下的方式来实现附加服务生成器1722不生成附加服务,或即使附加服务生成器113生成了附加服务,搜索结果生成器1719亦不添加所生成的附加服务。图18为用于对根据本发明另一示例性实施方式的搜索方法进行解释的流程图。如图18所示,当用户输入“对课程进行计划”至信息提供/搜索窗口 1701的输入窗口 1701-1中并按下信息提供按钮1701-2(1801)时,语素处理器1702通过参考语素字典1703来针对每个词性将“对课程进行计划”进行分离,以将其输出为“对课程进行计划,,(1802)。之后,语法分析器1704对语素处理结果执行语法分析,并输出结果(课程一计划) (1803)。之后,当意图指定器1706将信息提供者的意图指定为“提供”(1804和1805)时, 意图指定器1706基于语法分析来输出整合了所指定意图的最终意图“课程一计划一提供,,(1806)。之后,信息提供元数据提取器1708从元数据DB 1713中提取适于信息提供者的最终意图“课程一计划一提供”的内容的元数据(1807)。信息提供编辑器1709生成编辑器(其中,提取的元数据成为输入项),并将该编辑器提供给信息提供者(1808)。结果,信息提供者通过所提供的编辑器来输入元数据
(1809)。之后,存储目录确定装置1710确定信息DB 1712上适于存储所述内容的目录
(1810)。进一步地,信息存储装置1711将整合了由信息提供编辑器1709输入的元数据的内容存储于信息DB 1712内。在此情况下,所述内容被存储于由存储目录确定装置1710所确定的目录内。到目前为止,详细描述了根据信息提供者输入的信息及意图来检测信息提供者的最终意图、并基于检测到的意图来推导将被存储为单个内容的详细元数据输入的过程。下文中,将参考图19来对通过使用上述过程所存储的元数据来基于信息搜索者提供的关键字及意图来执行搜索的过程进行描述。图19为用于对根据本发明另一示例性实施方式的搜索方法进行解释的图示。在本发明的该示例性实施方式中,信息搜索者可基于关键字及意图来执行详细且精确的搜索。在此情况下,用户输入的关键字的示例可包括单词、短语以及句子。如图19所示,当用户输入“计划列表”至信息提供/搜索窗口 1701的输入窗口1701-1并按下搜索按钮1701-3 (1901)时,语素处理器1702通过参考语素字典1703来针对每个词性将“计划列表”进行分离,以将其输出为“计划/列表”(1902)。之后,语法分析器1704对语素处理结果执行语法分析,并输出结果(计划一列表) (1903)。之后,当意图指定器1706将信息提供者的意图指定为“搜索”(1904和1905)时, 意图指定器1706基于语法分析来输出整合了所指定意图的最终意图“计划一列表一搜索,,(1906)。之后,用于搜索的元数据提取器1714从元数据DB 1713中提取适于搜索者的最终意图“计划一列表一搜索”的内容的元数据,且用于搜索的编辑器1715生成编辑器(其中,用于搜索的元数据提取器1714提取的元数据是输入项),并将该编辑器提供给搜索者 (1908)。结果,搜索者通过所提供的编辑器输入元数据(1909)。搜索目录确定装置1716确定信息DB 1712上适于搜索所述内容的目录(1910), 且搜索装置1717对信息DB 1712的具有与由用于搜索的编辑器1715输入的元数据相同的元数据的内容进行搜索(1911)。在搜索目录确定装置1716中所确定的目录内执行所述搜索。在此情况下,搜索目录确定装置1716可通过参考意图指定器1706检测到的搜索者意图来确定所述目录。可另外确定与所确定的目录相类似的目录。这可执行更宽范围的搜索。进一步地,搜索装置1717还可执行相同搜索、部分搜索或相关搜索。之后,元数据比较器1718将通过用于搜索的编辑器1715输入的元数据与构成搜索装置1717所搜索的内容的元数据进行比较(191幻。进一步地,元数据比较器1718基于比较结果来仅选择并输出具有高度一致性的内容(1913)。到目前为止,详细描述了基于搜索者输入的信息及意图来推导详细元数据输入并通过使用输入的元数据来在符合搜索者的意图的目录内执行所述搜索的过程。上述示例性实施方式可用于宣传候选人以进行电子投票。图20示出了输入元数据至编辑器的结果,该结果通过输入“提供候选人的宣传信息”至信息提供/搜索窗1701并对其执行语素处理、语法分析、意图指定以及元数据提取而生成,且所述编辑器被提供给信息提供者。之后,当通过存储目录确定来将所述信息存储于信息DB 1712内时,可将候选人的宣传资料通过PC或移动电话等分发给投票者。因此,可通过使用目前使用成本很低的宣传纸来迅速地提供候选人的宣传资料。上述的示例性实施方式可实施于移动信息装置(诸如移动电话)中以及其他信息装置内。此外,信息提供按钮及信息搜索按钮可对应于/分派至移动信息装置(诸如移动电话)以及其他信息装置的特定按钮(按键)。虽然已结合目前被视为实际示例性实施方式的实施方式对本发明进行了描述,但可以理解的是,本发明并不局限于所公开的实施方式,相反地,本发明意欲覆盖包含于所附权利要求书的精神及范围内的各种变化及等价布置。
权利要求
1.一种用于搜索信息的方法,该方法包括通过使用针对关键字的分析结果来检测搜索者的意图;向所述搜索者提供符合所述搜索者的意图的编辑器;以及搜索具有与通过所述编辑器的输入项输入的元数据相关联的元数据的内容。
2.根据权利要求1所述的方法,该方法进一步包括 将输入的关键字分离为语意单词;以及对分离后的关键字执行语法分析,其中,对搜索者的意图的检测通过使用执行所述语法分析时的语法分析结果来检测所述搜索者的意图。
3.根据权利要求2所述的方法,其中所述语法分析的执行将语法表达式输出作为所述语法分析结果,其中通过分析句子内分离后的单词是否具有任何文法关系以及语义关联来获取所述语法表达式。
4.根据权利要求3所述的方法,其中所述语法表达式为逻辑表达式、修饰-被修饰以及语法列表表达式中的至少一者。
5.根据权利要求3所述的方法,其中语法分析的执行参考语法文法规则字典,以分析句子内分离后的单词是否具有任何文法关系以及语义关联,以及所述语法文法规则字典列有短语结构文法、格文法、敏感文法以及词汇文法中的至少 “"者 ο
6.根据权利要求2所述的方法,其中所述分离针对每个词性来对所述关键字进行分离。
7.根据权利要求6所述的方法,其中所述分离通过参考与每个单词的词性相关的信息来针对每个词性将所述关键字进行分离,所述与每个单词的词性相关的信息以数据库方式存储于语素字典内。
8.根据权利要求1所述的方法,该方法进一步包括提取符合所述搜索者的意图的内容的元数据,其中编辑器的提供提供作为符合所述搜索者的意图的编辑器的编辑器,在该编辑器中,被提取的元数据成为输入项。
9.根据权利要求1所述的方法,该方法进一步包括通过参考信息提供者的意图来确定用于执行搜索的目录,其中所述搜索对与所确定的目录相同或相似的目录中的内容进行搜索。
10.根据权利要求1所述的方法,其中所述关键字为单词单元、短语单元以及句子单元中的任一者。
11.根据权利要求1所述的方法,其中所述搜索对具有与通过所述编辑器的输入项输入的元数据中的至少一者相同的元数据、或具有与通过所述编辑器的输入项输入的元数据中的至少一者同义的元数据的内容进行搜索。
12.根据权利要求1所述的方法,该方法进一步包括在搜索时将附加服务添加至搜索结果中。
13.根据权利要求12所述的方法,其中所述附加服务为内容上下文认知服务,并且该内容上下文认知服务包括以下各项中的至少一者导航服务、销售服务、广告服务、教育服务、咨询服务、推荐服务以及行政服务。
14.根据权利要求1所述的方法,其中所述编辑器的输入项中的至少一者被自动输入作为通过使用所述关键字生成的实际数据。
15.根据权利要求1所述的方法,该方法进一步包括通过将输入的元数据与构成所搜索的内容的元数据进行比较,来分别选择并输出具有高度一致性的内容。
16.一种提供用于搜索的信息的方法,该方法包括通过使用针对包含于信息内的文本的分析结果,来检测提供所述信息的信息提供者的意图;将符合所述信息提供者的意图的编辑器提供给用户;以及对整合了通过所述编辑器的输入项输入的元数据的内容进行存储。
17.根据权利要求16所述的方法,该方法进一步包括将包含于输入信息内的文本分离成语意单词;以及对分离后的关键字执行语法分析,其中对信息提供者的意图的检测通过使用执行所述语法分析时的语法分析结果来检测提供所述信息的所述信息提供者的意图。
18.根据权利要求17所述的方法,其中语法分析的执行将语法表达式输出作为所述语法分析结果,其中通过分析句子内分离后的单词是否具有任何文法关系以及语义关联来获取所述语法表达式。
19.根据权利要求18所述的方法,其中所述语法表达式为逻辑表达式、修饰-被修饰以及语法列表表达式中的至少一者。
20.根据权利要求18所述的方法,其中语法分析的执行参考语法文法规则字典,以分析句子内分离后的单词是否具有任何文法关系以及语义关联,以及所述语法文法规则字典列有短语结构文法、格文法、敏感文法以及词汇文法中的至少 “"者 ο
21.根据权利要求17所述的方法,其中所述分离针对每个词性来对所述文本进行分1 O
22.根据权利要求21所述的方法,其中所述分离通过参考与每个单词的词性相关的信息来针对每个词性将所述文本进行分离,所述与每个单词的词性相关的信息以数据库方式存储于语素字典内。
23.根据权利要求16所述的方法,该方法进一步包括提取符合所述信息提供者的意图的内容的元数据,其中编辑器的提供提供作为符合所述信息提供者的意图的编辑器的编辑器,在该编辑器中,被提取的元数据成为输入项。
24.根据权利要求16所述的方法,该方法进一步包括通过参考所述信息提供者的意图来确定存储所述信息的目录,其中所述内容的存储将所述内容存储于所确定的目录内。
25.根据权利要求16所述的方法,该方法进一步包括对包含于针对每一目录划分的内容内的文本进行收集,其中所述检测使用针对收集到的文本的分析结果。
26.一种提供用于搜索的信息的方法,该方法包括 对包含于针对每一目录划分的内容内的文本进行收集;通过使用针对收集到的文本的分析结果,来检测提供信息的信息提供者的意图; 将符合所述信息提供者的意图的编辑器提供给用户;以及对整合了通过所述编辑器的输入项输入的元数据的内容进行存储。
27.一种搜索信息的方法,该方法包括 接收关键字;接收输入所述关键字的搜索者的意图;将符合最终意图的编辑器提供给所述搜索者,所述最终意图整合了对所述关键字的分析结果以及所述搜索者的意图;以及搜索具有与通过所述编辑器的输入项输入的元数据相关联的元数据的内容。
28.根据权利要求27所述的方法,该方法进一步包括 将输入的关键字分离为语意单词;以及对分离后的关键字执行语法分析,其中所述编辑器的提供使用执行所述语法分析时的语法分析结果。
29.一种提供用于搜索的信息的方法,该方法包括 接收信息;接收输入所述信息的信息提供者的意图;将符合最终意图的编辑器提供给所述信息提供者,所述最终意图整合了对所述信息的分析结果以及所述信息提供者的意图;以及对整合了通过所述编辑器的输入项输入的元数据的内容进行存储。
30.根据权利要求四所述的方法,该方法进一步包括 将输入的信息分离为语意单词;以及对分离后的单词执行语法分析,其中所述编辑器的提供使用执行所述语法分析时的语法分析结果。
全文摘要
提供了基于用户意图的信息搜索方法以及信息供应方法。所述信息搜索方法包括通过使用对被搜索的关键字的分析结果,来提供与所确认的搜索者的意图相匹配的编辑装置;以及,对具有与通过该编辑装置输入的元数据相关的元数据的内容进行搜索。以此方式,可根据搜索者输入的信息来确认搜索者的意图,可基于所确认的意图来导出详细元数据,并可通过使用输入的元数据来执行搜索。
文档编号G06F17/30GK102246164SQ200980150114
公开日2011年11月16日 申请日期2009年12月11日 优先权日2008年12月11日
发明者郑喜盛 申请人:有限公司呢哦派豆
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1