一种通过搜索重建数据的方法

文档序号:6463360阅读:199来源:国知局
专利名称:一种通过搜索重建数据的方法
技术领域
本发明属于网络信息处理领域,特别是一种通过搜索重建数据的方法。
背景技术
对于依赖互联网为生的企业来说,往往需要通过搜索引擎査询各类信息。如对零售商来说,某一产品的全部生产商,该产品在不同时期不同地点的销售价格,该产品的用户评价等,是其所关注的。
由于原始数据提供者的原因,互联网上的这些数据往往会随着时间的流逝而不断变化或消失,从而导致用户即便以同一方式搜索数据,也会在不同时期
看到迥异的结果;或者当下一次搜索时,己找不到期望的数据。数据的变化会导致结论上的差异;数据的缺失更难以形成结论。因此如能将用户通过互联网搜索到的公开信息资源重新组织、归类,把用户关注的内容收集整理,将无序、不可控制的公共数据变成有组织、可控制的私人数据。将为那些对相关信息资源敏感度很高的用户带来极大的便利。

发明内容
鉴于以上需求,本发明的目的在于通过技术手段将互联网上公开的和公共的各类信息资源重新组织、归类,把用户关注的内容,那些看似庞大、混乱
的数据以更合理、有序的方式呈现出来。即将各种非关系型数据通过技术手段重新组合,形成关系型数据。通过这项技术,可以将无组织、无管理的公共数据变成有组织、可管理的私人数据。
本发明所采用的技术方案是 一种通过搜索重建数据的方法,可以利用通过互联网提供服务的搜索引擎完成数据重建工作,本方法基于一个插入在用户和搜索引擎之间的解析接口系统;所述解析接口系统包括前端Web服务器、解析服务器和解析数据库服务器;
所述前端Web服务器包括一定制的用户搜索页面、以及一语义检査模块;
所述解析服务器包括搜索条件翻译模块、语义转化模块、网页编译模块、超文本解析模块、以及数据存储模块;
所述解析数据库服务器用于存储经过加工处理的数据。
本发明中,基于解析接口系统的方法包括以下步骤
步骤h在用户和搜索引擎之间插入解析接口系统;
步骤2:当用户进行搜索时,首先访问解析接口系统中的前端Web服务器,通过前端Web服务器提供的用户搜索页面,以接近自然语言的表达方式填写搜索条件进行搜索,语义检査模块对搜索条件进行语法检査,并发送给解析服务器;
步骤3:解析服务器收到搜索条件后,启用搜索条件翻译模块将搜索条件翻译为机器识别的结构化査询语言,然后解析服务器用此结构化査询语言到解析数据库服务器进行查询;
步骤4:解析数据库服务器返回搜索结果到解析服务器;步骤5:网页编译模块将搜索结果加工成符合特定形式的字符流发送给解析服务器;
步骤6:解析服务器将该字符流呈现给用户,用户得到检索结果。本发明的有益效果是
本发明一种通过搜索重建数据的方法可以满足用户在不同时期通过搜索引擎査询各类信息时,对公开信息资源重新组织、归类,把用户关注的内容收集整理,将无组织、无管理的公共数据变成有组织、有管理的私人数据。


以下结合实施例及其附图对本发明作进一步说明。
图1是一般情况下用户通过搜索引擎搜索信息的结构流程示意图2是本发明的结构流程示意图3是本发明方法的流程示意图。
图中l.用户、2.解析接口系统、3.搜索引擎、4.前端Web服务器、5.解析服务器、6.解析数据库服务器、7.用户搜索页面、8.语义检査模块、9.搜索条件翻译模块、IO.语义转化模块、ll.网页编译模块、12.超文本解析模块、13.数据存储模块、14.WEB服务器、15.中间服务器、16.数据库服务器
具体实施例方式
图1展示了一般情况下用户通过搜索引擎搜索信息的结构和流程,在传统搜索行为中,仅有用户1和搜索引擎3,搜索引擎3包括WEB服务器14、中间服务器15、数据库服务器16。
用户直接访问搜索引擎3的WEB服务器14提供的査询页面,并在査询页面上输入搜索条件,WEB服务器14对搜索条件进行语法检査,然后发送给中间服务器15,中间服务器15收到搜索条件后,将搜索条件翻译为机器识别的结构化査询语言,中间服务器15用该结构化查询语言到数据库服务器16查询,数据库服务器16返回查询结果之后,中间服务器15将査询结果加工成HTML或XML发送给WEB服务器14,并由WEB服务器14将该HTML或XML字符流呈现给最终用户。
而本发明一种通过搜索重建数据的方法,则不同于以上提及的传统的用户搜索方法。本发明的方法可以利用通过互联网提供服务的搜索引擎3完成数据
重建工作。从图2中可以看到
具体实施例方式
基于一个插入在用户1和搜索引擎3之间的解析接口系统2;所述解析接
口系统2包括前端Web服务器4、解析服务器5和解析数据库服务器5;
所述前端Web服务器4包括一定制的用户搜索页面7、以及一语义检查模
块8;
所述解析服务器5包括搜索条件翻译模块9、语义转化模块IO、阿页编译模块ll、超文本解析模块12、以及数据存储模块13;
所述解析数据库服务器6用于存储经过加工处理的数据。
本发明实施例
所述的基于解析接口系统2的方法包括以下步骤步骤h在用户l和搜索引擎3之间插入解析接口系统2;
步骤2:当用户l进行搜索时,首先访问解析接口系统2中的前端Web服务器4,通过前端Web服务器4提供的用户搜索页面7,以接近自然语言的表达方式填写搜索条件进行搜索,语义检查模块8对搜索条件进行语法检査,并发送给解析服务器5;
步骤3:解析服务器5收到搜索条件后,启用搜索条件翻译模块9将搜索条件翻译为机器识别的结构化査询语言,然后解析服务器5用此结构化查询语言到解析数据库服务器6进行查询;
步骤4:解析数据库服务器6返回搜索结果到解析服务器5;
步骤5:网页编译模块11将搜索结果加工成符合特定形式的字符流发送给解析服务器5;
步骤6:解析服务器5将该字符流呈现给用户1,用户l得到检索结果。在本发明实施例中,所述步骤4由以下步骤组成步骤4a:判断解析数据库服务器6返回的搜索结果,如果解析数据库服务器6返回的搜索结果大于零,则进入步骤5;如果解析数据库服务器6返回的
搜索结果不大于零,则进入步骤4b;
步骤4b:解析服务器5启用语义转化模块10将前端WEB服务器4的搜索条件转换为符合搜索引擎3规范的搜索条件,并将转换完成的搜索条件发送
给搜索引擎3;
步骤4c:解析服务器5获取搜索引擎3返回的搜索结果,该搜索结果以搜索引擎3规定的特定字符流形式返回到解析服务器5;
步骤4d:解析服务器5启用超文本解析模块12将步骤4c中返回的字符流重新组装成符合解析数据库服务器6存储要求的数据对象;
步骤4e:解析服务器5启用数据存储模块13将步骤4d组装完成的数据对象与通过步骤3翻译成的结构化査询语言建立对应关系,并将它们存储于解析数据库服务器6中;
步骤4f:转到步骤5。
步骤4a到步骤4f的目的是,如果解析数据库服务器6中'储存有用户1欲获取的信息,则直接将该信息呈现给用户1,以提高搜索速度;如果解析数据库服务器6中不包含用户1所需信息,则交由搜索引擎3进行检索并返回信息,同时将该信息与查询条件建立对应关系,并将他们存储于解析数据库服务器6中,完善解析数据库服务器6存储的信息数据,以便用户1下次搜索时可以直接从解析数据库服务器6中调用。
在本发明的实施例中,所述方法的步骤5:网页编译模块ll将搜索结果加工成符合特定形式的字符流发送给解析服务器5。其中符合特定形式的字符流为HTML或XML字符流。所述方法的步骤4C:解析服务器5获取搜索引擎3返回的搜索结果,该搜
索结果以搜索引擎3规定的特定字符流形式返回到解析服务器5。其中符合特定形式的字符流为HTML或XML字符流。
本发明一种通过搜索重建数据的方法,通过技术手段将互联网上公开的和公共的各类信息资源重新组织、归类,把用户关注的内容,使看似庞大、混乱的数据以更合理的方式呈现出来。即将各种非关系型数据通过技术手段重新组合,形成关系型数据。通过这项技术,可以将无序、不可控制的公共数据变成有组织、可控制的私人数据。将为那些对相关信息资源敏感度很高的用户带来极大的便利。在网络信息处理领域将有很大的巿场前景。
权利要求
1.一种通过搜索重建数据的方法,可以利用通过互联网提供服务的搜索引擎完成数据重建工作,其特征在于本方法基于一个插入在用户和搜索引擎之间的解析接口系统;所述解析接口系统包括前端Web服务器、解析服务器和解析数据库服务器;所述前端Web服务器包括一定制的用户搜索页面、以及一语义检查模块;所述解析服务器包括搜索条件翻译模块、语义转化模块、网页编译模块、超文本解析模块、以及数据存储模块;所述解析数据库服务器用于存储经过加工处理的数据。
2. 根据权利要求l所述的一种通过搜索重建数据的方法,其特征在于所述的 基于解析接口系统的方法包括以下步骤步骤l:在用户和搜索引擎之间插入解析接口系统;步骤2:用户进行搜索时,首先访问解析接口系统中的前端Web服务器,通过 前端Web服务器提供的用户搜索页面,以接近自然语言的表达方式填写搜索条 件进行搜索,语义检査模块对搜索条件进行语法检查,并发送给解析服务器;步骤3:解析服务器收到搜索条件后,启用搜'索条件翻译模块将搜索条件翻译为 机器识别的结构化查询语言,然后解析服务器用此结构化查询语言到解析数据 库服务器进行查询;步骤4:解析数据库服务器返回搜索结果到解析服务器;步骤5:网页编译模块将搜索结果加工成符合特定形式的字符流发送给解析服务 器;步骤6:解析服务器将该字符流呈现给用户,用户得到检索结果。
3. 根据权利要求2所述的一种通过搜索重建数据的方法,其特征在于所述步骤4由以下步骤组成步骤4a:判断解析数据库服务器返回的搜索结果,如果解析数据库服务器返回的搜索结果大于零,则进入步骤5;如果解析数据库服务器返回的搜索结果不大于零,则进入步骤4b;步骤4b:解析服务器启用语义转化模块将前端WEB服务器的搜索条件转换为符合搜索引擎规范的搜索条件,并将转换完成的搜索条件发送给搜索引擎;步骤4c:解析服务器获取搜索引擎返回的搜索结果,该搜索结果以搜索引擎规定的特定字符流形式返回到解析服务器;步骤4d:解析服务器启用超文本解析模块将步骤4c中返回的字符流重新组装成符合解析数据库服务器存储要求的数据对象;步骤4e:解析服务器启用数据存储模块将步骤4d组装完成的数据对象与通过步骤3翻译成的结构化査询语言建立对应关系,并将它们存储于解析数据库服务器中;步骤4f:转到步骤5。
4. 根据权利要求2所述的一种通过搜索重建数据的方法,其特征在于所述符合特定形式的字符流为HTML或XML字符流。
5. 根据权利要求3所述的一种通过搜索重建数据的方法,其特征在于所述符合特定形式的字符流为HTML或XML字符流。
全文摘要
本发明涉及一种通过搜索重建数据的方法,可以利用通过互联网提供服务的搜索引擎完成数据重建工作,本方法基于一个插入在用户和搜索引擎之间的解析接口系统;解析接口系统包括前端Web服务器、解析服务器和解析数据库服务器;本发明的方法包括步骤1在用户和搜索引擎之间插入解析接口系统;步骤2用户访问解析接口系统填写搜索条件进行搜索;步骤3解析服务器到解析数据库服务器进行查询;步骤4解析数据库服务器返回搜索结果到解析服务器;步骤5将搜索结果加工成符合特定形式的字符流发送给解析服务器;步骤6解析服务器将该字符流呈现给用户,用户得到检索结果。产品适用范围广,有广阔的国内和国际市场前景。
文档编号G06F17/30GK101561808SQ20081010441
公开日2009年10月21日 申请日期2008年4月18日 优先权日2008年4月18日
发明者晨 孙 申请人:北京瑞佳晨科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1