语意识别搜索的方法及系统的制作方法

文档序号:6372735阅读:306来源:国知局
专利名称:语意识别搜索的方法及系统的制作方法
技术领域
本发明涉及网络搜索的方法,具体的讲是用于网络的语意识别搜索的方法及系统。
背景技术
随着网络技术、电子技术的进步,互联网上的信息内容越来越庞大。目前的互联网用户对网络信息的获取已经很习惯的于通过互联网的搜索引擎进行搜索,并在搜索出的条目中找寻与自己真实搜索目的相关的内容。在互联网发展的早期,以雅虎为代表的网站分类目录查询非常流行。网站分类目录由人工整理维护,精选互联网上的优秀网站,并简要描述,分类放置到不同目录下。用户 查询时,通过一层层的点击来查找自己想找的网站。也有人把这种基于目录的检索服务网站称为搜索引擎,但从严格意义上讲,它并不是搜索引擎。由于互联网信息量的增长速度太快,以至于采用由人工整理维护网站分类目录的方式不可能继续。新一代搜索引擎应运而生。在数据库维护上,搜索引擎把以前被搜索的条目进行整理汇总形成数据库;搜索引擎主动抓取索引信息对数据库进行增补,进一步提高搜索数据库的覆盖范围。当用户发起搜索请求时,搜索引擎在数据库中检索“关键词”并将包含关键词的HTML链接反馈给用户。目前的各种搜索引擎都是基于这种技术建立起来的。但无论那种搜索引擎目前都不能对“关键词”进行“语意”的理解,更不能按照“语意”去为用户搜索所需的内容。每种搜索方式的核心都是基于“关键词”的文字表达在数据库中的检索。引擎反馈给用户的HTML链接也只是包含到“关键词”的特定网页。然而用户搜索命令的含义不仅为“关键词”的文字表达那么片面,是有其内涵并且含有期待的。譬如,搜索“北京”一词,就有以下若干可能小学生搜索“北京”,可能希望了解北京的历史、人文。以丰富知识;在外地搜索“北京”,可能是正在筹划一次旅行。希望知道的可能是航班、天气、旅游行程等;工作人员搜索“北京”,可能是有工差需要前往。希望知道的可能是工差地的吃、住、行等信息。那么利用现有的搜索引擎来搜索,得到的结果是广泛、无区别、不具针对性的。随着互联网用户的增多,用户的搜索需求也更加复杂。深入分析不同用户的潜在需求,缩小搜索结果范围、提高搜索精度,是对搜索引擎提出的新要求。

发明内容
针对上述的问题,本发明提供了一种语意识别搜索的方法及系统,能够准确理解用户输入条目的语意,并根据语意为用户用尽少的步骤搜索到用户真实关注的内容。并且系统具备知识集升级的功能。
本发明语意识别搜索的方法,包括客户端接收搜索关键词,并将搜索关键词和用户信息发送至语意搜索系统的语意库;所述语意库结合用户信息中的至少一个属性,将搜索关键词解析为与所述属性相关的类别关键词,并通过语意搜索系统将解析后的类别关键词通过互联网发送到搜索引擎中进行搜索;当语意库不能结合所述属性对搜索关键词进行解析时,语意搜索系统将搜索关键词发送至人工客服处,由人工结合所述属性将搜索关键词的语意解析为相关的类别关键词,并将解析后的类别关键词通过互联网发送到搜索引擎中进行搜索;语意搜索系统将搜索引擎搜索的结果反馈至客户端进行显示;
人工客服处由人工将本次搜索关键词、用户信息和类别关键词以关联方式存储到所述语意库中。对用户输入的搜索关键词先通过计算机系统进行语意的分析,当计算机系统不能解析关键词针对该用户的具体含义时,计算机系统将用户信息和搜索关键词发送到人工客服处,由人工进行解析。在人工解析时,可以是客服人员根据用户信息和搜索关键词直接进行判断和理解,也可以是通过和用户语音交流进行判断,最后将人工解析的结果和用户信息存入计算机系统的语意库中,对其进行升级,使语意库以后再遇到类似的用户信息和搜索关键词时,可以自行做出相应的语意解析。通过这种计算机系统和人工结合的方式,使用户的真实搜索需求得到了最大化的正确理解,明显提高了网络搜索的针对性和搜索效率。可选的,所述的搜索关键词为语音信息,客户端接收语音信息的搜索关键词后对其进行PCM (脉码调制)编码,并将编码后的信息发送至语音识别引擎转换为文本格式,将所述的文本格式信息反馈至客户端后,由客户端将文本格式的搜索关键词和用户信息发送至语意搜索系统的语意库。语音输入与文字输入相比明显更快捷性和方便,但语音输入后需要在客户端将输入的语音转换为文本格式以便于后续计算机和人工的处理。优选的,由语意搜索系统自动通过互联网的搜索引擎进行搜索后,对搜索结果语意搜索系统根据用户信息中的至少一个属性进行筛选,将筛选后的搜索结果反馈至客户端。对搜索的结果再根据用户信息进行一次筛选一次,能够进一步提高搜索的针对性,筛选的方式可以和之前对语意解析的方法一样。类似的一种优选方式,由人工客服处通过人工对搜索关键词进行互联网的搜索引擎搜索后,对搜索结果再由所述人工根据用户信息中的至少一个属性进行筛选,将筛选后的搜索结果通过语意搜索系统反馈至客户端。具体的,所述用户信息的属性包括有客户端IP、用户年龄、用户职业、目标时间和历史搜索类别中的至少一项,还可以根据系统的设置和具体环境结合更多的属性,使语意的理解更准确。具体的,所述的客户端为能够通过Web浏览器连接互联网的终端设备。本发明还提供用于上述方法的语意识别搜索的系统,是由客户端通过网络与语意搜索系统的语意库双向连接,语意搜索系统的输出端连接互联网的搜索引擎和人工客服处的终端,人工客服处的终端也连接至互联网的搜索引擎。为了简化用户的输入方式,可选的一种方式是客户端还与语音识别引擎进行双向连接,由语音识别引擎对语音输入进行文本转换。具体的,所述的客户端为能够通过Web浏览器连接互联网的终端设备。本发明的语意识别搜索的方法及系统,能够准确理解用户输入搜索关键词的语意,并能够根据语意为用户用尽少的步骤搜索到用户真实关注的内容,具有显著的针对性,提高了网络搜索的效率,同时系统还具备知识集升级的功能。以下结合附图所示实施例的具体实施方式
,对本发明的上述内容再作进一步的详细说明。但不应将此理解为本发明上述主题的范围仅限于以下的实例。在不脱离本发明上述技术思想情况下,根据本领域普通技术知识和惯用手段做出的各种替换或变更,均应包括在本发明的范围内。


图I为本发明语意识别搜索的方法的流程图。
具体实施例方式本发明语意识别搜索的系统,由具备Web浏览器的客户端通过网络与语意搜索系统的语意库双向连接,客户端还与语音识别引擎进行双向连接,由语音识别引擎对语音输入进行文本转换。语意搜索系统的输出端连接互联网的搜索引擎和人工客服处的终端,人工客服处的终端也连接至互联网的搜索引擎。如图I所示通过上述系统的本发明语意识别搜索的方法,包括客户端接收用户语音输入的搜索关键词,对其进行PCM (脉码调制)编码,并将编码后的信息发送至语音识别引擎转换为文本格式,再将所述的文本格式信息反馈至客户端后,将文本格式的搜索关键词和用户信息一并发送至语意搜索系统的语意库;用户信息中包含了客户端IP、用户年龄、用户职业、目标时间和历史搜索类别等属性,也可以根据系统的设置和具体环境结合更多的属性。语意库结合用户信息中的至少一个属性,将搜索关键词解析为与所述属性相关的类别关键词,如电影、音乐、天气、对话等,并通过语意搜索系统将解析后的类别关键词通过互联网发送到搜索引擎中进行搜索;当语意库不能结合所述属性对搜索关键词进行解析时,语意搜索系统将搜索关键词发送至人工客服处,由人工结合所述属性将搜索关键词的语意解析为相关的类别关键词,并将解析后的类别关键词通过互联网发送到搜索引擎中进行搜索;由语意搜索系统自动通过互联网的搜索引擎进行搜索后,对搜索结果语意搜索系统根据用户信息中的至少一个属性进行筛选,将筛选后的搜索结果反馈至客户端。对搜索的结果再根据用户信息进行一次筛选一次,能够进一步提高搜索的针对性,筛选的方式可以和之前对语意解析的方法一样。类似的,由人工客服处通过人工对搜索关键词进行互联网的搜索引擎搜索后,对搜索结果再由所述人工根据用户信息中的至少一个属性进行筛选,将筛选后的搜索结果通过语意搜索系统反馈至客户端;语意搜索系统将搜索引擎搜索的结果反馈至客户端进行显示;人工客服处由人工将本次搜索关键词、用户信息和类别关键词以关联方式存储到所述语意库中,对其进行升级,使语意库以后再遇到类似的用户信息和搜索关键词时,可以自行做出相应的语意解析。
通过本实施例的方法进行网络搜索时,如用户IP=四川,年龄=12,日志=常搜索地理、历史、人文、科教等信息,用户搜索“北京”,系统反馈为地图、朝代、名人等信息;如用户IP=四川,年龄=18,时间=8月等信息,用户搜索“北京”通过人工或系统分析用户可能高考完毕,准备旅游。反馈信息为航班,酒店,旅游路线等信息。
通过这种计算机系统和人工结合的方式,使用户的真实搜索需求得到了最大化的正确理解,明显提高了网络搜索的针对性和搜索效率。
权利要求
1.语意识别搜索的方法,其特征为包括 客户端接收搜索关键词,并将搜索关键词和用户信息发送至语意搜索系统的语意库; 所述语意库结合用户信息中的至少一个属性,将搜索关键词解析为与所述属性相关的类别关键词,并通过语意搜索系统将解析后的类别关键词通过互联网发送到搜索引擎中进行搜索; 当语意库不能结合所述属性对搜索关键词进行解析时,语意搜索系统将搜索关键词发送至人工客服处,由人工结合所述属性将搜索关键词的语意解析为相关的类别关键词,并将解析后的类别关键词通过互联网发送到搜索引擎中进行搜索; 语意搜索系统将搜索引擎搜索的结果反馈至客户端进行显示; 人工客服处由人工将本次搜索关键词、用户信息和类别关键词以关联方式存储到所述语意库中。
2.如权利要求I所述的语意识别搜索的方法,其特征为所述的搜索关键词为语音信息,客户端接收语音信息的搜索关键词后对其进行PCM编码,并将编码后的信息发送至语音识别引擎转换为文本格式,将所述的文本格式信息反馈至客户端后,由客户端将文本格式的搜索关键词和用户信息发送至语意搜索系统的语意库。
3.如权利要求I所述的语意识别搜索的方法,其特征为由语意搜索系统自动通过互联网的搜索引擎进行搜索后,对搜索结果语意搜索系统根据用户信息中的至少一个属性进行筛选,将筛选后的搜索结果反馈至客户端。
4.如权利要求I所述的语意识别搜索的方法,其特征为由人工客服处通过人工对搜索关键词进行互联网的搜索引擎搜索后,对搜索结果再由所述人工根据用户信息中的至少一个属性进行筛选,将筛选后的搜索结果通过语意搜索系统反馈至客户端。
5.如权利要求I至4之一所述的语意识别搜索的方法,其特征为所述用户信息的属性包括有客户端IP、用户年龄、用户职业、目标时间和历史搜索类别中的至少一项。
6.如权利要求I至4之一所述的语意识别搜索的方法,其特征为所述的客户端为能够通过Web浏览器连接互联网的终端设备。
7.用于权利要求I所述方法的语意识别搜索的系统,其特征为客户端通过网络与语意搜索系统的语意库双向连接,语意搜索系统的输出端连接互联网的搜索引擎和人工客服处的终端,人工客服处的终端也连接至互联网的搜索引擎。
8.如权利要求7所述的语意识别搜索的系统,其特征为客户端还与语音识别引擎进行双向连接。
9.如权利要求7或8所述的语意识别搜索的系统,其特征为所述的客户端为能够通过Web浏览器连接互联网的终端设备。
全文摘要
本发明涉及语意识别搜索的方法及系统,包括客户端将搜索关键词和用户信息发送至语意搜索系统的语意库;所述语意库结合用户信息中的至少一个属性,将搜索关键词解析为类别关键词后进行搜索;当语意库不能解析搜索关键词时,系统将搜索关键词发送至人工客服处,由人工解析类别关键词后进行搜索;客户端显示反馈的搜索结果;人工客服处由人工将本次搜索关键词、用户信息和类别关键词以关联方式存储到所述语意库中。本发明的语意识别搜索的方法及系统,能够准确理解用户输入搜索关键词的语意,并能够根据语意为用户用尽少的步骤搜索到用户真实关注的内容,具有显著的针对性,提高了网络搜索的效率,同时系统还具备知识集升级的功能。
文档编号G06F17/30GK102831157SQ20121022992
公开日2012年12月19日 申请日期2012年7月4日 优先权日2012年7月4日
发明者赵勇, 黄诚 申请人:四川长虹电器股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1