信息检索装置的制作方法

文档序号:6130503阅读:102来源:国知局

专利名称::信息检索装置的制作方法
技术领域
:本发明涉及电子导航领域,尤指一种信息检索装置。
背景技术
:i贿的车载卫星"f^元系统的信息检索装置"fi4老財是供了兴趣点信息的查询检索功能,利用该功能,用户可以方便的在查询界面输入自己想要查询的信息内容,系统会自动查询输出查询结果,以满足用户的需求。目前提供的兴趣点的详细信息主要有名称、地址、电话、传真、邮编等属性信息,用户查询检索到后,可以看到这些信息的详细文字记录即都是文字性抽象的记录,但用户并不能了解该兴趣点的实际外观形象。
发明内容本发明要解决的问^A提供一种展示实际外观形象的信息检索装置。为了解决上述问题,本发明信息检索装置包括输入单元,用于4妾收纟会索词;分词单元,用于对所述输入单元接收的检索词进行分词处理以荻得若干词元;匹配单元,用于在导航电子地图数据库中找出所述检索词或者所述词元匹配的字段;主照片配置单元,用于将兴趣点的主照片存入导航电子地图数据库中;显示单元,用于显示与所述匹配单元找出的字段相关的信息和其主照片。所述分词单元进一步包括词汇判断单元,判断检索词是否为可分类词汇;查找单元,若检索词为可分类词汇,则在指针集合中查^i企索词,若为一般词汇,则在词库集合中查找检索词;第一判断单元,用于判断所述查找单元是否找到所述检索词;检索词处理单元,若乂AM"述第一判断单^U矣收的信息为"否"则减小所述检索词的长度并将减d、长度后的检索词送给所述查找单元;存放单元,用于存》i^斤述检索词处理单元截取掉的字符和将查找到的检索词作为一个词元存j诸;第二判断单元,判断所述存放单元中是否还有未分词的部分,若还有则将未分词的部分送给所述查找单元,否则将词元输出。所述显示单元进一步包括排序单元,用于按照匹配度的高低对所述匹配单元4企索出的字段进行排序;相关显示单元,用于按照排序单元所排的顺序显示与所述字段相关的信息。与现有技^目比,本发明信息检索装置的有益效果为由于本发明采用了主照片配置单元104将兴趣点的主照片存入^^t电子地图数据库中,在将查询结果显示出来的时候同时也将其相应的主照片显示出来,从而能够展示兴趣点等待查询信息的实际形象。图l是本发明电子导航系统的信息检索装置的结构图;图2是图1中的分词单元的结构示意图;图3是词库结构示意图;图4是词库的举例示意图。具体实施例方式如图1所示,本发明电子导航系统的信息检索装置包括输入单元IOO,用于接收检索词;'分词单元101,用于对所述检索词进行分类并进行分词处理以获得若干词元;匹配单元102,用于在数据库中找出与所述词元匹配的字段;主照片配置单元104,用于将兴趣点的主照片存入导航电子地图数据库中;显示单元103,用于显示与所述匹配单元102找出的字段相关的信息和其主照片。由上述可知,主照片配置单元104将兴趣点的主照片存入^^元电子地图数据库中,输入单元100将接^^的检索词it^^词单元101,分词单元101将检索词处理后得到若千词元,匹配单元102在导航电子地图数据库中查找与这些词元匹配的信息,显示单元103在将这些匹配的信息的时候同时也将其主照片从,电子地图数据库中取出并显示出来,从而能够展示兴趣点的实际形象。POI主照片数据表Poiphoto结构如表1所示<table>tableseeoriginaldocumentpage5</column></row><table>表lPOI主照片数据表Poiphoto内#例如表2:<table>tableseeoriginaldocumentpage5</column></row><table>表2所述分词单元101进一步包括词汇判断单元1015,判断检索词是否为可分类词汇;查找单元1010,对于可分类词汇,在指针集合中查拔险索词;对于一般词汇,在整个词库集合中查找检索词;第一判断单元ion,用于判断所述查找单元1010是否找到所述检索词;检索词处理单元1012,若乂A^斤述第一判断单元1011接收的信息为"否"则减小所述检索词的长度并将减d、长度后的检索词送给所述查找单元1010;存放单元1013,用于存ii^斤述检索词处理单元1012截取掉的字符和将查找到的检索词作为一个词元存储;第二判断单元1014,判断所述存放单元1013中是否还有未分词的部分,若还有则将未分词的部分送给所述查找单元1010,否则将词元输出。所述显示单元103进一步包括排序单元1030,用于按照匹配度的高#^十所述匹配单元102检索出的字段进行排序;相关显示单元1031,用于按照排序单元所排的顺序显示与所述字,史相关的f自'&。其中,实现词汇判断单元1015的伪代码为Stringkey="4企索词";Stringtype=key.subString(length-2);〃取得;险索词的最后两个字Dictionarydie=newDictionaiy("SDIC.txt");〃加载类别表Has固aphm=newHas固ap()while((s=in.readLine())!=null)words=s.split("\t");Integerfreq=newInteger(words[l]);hm.put(words[O],freq);〃存入类别名称实现查找单元1010的伪代码为Stringkey="检索词";Setresultset="得到的检索集合";〃若为可分类词汇,则此集合为该类别的指针集合,若为H词汇,则此集合指整个词库中的内容booleanbool=resultset.containsKey(key);〃判断^r索词是否在4企索集合中实现检索词处理单元1012的伪代码为Stringkey="检索词";If(没有找到检索词){key-原检索词长度减小1后的结果;"l^亍1010单元;}现假设用户输入的检索词是"中国人民银行,,实现排序单元1030的伪代码为intnum=用户输入的检索词经过分词后得到的词元个数;int[]length=每个词元的字符串长度;Intlength=key.length();〃得到检索词的字符串长度〃是否找到类别名称intlen=搜索出的每个记录的名字长度;if(num=l){//分词结果为该词本身len与length比较。len越大,结果越靠后;〃实现"中国人民银行"排在"中国人民银行昌平分行"前面的功能else{num越大,表示该记录包含的词元数量越多,结果应靠前显示。当num—样时,则比较记录的长度,长度小的靠前显示;〃实现"中国人民银行昌平分行"排在"中国人民银行建设路分行,,前面的功能其中,所述可分类词汇指可划分到某个行业种类里面的词汇。例如检索词为"王府饭店",则这个4企索词就为可分类词汇,其类型名称为饭店。"!^元信息检索的特点之一为,用户检索的内容95%以上为各种地点的名称,而中文短句的中心词通常是最后两个字,例如xx饭店,xx宾馆,利用这个沐g,首先在词库中建立一个类别表,里面存放"饭店","宾馆","超市"等类型名称。进行类型判断时首先取出检索词的最后两个字,在类别表中查找,如果找到,则该检索词属于可分类词汇,类型名称为检索词的最后两个字。传统的词库都是換照词元的汉语拼音字母的顺序进行排序,本系统的词库采用类别和字母顺序相结合的方式进fri司元的排序。对于可分类词汇,每个类别内部以及各个类别之间的词元采用汉语挢奮字母的顺序进行排序,并且分布在词库中词元列表的前面,减少可分类词汇的检索时间;对于4史词汇,则只按照词元的汉语拼音字母的顺序进行排序,并且分布在可分类词汇的后面。词库中内容的片断截取如下银行14—1(可分类词汇)中国工商14—1—1中国建设14_1—2中国农业14—1—3癌231(—般词汇)癌细胞23—2癌症23—3癌胂23_4矮23一5纖23—6矮秆作物23—7类别J^要负责记录各种类别及其索引编号,以供查找。类别表的结构大体与词库相似,但内容要少很多,所以查询类别表花费的时间很少,^可以忽略。类别表内容的片断截取如下商场10—1超市10_2专卖店10_3如图3所示,词汇分类时采用从大类到小类的方式进行分类,也方便进frM]库的管理。根据曰常生活的特点,首先确定几个大的类别,为[个大类确定一个索引前缀,目的是唯一标识此大类,以便添加更小的类别(如娱乐休闲,索引前缀为11);然后对此大类进行进一步细分,划分出更加详细的小类别,并且在大类索引前缀的后面添加类别编号,完成此小类的索引前缀(如酒吧,索引前缀为11一2)。对于词库,以"银疗'为例,它属于一个小类别,对应的大类为"金融机构",其索引前缀为"14","银行"在大类中的编号是"1",这样,就可以确定"银行"这一小类别的索引前缀为"14_1"。然后为"银行"这一类别中添加具体内#索引指针,例如(名称)(指针/指针集合)银行14—1,14一1一1,14—1—2,14丄3…中国工商14—1—1中国建设14_1_2中国农业14—1—3例如用户开始输入的检索词为"北京威帝科技九复",iiA分词单元,首先进布险索词的类型判定,经过分析判定为建筑物(索引前缀20,如图3和4所示)-大厦(索引前缀20—13,如图3和4所示),在词库中查找数据区域为"^il"的词元,得到该索引区域的指针集合。在指针集合中查找"北京威帝科技,,,集合中如果没有找到这个词,则字符串长度减小一个字,变成"北京威帝科",再去集合中查找,如果没有,再减小一个,变成"北京威帝",这次如f^词库中找到了这个词,则"北京威帝"是分词结果的一部分;现在用户输入的检索词经过分词只剩下了"科技",将"科技"这个词继续在指针集合中查找,如找到,则最^#用户输入的检索词分词为"北京威帝,,,"科技","大厦,,,若在指针集合中无法找到与"北京威帝科技,,相关的内容,则将"北京威帝科技大厦"作为4词汇,进行词库查找。分词成功后,在导航电子地图数据库中查找出所有包含"北京威帝,,,"科技,,,"大厦,,三个关键字的记录,并按照与用户输入的检索词"北京威帝科技九复,,的匹配度高<纽行排序,然后4巴结果显示给用户。例如在"^元电子地图数据库中检索有关"中国人民银行"的信息,输入单元100接收检索词"中国人民银行"后,首先对检索词进行分类,分类结果为金融场所(索引前缀15)-银行(索引前缀15—14),将分类结果i^哈查找单元1010,查找单元IOIO取得"银行"的索引区域的指针集合,并在指针集合中查4议否存在该词,如果某个指针对应的数据区域内容刚好是"中国人民"则W司结束;如果所有指针对应的数据区域内转不满足"中国人民",则逐个减小"中国人民,,字符串的长度,在指针集合中查找,如仍然没有找到,则将"中国人民银行,,作为一般词汇进^^r索,得到最终的分词结果。主照片配置单元104的实现如下〃在导航电子地图数据库中取得POI名称及其相关属性publicgetResultSet(Stringpoiname){StringsqlStr="select*fromiis"+'SvhereNAME=poiname,,;ResultSetrs=stmtexecuteQuerty(sqlStr);returnrs;〃将poi的各种属性信息包括主照片信息导入到POI主照片数据表Poiphoto中publicvoidaddpoi(ResuleSetrs){Stringsql="insertintoPoiphoto(NAME,ADDRESS,PHONE,PHOTO一CODE)values("'+rs.getString(l)+'"re.getString(2)+"'+rs.getString(3)+'"+rs.getString(4》";s加t.executeUpdate(sql);例如,用户检索的是万寿宾馆,输入单元100接4t5'j这个词,经过^"i司单元101处理后得到与万寿宾馆相匹配的结果集合,显示单it^f结果集合进行排序处理,用户看到的地图界面的中心点为"万寿宾馆"这个poi点以及它的主照片信息。综上所述,由于本发明采用了主照片配置单元104将兴趣点的主照片存入^f^t电子地图数据库中,在将查询结果显示出来的时候同时也将其相应的主照片显示出来,从而能够展示兴趣点等待查询信息的实际形象。权利要求1、一种电子导航系统的信息检索装置,其特征在于,包括输入单元,用于接收检索词;分词单元,用于对所述输入单元接收的检索词进行分词处理以获得若干词元;匹配单元,用于在导航电子地图数据库中找出所述检索词或者所述词元匹配的字段;主照片配置单元,用于将兴趣点的主照片存入导航电子地图数据库中;显示单元,用于显示与所述匹配单元找出的字段相关的信息和其主照片。2、如权利要求1所述的信息检索装置,其特4確于,所述分词单元进一步包括词汇判断单元,判断纟企索词是否为可分类词汇;查找单元,若检索词为可分类词汇,则在指针集合中查找检索词,若为4殳词汇,则在词库集合中查找^r索词;第一判断单元,用于判断所述查找单元是否找到所述检索词;检索词处理单元,若从所述第一判断单元接收的信息为"否"则减小所述检索词的长度并将减'J、长#的检索词送给所述查找单元;存放单元,用于存^^斤述检索词处理单元截取掉的字符和将查找到的检索词作为一个词元存4诸;第二判断单元,判断所述存放单元中是否还有未分词的部分,若还有则将未分词的部分送给所述查找单元,否则将词元输出。3、如权利要求2所述的信息检索装置,其特;f4于,所ii^示单元进一步包括排序单元,用于按照匹配度的高^^"所述匹配单^U全索出的字段进行排序;相关显示单元,用于按照排序单元所排的顺序显示与所述字段相关的信息。全文摘要本发明公开一种信息检索装置包括输入单元,用于接收检索词;分词单元,用于对所述输入单元接收的检索词进行分词处理以获得若干词元;匹配单元,用于在导航电子地图数据库中找出所述检索词或者所述词元匹配的字段;主照片配置单元,用于将兴趣点的主照片存入导航电子地图数据库中;显示单元,用于显示与所述匹配单元找出的字段相关的信息和其主照片。由于本发明采用了主照片配置单元将兴趣点的主照片存入导航电子地图数据库中,在将查询结果显示出来的时候同时也将其相应的主照片显示出来,从而能够展示兴趣点等待查询信息的实际形象。文档编号G01C21/26GK101169327SQ200710151568公开日2008年4月30日申请日期2007年9月28日优先权日2006年10月25日发明者姜德荣,孙竹平申请人:高德软件有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1