基于地理位置的分布式实况搜索引擎及聊天系统的制作方法

文档序号:7856879阅读:429来源:国知局
专利名称:基于地理位置的分布式实况搜索引擎及聊天系统的制作方法
技术领域
本发明涉及一种移动互联网的搜索引擎及聊天系统,尤其涉及一种基于地理位置的分布式实况搜索引擎及聊天系统。
背景技术
目前的搜索引擎是利用网络蜘蛛程序抓取网站的外部链接,然后建立起数据库存储这些从互联网提取的各个网站的以网页文字为主的信息,并能检索与用户查询条件相匹配的记录,按一定的排列顺序返回结果,这样的搜索引擎搜索的是网站,搜索到的内容专业性不够,时效性和地域性不强,缺乏互动。生活中,搜索人经常遇到的是寻找特定目标人群的问题,比如有房要出租的房东·想要寻找打算租房的人,同时打算租房的人也在寻找有房要出租的房东,类似的关系还有要做家教的老师和要补课的学生等,对于租房或者家教这类有交易发生的事件,无论现实中还是互联网上都有中介机构为交易的双方提供对方的信息,并且从中收取中介费。生活中,搜索人与被搜索人还可能构成另一类关系,即志同道合者,比如计划周末约着出去旅游的人,想一起学习乐器的音乐爱好者等,这类关系的双方并不发生交易,双方找到对方的联系方式的途径很有限。目前还没有搜索引擎为以上两类关系中的搜索者提供寻找到适合自己的目标人群的解决方案,而且以上两类关系中的搜索者和被搜索者往往在很距离很近的地理范围内,这就要求搜索引擎对搜索的结果根据地理位置进行筛选。

发明内容
本发明的目的是提供一种实况搜索引擎及聊天系统,当用户在用户终端输入想要搜索的信息(即查询条件)后,搜到的结果是一定地理范围内对这个信息感兴趣的人,以及这些人发布的包含这个信息的关键词的信息,然后点击其中一个搜索到的人的头像按钮,就可以和这个人进行聊天交流。比如,搜索者输入“人大西门租房”,那么搜索到的结果是人大西门附近有房出租的用户以及同样也想在人大西门租房的用户,或者搜索到的结果仅仅是人大西门附近有房出租的用户,同时可以看到这些用户发布的信息,比如“出租人大西门附近苏州街地铁口小南庄主卧,2000/月”,然后用户点击其中一个搜索到的人的头像按钮,就可以和这个人进行
聊天交流。本发明是这样实现的一种基于地理位置的分布式实况搜索引擎及聊天系统,其构架包括用户终端,搜索引擎服务器端,聊天系统服务器端以及分布式存储网络,无论搜索引擎服务器端还是聊天系统服务器端的用户的所有数据都要存储到分布式数据库集群中。所述的实况搜索引擎及聊天系统的搜索引擎服务器端的功能是,接受到从搜索者用户终端发送的查询条件之后,匹配出和查询条件相关的离搜索者最近的一些用户的信息,这些信息包括用户名,用户ID,用户终端的IP地址,用户终端的端口号等,并且把这些信息返回给搜索者的用户终端。跟传统的搜索引擎相比,所述的搜索引擎服务器端存储的不是网页的文字信息,而是一些跟用户相关的信息,这些信息主要包括两类一类是用户的查询记录,当一个用户输入某个查询条件进行搜索的时候,他的搜索记录也被保存在搜索引擎服务器端的垂直数据库集群中,成为别人查询的数据源,另一类信息是用户发布的信息,比如某个餐馆发布的今日特价菜单,或者是周末组织的某个兴趣活动的消息。所述的实况搜索引擎及聊天系统的用户分为准用户以及鉴权用户,鉴权用户还可以细分为几个等级,准用户具备搜索及聊天权限,鉴权用户不仅仅能搜索信息,还可以发布一些自己想被别人搜索的到信息,比如广告,自己组织的兴趣活动的描述,鉴权用户的权限值不同,能够发布的信息的数据类型(指文字,语音,图片,视频)及数据长度,数据数量不同。所述的实况搜索引擎及聊天系统的搜索引擎服务器端在匹配用户的查询条件的时候,要根据搜索者用户所在的地理位置筛选出离搜索者最近的一些用户的信息,这就要·求用户终端提供地理位置信息。所述的实况搜索引擎及聊天系统的用户终端可以是带有GPS的手机,或者是不带GPS的手机,或者是电脑,其中只有带有GPS的手机能够提供搜索人所在的地理位置信息,这些地理位置信息可以是GPS采集到的经纬度数据,也可以是GPS采集到的经纬度编码后的数据。对于所述的不带GPS的手机,或者是电脑,用户终端设备无法获得准确经纬度,但是用户可以在用户终端输入自己所在的地理位置的名称,发送到搜索引擎服务器端,这些地理位置的名称也被作为是匹配的条件之一。所述的实况搜索引擎及聊天系统的搜索引擎服务器端包括搜索预处理模块,时间管理模块,垂直数据库集群,匹配模块和排序模块,其中搜索预处理模块包括去重,分类,分词,索引四个功能模块。所述的实况搜索引擎及聊天系统的搜索引擎服务器端的工作流程是当搜索人在用户终端输入要搜索的查询条件后,查询条件被发送到搜索引擎服务器端,搜索预处理模块根据数据字典表对查询条件进行去重,分类,分词,索引等预处理后,提取出关键词,把这些关键词存放在垂直数据库集群中,然后匹配模块会根据地理位置信息从垂直数据库集群中查到和预处理后的关键词相关的信息,这些信息包括用户ID,用户终端的IP地址,端口号,然后排序模块对匹配后的结果进行排序,再把排序后的结果发送到用户终端。所述的搜索引擎服务器端的时间管理模块的主要功能是把时间划分成一些时间片,根据时间片更新垂直数据库集群。所述的搜索引擎服务器端把搜索到的用户ID,用户终端的IP地址,端口号返回给搜索人的用户终端后,用户终端并不显示这些信息,搜索者只能从Π界面上看到搜索到的用户的头像和该用户发布的包含有搜索者输入的查询条件中的关键词的信息,然后点击搜索到的用户的头像按钮,搜索者根据搜索到的用户ID,用户终端的IP地址,端口号连接聊天系统服务器端,并建立和搜索到的用户的会话。所述的实况搜索引擎及聊天系统,用户终端与聊天系统服务器端交互的信息包括文字,图片,语音,视频等多种格式。
所述的实况搜索引擎及聊天系统,用户可以点击一个搜索到的用户的头像进行私聊,也可以点击几个搜索到的用户进行群聊,或者是创建讨论组。所述的实况搜索引擎及聊天系统的聊天系统服务器端包括交换机,聊天服务器集群,聊天管理服务器,缓存服务器,主服务器和备份服务器。所述的实况搜索引擎及聊天系统的聊天系统服务器端的工作流程是当用户A输入想要搜索的信息,并从搜索引擎服务器端获得用户B的用户ID,用户终端的IP地址,端口号后,可以根据这些信息连接聊天系统服务器端,聊天系统服务器端会根据用户A以及用户B的用户终端的IP地址,端口号等信息把聊天任务安排给聊天服务器集群中的一台服务器进行处理,这一台服务器完成用户A以及用户B的聊天过程的会话搭建,用户A以及用户B交互的数据暂时存放在缓存服务器上,然后会把聊天记录备份到备份服务器中。所述的实况搜索引擎及聊天系统,用户A和用户B聊天的方式可以是私聊,也可以是群聊,即允许其他人加入,如果是用户A发起的群聊,聊天管理服务器会把请求发送给主·的用户作出许可应答后,就可以加入到群聊中。所述的实况搜索引擎及聊天系统,用户输入的查询条件会被签名成〈key,value)数据对,存储在分布式网络节点中,其中的key值是查询条件经过签名运算得到的结果,value就是查询条件。在所述的实况搜索引擎及聊天系统的搜索引擎服务器端,搜索人的查询条件经过搜索预处理后分解出关键词,对各个关键词进行签名运算,计算得到的一个key值,原来的关键词为value,这样的每一对〈key, value)值也存储在分布式网络节点中。所述的分布式网络存储的意义是节省了搜索引擎服务器端备份数据所需要的服务器集群,节约了成本,一个网络节点中存储的〈key, value〉数据对中的key值必须是和本地路由表中的nodeID非常接近。由于采用了本发明的结构,当用户在用户终端输入想要搜索的信息(即查询条件)后,搜到的结果是一定地理范围内对这个信息感兴趣的人,以及这些人发布的包含这个信息的关键词的信息,然后点击其中一个搜索到的人的头像按钮,就可以和这个人进行聊天交流,这样搜索到的信息地域性强,时效性强,增加了互动性,也免去了中介费,降低了成本。


附图I是本发明的系统构架图。
具体实施例方式下面结合附图及实施例对本发明作进一步说明。如附图I所示,提供一种实况搜索引擎及聊天系统,当用户在用户终端01输入想要搜索的信息(即查询条件)后,搜到的结果是一定地理范围内对这个信息感兴趣的人,以及这些人发布的包含这个信息的关键词的信息,然后点击其中一个搜索到的人的头像按钮,就可以和这个人进行聊天交流。比如,搜索者输入“人大西门租房”,那么搜索到的结果是人大西门附近有房出租的用户以及同样也想在人大西门租房的用户,或者搜索到的结果仅仅是人大西门附近有房出租的用户,同时可以看到这些用户发布的信息,比如“出租人大西门附近苏州街地铁口小南庄主卧,2000/月”,然后用户点击其中一个搜索到的人的头像按钮,就可以和这个人进行
聊天交流。本发明是这样实现的一种基于地理位置的分布式实况搜索引擎及聊天系统,其构架包括用户终端01,搜索引擎服务器端02,聊天系统服务器端03以及分布式存储网络04,无论搜索引擎服务器端02还是聊天系统服务器端03的用户的所有数据都要存储到分布式数据库集群中。所述的实况搜索引擎及聊天系统的搜索引擎服务器端02的功能是,接受到从搜索者用户终端发送的查询条件之后,匹配出和查询条件相关的离搜索者最近的一些用户的信息,这些信息包括用户名,用户ID,用户终端的IP地址,用户终端的端口号等,并且把这·些信息返回给搜索者的用户终端01。跟传统的搜索引擎相比,所述的搜索引擎服务器端02存储的不是网页的文字信息,而是一些跟用户相关的信息,这些信息主要包括两类一类是用户的查询记录,当一个用户输入某个查询条件进行搜索的时候,他的搜索记录也被保存在搜索引擎服务器端02的垂直数据库集群025中,成为别人查询的数据源,另一类信息是用户发布的信息,比如某个餐馆发布的今日特价菜单,或者是周末组织的某个兴趣活动的消息。所述的实况搜索引擎及聊天系统的用户分为准用户011以及鉴权用户012,鉴权用户012还可以细分为几个等级,准用户011具备搜索及聊天权限,鉴权用户012不仅仅能搜索信息,还可以发布一些自己想被别人搜索的到信息,比如广告,自己组织的兴趣活动的描述,鉴权用户012的权限值不同,能够发布的信息的数据类型(指文字,语音,图片,视频)及数据长度,数据数量不同。所述的实况搜索引擎及聊天系统的搜索引擎服务器端02在匹配用户的查询条件的时候,要根据搜索者用户所在的地理位置筛选出离搜索者最近的一些用户的信息,这就要求用户终端提供地理位置信息。所述的实况搜索引擎及聊天系统的用户终端01可以是带有GPS的手机013,或者是不带GPS的手机014,或者是电脑015,其中只有带有GPS的手机013能够提供搜索人所在的地理位置信息,这些地理位置信息可以是GPS采集到的经纬度数据,也可以是GPS采集到的经纬度编码后的数据。对于所述的不带GPS的手机014,或者是电脑015,用户终端01设备无法获得准确经纬度,但是用户可以在用户终端01输入自己所在的地理位置的名称,发送到搜索引擎服务器端02,这些地理位置的名称也被作为是匹配的条件之一。所述的实况搜索引擎及聊天系统的搜索引擎服务器端02包括搜索预处理模块021,时间管理模块022,垂直数据库集群025,匹配模块027和排序模块026,其中搜索预处理模块021包括去重0211,分类0212,分词0213,索引0214四个功能模块。所述的实况搜索引擎及聊天系统的搜索引擎服务器端02的工作流程是当搜索人在用户终端01输入要搜索的查询条件后,查询条件被发送到搜索引擎服务器端02,搜索预处理模块021根据数据字典表024对查询条件进行去重0211,分类0212,分词0213,索引0214等预处理后,提取出关键词,把这些关键词存放在垂直数据库集群025中,然后匹配模块027会根据地理位置信息从垂直数据库集群025中查到和预处理后的关键词相关的信息,这些信息包括用户ID,用户终端的IP地址,端口号,然后排序模块026对匹配后的结果进行排序,再把排序后的结果发送到用户终端。所述的搜索引擎服务器端02的时间管理模块022的主要功能是把时间划分成一些时间片,根据时间片更新垂直数据库集群025。所述的搜索引擎服务器端02把搜索到的用户ID,用户终端的IP地址,端口号返回给搜索人的用户终端01后,用户终端01并不显示这些信息,搜索者只能从Π界面上看到搜索到的用户的头像和该用户发布的包含有搜索者输入的查询条件中的关键词的信息,然后点击搜索到的用户的头像按钮,搜索者根据搜索到的用户ID,用户终端的IP地址,端口号连接聊天系统服务器端03,并建立和搜索到的用户的会话。所述的实况搜索引擎及聊天系统,用户终端01与聊天系统服务器03端交互的信息包括文字,图片,语音,视频等多种格式。·所述的实况搜索引擎及聊天系统,用户可以点击一个搜索到的用户的头像进行私聊,也可以点击几个搜索到的用户进行群聊,或者是创建讨论组。所述的实况搜索引擎及聊天系统的聊天系统服务器端03包括交换机031,聊天服务器集群033,聊天管理服务器032,缓存服务器034,主服务器035和备份服务器036。所述的实况搜索引擎及聊天系统的聊天系统服务器端03的工作流程是当用户A输入想要搜索的信息,并从搜索引擎服务器端02获得用户B的用户ID,用户终端的IP地址,端口号后,可以根据这些信息连接聊天系统服务器端03,聊天系统服务器端03会根据用户A以及用户B的用户终端的IP地址,端口号等信息把聊天任务安排给聊天服务器集群033中的一台服务器进行处理,这一台服务器完成用户A以及用户B的聊天过程的会话搭建,用户A以及用户B交互的数据暂时存放在缓存服务器034上,然后会把聊天记录备份到备份服务器036中。所述的实况搜索引擎及聊天系统,用户A和用户B聊天的方式可以是私聊,也可以是群聊,即允许其他人加入,如果是用户A发起的群聊,聊天管理服务器032会把请求发送给主服务器035,然后主服务器035会向用户A提供的想要群聊的用户群组发送广播包,接受到广播包的用户作出许可应答后,就可以加入到群聊中。所述的实况搜索引擎及聊天系统,用户输入的查询条件会被签名成〈key,value)数据对,存储在分布式存储网络04的网络节点中,其中的key值是查询条件经过签名运算得到的结果,value就是查询条件。在所述的实况搜索引擎及聊天系统的搜索引擎服务器端02,搜索人的查询条件经过搜索预处理后分解出关键词,对各个关键词进行签名运算,计算得到的一个key值,原来的关键词为value,这样的每一对〈key,value〉值也存储在分布式网络存储网络04的网络节点中。所述的分布式存储网络04的意义是节省了搜索引擎服务器端02备份数据所需要的服务器集群,节约了成本,一个网络节点中存储的〈key, value〉数据对中的key值必须是和本地路由表中的nodeID非常接近。由于采用了本发明的结构,当用户在用户终端01输入想要搜索的信息(即查询条件)后,搜到的结果是一定地理范围内对这个信息感兴趣的人,以及这些人发布的包含这个信息的关键词的信息,然后点击其中一个搜索到的人的头像按钮,就可以和这个人进行聊天交流,这样搜索到的信息地域性强,时效性强,增加了互动性,也免去了中介费,降低了成本。应当指出,在不脱离本发明原理的情况下,本领域的技术人员可以对本发明的搜索引擎服务器端02,聊天系统服务器端03,分布式存储网络04以及用户终端01进行各种改动和变型,这些改动和变型,也被视为本发明的保护范围。·
权利要求
1.一种基于地理位置的分布式实况搜索引擎及聊天系统,其特征在于所述的基于地理位置的分布式实况搜索引擎及聊天系统的构架包括用户终端,搜索引擎服务器端,聊天系统服务器端,无论搜索引擎服务器端还是聊天系统服务器端的用户的所有数据都要进行分布式存储,当搜索人输入想要搜索的信息进行搜索时,所述的搜索引擎搜索到的结果是一定地理范围内对这些信息也感兴趣的用户以及这些用户发布的含有这些信息的关键词的信息,点击这些用户中的任意一个用户的头像,就可以和这个用户进行聊天交流。
2.根据权利要求I所述的一种基于地理位置的分布式实况搜索引擎及聊天系统,其特征在于所述的实况搜索引擎及聊天系统的用户终端可以是带有GPS的手机,或者是不带GPS的手机,或者是电脑,其中只有带有GPS的手机能够提供搜索人所在的地理位置信息,这些地理位置信息可以是GPS采集到的经纬度,也可以是GPS采集到的经纬度编码后的数据。
3.根据权利要求I或2所述的一种基于地理位置的分布式实况搜索引擎及聊天系统,其特征在于所述的实况搜索引擎及聊天系统的搜索引擎服务器端包括搜索预处理模块,时间管理模块,垂直数据库集群,匹配模块和排序模块,其中搜索预处理模块由去重,分类,分词,索引四个功能模块组成,当搜索人输入想要搜索的信息后,这些信息被发送到搜索引擎服务器端,搜索预处理模块根据数据字典表对这些信息进行去重,分类,分词,索引等预处理后,分离出关键词,并且把这些关键词连同搜索人的用户ID,用户终端的IP地址,端口号等数据存放在垂直数据库集群中,垂直数据库集群是分布式集群,可以根据地理编码索引快速查找垂直数据库集群中的表,然后匹配模块会从垂直数据库集群中查到和预处理后的关键词相关联的一些跟搜索人距离最近的用户的用户ID,用户终端的IP地址,端口号,再把这些查到的结果进行排序后,发送到用户终端。
4.根据权利要求I或2或3所述的一种基于地理位置的分布式实况搜索引擎及聊天系统,其特征在于所述的实况搜索引擎及聊天系统的聊天系统服务器端包括交换机,聊天服务器集群,聊天管理服务器,缓存服务器,主服务器和备份服务器,用户终端和聊天系统服务器端交互的数据可以是文字,语音,图片,视频,当用户A输入想要搜索的信息,并从搜索引擎服务器端获得用户B的用户ID,用户终端的IP地址,端口号后,可以根据这些信息连接聊天系统服务器端,聊天系统服务器端会根据用户A以及用户B的用户终端的IP地址,端口号等信息把聊天任务安排给聊天服务器集群中的一台服务器进行处理,这一台服务器完成用户A以及用户B的聊天过程的会话搭建,用户A以及用户B交互的数据暂时存放在缓存服务器上,然后会把聊天记录备份到备份服务器中,用户A和用户B聊天的方式可以是私聊,也可以是群聊,即允许其他人加入,如果是用户A发起的群聊,聊天管理服务器会把请求发送给主服务器,然后主服务器会向用户A提供的想要群聊的用户群组发送广播包,接受到广播包的用户作出许可应答后,就可以加入到群聊中。
5.根据权利要求I或2或3或4所述的一种基于地理位置的分布式实况搜索引擎及聊天系统,其特征在于所述的实况搜索引擎及聊天系统的用户分为准用户以及鉴权用户,鉴权用户还可以细分为几个等级,准用户具备搜索及聊天权限,鉴权用户不仅仅能搜索关键词,还可以发布一些自己想被别人搜索的到信息,比如广告,自己组织的兴趣活动的描述,鉴权用户的权限值不同,能够发布的信息的数据类型(指文字,语音,图片,视频)及数据长度,数据数量不同。
6.根据权利要求I或2或3或4或5所述的一种基于地理位置的分布式实况搜索引擎及聊天系统,其特征在于所述实况搜索引擎及聊天系统不仅仅在搜索引擎服务器端和聊天系统服务器端把用户的数据存储到分布式数据库集群中,而且用户输入的搜索想要搜索的信息及发布的文字广告会被签名成〈key, value)数据对,分布式存储在网络节点中,当用户想要搜索的信息发送到搜索引擎服务器端后经过搜索预处理提取出的关键词也会被签名成〈key, value)数据对,分布式存储在网络节点中。
全文摘要
一种基于地理位置的实况搜索引擎及聊天系统,包括用户终端,搜索引擎服务器端,聊天系统服务器端和分布式存储网络。当用户在用户终端输入想要搜索的信息后,这些信息被发送到搜索引擎服务器端,提取出关键词,并且用户的地理位置信息,用户ID,IP地址,端口号和签名后的关键词被存入垂直数据库集群,经过匹配,数据库选出和这些关键词相关联的和用户地理位置最近的一些用户的用户ID,IP地址,端口号等信息,返回用户终端,用户根据这些信息连接聊天系统服务器端,和这些用户聊天交流,当用户在用户终端输入想要搜索的信息的同时,这些信息也被发送到分布式网络进行备份存储。
文档编号H04L29/08GK102789508SQ20121026279
公开日2012年11月21日 申请日期2012年7月27日 优先权日2012年7月27日
发明者吴建辉 申请人:吴建辉
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1