一种个人信息推送系统的制作方法

文档序号:10655314阅读:362来源:国知局
一种个人信息推送系统的制作方法
【专利摘要】本发明公开了一种个人信息推送系统,涉及信息技术领域。该系统包括:个人兴趣采集系统、信息推送系统和信息采集系统;所述用户端包括:数据接收模块、用户注册模块、用户搜索模块和用户自主修改模块;所述个人兴趣采集系统包括:用户属性静态分析模块、词频统计模块、时间分析模块、日志挖掘分析模块、分析模块和个人兴趣集;所述信息推送系统包括:信息检索模块、兴趣采集模块和信息发送模块;所述信息采集系统包括:信息采集模块、信息分类模块和数据库。该系统提供了一种能针对个人兴趣推送信息的系统,具有准确性高、学习性强、针对性强等优点。
【专利说明】
-种个人信息推送系统
技术领域
[0001 ]本发明设及物联网技术领域,特别设及一种个人信息推送系统。
【背景技术】
[0002] 互联网的出现人人加速了现代社会信息化的进程,已经和正在深刻地改变着人们 的工作、生活的方式,互联网上丰富的资源也让每个人屯、动。然而,要在如此浩滿的资源中 找到自己所需的信息是一件费时费力的事情。当用户需要某方面的信息时,通常有两种方 式:通过捜索引擎查询或逐个访问专业网站。
[0003] 捜索引擎的出现和不断完善使得人们在互联网上捜索资源变得容易多了,对于一 个捜索主题,可W在很短的时间内得到返回结果。像雅虎、谷歌运些著名的捜索引擎无疑是 大多数用户的首选,因为它速度快,准确率高,并且将查找结果按相关程度排序。
[0004] 但是通过现有的捜索引擎查询信息存在不少缺点:
[0005] 1、针对性弱,不能就用户查询的信息提供更适合用户兴趣点的信息,导致用户还 需要进行筛选信息。
[0006] 2、时效性弱,网上的信息往往都已经发布很久,存在时间很久,而用户不能第一时 间进行查阅,导致时效性较弱。
[0007] 对一个企业或组织来说,无法通过统一途径对信息进行实时采集,仍然保持剪报、 个体上网、信息罗列的低效方法,运种多部口重复收集信息的情况,更加剧了资源浪费和管 理上的凌乱。而企业对运种捜集来的良莽不齐又杂乱无章的信息难W进行有效的管理和充 分的利用。因此,用户期望出现一些能够协助其理解、检索所需信息的系统。一些信息服务 机构也希望能够为它们的川户提供贴切的个性化服务,从而在激烈的竞争中击败对手。
[000引由W上分析可知,无论是通过捜索引擎或逐个访问专业网站查询信息都存在同样 的问题:现在绝大多数的网站都只能被动地接受访问。而现在的用户希望能够开发一个系 统自动捜集用户定制的某方面的信息,并根据用户的兴趣对获得的信息进行筛选后分类并 推荐给用户。为不同用户提供切合其需求的个性化服务是当前最迫切的任务。

【发明内容】

[0009] 鉴于此,本发明提供了一种个人信息推送系统,该系统具有集成度高、引导性足、 提供个性化服务、安全性高等优点。
[0010] 本发明采用的技术方案如下:
[0011] -种个人信息推送系统,其特征在于,所述系统包括:用户端、个人兴趣采集系统、 信息推送系统和信息采集系统;所述用户端包括:数据接收模块、用户注册模块、用户捜索 模块和用户自主修改模块;所述个人兴趣采集系统包括:用户属性静态分析模块、词频统计 模块、时间分析模块、日志挖掘分析模块、分析模块和个人兴趣集;所述信息推送系统包括: 信息检索模块、兴趣采集模块和信息发送模块;所述信息采集系统包括:信息采集模块、信 息分类模块和数据库;
[0012] 所述用户注册模块,用于在用户初次使用软件应用时,对用户的个人兴趣进行初 次采集,将采集好的个人兴趣信息发送至用户属性静态分析模块;
[0013] 所述数据接收模块,用于接收来自信息推送系统发送过来数据信息;
[0014] 所述用户捜索模块,用于提供给用户自主捜索相关数据信息;
[0015] 所述用户自主修改模块,用于用户自主修改自己的个人兴趣集数据信息;
[0016] 所述用户属性静态分析模块,用于对用户注册模块初次采集的个人兴趣记性静态 分析,将分析后的个人兴趣发送至个人兴趣集进行存储;
[0017] 所述词频统计模块,用于对用户捜索模块的捜索关键词进行频率统计,将统计结 果发送至分析模块;
[0018] 所述时间分析模块,用于分析用户在用户捜索模块反馈回来的信息W及信息接收 模块接收到的信息上的停留时间,将分析结果发送至分析模块;
[0019] 所述日志挖掘分析模块,用于对用户的操作日志进行分析,将分析结果发送至分 析模块;
[0020] 所述分析模块,用于根据词频统计模块、时间分析模块和日志挖掘分析模块发送 过来分析结果进行分析,得出新的个人兴趣结果,将新的个人兴趣结果发送至个人兴趣集; [0021 ]所述个人兴趣集,用于存储个人兴趣信息;
[0022] 所述兴趣采集模块,用于对个人兴趣集中的兴趣进行数据采集,将采集后的结果 发送至信息检索模块;
[0023] 所述信息检索模块,用于根据兴趣采集模块发送过来的采集结果,在数据库中检 索相关信息,将信息发送至数据发送模块;
[0024] 所述数据发送模块,用于将信息检索模块发送过来的数据信息,发送至数据接收 模块;
[0025] 所述信息采集模块,用于采集互联网中的相关数据信息,将运些信息发送至数据 分类模块;
[0026] 所述信息分类模块,用于将信息采集模块采集到的数据信息进行分类处理,将分 类后的数据信息发送至数据库;
[0027] 所述数据库,用于对分类后的数据信息进行分类存储。
[0028] 所述词频统计模块的统计方法包括W下步骤;
[0029] 步骤1:在捜索模块设置词频触发器,用户每次进行捜索操作的时候,词频触发器 启动发送信号至词频统计模块;
[0030] 步骤2:对用户进行捜索的关键词进行拆分处理;
[0031] 步骤2:词频统计模块对该次捜索行为的捜索关键词进行记录,存储在本地缓存 中;
[0032] 步骤3:设定一个统计阔值:D;若词频统计模块统计到的某个捜索关键词高于该阔 值,则发送该关键词至分析模块。
[0033] 所述时间分析模块的时间分析方法包括W下步骤:
[0034] 步骤1:在用户捜索模块和数据接收模块设置时间触发器,当用户每次查阅用户捜 索模块反馈回来和数据接收模块接收到的数据信息时,时间触发器启动发送信号至时间分 析模块;
[0035] 步骤2:时间分析模块中设定一个时间阔值:T;
[0036] 步骤3:时间分析模块记录用户点击进入该页面到最后离开该页面,停留在该数据 信息页面的时间,将该时间和时间阔值T进行比较,若该时间大于时间阔值,则发送页面信 息至时间分析模块;
[0037] 所述日志挖掘分析模块的日志挖掘分析方法包括W下步骤:
[0038] 步骤1:在用户捜索模块设置日志触发器,当用于每次对用户捜索模块反馈回来的 数据信息进行复制、截图操作时,触发器启动,将该数据信息至日志挖掘分析模块;
[0039] 步骤2:用户挖掘分析模块对运些操作进行记录,记载在本地缓存中,生成操作日 志;
[0040] 步骤3:设定一个时间周期:H,设定一个日志阔值:I;
[0041 ]步骤4:用户挖掘分析模块每隔该时间周期,对本地缓存中的操作日志进行统计分 析;若针对某个网站的数据信息进行的操作高于时间阔值I,则发送该网站和域名信息至分 析模块。
[0042] 所述分析模块的分析方法包括W下步骤:
[0043] 步骤1:接收来自词频统计模块、时间分析模块和日志挖掘分析模块发送过来的信 息;
[0044] 步骤2:提取时间分析模块发送过来的页面信息中的关键词,将词频统计模块发送 过来的关键词信息和提取自时间分析模块中的关键词进行比对,筛选出比对一致的关键 词;
[0045] 步骤3:获取筛选出一致的关键词信息的源网站信息;将网站信息和日志挖掘分析 模块发送过来的网站信息进行比对,筛选出一致的网站信息;
[0046] 步骤4:将筛选出的网站信息发送至个人兴趣集。
[0047] 所述信息采集模块的信息采集方法包括W下步骤:
[0048] 步骤1:由系统管理员选定多个网站作为网站集:
[0049] 步骤2:设定站点的权重最大值为100,最小值为0,再设定两个权重阔值:C = 70,B =40;然后对每个站点设定权重值;
[0050] 步骤3:信息检索模块根据每个站点的权重值,采用蜘蛛程序进行不同深度和广度 的信息采集;权重值高于70的站点,采集深度和广度为高级;权重值介于40到70之间的站 点,采集深度和广度为中级;权重值低于40的站点,采集深度和广度为低级。
[0051] 所述信息采集模块的蜘蛛程序采集后,对信息的排序方法包括W下步骤:
[0052] 步骤1:取检索系统中的数据结构为G,G的规模为N,设定网站集合为:
[0053] Wsite = {(sitei ,webi), (sites ,web2), (site3,web3),…(siten'webn) },其中 《n,Ws i te中的每一个元素为一个网站站点;每个网站站点为G中的一个结点。
[0化4] 步骤2:对于G中的每一个节点n,设W(n)是权重值,而向量石巧为G对应的W(n)结果 向量。
[0055]步骤:3:设定
目P :对G中每一个节点n,设定其初始值 W(n〇)均为 ~。
[0化6] 步骤4:当k = 1,2,3......n;对G中的每一个节点,均有:
[0化7]
[0058] 步骤5:其中,a为预先设定的参数,Scanf(Pi)为页面的出度值;
[0059] 步骤6:按照出度值对每个采集到的信息进行排序。
[0060] 采用W上技术方案,本发明产生了 W下有益效果:
[0061] 1、数据处理效率高:系统从安卓手机应用的线程级别入手分析其计算与数据,把 应用程序中部分运算量大的函数迁移到云端上执行,利用云端的强大性能来减轻手机端的 计算压力,提高手机应用的运行效率。。
[0062] 2、简洁易操作,无需修改源代码:本专利提出一种高效稳定的划分机制,通过一定 的规则和算法自动灵活地划分安卓手机应用的执行模块并计算函数的运行时间,无需修改 应用程序的源代码,就能自动地使正在运行的大计算量函数从手机端无缝地转移到云端运 行。该系统能够极大地加快安卓手机应用的响应速度,提供更好的用户体验。
[0063] 3、数据完整性:为了保证数据在传送过程中不会被篡改,手机端利用md5码对传送 数据进行加密。服务端接收到数据W后,首先进行的是md5码检测校验,即将接收到的数据 信息的md5码计算出来,然后与接收到的数据中的md5码进行对比,如果完全相同,则表示数 据再传送过程中未被篡改,可W继续执行。否则就表示数据已经被篡改,转移失败。
【附图说明】
[0064] 图1是本发明的一种个人信息推送系统的系统结构示意图。
【具体实施方式】
[0065] 本说明书中公开的所有特征,或公开的所有方法或过程中的步骤,除了互相排斥 的特征和/或步骤W外,均可W W任何方式组合。
[0066] 本说明书(包括任何附加权利要求、摘要)中公开的任一特征,除非特别叙述,均可 被其他等效或具有类似目的的替代特征加 W替换。即,除非特别叙述,每个特征只是一系列 等效或类似特征中的一个例子而已。
[0067] 本发明实施例1中提供了一种基于云计算的安卓手机应用加速系统,系统结构如 图1所示:
[0068] -种个人信息推送系统,其特征在于,所述系统包括:用户端、个人兴趣采集系统、 信息推送系统和信息采集系统;所述用户端包括:数据接收模块、用户注册模块、用户捜索 模块和用户自主修改模块;所述个人兴趣采集系统包括:用户属性静态分析模块、词频统计 模块、时间分析模块、日志挖掘分析模块、分析模块和个人兴趣集;所述信息推送系统包括: 信息检索模块、兴趣采集模块和信息发送模块;所述信息采集系统包括:信息采集模块、信 息分类模块和数据库;
[0069] 所述用户注册模块,用于在用户初次使用软件应用时,对用户的个人兴趣进行初 次采集,将采集好的个人兴趣信息发送至用户属性静态分析模块;
[0070] 所述数据接收模块,用于接收来自信息推送系统发送过来数据信息;
[0071 ]所述用户捜索模块,用于提供给用户自主捜索相关数据信息;
[0072] 所述用户自主修改模块,用于用户自主修改自己的个人兴趣集数据信息;
[0073] 所述用户属性静态分析模块,用于对用户注册模块初次采集的个人兴趣记性静态 分析,将分析后的个人兴趣发送至个人兴趣集进行存储;
[0074] 所述词频统计模块,用于对用户捜索模块的捜索关键词进行频率统计,将统计结 果发送至分析模块;
[0075] 所述时间分析模块,用于分析用户在用户捜索模块反馈回来的信息W及信息接收 模块接收到的信息上的停留时间,将分析结果发送至分析模块;
[0076] 所述日志挖掘分析模块,用于对用户的操作日志进行分析,将分析结果发送至分 析模块;
[0077] 所述分析模块,用于根据词频统计模块、时间分析模块和日志挖掘分析模块发送 过来分析结果进行分析,得出新的个人兴趣结果,将新的个人兴趣结果发送至个人兴趣集;
[0078] 所述个人兴趣集,用于存储个人兴趣信息;
[0079] 所述兴趣采集模块,用于对个人兴趣集中的兴趣进行数据采集,将采集后的结果 发送至信息检索模块;
[0080] 所述信息检索模块,用于根据兴趣采集模块发送过来的采集结果,在数据库中检 索相关信息,将信息发送至数据发送模块;
[0081] 所述数据发送模块,用于将信息检索模块发送过来的数据信息,发送至数据接收 模块;
[0082] 所述信息采集模块,用于采集互联网中的相关数据信息,将运些信息发送至数据 分类模块;
[0083] 所述信息分类模块,用于将信息采集模块采集到的数据信息进行分类处理,将分 类后的数据信息发送至数据库;
[0084] 所述数据库,用于对分类后的数据信息进行分类存储。
[0085] 本发明实施例2中提供了一种个人信息推送系统的连接,系统结构如图1所示:
[0086] -种个人信息推送系统,其特征在于,所述系统包括:用户端、个人兴趣采集系统、 信息推送系统和信息采集系统;所述用户端包括:数据接收模块、用户注册模块、用户捜索 模块和用户自主修改模块;所述个人兴趣采集系统包括:用户属性静态分析模块、词频统计 模块、时间分析模块、日志挖掘分析模块、分析模块和个人兴趣集;所述信息推送系统包括: 信息检索模块、兴趣采集模块和信息发送模块;所述信息采集系统包括:信息采集模块、信 息分类模块和数据库;
[0087] 所述用户注册模块,用于在用户初次使用软件应用时,对用户的个人兴趣进行初 次采集,将采集好的个人兴趣信息发送至用户属性静态分析模块;
[0088] 所述数据接收模块,用于接收来自信息推送系统发送过来数据信息;
[0089] 所述用户捜索模块,用于提供给用户自主捜索相关数据信息;
[0090] 所述用户自主修改模块,用于用户自主修改自己的个人兴趣集数据信息;
[0091] 所述用户属性静态分析模块,用于对用户注册模块初次采集的个人兴趣记性静态 分析,将分析后的个人兴趣发送至个人兴趣集进行存储;
[0092] 所述词频统计模块,用于对用户捜索模块的捜索关键词进行频率统计,将统计结 果发送至分析模块;
[0093] 所述时间分析模块,用于分析用户在用户捜索模块反馈回来的信息W及信息接收 模块接收到的信息上的停留时间,将分析结果发送至分析模块;
[0094] 所述日志挖掘分析模块,用于对用户的操作日志进行分析,将分析结果发送至分 析模块;
[0095] 所述分析模块,用于根据词频统计模块、时间分析模块和日志挖掘分析模块发送 过来分析结果进行分析,得出新的个人兴趣结果,将新的个人兴趣结果发送至个人兴趣集;
[0096] 所述个人兴趣集,用于存储个人兴趣信息;
[0097] 所述兴趣采集模块,用于对个人兴趣集中的兴趣进行数据采集,将采集后的结果 发送至信息检索模块;
[0098] 所述信息检索模块,用于根据兴趣采集模块发送过来的采集结果,在数据库中检 索相关信息,将信息发送至数据发送模块;
[0099] 所述数据发送模块,用于将信息检索模块发送过来的数据信息,发送至数据接收 模块;
[0100] 所述信息采集模块,用于采集互联网中的相关数据信息,将运些信息发送至数据 分类模块;
[0101] 所述信息分类模块,用于将信息采集模块采集到的数据信息进行分类处理,将分 类后的数据信息发送至数据库;
[0102] 所述数据库,用于对分类后的数据信息进行分类存储。
[0103] 所述词频统计模块的统计方法包括W下步骤;
[0104] 步骤1:在捜索模块设置词频触发器,用户每次进行捜索操作的时候,词频触发器 启动发送信号至词频统计模块;
[0105] 步骤2:对用户进行捜索的关键词进行拆分处理;
[0106] 步骤2:词频统计模块对该次捜索行为的捜索关键词进行记录,存储在本地缓存 中;
[0107] 步骤3:设定一个统计阔值:D;若词频统计模块统计到的某个捜索关键词高于该阔 值,则发送该关键词至分析模块。
[0108] 本发明实施例3中提供了一种个人信息推送系统,系统结构如图1所示:
[0109] 所述词频统计模块的统计方法包括W下步骤;
[0110] 步骤1:在捜索模块设置词频触发器,用户每次进行捜索操作的时候,词频触发器 启动发送信号至词频统计模块;
[0111] 步骤2:对用户进行捜索的关键词进行拆分处理;
[0112] 步骤2:词频统计模块对该次捜索行为的捜索关键词进行记录,存储在本地缓存 中;
[0113] 步骤3:设定一个统计阔值:D;若词频统计模块统计到的某个捜索关键词高于该阔 值,则发送该关键词至分析模块。
[0114] 所述时间分析模块的时间分析方法包括W下步骤:
[0115] 步骤1:在用户捜索模块和数据接收模块设置时间触发器,当用户每次查阅用户捜 索模块反馈回来和数据接收模块接收到的数据信息时,时间触发器启动发送信号至时间分 析模块;
[0116] 步骤2:时间分析模块中设定一个时间阔值:T;
[0117] 步骤3:时间分析模块记录用户点击进入该页面到最后离开该页面,停留在该数据 信息页面的时间,将该时间和时间阔值T进行比较,若该时间大于时间阔值,则发送页面信 息至时间分析模块;
[0118] 所述日志挖掘分析模块的日志挖掘分析方法包括W下步骤:
[0119] 步骤1:在用户捜索模块设置日志触发器,当用于每次对用户捜索模块反馈回来的 数据信息进行复制、截图操作时,触发器启动,将该数据信息至日志挖掘分析模块;
[0120] 步骤2:用户挖掘分析模块对运些操作进行记录,记载在本地缓存中,生成操作日 志;
[0121] 步骤3:设定一个时间周期:H,设定一个日志阔值:1;
[0122] 步骤4:用户挖掘分析模块每隔该时间周期,对本地缓存中的操作日志进行统计分 析;若针对某个网站的数据信息进行的操作高于时间阔值I,则发送该网站和域名信息至分 析模块。
[0123] 所述分析模块的分析方法包括W下步骤:
[0124] 步骤1:接收来自词频统计模块、时间分析模块和日志挖掘分析模块发送过来的信 息;
[0125] 步骤2:提取时间分析模块发送过来的页面信息中的关键词,将词频统计模块发送 过来的关键词信息和提取自时间分析模块中的关键词进行比对,筛选出比对一致的关键 词;
[0126] 步骤3:获取筛选出一致的关键词信息的源网站信息;将网站信息和日志挖掘分析 模块发送过来的网站信息进行比对,筛选出一致的网站信息;
[0127] 步骤4:将筛选出的网站信息发送至个人兴趣集。
[0128] 所述信息采集模块的信息采集方法包括W下步骤:
[0129] 步骤1:由系统管理员选定多个网站作为网站集:
[0130] 步骤2:设定站点的权重最大值为100,最小值为0,再设定两个权重阔值:C = 70, B =40;然后对每个站点设定权重值;
[0131] 步骤3:信息检索模块根据每个站点的权重值,采用蜘蛛程序进行不同深度和广度 的信息采集;权重值高于70的站点,采集深度和广度为高级;权重值介于40到70之间的站 点,采集深度和广度为中级;权重值低于40的站点,采集深度和广度为低级。
[0132] 所述信息采集模块的蜘蛛程序采集后,对信息的排序方法包括W下步骤:
[0133] 步骤1:取检索系统中的数据结构为G,G的规模为N,设定网站集合为:
[0134] Wsite = {(sitei ,webi), (sites ,web2), (site3,web3),…(siten,webn) },其中 《n,Ws i te中的每一个元素为一个网站站点;每个网站站点为G中的一个结点。
[0135] 步骤2:对于G中的每一个节点n,设W (n)是权重值,而向量石承为G对应的W( n)结果 向量。
[0136] 步骤:3:设定
即:对G中每一个节点n,设定其初始值 W(n〇)均为募。
[0137] 步骤4:当k = I,2,3……n;对G中的每一个节点,均有:
[013 引
[0139] 步骤5:其中,a为预先设定的参数,Scanf(Pi)为页面的出度值;
[0140] 步骤6:按照出度值对每个采集到的信息进行排序。
[0141] 本发明实施例4中提供了一种个人信息推送系统,系统结构如图1所示:
[0142] -种个人信息推送系统,其特征在于,所述系统包括:用户端、个人兴趣采集系统、 信息推送系统和信息采集系统;所述用户端包括:数据接收模块、用户注册模块、用户捜索 模块和用户自主修改模块;所述个人兴趣采集系统包括:用户属性静态分析模块、词频统计 模块、时间分析模块、日志挖掘分析模块、分析模块和个人兴趣集;所述信息推送系统包括: 信息检索模块、兴趣采集模块和信息发送模块;所述信息采集系统包括:信息采集模块、信 息分类模块和数据库;
[0143] 所述用户注册模块,用于在用户初次使用软件应用时,对用户的个人兴趣进行初 次采集,将采集好的个人兴趣信息发送至用户属性静态分析模块;
[0144] 所述数据接收模块,用于接收来自信息推送系统发送过来数据信息;
[0145] 所述用户捜索模块,用于提供给用户自主捜索相关数据信息;
[0146] 所述用户自主修改模块,用于用户自主修改自己的个人兴趣集数据信息;
[0147] 所述用户属性静态分析模块,用于对用户注册模块初次采集的个人兴趣记性静态 分析,将分析后的个人兴趣发送至个人兴趣集进行存储;
[0148] 所述词频统计模块,用于对用户捜索模块的捜索关键词进行频率统计,将统计结 果发送至分析模块;
[0149] 所述时间分析模块,用于分析用户在用户捜索模块反馈回来的信息W及信息接收 模块接收到的信息上的停留时间,将分析结果发送至分析模块;
[0150] 所述日志挖掘分析模块,用于对用户的操作日志进行分析,将分析结果发送至分 析模块;
[0151] 所述分析模块,用于根据词频统计模块、时间分析模块和日志挖掘分析模块发送 过来分析结果进行分析,得出新的个人兴趣结果,将新的个人兴趣结果发送至个人兴趣集;
[0152] 所述个人兴趣集,用于存储个人兴趣信息;
[0153] 所述兴趣采集模块,用于对个人兴趣集中的兴趣进行数据采集,将采集后的结果 发送至信息检索模块;
[0154] 所述信息检索模块,用于根据兴趣采集模块发送过来的采集结果,在数据库中检 索相关信息,将信息发送至数据发送模块;
[0155] 所述数据发送模块,用于将信息检索模块发送过来的数据信息,发送至数据接收 板块;
[0156] 所述信息采集模块,用于采集互联网中的相关数据信息,将运些信息发送至数据 分类模块;
[0157] 所述信息分类模块,用于将信息采集模块采集到的数据信息进行分类处理,将分 类后的数据信息发送至数据库;
[0158] 所述数据库,用于对分类后的数据信息进行分类存储。
[0159] 所述词频统计模块的统计方法包括W下步骤;
[0160] 步骤1:在捜索模块设置词频触发器,用户每次进行捜索操作的时候,词频触发器 启动发送信号至词频统计模块;
[0161] 步骤2:对用户进行捜索的关键词进行拆分处理;
[0162] 步骤2:词频统计模块对该次捜索行为的捜索关键词进行记录,存储在本地缓存 中;
[0163] 步骤3:设定一个统计阔值:D;若词频统计模块统计到的某个捜索关键词高于该阔 值,则发送该关键词至分析模块。
[0164] 所述时间分析模块的时间分析方法包括W下步骤:
[0165] 步骤1:在用户捜索模块和数据接收模块设置时间触发器,当用户每次查阅用户捜 索模块反馈回来和数据接收模块接收到的数据信息时,时间触发器启动发送信号至时间分 析模块;
[0166] 步骤2:时间分析模块中设定一个时间阔值:T;
[0167] 步骤3:时间分析模块记录用户点击进入该页面到最后离开该页面,停留在该数据 信息页面的时间,将该时间和时间阔值T进行比较,若该时间大于时间阔值,则发送页面信 息至时间分析模块;
[0168] 所述日志挖掘分析模块的日志挖掘分析方法包括W下步骤:
[0169] 步骤1:在用户捜索模块设置日志触发器,当用于每次对用户捜索模块反馈回来的 数据信息进行复制、截图操作时,触发器启动,将该数据信息至日志挖掘分析模块;
[0170] 步骤2:用户挖掘分析模块对运些操作进行记录,记载在本地缓存中,生成操作日 志;
[0171] 步骤3:设定一个时间周期:H,设定一个日志阔值:1;
[0172] 步骤4:用户挖掘分析模块每隔该时间周期,对本地缓存中的操作日志进行统计分 析;若针对某个网站的数据信息进行的操作高于时间阔值I,则发送该网站和域名信息至分 析模块。
[0173] 所述分析模块的分析方法包括W下步骤:
[0174] 步骤1:接收来自词频统计模块、时间分析模块和日志挖掘分析模块发送过来的信 息;
[0175] 步骤2:提取时间分析模块发送过来的页面信息中的关键词,将词频统计模块发送 过来的关键词信息和提取自时间分析模块中的关键词进行比对,筛选出比对一致的关键 词;
[0176] 步骤3:获取筛选出一致的关键词信息的源网站信息;将网站信息和日志挖掘分析 模块发送过来的网站信息进行比对,筛选出一致的网站信息;
[0177] 步骤4:将筛选出的网站信息发送至个人兴趣集。
[0178] 所述信息采集模块的信息采集方法包括W下步骤:
[0179] 步骤1:由系统管理员选定多个网站作为网站集:
[0180] 步骤2:设定站点的权重最大值为100,最小值为0,再设定两个权重阔值:C = 70, B =40;然后对每个站点设定权重值;
[0181] 步骤3:信息检索模块根据每个站点的权重值,采用蜘蛛程序进行不同深度和广度 的信息采集;权重值高于70的站点,采集深度和广度为高级;权重值介于40到70之间的站 点,采集深度和广度为中级;权重值低于40的站点,采集深度和广度为低级。
[0182] 所述信息采集模块的蜘蛛程序采集后,对信息的排序方法包括W下步骤:
[0183] 步骤1:取检索系统中的数据结构为G,G的规模为N,设定网站集合为:
[0184] Wsite = {(sitei ,webi), (sites ,web2), (site3,web3),…(siten,webn) },其中 《n,Ws i te中的每一个元素为一个网站站点;每个网站站点为G中的一个结点。
[0185] 步骤2:对于G中的每一个节点n,设W(n)是权重值,而向量巧彭为G对应的W(n)结果 向量。
[0186] 步骤:3:设定
即:对G中每一个节点n,设定其初始值 W( no)均为丢。 N
[0187] 步骤4:当k = 1,2,3……n;对G中的每一个节点,均有:
[018 引
[0189] 步骤5:其中,a为预先设定的参数,Scanf(Pi)为页面的出度值;
[0190] 步骤6:按照出度值对每个采集到的信息进行排序。
[0191] 本发明并不局限于前述的【具体实施方式】。本发明扩展到任何在本说明书中披露的 新特征或任何新的组合,W及披露的任一新的方法或过程的步骤或任何新的组合。
【主权项】
1. 一种个人信息推送系统,其特征在于,所述系统包括:用户端、个人兴趣采集系统、信 息推送系统和信息采集系统;所述用户端包括:数据接收模块、用户注册模块、用户搜索模 块和用户自主修改模块;所述个人兴趣采集系统包括:用户属性静态分析模块、词频统计模 块、时间分析模块、日志挖掘分析模块、分析模块和个人兴趣集;所述信息推送系统包括:信 息检索模块、兴趣采集模块和信息发送模块;所述信息采集系统包括:信息采集模块、信息 分类模块和数据库; 所述用户注册模块,用于在用户初次使用软件应用时,对用户的个人兴趣进行初次采 集,将采集好的个人兴趣信息发送至用户属性静态分析模块; 所述数据接收模块,用于接收来自信息推送系统发送过来数据信息; 所述用户搜索模块,用于提供给用户自主搜索相关数据信息; 所述用户自主修改模块,用于用户自主修改自己的个人兴趣集数据信息; 所述用户属性静态分析模块,用于对用户注册模块初次采集的个人兴趣记性静态分 析,将分析后的个人兴趣发送至个人兴趣集进行存储; 所述词频统计模块,用于对用户搜索模块的搜索关键词进行频率统计,将统计结果发 送至分析模块; 所述时间分析模块,用于分析用户在用户搜索模块反馈回来的信息以及信息接收模块 接收到的信息上的停留时间,将分析结果发送至分析模块; 所述日志挖掘分析模块,用于对用户的操作日志进行分析,将分析结果发送至分析模 块; 所述分析模块,用于根据词频统计模块、时间分析模块和日志挖掘分析模块发送过来 分析结果进行分析,得出新的个人兴趣结果,将新的个人兴趣结果发送至个人兴趣集; 所述个人兴趣集,用于存储个人兴趣信息; 所述兴趣采集模块,用于对个人兴趣集中的兴趣进行数据采集,将采集后的结果发送 至信息检索模块; 所述信息检索模块,用于根据兴趣采集模块发送过来的采集结果,在数据库中检索相 关信息,将信息发送至数据发送模块; 所述数据发送模块,用于将信息检索模块发送过来的数据信息,发送至数据接收模块; 所述信息采集模块,用于采集互联网中的相关数据信息,将这些信息发送至数据分类 丰旲块; 所述信息分类模块,用于将信息采集模块采集到的数据信息进行分类处理,将分类后 的数据信息发送至数据库; 所述数据库,用于对分类后的数据信息进行分类存储。2. 如权利要求1所述的个人信息推送系统,其特征在于,所述词频统计模块的统计方法 包括以下步骤; 步骤1:在搜索模块设置词频触发器,用户每次进行搜索操作的时候,词频触发器启动 发送信号至词频统计模块; 步骤2:对用户进行搜索的关键词进行拆分处理; 步骤2:词频统计模块对该次搜索行为的搜索关键词进行记录,存储在本地缓存中; 步骤3:设定一个统计阈值:D;若词频统计模块统计到的某个搜索关键词高于该阈值, 则发送该关键词至分析模块。3. 如权利要求1所述的个人信息推送系统,其特征在于,所述时间分析模块的时间分 析方法包括以下步骤: 步骤1:在用户搜索模块和数据接收模块设置时间触发器,当用户每次查阅用户搜索模 块反馈回来和数据接收模块接收到的数据信息时,时间触发器启动发送信号至时间分析模 块; 步骤2:时间分析模块中设定一个时间阈值:T; 步骤3:时间分析模块记录用户点击进入该页面到最后离开该页面,停留在该数据信息 页面的时间,将该时间和时间阈值T进行比较,若该时间大于时间阈值,则发送页面信息至 时间分析模块。4. 如权利要求1所述的个人信息推送系统,其特征在于,所述日志挖掘分析模块的日志 挖掘分析方法包括以下步骤: 步骤1:在用户搜索模块设置日志触发器,当用于每次对用户搜索模块反馈回来的数据 信息进行复制、截图操作时,触发器启动,将该数据信息至日志挖掘分析模块; 步骤2:用户挖掘分析模块对这些操作进行记录,记载在本地缓存中,生成操作日志; 步骤3:设定一个时间周期:H,设定一个日志阈值:I; 步骤4:用户挖掘分析模块每隔该时间周期,对本地缓存中的操作日志进行统计分析; 若针对某个网站的数据信息进行的操作高于时间阈值I,则发送该网站和域名信息至分析 丰旲块。5. 如权利要求1所述的个人信息推送系统,其特征在于,所述分析模块的分析方法包括 以下步骤: 步骤1:接收来自词频统计模块、时间分析模块和日志挖掘分析模块发送过来的信息; 步骤2:提取时间分析模块发送过来的页面信息中的关键词,将词频统计模块发送过来 的关键词信息和提取自时间分析模块中的关键词进行比对,筛选出比对一致的关键词; 步骤3:获取筛选出一致的关键词信息的源网站信息;将网站信息和日志挖掘分析模块 发送过来的网站信息进行比对,筛选出一致的网站信息; 步骤4:将筛选出的网站信息发送至个人兴趣集。6. 如权利要求1所述的个人信息推送系统,其特征在于,所述信息采集模块的信息采集 方法包括以下步骤: 步骤1:由系统管理员选定多个网站作为网站集: 步骤2:设定站点的权重最大值为100,最小值为O,再设定两个权重阈值:C = 70,B = 40; 然后对每个站点设定权重值; 步骤3:信息检索模块根据每个站点的权重值,采用蜘蛛程序进行不同深度和广度的信 息采集;权重值高于70的站点,采集深度和广度为高级;权重值介于40到70之间的站点,采 集深度和广度为中级;权重值低于40的站点,采集深度和广度为低级。7. 如权利要求6所述的个人信息推送系统,其特征在于,所述信息采集模块的蜘蛛程序 采集后,对信息的排序方法包括以下步骤: 步骤1:取检索系统中的数据结构为G,G的规模为N,设定网站集合为: Wsite = {(sitei,webi),(site2,web2),(site3,web3),···(siten,web n) },其中 Ki<n,Wsite中 的每一个元素为一个网站站点;每个网站站点为G中的一个结点。 步骤2:对于G中的每一个节点η,设W (η)是权重值,而向量?审为G对应的W (η)结果向量。 步骤:3:设定!卩:对G中每一个节点η, 设定其 初始值W(n〇)均为 步骤4:当k=l,2,3......η;对G中的每一个节点,均有:步骤5:其中,a为预先设定的参数,Scanf(P1)为页面的出度值; 步骤6:按照出度值对每个采集到的信息进行排序。
【文档编号】G06F17/30GK106021476SQ201610331230
【公开日】2016年10月12日
【申请日】2016年5月18日
【发明人】曾丽
【申请人】成都九十度工业产品设计有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1