互联网监测方法、装置及系统的制作方法_3

文档序号:9547226阅读:来源:国知局
骤S102之后还包括:步骤S105,给描述模型的标 签设定优先级。
[0064] 在一个具体的实例中,可以给每个标签或者说对应的节点赋予优先级,还可以给 部分标签(例如第二级L2的标签)或者说对应的节点赋予优先级。例如,优先级可以为分 高、中、低三级。如此,步骤S103中所述的至少一个标签就可以选择优先级超过预定值的标 签。例如,选取优先级为高级的标签。
[0065] 而优先级的设定可以参考标签所对应的问题相对于用户的重要性来说。例如,对 于一款应用程序,闪退、死机/黑屏、播放速度卡、安全等问题会严重用户使用,因此可以赋 予最高的优先级;而安装、活动等问题影响相对较小,可以赋予相对较低的优先级。当然,设 定优先级的标准并不限于这样,在具体使用时可以根据具体的需要,采用任意合适的标准 来确认标签的优先级。
[0066] 根据本实施例的方法,通过给标签设置优先级,可以实现对相关信息的多层次过 滤,减少非相关问题对监测过程的干扰。
[0067] 参阅图6,其为第四实施例提供的互联网监测方法的流程图。本实施例的方法与图 5所示的方法相似,其不同之处在于,在步骤S105之后还包括:步骤S106,给描述模型的标 签设定情感倾向性标记。
[0068] 在一个具体的实例中,可以给每个标签或者说对应的节点赋予情感倾向性标记, 还可以给部分标签(例如第二级L2与第三级L3的标签)或者说对应的节点赋予优先级。 [0069] 在一个具体的实例中,情感倾向性标记可以分为正面、负面、中性三种。如此步骤 S103中所述的至少一个标签就可以选择某一个或者多个情感倾向性标记对应的标签。
[0070] 根据本实施例的方法,通过情感倾向性标记,可以迅速的通过标签的匹配检索直 接判断该信息对于监测目标的情感倾向,而无须再通过进行文本识别、语义分析的方式获 取信息对于监测目标的情感倾向,从而可以提升互联监测时的检索效率。
[0071] 参阅图7,其为第五实施例提供的互联网监测方法的流程图。本实施例的方法与图 3所示的方法相似,其不同之处在于,在步骤S104之后还包括步骤S107,输出统计结果。
[0072] 具体地,参阅图8,步骤S107包括以下步骤:
[0073] 步骤S201,获取所述监测目标的监测结果输出规则,所述监测结果输出规则包括 至少一个分类,每个分类对应所述描述模型的中的至少一个标签。
[0074] 例如,从配置文件或者数据库中读取与某个监测目标对应的监测结果输出规则。 监测结果输出规则可以包括多个分类,而每个分类可以对应于描述模型中的至少一个标 签。
[0075] 在一个具体的实例中,监测结果输出规则包括以下分类:1、功能故障,2、安全隐 私,3、支付问题,4、性能。而每个分类可以具有一个或者多个标签,例如,分类4就可包括图 4所示的所有二级及三级标签。
[0076] 步骤S202,根据每个分类所包括的标签对标签的匹配检索结果进行聚类。
[0077] 例如,参阅图4,标签"闪退"与"播放速度卡"都属于分类4的标签,因此所有匹配 检索到"闪退"与"播放速度卡"的相关信息的数量都可记入分类4的匹配检索结果中。
[0078] 步骤S203,将每个分类的标签匹配检索统计结果发送给预定义的第一联系人或联 系人组。
[0079] 经过步骤S202,根据不同分类对标签的检索结果进行了聚类,然后可将聚类结果 进行具体的输出。可以理解,一般来说,互联网监测是由专门设置的服务器进行,相关的人 员并不会直接得到统计结果。因此,在步骤S203中,可以将监测的统计结果发送给预定义 的第一联系人或者联系人组。具体地,可以采用邮件、即时通讯消息、移动通信的短消息等 方式进行发送。
[0080] 根据本实施例的方法,可以根据监测结果的输出规则对标签的检索结果进行聚类 处理,进而生成预定格式的统计结果发送给相关的联系人或者联系人组,方便用户查阅监 测结果。
[0081] 参阅图9,其为第六实施例提供的互联网监测方法的流程图。本实施例的方法与 图7所示的方法相似,其不同之处在于,还包括步骤S108:在预定的时间段内若所述相关信 息的数量小于预设的阈值d,根据所述统计结果以及预定义的第一规则计算第一风险系数; 若所述第一风险系数大于或等于预定义的第一风险阈值m才进行所述输出统计结果的步 骤。
[0082] 上述的相关信息的数量阈值d可以是预先设定好的。以图4所示的XX视频产品为 例,d其可以通过以下方式获取:抽取过去一个长时间段(例如3年)中该监测目标的所有 相关信息,计算每天的平均信息量。此外还可对前半年每5分钟爬取一次的数据进行统计。 发现一般情况下该监测目标的热度每5分钟在40条左右,一天高峰基本不超过100条。热 点事件下监测目标的5分钟热度则可以达到500条。因此,阈值d就可以设定为100或者 更高的值。
[0083] 上述的第一规则是指第一风险系数的计算公式。一般来说,可以主要考虑数量以 及比例。二级标签根据其描述的问题的对于用户使用上的影响程度分为两类,高风险问题 与低风险问题,例如,在性能下的用不了与登陆不上,在帐号安全中的帐号安全、支付与支 付安全问题均属于需要关注的高风险问题,对于高风险问题,给予其一个相对高的权重。例 如,在本实施例中,对于高风险问题,其权重可以确定为2-5,而具体的数值可以根据具体情 形由维护人员调整。而对于低风险问题,可给予其一个较低的权重,例如1。每个问题的权 重可以用t表示,而每个问题的风险度可以采用一个数值表达,例如可以用q表示,因此,对 于一个问题,其风险程度可以用t*q表示。
[0084] 在一个具体的实例中,第一风险系数可根据以下公式计算:
[0086] 其中,k表示描述模型中二级标签(L2)的总数,i表示低风险问题的总数, 1彡j彡k,0彡i彡k,表示序号为j的问题的权重,而 qj表示序号为j的问题的风险度。
[0087] 第一风险阈值例如可以确定为50%。
[0088] 根据本实施例的方法,通过设定相关信息的阈值d以及第一风险阈值m使得在检 测到真正具有风险的前提下才向预定的联系人或联系人组输出监测结果,可以避免过多的 监测消息干扰到用户,而使监测消息失去了警告的价值。
[0089] 参阅图10,其为第七实施例提供的互联网监测方法的流程图。本实施例的方法与 图7所示的方法相似,其不同之处在于,还包括步骤S109 :若所述相关文档的数量大于预设 的阈值d,根据所述统计结果以及预定义的第二规则计算第二风险系数;若所述第二风险 系数大于或等于预定义的第二风险阈值η才进行所述输出统计结果的步骤。
[0090] 上述的第二规则是指第二风险系数的计算公式。一般来说,可以主要考虑数量以 及比例。不同于第一风险系数的地方在于,第二风险系数的计算需要考虑产品的热度问题 是否超过阈值,需要在计算公式中引入热度变化的涨幅。例如,在一个具体的实例中,第二 风险系数可根据以下公式计算:
[0092] 其中,p表示产品热度(例如可以采用有效评论量来表达),h为当次计算的时间 段,h-Ι表示上一个时间段,因此p h/ph i表示产品热度的涨幅。
[0093] 当产品热度涨幅ph/ph i大于1的时候,由于产品热度上升,放大了风险系数,当本 次热度有所回落,但是回落不够多的情况下仍然在有风险的范围内,直到跌幅明显,因此, 第二风险阈值可以确定为低于第一风险阈值的数值。在一个具体的实例中,第二风险阈值 例如可以确定为30%。
[0094] 根据本实施例的方法,通过设定相关信息的阈值d以及第二风险阈值η使得在检 测到真正具有风险的前提下才向预定的联系人或联系人组输出监测结果,可以避免过多的 监测消息干扰到用户,而使监测消息失去了警告的价值。
[0095] 参阅图11,其为第八实施例提供的互联网监测方法的流程图。
当前第3页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1