确定目标新闻源中的热点新闻的方法与设备的制造方法_3

文档序号:9326976阅读:来源:国知局
,所述候选热点新闻是指有可能是热点新闻的新闻。
[0067]在此,所述热点新闻块是指所述目标新闻源中指定的、或者是对目标新闻源进行页面分析得到的,登载热点新闻的区域。
[0068]本领域技术人员应能理解上述目标新闻源、热点新闻块仅为举例,其他现有的或今后可能出现的目标新闻源或热点新闻块如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
[0069]例如,对于目标新闻源如新闻网站news-page I,该网站中预定的热点新闻块为焦点新闻模块hot-news-module,则在步骤SI中,热点确定设备I可将新闻网站news-pagel中位于热点新闻块即焦点新闻模块hot-news-module的所有新闻如newl-newlO均作为该新闻网站news-page I的候选热点新闻。
[0070]本领域技术人员应能理解上述确定目标新闻源中的候选热点新闻的方式仅为举例,其他现有的或今后可能出现的确定目标新闻源中的候选热点新闻的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
[0071]在步骤S2中,热点确定设备I根据所述候选热点新闻的访问特征信息,从所述候选热点新闻中确定热点新闻。
[0072]在此,所述热点新闻是指比较受用户关注或者欢迎的新闻。
[0073]在此,所述候选热点新闻的访问特征信息是指用户对该候选热点新闻的访问反馈信息,如阅读量/阅读频率、评论数量/评论频率、分享量/分享频率等。本领域技术人员应能理解上述访问特征信息仅为举例,其他现有的或今后可能出现的访问特征信息如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
[0074]在此,在步骤S2中,热点确定设备I从所述候选热点新闻中确定热点新闻的方式包括但不限于以下至少任一项:
[0075]I)根据所述候选热点新闻的访问特征信息,结合所述候选热点新闻的时效特征信息,从所述候选热点新闻中确定热点新闻。
[0076]在此,所述候选热点新闻的时效特征信息是指该候选热点新闻的发布时间和/或从其发布到能够从网络上被抓取到的所经历的时间等。在具体实施例中,候选热点新闻的发布时间相对越靠近当前时刻,其属于热点新闻的概率就越大;候选热点新闻从其发布到能够从网络上被抓取到的所经历的时间越短,其属于热点新闻的概率也越大。
[0077]例如,对于目标新闻源如新闻网站news-pagel,在步骤SI中,热点确定设备I确定该目标新闻源中的候选热点新闻为newl-newlO,假设候选热点新闻newl-newlO中new2-new5的发布时间相对比较靠近当前时刻,则在步骤S2中,热点确定设备I确定候选热点新闻new2-new5为热点新闻。
[0078]2)根据所述候选热点新闻的访问特征信息,结合所述候选热点新闻的热点等级信息,从所述候选热点新闻中确定热点新闻。
[0079]例如,对于目标新闻源如新闻网站news-page I,在步骤SI中,热点确定设备I确定该目标新闻源中的候选热点新闻为newl-newlO,假设候选热点新闻newl-newlO中new3-new5的热点等级高于其他候选热点新闻,则在步骤S2中,热点确定设备I可确定候选热点新闻new3-new5为热点新闻。
[0080]本领域技术人员应能理解上述从候选热点新闻中确定热点新闻的方式仅为举例,其他现有的或今后可能出现的从候选热点新闻中确定热点新闻的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
[0081 ] 在此,本领域技术人员应当理解,在具体实施例中,本发明还可将所述访问特征信息、所述时效特征信息和所述热点等级信息三者结合起来确定候选热点新闻是否为热点新闻。
[0082]优选地,该方法还包括步骤S3 (未示出)。具体地,在步骤S3中,热点确定设备I根据所述候选热点新闻在相关新闻源中被发布的发布操作量信息,确定所述热点等级信息。
[0083]在此,所述相关新闻源是指不同于所述目标新闻源的其他新闻源。在此,所述发布操作量信息是指所述候选热点新闻在相关新闻源中被发布的总次数、发布/更新频率等信息。在具体实施例中,所述热点等级信息可与所述发布操作量信息具有一定对应关系,如热点等级为I级的新闻具有某范围的发布操作量信息。本领域技术人员应能理解上述发布操作量信息仅为举例,其他现有的或今后可能出现的发布操作量信息如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
[0084]例如,对于候选热点新闻new2和new3,假设候选热点新闻new2在相关新闻源中被发布的总次数为100次,而候选热点新闻new3在相关新闻源中被发布的总次数为30次,热点等级为I级的新闻对应的在相关新闻源中被发布的总次数为[50,+⑴),而热点等级为II级的新闻对应的在相关新闻源中被发布的总次数为[20,50),则在步骤S3中,热点确定设备I可确定候选热点新闻new2和new3的热点等级信息分别为I级和II级。
[0085]本领域技术人员应能理解上述确定所述热点等级信息的方式仅为举例,其他现有的或今后可能出现的确定所述热点等级信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
[0086]在此,本发明实现了热点新闻的自动化挖掘,提高了热点新闻的识别率,并降低了识别成本。
[0087]该方法的各个步骤之间是持续不断工作的。具体地,在步骤SI中,热点确定设备I持续确定目标新闻源中的候选热点新闻,其中,所述候选热点新闻位于所述目标新闻源中的热点新闻块;在步骤S2中,热点确定设备I持续根据所述候选热点新闻的访问特征信息,从所述候选热点新闻中确定热点新闻。在此,本领域技术人员应理解,所述“持续”是指该方法的各步骤之间分别不断地进行候选热点新闻的确定、热点新闻的确定,直至热点确定设备I在较长时间内停止确定所述候选热点新闻。
[0088]优选地,热点确定设备I还包括步骤S4 (未示出)。具体地,在步骤S4中,热点确定设备I根据从多个新闻源中确定的热点新闻,建立或更新热点新闻库,如按热点新闻的热点等级信息为顺序,将从多个新闻源中确定的热点信息进行排列。
[0089]在此,所述热点新闻库可用于当用户访问新闻网站或打开新闻app客户端时,将热点新闻库中的热点等级较高的新闻主动提供给用户,还可用于当用户查询热点新闻时,从该库中进行匹配查询,以提高向用户提供热点新闻的效率及所提供的热点新闻的准确度。
[0090]图4示出根据本发明一个优选实施例的一种用于确定目标新闻源中的热点新闻的方法流程图。
[0091 ] 其中,该方法包括步骤S I’和步骤S2 ’,其中,步骤S I’包括步骤S11’和步骤S12 ’。具体地,在步骤S11’中,热点确定设备I确定目标新闻源中的热点新闻块;在步骤S12’中,热点确定设备I确定所述热点新闻块中的候选热点新闻,以作为所述目标新闻源中的候选热点新闻;在步骤S2’中,热点确定设备I根据所述候选热点新闻的访问特征信息,从所述候选热点新闻中确定热点新闻。在此,本领域技术人员应当理解,步骤S2’与图3实施例中对应步骤的内容相同或基本相同,为简明起见,故在此不再赘述。
[0092]具体地,在步骤S11’中,热点确定设备I确定目标新闻源中的热点新闻块,如将目标新闻源中的指定块作为所述热点新闻块,或者,还可根据目标新闻源中的新闻块是否满足预定的热点块判断规则,确定该目标新闻源中的热点新闻块;其中,所述预定的热点块判断规则包括以下至少任一项:
[0093]-若所述新闻块包含预定热点块标识信息,则该新闻块属于热点新闻块;
[0094]-若所述新闻块属于指定的热点块,则该新闻块属于热点新闻块。
[0095]例如,对于目标新闻源如新闻网站news-pagel,假设在步骤S11’中,热点确定设备I对该新闻网站进行页面分析,诸如根据页面的css或DOM树节点发现该网站中的新闻块news-module-Ι包含预定热点块标识信息,则在步骤S11’中,热点确定设备I确定新闻块news-module-Ι为新闻网站news-pagel中的热点新闻块。在此,所述预定热点块标识信息用于标识新闻块是否属于热点新闻块,其可以是hot字符标识、!号标识等。在此,本领域技术人员应能理解上述热点块标识信息仅为举例,其他现有的或今后可能出现的热点块标识信息如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
[0096]再如,对于目标新闻源如新闻网站news-pagel,假设该网站中的新闻块news-module-2属于指定的热点块,如是人工配置的热点块,则在步骤SI I’中,热点确定设备I确定新闻块news-module-2为新闻网站news-pagel中的热点新闻块。
[0097]本领域技术人员应能理解上述确定目标新闻源中的热点新闻块的方式仅为举例,其他现有的或今后可能出现的确定目标新闻源
当前第3页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1