确定目标新闻源中的热点新闻的方法与设备的制造方法_2

文档序号:9326976阅读:来源:国知局
闻源中被发布的发布操作量信息,确定所述热点等级信息。
[0040]在此,所述相关新闻源是指不同于所述目标新闻源的其他新闻源。在此,所述发布操作量信息是指所述候选热点新闻在相关新闻源中被发布的总次数、发布/更新频率等信息。在具体实施例中,所述热点等级信息可与所述发布操作量信息具有一定对应关系,如热点等级为I级的新闻具有某范围的发布操作量信息。本领域技术人员应能理解上述发布操作量信息仅为举例,其他现有的或今后可能出现的发布操作量信息如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
[0041 ] 例如,对于候选热点新闻new2和new3,假设候选热点新闻new2在相关新闻源中被发布的总次数为100次,而候选热点新闻new3在相关新闻源中被发布的总次数为30次,热点等级为I级的新闻对应的在相关新闻源中被发布的总次数为[50,+⑴),而热点等级为II级的新闻对应的在相关新闻源中被发布的总次数为[20,50),则热点等级确定装置可确定候选热点新闻new2和new3的热点等级信息分别为I级和II级。
[0042]本领域技术人员应能理解上述确定所述热点等级信息的方式仅为举例,其他现有的或今后可能出现的确定所述热点等级信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
[0043]在此,本发明实现了热点新闻的自动化挖掘,提高了热点新闻的识别率,并降低了识别成本。
[0044]热点确定设备I的各个装置之间是持续不断工作的。具体地,候选确定装置11持续确定目标新闻源中的候选热点新闻,其中,所述候选热点新闻位于所述目标新闻源中的热点新闻块;热点确定装置12持续根据所述候选热点新闻的访问特征信息,从所述候选热点新闻中确定热点新闻。在此,本领域技术人员应理解,所述“持续”是指热点确定设备I的各装置之间分别不断地进行候选热点新闻的确定、热点新闻的确定,直至热点确定设备I在较长时间内停止确定所述候选热点新闻。
[0045]优选地,热点确定设备I还包括用于根据从多个新闻源中确定的热点新闻,建立或更新热点新闻库的装置(以下简称“热点新闻库建立装置”,未示出)。具体地,热点新闻库建立装置根据从多个新闻源中确定的热点新闻,建立或更新热点新闻库,如按热点新闻的热点等级信息为顺序,将从多个新闻源中确定的热点信息进行排列。
[0046]在此,所述热点新闻库可用于当用户访问新闻网站或打开新闻app客户端时,将热点新闻库中的热点等级较高的新闻主动提供给用户,还可用于当用户查询热点新闻时,从该库中进行匹配查询,以提高向用户提供热点新闻的效率及所提供的热点新闻的准确度。
[0047]图2示出根据本发明一个优选实施例的一种用于确定目标新闻源中的热点新闻的热点确定设备的设备示意图,其中,热点确定设备I包括候选确定装置11’和热点确定装置12’,其中,候选确定装置11’包括用于确定目标新闻源中的热点新闻块的单元(以下简称“第一确定单元111’”)和用于确定所述热点新闻块中的候选热点新闻,以作为所述目标新闻源中的候选热点新闻的单元(以下简称“第二确定单元112’”)。具体地,第一确定单元111’确定目标新闻源中的热点新闻块;第二确定单元112’确定所述热点新闻块中的候选热点新闻,以作为所述目标新闻源中的候选热点新闻;热点确定装置12’根据所述候选热点新闻的访问特征信息,从所述候选热点新闻中确定热点新闻。在此,本领域技术人员应当理解,热点确定装置12’与图1实施例中对应装置的内容相同或基本相同,为简明起见,故在此不再赘述。
[0048]具体地,第一确定单元111’确定目标新闻源中的热点新闻块,如将目标新闻源中的指定块作为所述热点新闻块,或者,还可根据目标新闻源中的新闻块是否满足预定的热点块判断规则,确定该目标新闻源中的热点新闻块;其中,所述预定的热点块判断规则包括以下至少任一项:
[0049]-若所述新闻块包含预定热点块标识信息,则该新闻块属于热点新闻块;
[0050]-若所述新闻块属于指定的热点块,则该新闻块属于热点新闻块。
[0051]例如,对于目标新闻源如新闻网站news-pagel,假设第一确定单元111’对该新闻网站进行页面分析,诸如根据页面的css或DOM树节点发现该网站中的新闻块news-module-1包含预定热点块标识信息,则第一确定单元111’确定新闻块news-module-1为新闻网站news-pagel中的热点新闻块。在此,所述预定热点块标识信息用于标识新闻块是否属于热点新闻块,其可以是hot字符标识、!号标识等。在此,本领域技术人员应能理解上述热点块标识信息仅为举例,其他现有的或今后可能出现的热点块标识信息如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
[0052]再如,对于目标新闻源如新闻网站news-pagel,假设该网站中的新闻块news-module-2属于指定的热点块,如是人工配置的热点块,则第一确定单元111’确定新闻块news-module-2为新闻网站news-pagel中的热点新闻块。
[0053]本领域技术人员应能理解上述确定目标新闻源中的热点新闻块的方式仅为举例,其他现有的或今后可能出现的确定目标新闻源中的热点新闻块的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
[0054]第二确定单元112’确定所述热点新闻块中的候选热点新闻,如将所述热点新闻块中的所有新闻均作为所述候选热点新闻,以作为所述目标新闻源中的候选热点新闻;或者,还可根据所述热点新闻块中新闻的热点特征信息,确定所述候选热点新闻。优选地,所述热点特征信息包括以下至少任一项:
[0055]-所述热点新闻块中新闻的标题样式信息;
[0056]-所述热点新闻块中新闻的热点标识信息。
[0057]在此,所述标题样式信息包含标题的字体大小、字体是否加粗、标题是否高亮显示等信息。
[0058]在此,所述热点标识信息用于标识新闻是否属于热点新闻,其可以是hot字符标识、!号标识、红色小方块等任何标识。
[0059]例如,对于目标新闻源如新闻网站news-page I,其热点新闻块为新闻块news-module-Ι,假设第二确定单元112’发现该热点新闻块中的新闻newl’和new2’的标题为高亮显示,或者,标题的字体是加粗的,或者,具有热点标识信息如hot标识等,则第二确定单元112’可确定新闻newl’和new2’为新闻块news-module-1中的候选热点新闻,从而得到目标新闻源如新闻网站news-pagel的候选热点新闻。
[0060]本领域技术人员应能理解上述确定所述热点新闻块中的候选热点新闻的方式仅为举例,其他现有的或今后可能出现的确定所述热点新闻块中的候选热点新闻的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
[0061]图3示出根据本发明另一个方面的一种用于确定目标新闻源中的热点新闻的方法流程图。
[0062]其中,该方法包括步骤SI和步骤S2。具体地,在步骤SI中,热点确定设备I确定目标新闻源中的候选热点新闻,其中,所述候选热点新闻位于所述目标新闻源中的热点新闻块;在步骤S2中,热点确定设备I根据所述候选热点新闻的访问特征信息,从所述候选热点新闻中确定热点新闻。
[0063]在此,热点确定设备I包括但不限于网络设备、用户设备或网络设备与用户设备通过网络相集成所构成的设备。在此,所述网络设备包括但不限于如网络主机、单个网络服务器、多个网络服务器集或基于云计算的计算机集合等实现;或者由用户设备实现。在此,云由基于云计算(Cloud Computing)的大量主机或网络服务器构成,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。在此,所述用户设备可以是任何一种可与用户通过键盘、鼠标、触摸板、触摸屏、或手写设备等方式进行人机交互的电子产品,例如计算机、手机、智能手机、PDA、可穿戴设备、掌上电脑PPC或平板电脑等。所述网络包括但不限于互联网、广域网、城域网、局域网、VPN网络、无线自组织网络(Ad Hoc网络)等。本领域技术人员应能理解上述热点确定设备I仅为举例,其他现有的或今后可能出现的网络设备或用户设备如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。在此,网络设备及用户设备均包括一种能够按照事先设定或存储的指令,自动进行数值计算和信息处理的电子设备,其硬件包括但不限于微处理器、专用集成电路(ASIC)、可编程门阵列(FPGA)、数字处理器(DSP)、嵌入式设备等。
[0064]具体地,在步骤SI中,热点确定设备I确定目标新闻源中的候选热点新闻,其中,所述候选热点新闻位于所述目标新闻源中的热点新闻块。
[0065]在此,所述目标新闻源是指能够登载新闻供网络用户浏览的网站(如国家大型新闻门户、商业门户、地方新闻门户等)、页面、新闻app等。
[0066]在此
当前第2页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1