一种信息获取方法、设备及系统与流程

文档序号:37621762发布日期:2024-04-18 17:36阅读:15来源:国知局
一种信息获取方法、设备及系统与流程

本技术实施例涉及终端应用,尤其涉及一种信息获取方法、设备及系统。


背景技术:

1、当前,随着网络信息的爆发式增长,信息内容也呈现多样性。对于同一话题或专题的信息而言,由于其信息来源不同,侧重点不同,编辑者的编辑方式等的不同,会造成信息内容也会存在一些差异。因此,用户想要获取同一话题或专题的信息需要花费较多的时间。

2、以新闻信息为例,若用户想要获取同一话题或专题的新闻信息,则需要在新闻应用或者网页逐一进行多个相关关键词的搜索,或者需要分别在不同新闻应用或者网页逐一进行多个相关关键词的搜索,这对用户来说操作繁琐且非常耗时;并且,基于上述常规信息搜索方法获取的新闻信息是零散的,无法供用户集中阅览。


技术实现思路

1、本技术提供一种信息获取方法、设备及系统,可以便捷、快速地集中获取同一话题或专题的信息。

2、为达到上述目的,本技术实施例采用如下技术方案:

3、第一方面,提供一种信息获取方法,该方法包括:从原始信息内容中提取多个实体词和与该多个实体词相关联的关联词;基于提取的多个实体词生成一个或多个专题;根据上述专题对应的实体词和关联词聚合对应的专题相关信息,其中一个或多个专题均包括至少两个实体词。

4、其中,实体词是信息中的关键主体,如人名、地名、活动名称、组织名等;关联词是与信息中上述实体词均相关联的动词、连接词、形容词、副词等词语或者短语等。例如:信息“a公司收购b公司”中,关键主体“a公司”和“b公司”为实体词,与“a公司”和“b公司”均相关联的“收购”为关联词。

5、示例性地,上述方法可以应用于服务器,如新闻应用服务器或者具备信息热点推荐功能的服务器。

6、上述第一方面提供的方案,通过自动化地从海量原始信息中提取关键词,如实体词和关联词,并以多个实体词组合的方式创建专题,以及根据专题对应的实体词和关联词聚合对应的专题相关信息,便于用户直接通过访问某一专题,集中访问该专题相关的具体内容。该方法可以自动化地创建专题,无需用户逐一进行相关关键词的搜索,也无需人工配置相关短语或句子,且可以避免专题生成出错。另外,由于创建的专题由多个实体词组合而成,因此可以定位具体热点内容,避免专题涵盖的范围太广的问题。

7、作为一种可能的实现方式,上述方法还包括:接收第一端侧设备输入的k1值,该k1值用于规定一个或多个专题的实体词的数量,k1为大于1的正整数;上述基于提取的多个实体词生成一个或多个专题,包括:基于提取的多个实体词生成一个或多个专题,该一个或多个专题均包括k1个实体词。本技术支持对组成专题的实体词的数量的自定义设置,因此可以支持通过k1值调整提升专题的代表性和专题聚焦信息的能力,灵活度高且适应性强。

8、作为一种可能的实现方式,上述方法还包括:向第二端侧设备发送一个或多个专题,该一个或多个专题包括第一专题;响应于第二端侧设备对第一专题的选择请求,向第二端侧设备发送第一专题对应的一个或多个信息概览内容。本技术中,在完成专题创建之后,支持通过端侧设备(如手机)向用户展示创建的专题供用户浏览和选择,以及在用户选择某一专题之后,通过该端侧设备(如手机)向用户集中展示与该专题相关的所有信息概览内容。示例性地,第二端侧设备可以根据通过列表形式显示第一专题对应的一个或多个信息概览内容。基于此,用户无需逐一进行相关关键词的搜索,可以直接通过访问某一专题集中访问该专题相关的具体内容,操作便捷,用户体验度高。

9、作为一种可能的实现方式,上述方法还包括:根据上述请求(即第二端侧设备对第一专题的选择请求)向第二端侧设备发送第一专题对应的信息链接,其中信息链接用于关联一个或多个信息概览内容对应的原始信息内容页面。示例性地,第二端侧设备可以在用户选择信息概览内容列表中任意一个信息概览内容时,通过对应信息链接进入对应的原始信息内容页面,方便用户查看原始信息内容。

10、作为一种可能的实现方式,上述方法还包括:接收第一端侧设备输入的k2值,其中k2为大于1的正整数,且k2≠k1;上述基于提取的所述多个实体词生成一个或多个专题,还包括:基于提取的多个实体词生成一个或多个专题,该一个或多个专题均包括k2个实体词。基于此,在进行创建时,可以针对相同的原始信息创建多个由不同数量实体词组合的专题,方便用户根据实际聚焦需求进行专题选择。

11、作为一种可能的实现方式,上述从原始信息内容中提取多个实体词和关联词,包括:通过语言模型从原始信息内容中提取多个实体词和关联词;其中语言模型包括语义向量模型、实体词识别模型和关联词识别模型。基于此,可以自动化地从海量原始信息中提取实体词和关联词,以支持专题创建和专题相关信息聚合。并且,该方法无需人工配置相关短语或句子,且可以避免专题生成出错。

12、作为一种示例,上述语言模型可以由服务器基于大量训练数据训练得到。

13、作为一种示例,语义向量模型如bert(bidirectional encoder representationsfrom transformers)模型、鲁棒优化bert方法(robustly optimized bert approach,roberta)模型、轻量级bert(a lite bert,albert)模型、增强型语言表达(enhancedrepresentation through knowledge integration,ernie)模型、electra(efficientlylearning an encoder that classifies token replacements accurately)模型等。

14、作为一种可能的实现方式,上述方法还包括:基于爬虫信息获取技术从一个或多个渠道获取原始信息,该原始信息包括原始信息内容和对应的信息链接。基于此,可以自动化地进行不同渠道的大量原始信息收集,并且可以避免热点信息的流失。

15、作为一种可能的实现方式,上述方法用于获取新闻信息,上述原始信息内容为原始新闻内容,上述第一专题为新闻专题。作为一种应用场景,本技术提供的方案可以用于基于新闻信息进行新闻专题创建。但是,该方案也可以用于基于其它类型的信息进行专题创建,例如社交媒体言论、论文或网络文章,本技术不限定。

16、第二方面,提供一种信息获取方法,该方法应用于端侧设备,如第二端侧设备,该方法包括:第二端侧设备接收来自服务器的一个或多个专题,其中该一个或多个专题均包括至少两个实体词;第二端侧设备显示上述一个或多个专题。

17、上述第二方面提供的方案,第二端侧设备通过向用户展示服务器创建的由多个实体词组成的一个或多个专题,可以避免用户逐一进行相关关键词的搜索给用户带来的不便,还可以定位具体热点内容,避免专题涵盖的范围太广的问题。

18、作为一种可能的实现方式,上述方法还包括:响应于用户对一个或多个专题中第一专题的选择操作,第二端侧设备向服务器发送请求消息,用于请求第一专题对应的一个或多个信息概览内容;第二端侧设备接收来自服务器的第一专题对应的一个或多个信息概览内容;第二端侧设备显示信息概览内容列表,该列表中包括上述第一专题对应的一个或多个信息概览内容。基于此,用户无需逐一进行相关关键词的搜索,可以直接通过访问某一专题集中访问该专题相关的具体内容,操作便捷,用户体验度高。

19、作为一种可能的实现方式,上述请求消息还用于请求第一专题对应的信息链接,其中信息链接用于关联一个或多个信息概览内容对应的原始信息内容页面。基于此,可以支持通过对应信息链接关联至对应的原始信息内容页面,方便用户查看原始信息内容。作为一种可能的实现方式,上述方法还包括:响应于用户在信息概览内容列表中选择第一信息概览内容的操作,第二端侧设备通过第一信息概览内容对应的信息链接关联至对应原始信息内容页面。基于此,可以支持通过对应信息链接进入对应的原始信息内容页面,方便用户查看原始信息内容。

20、作为一种可能的实现方式,上述方法用于获取新闻信息,上述第一专题为新闻专题。作为一种应用场景,本技术提供的方案可以用于基于新闻信息进行新闻专题创建。但是,该方案也可以用于基于其它类型的信息进行专题创建,例如社交媒体言论、论文或网络文章,本技术不限定。

21、第三方面,提供一种服务器,该服务器包括:关键信息提取单元,用于从原始信息内容中提取多个实体词和与该多个实体词相关联的关联词;专题创建单元,用于基于提取的多个实体词生成一个或多个专题,以及根据上述专题对应的实体词和关联词聚合对应的专题相关信息,其中一个或多个专题均包括至少两个实体词。

22、上述第三方面提供的方案,服务器通过自动化地从海量原始信息中提取关键词,如实体词和关联词,并以多个实体词组合的方式创建专题,以及根据专题对应的实体词和关联词聚合对应的专题相关信息,便于用户直接通过访问某一专题,集中访问该专题相关的具体内容。该方法可以自动化地创建专题,无需用户逐一进行相关关键词的搜索,也无需人工配置相关短语或句子,且可以避免专题生成出错。另外,由于创建的专题由多个实体词组合而成,因此可以定位具体热点内容,避免专题涵盖的范围太广的问题。

23、作为一种可能的实现方式,上述服务器还包括:k值输入单元,用于接收第一端侧设备输入的k1值,该k1值用于规定一个或多个专题的实体词的数量,k1为大于1的正整数;上述专题创建单元基于提取的多个实体词生成一个或多个专题,包括:专题创建单元基于提取的多个实体词生成一个或多个专题,该一个或多个专题均包括k1个实体词。本技术支持对组成专题的实体词的数量的自定义设置,因此可以支持通过k1值调整提升专题的代表性和专题聚焦信息的能力,灵活度高且适应性强。

24、作为一种可能的实现方式,上述服务器还包括:输出单元,用于:向第二端侧设备发送一个或多个专题,该一个或多个专题包括第一专题;以及,响应于第二端侧设备对第一专题的选择请求,向第二端侧设备发送第一专题对应的一个或多个信息概览内容。本技术中,在完成专题创建之后,支持通过端侧设备(如手机)向用户展示创建的专题供用户浏览和选择,以及在用户选择某一专题之后,通过该端侧设备(如手机)向用户集中展示与该专题相关的所有信息概览内容。示例性地,第二端侧设备可以根据通过列表形式显示第一专题对应的一个或多个信息概览内容。基于此,用户无需逐一进行相关关键词的搜索,可以直接通过访问某一专题集中访问该专题相关的具体内容,操作便捷,用户体验度高。

25、作为一种可能的实现方式,上述输出单元还用于:根据上述请求(即第二端侧设备对第一专题的选择请求)向第二端侧设备发送第一专题对应的信息链接,其中信息链接用于关联一个或多个信息概览内容对应的原始信息内容页面。示例性地,第二端侧设备可以在用户选择信息概览内容列表中任意一个信息概览内容时,通过对应信息链接进入对应的原始信息内容页面,方便用户查看原始信息内容。

26、作为一种可能的实现方式,上述k值输入单元还用于:接收第一端侧设备输入的k2值,其中k2为大于1的正整数,且k2≠k1;上述专题创建单元基于提取的所述多个实体词生成一个或多个专题,还包括:专题创建单元基于提取的多个实体词生成一个或多个专题,该一个或多个专题均包括k2个实体词。基于此,在进行创建时,可以针对相同的原始信息创建多个由不同数量实体词组合的专题,方便用户根据实际聚焦需求进行专题选择。

27、作为一种可能的实现方式,上述专题创建单元从原始信息内容中提取多个实体词和关联词,包括:专题创建单元通过语言模型从原始信息内容中提取多个实体词和关联词;其中语言模型包括语义向量模型、实体词识别模型和关联词识别模型。基于此,可以自动化地从海量原始信息中提取实体词和关联词,以支持专题创建和专题相关信息聚合。并且,该方法无需人工配置相关短语或句子,且可以避免专题生成出错。

28、作为一种可能的实现方式,上述服务器还包括:训练单元,用于通过训练大量训练数据,得到上述语言模型。

29、作为一种可能的实现方式,上述服务器还包括:信息获取单元,用于基于爬虫信息获取技术从一个或多个渠道获取原始信息,该原始信息包括原始信息内容和对应的信息链接。基于此,可以自动化地进行不同渠道的大量原始信息收集,并且可以避免热点信息的流失。

30、作为一种可能的实现方式,上述原始信息内容为原始新闻内容,上述第一专题为新闻专题。作为一种应用场景,本技术提供的方案可以用于基于新闻信息进行新闻专题创建。但是,该方案也可以用于基于其它类型的信息进行专题创建,例如社交媒体言论、论文或网络文章,本技术不限定。

31、第四方面,提供一种端侧设备,如第二端侧设备,该第二端侧设备包括:通信单元,用于接收来自服务器的一个或多个专题,其中该一个或多个专题均包括至少两个实体词;显示单元,用于显示上述一个或多个专题。

32、上述第四方面提供的方案,第二端侧设备通过向用户展示服务器创建的由多个实体词组成的一个或多个专题,可以避免用户逐一进行相关关键词的搜索给用户带来的不便,还可以定位具体热点内容,避免专题涵盖的范围太广的问题。

33、作为一种可能的实现方式,上述通信单元还用于:响应于用户对一个或多个专题中第一专题的选择操作,向服务器发送请求消息,用于请求第一专题对应的一个或多个信息概览内容;以及,接收来自服务器的第一专题对应的一个或多个信息概览内容;上述显示单元还用于:显示信息概览内容列表,该列表中包括上述第一专题对应的一个或多个信息概览内容。基于此,用户无需逐一进行相关关键词的搜索,可以直接通过访问某一专题集中访问该专题相关的具体内容,操作便捷,用户体验度高。

34、作为一种可能的实现方式,上述请求消息还用于请求第一专题对应的信息链接,其中信息链接用于关联一个或多个信息概览内容对应的原始信息内容页面。基于此,可以支持通过对应信息链接进入对应的原始信息内容页面,方便用户查看原始信息内容。

35、作为一种可能的实现方式,上述显示单元还用于:响应于用户在信息概览内容列表中选择第一信息概览内容的操作,显示通过第一信息概览内容对应的信息链接关联的对应原始信息内容页面。基于此,可以支持通过对应信息链接进入对应的原始信息内容页面,方便用户查看原始信息内容。

36、作为一种可能的实现方式,上述第一专题为新闻专题。作为一种应用场景,本技术提供的方案可以用于基于新闻信息进行新闻专题创建。但是,该方案也可以用于基于其它类型的信息进行专题创建,例如社交媒体言论、论文或网络文章,本技术不限定。

37、第五方面,提供一种服务器,该服务器包括:存储器,用于存储计算机程序指令;通信接口,用于进行信号发送与接收;处理器,用于执行所述指令,使得电子设备实现如第一方面任一种可能的实现方式中所述的方法。

38、第六方面,提供一种端侧设备,该端侧设备包括:显示器,用于进行界面显示;存储器,用于存储计算机程序指令;通信接口,用于进行信号发送与接收;处理器,用于执行所述指令,使得电子设备实现如第二方面任一种可能的实现方式中所述的方法。

39、第七方面,提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机可读指令,该计算机可读指令被处理器执行时实现如第一方面任一种可能的实现方式中的方法。

40、第八方面,提供一种信息获取系统,该信息获取系统包括如第三方面或第五方面任一种可能的实现方式中的服务器,以及如第四方面或第六方面任一种可能的实现方式中的端侧设备。

41、第九方面,提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机可读指令,该计算机可读指令被处理器执行时实现如第一方面或第二方面任一种可能的实现方式中的方法。

42、第十方面,提供一种芯片系统,该芯片系统包括处理器、存储器,存储器中存储有指令;所述指令被所述处理器执行时,实现如第一方面或第二方面任一种可能的实现方式中的方法。该芯片系统可以由芯片构成,也可以包含芯片和其他分立器件。

43、第八方面,提供一种计算机程序产品,包括计算机可读指令,当该计算机可读指令在计算机上运行时,使得实现如第一方面或第二方面任一种可能的实现方式中的方法。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1