基于文本的网页内容生成视频摘要的方法、装置及系统的制作方法

文档序号：8412624阅读：381来源：国知局

基于文本的网页内容生成视频摘要的方法、装置及系统的制作方法
【技术领域】
[0001]本发明涉及视频生成领域，具体而言，涉及基于文本的网页内容生成视频摘要的方法、装置及系统。
【背景技术】
[0002]新闻网站，指以经营新闻业务为主要生存手段的网站。包括国家大型新闻门户，商业门户，地方新闻门户，还有各种行业门户网站也充当了该行业的新闻网站。
[0003]现有的新闻网站，新闻展示一般基于文字及图片来描述。目前用户通过越来越多的途径，例如手机、平板电脑、电视等，来获取新闻的内容。现有的新闻类应用从新闻网站获取新闻的也多以文字图片为主。
[0004]现有的新闻网站上新闻的缺点是在内容快速消费时代，用户阅读文字的时间成本相对提高，不利于新闻网站用文字向用户展示新闻。

【发明内容】

[0005]本发明的目的在于提供一种基于文本的网页内容生成视频摘要的方法、装置及系统，用生成视频摘要的方式向用户展示网页上的新闻，以节省用户阅读新闻网页上新闻的时间成本。
[0006]第一方面，本发明实施例提供了一种文本的网页内容生成视频摘要的方法，包括:提取目标新闻网页文本内容的文本摘要；解析所述文本摘要，得到所述文本摘要中的关键词；对所述关键词进行语义分析，得到所述关键词本体语义；基于所述关键词本体语义，从互联网络中检索对应的图片或视频，形成背景图，形成背景图；基于所述关键词本体语义，从预先设立的语法数据库中获取与所述关键词对应的动画模板；将所述文本摘要转化为音频数据；按照预设渲染规则，将所述背景图、所述动画模板及所述音频数据合成渲染为视频文件。
[0007]结合第一方面，本发明实施例提供了第一方面的第一种可能的实施方式，其中，所述提取目标新闻网页文本内容的文本摘要包括:基于网页链接，获取新闻网页；去除所述新闻网页中的附加信息，其中所述附加信息包括以下一种或多种:广告、图片、视频、框架及图表；提取去除所属附加信息后的所述新闻网页的文本内容；从所述文本内容中摘取重点语句组成所述文本摘要。
[0008]结合第一方面，本发明实施例提供了第一方面的第二种可能的实施方式，其中，所述从所述文本内容中摘取重点语句组成所述文本摘要，包括:依次计算所述文本内容中每两句语句之间的相似性；根据所述相似性的计算结果，对所述文本内容中的语句分类；按照所述分类的结果，从每类语句中分别提取语句进行组合，得到候选摘要；从所述候选摘要中选取与预设文本摘要长度差值最小的候选摘要作为所述新闻网页的摘要文本，其中所述预设文本摘要长度根据待生成的视频长度和预先设定的文本摘要朗读速度确定。
[0009]结合第一方面，本发明实施例提供了第一方面的第三种可能的实施方式，其中，所述依次计算所述文本内容中每两句语句之间的相似性，包括:计算当前两句语句中共有词语的数量之和；将所述数量之和除以当前两句语句的长度平均值，得到当前两句语句的相似性；依照获取当前两句语句的相似性的方法计算所述文本内容中每两句语句之间的相似性。
[0010]结合第一方面，本发明实施例提供了第一方面的第四种可能的实施方式，其中，所述解析所述文本摘要，得到所述文本摘要中的关键词，包括:对所述文本摘要进行分词；将所述分词后得到的词语与所述语法数据库中的词语模板进行比对，确定分词后得到的词语的词性；根据所述词性的判断结果，从分词后的词语中选取名词及数词作为所述文本摘要的关键词。
[0011]结合第一方面，本发明实施例提供了第一方面的第五种可能的实施方式，其中，所述对所述关键词进行语义分析，得到所述关键词本体语义，包括:在所述语法数据库中检索所述关键词，获取与所述关键词相关的所有本体描述；利用网络本体语言OWL从所述关键词的所有本体描述中确定出当前语境下的关键词本体语义。
[0012]结合第一方面，本发明实施例提供了第一方面的第六种可能的实施方式，其中，所述按照预设渲染规则，将所述背景图、所述动画模板及所述音频数据合成渲染为视频文件，包括:设定所述音频数据中所述关键词、与所述关键词对应的背景图及动画模板的映射关系；按照所述映射关系，对所述背景图、所述动画模板及所述音频数据进行合成渲染。
[0013]第二方面，本发明实施例还提供了一种基于文本的网页内容生成视频摘要的装置，包括:提取模块，用于提取目标新闻网页文本内容的文本摘要；关键词获取模块，用于解析所述文本摘要，得到所述文本摘要中的关键词；语义分析模块，用于对所述关键词进行语义分析，得到所述关键词本体语义；背景图形成模块，用于基于所述关键词本体语义，从互联网络中检索对应的图片或视频，形成背景图；动画模板获取模块，用于基于所述关键词本体语义，从预设的语法数据库中获取与所述关键词对应的动画模板；音频转换模块，用于将所述文本摘要转化为音频数据；视频合成模块，用于按照预设渲染规则，将所述背景图、所述动画模板及所述音频数据合成渲染为视频文件。
[0014]结合第二方面，本发明实施例提供了第二方面的第一种可能的实施方式，其中，所述关键词获取模块，包括:分词单元，用于对所述文本摘要进行分词；词性确定单元，用于将所述分词后得到的词语与所述语法数据库中的词语模板进行比对，确定分词后得到的词语的词性；关键词选取单元，用于根据所述词性的判断结果，从分词后的词语中选取名词及数词作为所述文本摘要的关键词。
[0015]第三方面，本发明实施例还提供了一种基于文本的网页内容生成视频摘要的系统，包括:用户端及与用户端通过互联网连接的新闻服务器端；所述新闻服务器端包括如第二方面和第二方面第一种可能的实施方式所述的基于文本的网页内容生成视频摘要的
目.ο
[0016]本发明实施例提供的基于文本的网页内容生成视频摘要的方法、装置及系统，能够基于目标新闻网页文本内容生成视频摘要，并将视频摘要在目标新闻网页上展示出来。用户在浏览相应新闻网页时，可以通过观看视频摘要的方式获取新闻信息，相比现有新闻网站通过图片和文字展示新闻的方式，能节省用户阅读新闻网页上新闻的时间成本。
[0017]为使本发明的上述目的、特征和优点能更明显易懂，下文特举较佳实施例，并配合所附附图，作详细说明如下。
【附图说明】
[0018]为了更清楚地说明本发明实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本发明的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。
[0019]图1示出了本发明实施例1所提供的基于文本的网页内容生成视频摘要的方法流程不意图；
[0020]图2示出了本发明实施例2所提供的基于文本的网页内容生成视频摘要的方法流程不意图；
[0021]图3示出了本发明实施例3所提供的基于文本的网页内容生成视频摘要的方法流程不意图；
[0022]图4示出了本发明实施例4所提供的基于文本的网页内容生成视频摘要的方法流程不意图；
[0023]图5示出了本发明实施例5所提供的基于文本的网页内容生成成视频摘要的方法流程示意图；
[0024]图6示出了本发明实施例6所提供的基于文本的网页内容生成视频摘要的装置的结构意图；
[0025]图7示出了本发明实施例7所提供的基于文本的网页内容生成视频摘要的装置中关键词获取模块的结构示意图；
[0026]图8示出了本发明实施例8所提供的基于文本的网页内容生成视频摘要的系统连接示意图。
[0027]主要元件符号说明:
[0028]21、提取模块；22、关键词获取模块；23、语义分析模块；24、背景图形成模块；25、动画模板获取模块；26、音频转换模块；27、视频合成模块；22a、分词单元；22b、词性确定单元；22c、关键词选取单元；31、用户端；32、新闻服务器端。
【具体实施方式】
[0029]下面将结合本发明实施例中附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此，以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围，而是仅仅表示本发明的选定实施例。基于本发明的实施例，本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本发明保护的范围。
[0030]实施例1:
[0031]本实施例1提供了一种基于文本的网页内容生成视频摘要的方法，其流程示意图为图1，主要处理步骤包括:
[0032]步骤SlOl:提取目标新闻网页文本内容的文本摘要。
[0033]新闻信息的文本可能不够简洁，用户需要较多的时间成本获取网页上的新闻信息，通过提取新闻网页文本内容的文本摘要能够以较为简洁且相对完整的向用户介绍新闻信息。
[0034]

完整全部详细技术资料下载

当前第1页1 2 3 4

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：李国祥;
技术所有人：北京威扬科技有限公司;
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。