基于电子商务网页内容生成视频摘要的方法、装置及系统的制作方法_2

文档序号:8412625阅读:来源:国知局
,能够得到商品介绍的关键词,为后续步骤提供关键词信息。
[0034]步骤S103、对关键词进行语义分析,得到关键词本体语义。
[0035]本体是概念化的明确的规范说明,给出构成相关领域词汇的基本术语和关系,以及利用这些术语和关系构成的规定这些词汇外延的规则的定义。利用本体语义,可以得到商品的基本描述,例如“衬衫”的本体描述是“服饰”。一个词语可能有多个本体描述,例如“苹果”的本体描述可以是“水果”,也可以是“公司”,因此需要确定出当前语境下的关键词本体语义。本步骤对关键词进行语义分析得到键词本体语义,以便后续步骤中正确的基于电子商务网页内容生成视频摘要。
[0036]步骤S104、基于关键词本体语义,从互联网络中检索对应的图片或视频,形成背景图;
[0037]合成视频摘要需要素材。根据关键词本体语义,在互联网络搜索引擎中检索相应的图片或视频,形成背景图,作为后续步骤中合成视频摘要的素材。
[0038]步骤S105、基于关键词本体语义,从预先设立的语法数据库中获取与关键词对应的动画模板;
[0039]语法数据库中存储了不同词语本体语义对应的动画模板,根据关键词本体语义,可以从语法数据库中获取对应的动画模板。将不同关键词对应的模板拼凑起来,能够获得生成完整视频摘要的组建方式。
[0040]步骤S106、将文本摘要转化为音频数据;
[0041]即利用相应的软件将文本摘要转化成音频数据,以此音频数据作为合成视频摘要的音频素材。在视频摘要中,以音频的方式向用户介绍商品,相比文字介绍,更加简便,节省用户的时间。
[0042]步骤S107、按照预设渲染规则,将背景图、动画模板及所音频数据合成渲染为视频文件。
[0043]渲染生成视频文件,有相应的软件和渲染规则,按照预设渲染规则,将背景图、动画模板及所音频数据合成渲染为视频文件。合成渲染视频时,设定音频数据中关键词、与关键词对应的背景图及动画模板的映射关系;按照映射关系,对背景图、动画模板及音频数据进行合成渲染。例如关键词I在音频中第3秒时出现,音频中第5秒时出现下一个关键词,则关键词I对应的背景图按照动画模板在第3秒与第5秒之间展现。通过此方法,使得视频摘要中的音频与图像吻合,更好的向用户介绍商品。
[0044]本实施例1提供了一种基于电子商务网页内容生成视频摘要的方法,能够基于目标电子商务网页文本内容生成视频摘要,并将视频摘要在目标电子商务网页上展示出来。用户在浏览相应电子商务网页时,可以通过观看视频摘要的方式获取商品介绍信息,相比现有电子商务网站通过图片和文字介绍商品的方式,能节省用户阅读电子商务网页上商品介绍的时间成本。
[0045]实施例2:
[0046]本实施例2在实施例1的基础上提供一种优选的基于电子商务网页内容生成视频摘要的方法,其流程示意图为图2,主要步骤包括:
[0047]步骤S201、基于网页链接,获取电子商务网页;
[0048]网页链接的地址,可以是用户访问电子商务网页时,向电子商务服务器发送的当前电子商务网页地址;也可以是电子商务服务器扫描获取的相应电子商务网站上所有介绍商品的电子商务网页的地址。电子商务服务器基于获取的网页链接,取得相应电子商务网页信息。
[0049]步骤S202、去除电子商务网页中的附加信息,其中附加信息包括以下一种或多种:
广告、图片、视频、框架及图表;
[0050]电子商务服务器获取的电子商务网页上,除了包括商品对应的文字介绍外,还可能有其他不相关的附加信息,例如广告、图片、视频、框架及图表,此附加信息对于了解商品信息毫无用处,因此步骤S202用来去除电子商务网页上的附加信息。
[0051]步骤S203、提取去除附加信息后的电子商务网页的文本内容;
[0052]去除了电子商务网页上的附加信息后,电子商务服务器得到对商品进行介绍的文本信息,以便在之后的步骤中基于电子商务网页上相应的文本信息生成视频摘要。
[0053]步骤S204、从文本内容中摘取重点语句组成文本摘要。
[0054]电子商务网页上的商品介绍可能不够简洁,含有较多的文字,用户需要较多的时间成本获取网页上的商品介绍信息,因此,需要从文本内容中摘取重点语句组成文本摘要,以便更简洁地向用户介绍电子商务网页上的商品,节省用户获取商品信息的时间成本。
[0055]步骤S205、解析文本摘要,得到文本摘要中的关键词。
[0056]本步骤得到商品介绍的关键词,为后续步骤提供关键词信息。
[0057]步骤S206、对关键词进行语义分析,得到关键词本体语义。
[0058]本步骤得到关键词的语义分析得到本体语义,以便后续步骤中正确的基于电子商务网页内容生成视频摘要。
[0059]步骤S207、基于关键词本体语义,从互联网络中检索对应的图片或视频,形成背景图;
[0060]本步骤得到背景图,作为后续步骤中合成视频摘要的素材。
[0061]步骤S208、基于关键词本体语义,从预先设立的语法数据库中获取与关键词对应的动画模板;
[0062]本步骤能够获得生成视频摘要的方式。
[0063]步骤S209、将文本摘要转化为音频数据;
[0064]本步骤将文本摘要转化成音频数据,以此音频数据作为合成视频摘要的音频素材。
[0065]步骤S210、按照预设渲染规则,将背景图、动画模板及所音频数据合成渲染为视频文件。
[0066]本步骤渲染生成视频文件。
[0067]本实施例2提供的一种基于电子商务网页内容生成视频摘要的方法与实施例1提供的方法相比,其工作过程和优点相同,不再赘述。
[0068]实施例3:
[0069]本实施例3在实施例2的基础上提供一种优选的基于电子商务网页内容生成视频摘要的方法,其流程示意图为图3,主要步骤包括:
[0070]步骤S301、基于网页链接,获取电子商务网页;
[0071]本步骤取得相应电子商务网页。
[0072]步骤S302、去除电子商务网页中的附加信息,其中附加信息包括以下一种或多种:广告、图片、视频、框架及图表;
[0073]本步骤用来去除电子商务网页上的附加信息。
[0074]步骤S303、提取去除附加信息后的电子商务网页的文本内容;
[0075]本步骤得到对商品进行介绍的文本信息。
[0076]步骤S304、依次计算文本内容中每两句语句之间的相似性。
[0077]相似的语句通常包含相似的信息。为了简洁、完整的向用户介绍电子商务网页上的商品,可以根据相似性将文本内容中语句分类,每个类中提出一句语句,如此便可以简洁、完整的向用户介绍电子商务网页上的商品。
[0078]具体的计算两句语句之间相似性的方法是:
[0079]首先,计算当前两句语句中共有词语的数量之和;
[0080]计算同时出现在当前两句话中的所有词语的总数,其总数越大,则认为两句语句之间相似性越大;
[0081]其次,将数量之和除以当前两句语句的长度平均值,得到当前两句语句的相似性;
[0082]本方法中定义语句的长度为语句中的字数。将同时出现在当前两句话中的所有词语的总数除以两句语句的字数的平均值,得到当前两句语句的相似性,即两句语句共有的词语越多,两句语句平均长度越短,则认为两句语句之间相似性越大。用此方法可以简便地获得两句语句之间的相似性。例如,文本内容中的两句话分别为语句I和语句2 ;语句I中包含4个词语,每个词语长度为2个字,分别为词语I,词语2,词语3,词语4 ;语句2中包含6个词语,每个词语长度为2个字,分别为词语3,词语4,词语5,词语6,词语7,词语8。语句I和语句2中共有词语3和词语4共2个词;语句I长度是8个字,语句2长度是12个字,这两句语句平均长度是10个字;故语句I和语句2的相似性为0.2。
[0083]利用上述方法,可以计算文本内容中每两句语句之间的相似性。
[0084]步骤S305、根据相似性的计算结果,对文本内容中的语句分类;
[0085]根据步骤S304计算的结果给所有的语句分类,例如,若语句I与语句2之间的相似性大于语句I与其他所有语句之间的相似性并且语句I与语句2之间的相似性大于语句之间平均相似性,则语句I与语句2分为一个类;否则,语句I与语句2分为不同的类。经过将语句分类,可以认为同一类中的语句表达了同样的意思;将所有类都提取一个语句,可以完整、简洁的向用户介绍电子商务网页上的商品摘要信息,节省用户获取商品介绍的时间成本。
[0086]步骤S306、按照分类的结果,从每类语句中分别提取语句进行组合,得到候选摘要;
[0087]前面得到的文本内容可以根据语句间的相似性进行分类,文本内容中的语句分为多个类,每个类中可能含有不止一个拥有相似内容的语
当前第2页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1