一种电影故事生成方法与流程

文档序号：20918285发布日期：2020-05-29 13:48阅读：725来源：国知局

本公开涉及计算机软件领域，特别涉及一种电影故事生成方法。

背景技术：

随着科技的发展，我们希望计算机可以像人类一样写作，能够撰写出高质量的自然语言文本。因此，在新闻撰写、文书生成、天气预报信息等领域，利用半结构化、结构化文本数据生成自然语言文本，得到了越来越广泛的应用。目前，现有技术通常使用神经网络来实现字符级的短文本生成、词级的文本生成。

但是，现有技术仍然存在一些缺陷，例如，利用现有技术无法得到特定情景下的文本，因此，如何使生成的文本贴合指定主题或场景，成为一个亟待解决的技术问题。

技术实现要素：

本公开实施例的目的是提供一种电影故事生成方法，以使生成的文本贴合指定主题或场景。

为达到上述目的，本公开实施例提供一种电影故事生成方法，所述方法包括：

从历史文本的各个语句中抽取事实三元组；

确定所述历史文本的属性信息；其中，所述属性信息包括所述历史文本的主题；

根据所述事实三元组以及所述历史文本的属性信息，建立知识图谱；

根据指定属性信息与预设路径规划算法，从所述知识图谱中选取多个节点；

按照所述节点被选取的顺序，将所述节点依次输入循环神经网络模型，生成目标文本。

本公开实施例还提供一种电影故事生成装置，所述装置包括：

事实三元组抽取模块，用于从历史文本的各个语句中抽取事实三元组；

文本属性信息确定模块，用于确定所述历史文本的属性信息；其中，所述属性信息包括所述历史文本的主题；

知识图谱建立模块，用于根据所述事实三元组以及所述历史文本的属性信息，建立知识图谱；

节点选取模块，用于根据指定属性信息与预设路径规划算法，从所述知识图谱中选取多个节点；

目标文本生成模块，用于按照所述节点被选取的顺序，将所述节点依次输入循环神经网络模型，生成目标文本。

本公开实施例还提供一种计算机设备，包括处理器以及用于存储处理器可执行指令的存储器，所述处理器执行所述指令时实现上述任意实施例中所述电影故事生成方法的步骤。

本公开实施例还提供一种计算机可读存储介质，其上存储有计算机指令，所述指令被执行时实现上述任意实施例中所述电影故事生成方法的步骤。

由以上本公开实施例提供的技术方案可见，本公开通过在事实三元组的基础上，加入文本属性信息的约束，例如主题约束，生成知识图谱，进一步的，通过预设的路径规划算法链接知识图谱中的多个节点构成故事的情节主线，使得故事更加丰富，生成的文本更加贴合指定主题。

附图说明

图1是本公开实施例提供的一种电影故事生成方法流程图；

图2是本公开实施例提供的句法依赖树示意图；

图3是本公开实施例提供的lstm模型示意图；

图4是本公开实施例提供lstm模型内部结构示意图；

图5是本公开实施例提供的一种电影故事生成装置的模块结构图；

图6是本公开实施例提供的计算机设备的示意图；

图7是本公开实施例提供的计算机可读存储介质的示意图。

具体实施方式

本公开实施例提供一种电影故事生成方法。

为了使本技术领域的人员更好地理解本公开中的技术方案，下面将结合本公开实施方式中的附图，对本公开实施方式中的技术方案进行清楚、完整地描述，显然，所描述的实施方式仅仅是本公开一部分实施方式，而不是全部的实施方式。基于本公开中的实施方式，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施方式，都应当属于本公开保护的范围。

参考图1所示，为本公开实施例提供的一种电影故事生成方法的流程图，可以包括如下步骤：

s1：从历史文本的各个语句中抽取事实三元组。

在本实施方式中，先从语料库中获取多个历史文本，再对每个历史文本进行句子级的信息抽取，以得到各个句子的事实三元组，即各个句子的主谓宾，可以表示为(s,p,o)。对于主谓宾不全的语句，可以跳过，不抽取该句子的事实三元组。

参考图2所示，通常可以采用句法依赖树进行抽取。

例如，一个句子为：mydoglikeseatingsausage.通过句法依赖树抽取，得到该句子的nmod(复合名词修饰)，xcomp(x从句补语)，nsubj(名词性主语)，dobj(直接宾语)，root(根节点)，从而确定出该句子的主谓宾结构，抽取出事实三元组。

s2：确定所述历史文本的属性信息；其中，所述属性信息包括所述历史文本的主题。

在本实施方式中，可以通过tf-idf(termfrequency-inversedocumentfrequency,词频-逆文本频率指数)算法；或lda(latentdirichletallocation，潜在狄利克雷分配)模型确定所述历史文本的主题。

例如，通过tf-idf算法确定历史文本的主题包括如下步骤：

s21：计算词频

s22：计算逆文本频率指数

s23：计算tfw-idf

tfw-idf＝词频(tfw)×逆文本频率(idf)

将tf-idf值最大的词作为该历史文本的主题。

s3：根据所述事实三元组以及所述历史文本的属性信息，建立知识图谱。

在本实施方式中，通过将历史文本的属性信息添加至事实三元组中，得到扩充后的事实三元组，并基于扩充后的事实三元组，建立知识图谱。

例如，某个历史文本中的一个句子为：

lester:ibookamovieticketfortheafternoon.

则抽取出的事实三元组为(lester，book，movieticket)。

进一步的，该历史文本的场景是earthcinema，类型是comdy，则扩充后的事实三元组为(lester，book，movieticket，earthcinema，comdy)。

当然，上述举例仅仅为了更好地说明扩充后的事实三元组，还可以适用于中文的历史文本，对此本申请不做限定。

s4：根据指定属性信息与预设路径规划算法，从所述知识图谱中选取多个节点。

在本实施方式中，在知识图谱中随机选取符合指定属性信息的相关节点，选择完成后，在知识图谱中以路径规划的方式连接起选定的节点。预设路径规划算法可以包括a*(a-star)算法。

例如a*算法，通过式子f(i)＝g(i)+h(i)，每次从优先队列中选取f(i)值最小(优先级最高)的节点node作为下一个要遍历的节点。

其中，f(i)是节点node的综合优先级，当选择下一个要遍历的节点时，总会选取综合优先级最高(值最小)的节点；g(i)是节点node距离起点的代价；h(i)是节点node距离终点的预计代价。a*算法分别使用两个集合来表示待遍历的节点open_set，与已经遍历过的节点close_set。

在利用a-star算法从所述知识图谱中选取多个节点时，所述知识图谱中的节点间的距离定义为：

distance＝dismanhattan+simsemantics

其中，distance为节点间的距离；dismanhattan为曼哈顿距离；simsemantics为所述知识图谱中待遍历节点之间的语义相似度。

语义相似度通过向量化节点数据，解算节点向量间的余弦值，来表征结点间的语义相似度。定义为：simsemantics＝cos(v(nodei),v(nodej))。

s5：按照所述节点被选取的顺序，将所述节点依次输入循环神经网络模型，生成目标文本。

在本实施方式中，预先训练得到一个循环神经网络模型，该循环神经网络模型可以是lstm(longshort-termmemory，长短期记忆)模型，也可以是gru(gatedrecurrentunit，门控循环单元)模型，将所述节点依次输入循环神经网络模型，生成目标文本。

例如，循环神经网络模型可以为lstm模型，lstm模型是一种特殊的rnn(循环神经网络模型)，主要为了解决长序列训练过程中的梯度消失和梯度爆炸问题。具体的，将选择的节点作为初始lstm长短期记忆网络节点输入，将生成的词与当前lstm长短记忆网络节点的输出作为预测下一个词的输入。

如图3所示。该模型在t时刻，有两个传输状态cellstatec^t和hiddenstateh^t，y^t是lstm模型的输出。该模型的输入是由x^t和上一个状态传递下来的h^t-1拼接训练得到四个状态：

其中，zⁱ，z^f，z^o是由拼接向量乘以权重矩阵之后，再通过sigmoid激活函数转换成0到1之间的数值，来作为一种门控状态，z是将结果通过一个tanh激活函数将结果转换成-1到1之间的值。

如图4所示，lstm模型内部结构的三个阶段：忘记阶段，这个阶段选择主要针对上一个节点传进来的输入进行选择性的忘记，上述中z^f表示忘记门控，来控制上一个状态c^t-1中需要以往的部分；选择记忆阶段，上述zⁱ表示选择门控信号，来控制输入xⁱ的选择性记忆；输入阶段，上述z^o控制当前阶段的输出，并且还对上一阶段的c^o通过tanh进行放缩。

可以看出，本公开提供的技术方案通过在事实三元组的基础上，加入文本属性信息的约束，例如主题约束，生成知识图谱，进一步的，通过预设的路径规划算法链接知识图谱中的多个节点构成故事的情节主线，使得故事更加丰富，生成的文本更加贴合指定主题。

此外，利用本公开提供的技术方案，在需要生成篇幅较长的文本时，只需要增加情节主线的长度，即增加选取的知识图谱中的节点数量即可，避免了现有技术生成的长文本存在句子重复现象。

参考图5所示，本公开还提供一种电影故事生成装置，所述装置包括：

事实三元组抽取模块100，用于从历史文本的各个语句中抽取事实三元组；

文本属性信息确定模块200，用于确定所述历史文本的属性信息；其中，所述属性信息包括所述历史文本的主题；

知识图谱建立模块300，用于根据所述事实三元组以及所述历史文本的属性信息，建立知识图谱；

节点选取模块400，用于根据指定属性信息与预设路径规划算法，从所述知识图谱中选取多个节点；

目标文本生成模块500，用于按照所述节点被选取的顺序，将所述节点依次输入循环神经网络模型，生成目标文本。

参考图6所示，本公开还提供一种计算机设备，包括处理器以及用于存储处理器可执行指令的存储器，所述处理器执行所述指令时实现上述任意实施方式中所述电影故事方法的步骤。

参考图7所示，本公开实施例还提供一种计算机可读存储介质，其上存储有计算机指令，所述指令被执行时实现上述任意实施方式中所述电影故事生成方法的步骤。

在20世纪90年代，对于一个技术的改进可以很明显地区分是硬件上的改进(例如，对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而，随着技术的发展，当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此，不能说一个方法流程的改进就不能用硬件实体模块来实现。例如，可编程逻辑器件(programmablelogicdevice,pld)(例如现场可编程门阵列(fieldprogrammablegatearray，fpga))就是这样一种集成电路，其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片pld上，而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且，如今，取代手工地制作集成电路芯片，这种编程也多半改用“逻辑编译器(logiccompiler)”软件来实现，它与程序开发撰写时所用的软件编译器相类似，而要编译之前的原始代码也得用特定的编程语言来撰写，此称之为硬件描述语言(hardwaredescriptionlanguage，hdl)，而hdl也并非仅有一种，而是有许多种，如abel(advancedbooleanexpressionlanguage)、ahdl(alterahardwaredescriptionlanguage)、confluence、cupl(cornelluniversityprogramminglanguage)、hdcal、jhdl(javahardwaredescriptionlanguage)、lava、lola、myhdl、palasm、rhdl(rubyhardwaredescriptionlanguage)等，目前最普遍使用的是vhdl(very-high-speedintegratedcircuithardwaredescriptionlanguage)与verilog。本领域技术人员也应该清楚，只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中，就可以很容易得到实现该逻辑方法流程的硬件电路。

本领域技术人员也知道，除了以纯计算机可读程序代码方式实现控制器以外，完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件，而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至，可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。

上述实施例阐明的装置、模块，具体可以由计算机芯片或实体实现，或者由具有某种功能的产品来实现。

为了描述的方便，描述以上装置时以功能分为各种模块分别描述。当然，在实施本公开时可以把各模块的功能在同一个或多个软件和/或硬件中实现。

通过以上的实施方式的描述可知，本领域的技术人员可以清楚地了解到本公开可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解，本公开的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，在一个典型的配置中，计算设备包括一个或多个处理器(cpu)、输入/输出接口、网络接口和内存。该计算机软件产品可以包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本公开各个实施例或者实施例的某些部分所述的方法。该计算机软件产品可以存储在内存中，内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器(ram)和/或非易失性内存等形式，如只读存储器(rom)或闪存(flashram)。内存是计算机可读介质的示例。计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括短暂电脑可读媒体(transitorymedia)，如调制的数据信号和载波。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于装置实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

本公开可用于众多通用或专用的计算机系统环境或配置中。例如：个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的消费电子设备、网络pc、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。

本公开可以在由计算机执行的计算机可执行指令的一般上下文中描述，例如程序模块。一般地，程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本公开，在这些分布式计算环境中，由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中，程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

以上所述的具体实施例，对本发明的目的、技术方案和有益效果进行了进一步详细说明，应当理解的是，以上所述仅为本发明的具体实施例而已，并不用于限制本发明，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：刘宏伟;刘宏蕊
技术所有人：天津外国语大学;广东工业大学
我是此专利的发明人

上一篇：高速轨道交通系统的IF声屏障的制作方法
上一篇：一种焊接治具的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。