一种游戏对话台词生成方法和系统与流程

文档序号:17741023发布日期:2019-05-24 20:05阅读:810来源:国知局
一种游戏对话台词生成方法和系统与流程

本发明涉及人工智能领域,尤其涉及一种游戏对话台词生成方法和系统。



背景技术:

在传统需要文学创作的行业里,需要大量的剧情对话,有时是为了推动剧情的发展,阐述世界观,表明角色的立场,展示角色的内心等等,这些对白甚至占据了文学作品中过半的篇幅。

同样在游戏行业,游戏的主线或直线人物中,多是需要海量的npc来提供大量的任务,通过完成这些任务,来使玩家的角色成长,剧情进行推动,探索新的场景等等。这些海量npc的庞大的剧情对话,需要非常多人的策划来进行编写,同时也要耗费巨大的时间和金钱。

因此,需要一种方法能够快速生成角色大段的对话,而这些对话应当是和剧情有关的对话从而大大提升效率和节省成本。



技术实现要素:

本申请的目的是解决现有技术的不足,提供一种游戏对话台词生成方法和系统,能够高效地进行游戏角色对话生成。

为了实现上述目的,本申请采用以下的技术方案。

首先,本申请提出了一种游戏对话台词生成方法,包括以下步骤:

s100,导入游戏剧情文本,所述游戏剧情文本格式是txt格式或doc格式;

s200,建立台词数据库,并基于台词数据库通过神经网络训练台词分类库;

s300,基于所述台词分类库对剧情文本进行分类并标记;

s400,利用wordnet根据分类的语句意思引入相关的词汇,生成与角色相匹配的台词。

进一步地,在本申请的上述方法中,所述步骤s100包括将导入的游戏剧本进行机器翻译成英文以进行下一步处理,待台词生成后,将生成的台词再进行机器翻译成中文。

进一步地,在本申请的上述方法中,所述步骤s200还包括以下子步骤:

s201,导入台词数据库,基于字典学习算法生成标准台词字典;

s202,根据标准台词字典生成样本集以训练得到台词转换模型,其中,台词转换模型为神经网络模型;

进一步地,在本申请的上述方法中,所述步骤s100包括将导入的游戏剧本进行机器翻译成英文以进行下一步处理,待台词生成后,将生成的台词再进行机器翻译成中文。

进一步地,在本申请的上述方法中,所述步骤s300还包括以下子步骤:

s301,基于ubuntu操作系统搭建开发环境,导入自然语言处理工具包;

s302,基于台词分类库识别与台词相关的文本并标记;

s303,根据自然语言处理工具包对与台词相关的文本进行分句并提取语句中的词干,对所述词干添加标签。

进一步地,在本申请的上述方法中,所述步骤s400还包括以下子步骤:

s401,使用wordnet处理包,对文本内的同义词进行提取;

s402,基于深度学习对语句的词汇进行替换挖掘,使语句进一步通顺;

s403,提取游戏角色信息,生成并输出与角色匹配的台词。

进一步地,在本申请的上述方法中,所述角色信息包括角色性格、职业、队伍、敌人名称。

进一步地,在本申请的上述方法中,所述台词转换模型是基于tensorflow和kerass学习框架建立。

进一步地,在本申请的上述方法中,还包括对生成的台词文本进行语义识别,自动提示错误并纠正错误台词。

其次,本申请还公开了一种游戏对话台词生成系统,包括以下模块:导入模块,用于导入游戏剧情文本,所述游戏剧情文本格式是txt格式或doc格式;模型训练模块,用于建立台词数据库,并基于台词数据库通过神经网络训练台词分类库;分类模块,用于基于所述台词分类库对剧情文本进行分类并标记;生成模块,用于利用wordnet根据分类的语句意思引入相关的词汇,生成与角色相匹配的台词。

进一步地,在本申请的上述系统中,所述导入模块还包括翻译模块:用于将导入的游戏剧本进行机器翻译成英文以进行下一步处理,待台词生成后,将生成的台词再进行机器翻译成中文。

进一步地,在本申请的上述系统中,所述模型训练模块还包括以下子模块:字典训练模块,用于导入台词数据库,基于字典学习算法生成标准台词字典;神经网络训练模块,用于根据标准台词字典生成样本集以训练得到台词转换模型,其中,台词转换模型为神经网络模型。

进一步地,在本申请的上述系统中,所述分类模块还包括以下子模块:识别模块,用于基于台词分类库识别与台词相关的文本并标记;分句模块,根据自然语言处理工具包对与台词相关的文本进行分句并提取语句中的词干,对所述词干添加标签。

进一步地,在本申请的上述系统中,所述生成模块还包括以下子模块:提取模块,使用wordnet处理包,对文本内的同义词进行提取;整理模块,基于深度学习对语句的词汇进行替换挖掘,使语句进一步通顺;输出模块,提取游戏角色信息,生成并输出与角色匹配的台词。

最后,本申请还提出一种计算机可读存储介质,其上存储有计算机指令。上述指令被处理器执行时,包括以下步骤:

s100,导入游戏剧情文本,所述游戏剧情文本格式是txt格式或doc格式;

s200,建立台词数据库,并基于台词数据库通过神经网络训练台词分类库;

s300,基于所述台词分类库对剧情文本进行分类并标记;

s400,利用wordnet根据分类的语句意思引入相关的词汇,生成与角色相匹配的台词。

进一步地,在处理器执行上述指令时,所述步骤s100包括将导入的游戏剧本进行机器翻译成英文以进行下一步处理,待台词生成后,将生成的台词再进行机器翻译成中文。

进一步地,在处理器执行上述指令时,所述步骤s200还包括以下子步骤:

s201,导入台词数据库,基于字典学习算法生成标准台词字典;

s202,根据标准台词字典生成样本集以训练得到台词转换模型,其中,台词转换模型为神经网络模型;

进一步地,在处理器执行上述指令时,所述步骤s100包括将导入的游戏剧本进行机器翻译成英文以进行下一步处理,待台词生成后,将生成的台词再进行机器翻译成中文。

进一步地,在处理器执行上述指令时,所述步骤s300还包括以下子步骤:

s301,基于ubuntu操作系统搭建开发环境,导入自然语言处理工具包;

s302,基于台词分类库识别与台词相关的文本并标记;

s303,根据自然语言处理工具包对与台词相关的文本进行分句并提取语句中的词干,对所述词干添加标签。

进一步地,在处理器执行上述指令时,所述步骤s400还包括以下子步骤:

s401,使用wordnet处理包,对文本内的同义词进行提取;

s402,基于深度学习对语句的词汇进行替换挖掘,使语句进一步通顺;

s403,提取游戏角色信息,生成并输出与角色匹配的台词。

进一步地,在处理器执行上述指令时,所述台词转换模型是基于tensorflow和kerass学习框架建立。

进一步地,在处理器执行上述指令时,还包括对生成的台词文本进行语义识别,自动提示错误并纠正错误台词。

本申请的有益效果为:弥补了以往游戏开发需要大量人力来编写大量游戏内角色或npc对话的弊端,减少了资金和管理的压力,解决了游戏开发中,制作大量的游戏npc对白和任务描述来充实游戏和游戏相关的资料片,缩短游戏的开发周期时间。

附图说明

图1所示为本申请所公开的游戏对话台词生成方法的流程图;

图2所示为在本申请的一个方法实施例中的子方法的流程图;

图3所示为在本申请的一个方法实施例中的子方法的流程图;

图4所示为在本申请的一个方法实施例中的子方法的流程图;

图5所示为本申请所公开的基于神经网络的歌曲生成系统的结构图。

具体实施方式

以下将结合实施例和附图对本申请的构思、具体结构及产生的技术效果进行清楚、完整的描述,以充分地理解本申请的目的、方案和效果。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。

需要说明的是,如无特殊说明,当某一特征被称为“固定”、“连接”在另一个特征,它可以直接固定、连接在另一个特征上,也可以间接地固定、连接在另一个特征上。此外,本申请中所使用的上、下、左、右等描述仅仅是相对于附图中本申请各组成部分的相互位置关系来说的。在本申请和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。

此外,除非另有定义,本文所使用的所有的技术和科学术语与本技术领域的技术人员通常理解的含义相同。本文说明书中所使用的术语只是为了描述具体的实施例,而不是为了限制本申请。本文所使用的术语“和/或”包括一个或多个相关的所列项目的任意的组合。

应当理解,尽管在本申请中可能采用术语第一、第二、第三等来描述各种元件,但这些元件不应限于这些术语。这些术语仅用来将同一类型的元件彼此区分开。例如,在不脱离本申请范围的情况下,第一元件也可以被称为第二元件,类似地,第二元件也可以被称为第一元件。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”。

参照图1所示的方法流程图,在本申请的一个或多个实施例中,本申请提出一种游戏对话台词生成方法,包括以下步骤:

s100,导入游戏剧情文本,所述游戏剧情文本格式是txt格式或doc格式;

s200,建立台词数据库,并基于台词数据库通过神经网络训练台词分类库;

s300,基于所述台词分类库对剧情文本进行分类并标记;

s400,利用wordnet根据分类的语句意思引入相关的词汇,生成与角色相匹配的台词。

具体地,在游戏开发过程中的角色台词创作过程中,根据游戏剧情文本对角色的性格、背景、种族等信息进行台词编写。在进行本发明的游戏对话台词生成过程中,由于目前计算机程序在处理中文文本上首先对中文文本转码再进行下一步的操作,在一定程度上计算处理中文文本的速度相对于处理英文文本的速度更慢,因此,在本发明提出的方法步骤s100包括将导入的游戏剧本进行机器翻译成英文以进行下一步处理,待台词生成后,将生成的台词再进行机器翻译成中文。

对于上述台词分类库,参照图2所示的子方法流程图,在本申请的一个或多个实施例中,可以通过以下子步骤实现:

s201,导入台词数据库,基于字典学习算法生成标准台词字典;

s202,根据标准台词字典生成样本集以训练得到台词转换模型,其中,台词转换模型为神经网络模型。

具体地,在本申请的一个或多个实施例中,台词转换模型是基于tensorflow和kerass学习框架建立。具体地,通过神经网络tensorflow的机器学习和深度学习计算,结合kerasapi的卷积神经网络和相信函数,在来自网络或本地数据库的台词文件样本集合中进行机器训练,从而实现预测台词对应的持续时间和基频的深度学习。本领域技术人员可以根据采用现有的神经网络训练方式建立并训练相应的分类器,本申请对此不予具体限定。

进一步地,参照图3所示的子方法流程图,在本申请的上述一个或多个实施例中,对台词进行分类还包括:

s301,基于ubuntu操作系统搭建开发环境,导入自然语言处理工具包;

s302,基于台词分类库识别与台词相关的文本并标记;

s303,根据自然语言处理工具包对与台词相关的文本进行分句并提取语句中的词干,对所述词干添加标签。

具体地,对剧情文本中与台词相关文本进行标记,从而将其他不相关的内容去除,例如,将剧情文本中描述天气、交代前因后果等与人物对话不相关的内容过滤,剩下可以作为台词创作的文本。进一步地,利用自然语言处理工具对筛选出来的文本进行分段,将属于同一个故事情景或对话场景的文本归为一类,并且提取语句中词干,词干包括人物、时间、地方、事情等词汇,并对这些词汇添加标签以进行之后的整理和丰富对话台词。

进一步地,参照图4所示的子方法流程图,在本申请的上述一个或多个实施例中,生成与角色匹配的对话台词还包括以下子步骤:

s401,使用wordnet处理包,对文本内的同义词进行提取;

s402,基于深度学习对语句的词汇进行替换挖掘,使语句进一步通顺;

s403,提取游戏角色信息,生成并输出与角色匹配的台词。

具体地,wordnet处理包是用于比较词语相似度的工具,基于wordnet处理包寻找剧情文本中能够用作对话台词的文本的同义词,因为对于大多数剧情文本,对剧情进行描述的词语或句子并不一定适用于对话台词,需要进一步优化,于是在进行台词设计时往往利用剧情文本中的词汇的同义词或近义词进行替换,使对话台词变得自然通顺。进一步地,当对提取了相应的同义词或近义词之后,通过深度学习基于筛选的文本通过网络挖掘在语句中添加语气助词或副词,并且通过深度学习判断当前文本中的词汇是否适合用于对话台词,如果不适合,则在一个或多个同义词中寻找适合的词语进行替换。最后,提取角色信息,其中角色信息包括角色性格、职业、队伍、敌人名称等相关信息。

进一步地,在本申请的上述一个或多个实施例中,还包括对生成的台词文本进行语义识别,自动提示错误并纠正错误台词,或者对不符合语法的对话台词进行标记以提醒技术人员作进一步修改。

参照图5所示的模块结构图,在本申请的一个或多个实施例中,本申请还公开了一种游戏对话台词生成系统,包括以下模块:导入模块,用于导入游戏剧情文本,所述游戏剧情文本格式是txt格式或doc格式;模型训练模块,用于建立台词数据库,并基于台词数据库通过神经网络训练台词分类库;分类模块,用于基于所述台词分类库对剧情文本进行分类并标记;生成模块,用于利用wordnet根据分类的语句意思引入相关的词汇,生成与角色相匹配的台词。

进一步地,在进行本发明的游戏对话台词生成过程中,由于目前计算机程序在处理中文文本上首先对中文文本转码再进行下一步的操作,在一定程度上计算处理中文文本的速度相对于处理英文文本的速度更慢,因此,在本申请的上述系统中,导入模块还包括翻译模块:用于将导入的游戏剧本进行机器翻译成英文以进行下一步处理,待台词生成后,将生成的台词再进行机器翻译成中文。

进一步地,在本申请的上述一个或多个实施例中,模型训练模块还包括以下子模块:字典训练模块,用于导入台词数据库,基于字典学习算法生成标准台词字典;神经网络训练模块,用于根据标准台词字典生成样本集以训练得到台词转换模型,其中,台词转换模型为神经网络模型。

具体地,在本申请的一个或多个实施例中,台词转换模型是基于tensorflow和kerass学习框架建立。具体地,通过神经网络tensorflow的机器学习和深度学习计算,结合kerasapi的卷积神经网络和相信函数,在来自网络或本地数据库的台词文件样本集合中进行机器训练,从而实现预测台词对应的持续时间和基频的深度学习。本领域技术人员可以根据采用现有的神经网络训练方式建立并训练相应的分类器,本申请对此不予具体限定。

进一步地,在本申请的上述一个或多个实施例中,分类模块还包括以下子模块:识别模块,用于基于台词分类库识别与台词相关的文本并标记;分句模块,根据自然语言处理工具包对与台词相关的文本进行分句并提取语句中的词干,对所述词干添加标签。

具体地,对剧情文本中与台词相关文本进行标记,从而将其他不相关的内容去除,例如,将剧情文本中描述天气、交代前因后果等与人物对话不相关的内容过滤,剩下可以作为台词创作的文本。进一步地,利用自然语言处理工具对筛选出来的文本进行分段,将属于同一个故事情景或对话场景的文本归为一类,并且提取语句中词干,词干包括人物、时间、地方、事情等词汇,并对这些词汇添加标签以进行之后的整理和丰富对话台词。

进一步地,在本申请的上述一个或多个实施例中,分类模块还包括以下子模块:提取模块,使用wordnet处理包,对文本内的同义词进行提取;整理模块,基于深度学习对语句的词汇进行替换挖掘,使语句进一步通顺;输出模块,提取游戏角色信息,生成并输出与角色匹配的台词。

具体地,wordnet处理包是用于比较词语相似度的工具,基于wordnet处理包寻找剧情文本中能够用作对话台词的文本的同义词,因为对于大多数剧情文本,对剧情进行描述的词语或句子并不一定适用于对话台词,需要进一步优化,于是在进行台词设计时往往利用剧情文本中的词汇的同义词或近义词进行替换,使对话台词变得自然通顺。进一步地,当对提取了相应的同义词或近义词之后,通过深度学习基于筛选的文本通过网络挖掘在语句中添加语气助词或副词,并且通过深度学习判断当前文本中的词汇是否适合用于对话台词,如果不适合,则在一个或多个同义词中寻找适合的词语进行替换。最后,提取角色信息,其中角色信息包括角色性格、职业、队伍、敌人名称等相关信息。

应当认识到,本申请的实施例可以由计算机硬件、硬件和软件的组合、或者通过存储在非暂时性计算机可读存储器中的计算机指令来实现或实施。该方法可以使用标准编程技术-包括配置有计算机程序的非暂时性计算机可读存储介质在计算机程序中实现,其中如此配置的存储介质使得计算机以特定和预定义的方式操作——根据在具体实施例中描述的方法和附图。每个程序可以以高级过程或面向对象的编程语言来实现以与计算机系统通信。然而,若需要,该程序可以以汇编或机器语言实现。在任何情况下,该语言可以是编译或解释的语言。此外,为此目的该程序能够在编程的专用集成电路上运行。

进一步地,该方法可以在可操作地连接至合适的任何类型的计算平台中实现,包括但不限于个人电脑、迷你计算机、主框架、工作站、网络或分布式计算环境、单独的或集成的计算机平台、或者与带电粒子工具或其它成像装置通信等等。本申请的各方面可以以存储在非暂时性存储介质或设备上的机器可读代码来实现,无论是可移动的还是集成至计算平台,如硬盘、光学读取和/或写入存储介质、ram、rom等,使得其可由可编程计算机读取,当存储介质或设备由计算机读取时可用于配置和操作计算机以执行在此所描述的过程。此外,机器可读代码,或其部分可以通过有线或无线网络传输。当此类媒体包括结合微处理器或其他数据处理器实现上文该步骤的指令或程序时,本文所述的申请包括这些和其他不同类型的非暂时性计算机可读存储介质。当根据本申请所述的方法和技术编程时,本申请还包括计算机本身。

计算机程序能够应用于输入数据以执行本文所述的功能,从而转换输入数据以生成存储至非易失性存储器的输出数据。输出信息还可以应用于一个或多个输出设备如显示器。在本申请优选的实施例中,转换的数据表示物理和有形的对象,包括显示器上产生的物理和有形对象的特定视觉描绘。

因此,应以说明性意义而不是限制性意义来理解本说明书和附图。然而,将明显的是:在不脱离如权利要求书中阐述的本申请的更宽广精神和范围的情况下,可以对本申请做出各种修改和改变。

其他变型在本申请的精神内。因此,尽管所公开的技术可容许各种修改和替代构造,但在附图中已示出并且在上文中详细描述所示的其某些实施例。然而,应当理解,并不意图将本申请局限于所公开的一种或多种具体形式;相反,其意图涵盖如所附权利要求书中所限定落在本申请的精神和范围内的所有修改、替代构造和等效物。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1