一种文景转换中交互式场景的生成方法与流程

文档序号:17332599发布日期:2019-04-05 22:11阅读:148来源:国知局
本发明属于文本可视化领域,尤其涉及一种文景转换中交互式场景生成的方法。
背景技术
::文景转换即是指从自然语言的文本描述自动生成可视化场景的过程,宏观上可以分解为文本描述的自然语言处理、文本到场景映射关系的建立和可视化场景生成三个部分。自然语言处理部分,利用自然语言处理的技术让计算机具备识别文本的能力;文本到场景的映射部分,需结合空间知识和场景布局的知识构建场景模型;场景可视化部分,通过搭建3d模型库的思想,借助可视化工具平台可视化文本场景。然而,由于常识事实、空间知识和约束关系等信息很难用自然语言描述,致使计算机对自然语言处理的能力达不到人对文本的理解能力,导致当前的文景转换系统生成的场景粗糙、过度一致化、缺乏用户反馈等问题。根据国内外对文景转换的相关研究,当前研究主流的方向有如下两种:一、借助自然语言处理的技术,放宽场景描述文本的限制,用更自然的语言输入,处理更丰富的文本,以提取出更多的实体、空间知识和约束关系等可视化信息,进而生成更符合人类审美的场景;二、自动学习的文景转换系统开发,让系统具备学习能力,自动的学习场景布局、空间知识、常识知识以及对象的约束关系等。本文旨在解决上述场景粗糙、过度单一等问题,提出一种交互式场景生成的方法。在已有文景转换的基础上增加文本交互接口,用于用户和系统交互。交互,不仅可以让用户参与场景生成展示个人的创作性,而且文景转换系统可以学习构建场景的空间知识、常识事实、约束关系,使生成的场景更趋近人类的审美。技术实现要素:本发明旨在解决以上现有技术的问题。提出了一种使生成的场景更趋近人类的审美的文景转换中交互式场景的生成方法。本发明的技术方案如下:一种文景转换中交互式场景的生成方法,其包括以下步骤:1)、建立用于表示初始场景信息的初始状态集;2)、基于语法和语用规则分析并归纳常用交互动作的语言描述,针对场景状态构建高级操作语义集;3)、对交互式文本做自然语言处理生成操作序列;4)、利用步骤2)中的高级语义操作集解析步骤3)的操作序列得到操作解析序列;5)、消除交互文本中涉及的指示代词以及集合名词的模糊语义,结合初始场景和空间知识推导交互操作中缺损或隐含的实体和空间关系,修正步骤4)的操作解析序列,确定交互操作集;6)、利用步骤5)的交互操作集对初始场景进行重构,构建交互后的场景模型;7)、借助可视化工具和3d模型库将交互后的场景模型可视化,生成交互后的三维场景。进一步的,所属步骤1)建立初始场景状态集,具体包括:场景信息由一个四元组表示:z=(s,sel,viewp,c)z表示当前场景的状态,用于记录当前场景信息;s表示候选场景,用于记录当前场景类型、背景信息;sel表示初始场景中可选的对象,sel={obj1,…,objn},obji={a,num}表示场景中一个可操作的实体对象,其中a(attribute):表示操作对象自身的实体属性,a={color,texture,size,shape,orientation}表示颜色、纹理、大小尺寸、形状,num表示场景中对应实体的个数;viewp表示当前场景的视点,用于确定当前场景初始视点的方向;c用于表示场景中实体空间布局的约束信息c={r,cp},r:表示实体对象在场景中的空间关系,r={up,down,left,right,front,back,in,out,intersect}表示上、下、左、右、前、后、里、外、相交、相离在内表示空间关系的信息,cp:表示实体在三维场景中的坐标位置。进一步的,所述步骤2)中,建立高级语义操作集,具体包括:根据常用交互动作和功能,以动词为核心进行划分,将交互语义归为两大类:对场景中已有实体对象做操作,包括选择目标对象、移动对象、缩放对象、删除对象、修改对象属性及添加对象;对场景要素的操作,包括场景背景的操作、场景光线的调控、场景视点的控制、场景的重力、风力、磁力在内的物理场的控制。进一步的,所述步骤3)对交互式文本做自然语言处理生成操作序列,具体包括:当用户给定交互文本u,利用中文分词工具对文本做分词、词性标注,将交互文本转化为一组对场景操作的序列os,os={o1,…,on},其中oi表示对场景做的一个操作。进一步的,所述步骤4)中,利用步骤2)的高级语义对步骤3)生成的操作序列解析,具体包括:构建交互操作的结构表达式:oi=v(obji,objj,c,a)oi:表示操作序列中一个具体的操作文本的四元组表示,obji:表示操作对象或目标实体;objj:表示参照对象或在场景中依存的实体;v:表示操作动词的类型v={select,view,insert,move,replace,remove,add,zoom}表示选择、查看、插入、移动、替换、删除、添加、缩放操作;c(constraint)用于表示场景中实体空间布局的约束信息c={r,cp},c.r(relationship):表示实体对象在场景中的空间关系,r={up,down,left,right,front,back,in,out,intersect}表示上、下、左、右、前、后、里、外、相交、相离等表示空间关系的信息,cp(coordinateposition):表示实体在三维场景中的坐标位置;a(attribute):表示操作对象自身的实体属性,a={color,texture,size,shape,orientation}表示颜色、纹理、大小尺寸、形状。进一步的,所述步骤5)中,结合初始场景对交互操作中的指示代词做推导,还原交互操做中隐含或缺损的具体指代对象;结合初始场景和空间知识库,对交互操作中描述对象的方位介词或对象间依存关系进行推导,确定对象在场景中隐含或缺损的空间关系r。利用上述两方面的推导修正步骤4)的操作解析,确定操作集。进一步的,所述步骤6)中,利用步骤5)的交互操作集对步骤1)的初始状态集z=(s,sel,viewp,c)进行修改,建立新的场景状态z′=(s′,sel′,viewp′,c′)。进一步的,步骤7)中,借助可视化工具和3d模型库将步骤6)交互后的场景模型可视化,生成交互后的三维场景。本发明的优点及有益效果如下:本发明与现有的技术相比,本发明的创新点是构建可交互的场景状态模型,用户使用文本与计算机交互,迭代修改创作场景。本发明的有益效果是提供文本交互的场景生成接口,降低三维场景创作对专业和技术的要求,让更多的人群可以使用和创建三维场景。交互,不仅可以让用户参与场景生成展示个人的创作性,而且文景转换系统可以学习构建场景的空间知识、常识事实、约束关系,使生成的场景更趋近人类的审美。附图说明图1是本发明提供优选实施例一种文景转换中交互式场景生成的方法的流程图。图2为本申请中文景转换中交互式场景生成的系统实现图。具体实施方式下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、详细地描述。所描述的实施例仅仅是本发明的一部分实施例。本发明解决上述技术问题的技术方案是:本发明解决上述问题的技术方案是:本发明提供一种文景转换中交互式场景生成的方法,包括:步骤一、建立用于表示初始场景信息的初始状态集;步骤二、分析并归纳常用交互动作的语言描述,建立高级语义操作集;步骤三、对交互式文本做自然语言处理生成操作序列;步骤四、利用步骤2)中的高级语义操作集解析步骤3)的操作序列;步骤五、消除交互文本中涉及的指示代词以及集合名词的模糊语义,利用步骤1)的初始场景结合空间知识推导交互操作中缺损或隐含的实体或空间关系,修正4)的操作解析,确定交互操作集;步骤六、利用步骤5)的操作集对初始场景进行重构,构建交互后的场景模型;步骤七、借助可视化工具和3d模型库将步骤6)交互后的场景模型可视化,生成交互后的三维场景。所述的文景转换中交互式场景生成的方法,其中步骤一,包括:根据具体交互场景的情况,构建初始场景四元组:z=(s,sel,viewp,c)z表示当前场景的状态,用于记录当前场景信息;s表示候选场景,用于记录当前场景类型、背景等信息;sel表示初始场景中可选的对象,sel={obj1,…,objn},obji={a,num}表示场景中一个可操作的实体对象,其中a(attribute):表示操作对象自身的实体属性,a={color,texture,size,shape,orientation}表示颜色、纹理、大小尺寸、形状等,num(number)表示场景中对应实体的个数;viewp(viewpoint)表示当前场景的视点,用于确定当前场景初始视点的方向;c(constraint)用于表示场景中的实体空间布局的约束信息c={r,cp},r(relationship):表示实体对象在场景中的空间关系,r={up,down,left,right,front,back,in,out,intersect}表示上、下、左、右、前、后、里、外、相交、相离等表示空间关系的信息,cp(coordinateposition):表示实体在三维场景中的坐标位置。例如,可视化文本“每周四我们将在会议室举行会议”生成的初始场景状态集z=(s,sel,viewp,c)为:s=会议室,候选场景为:会议室;sel={1张会议桌,6把椅子,4个人,1台笔记本电脑,两份文稿},候选对象集合;对象集obji:实体属性obji.a=null,实体数量obji.num={1,6,4,1,2};viewp=forward,场景视点:正面向前;c.r={up(laptop,meetingtable),up(paper,meetingtable),left(laptop,paper),front(chair1,meetingtable),front(chair2,meetingtable),back(chair3,meetingtable),back(chair4,meetingtable),left(chair5,meetingtable),left(chair6,meetingtable),up(personi,chairi)},场景约束中对象间的空间关系集;所述的文景转换中交互式场景生成的方法,其中步骤二,包括:收集用户常用交互动作和功能的文本表示语料,以动词为核心进行语料标注,可将交互语义归为两大类:对场景中已有实体对象做操作,包括选择目标对象,移动对象,缩放对象,删除对象,添加对象,修改对象属性(颜色、大小、纹理、朝向以及对象间约束关系等)等;对场景要素的操作,包括场景背景的操作(添加、修改、删除场景背景)、场景光线的调控、场景视点的控制、场景的重力、风力、磁力等物理场的控制等。由于汉语动词词义和语用的多样性,动词的划分可以从不同的角度考虑。目前主流的划分方法是:根据语义,是否带宾语以及语用等方法对动词做语法上的区分。但是由于汉语多意以及汉语语用多变的原因,词义的并没有严格意义的划分。操作语义集主要研究交互语用动词的语义表述及其常见的语法结构,以用于步骤四中的操作序列解析。例如,交互操作中的“添加”操作的操作语义如下:交互文本多短文本或动词短语,则可将“添加”的动词的语用分为:短语(verbphrase)vp,动词+名词短语(nounphrase)np,名词+动词短语n+vp,名词短语+动词短语np+vp。通过上述语用的归纳可将“添加”的语用描述为:op=v(am,ar)其中op(operate):表示一个交互操作动作;v:交互动作;am(actionmaker):动作的发出者;ar(actionreceiver):动作的接受、响应者。所述的文景转换中交互式场景生成的方法,其中步骤三,包括:对交互的文本做自然语言处理,对文本进行分词、词性标注等操作将其转化为带标注的操作序列os(operatesequence):os={o1,…,on},其中opi表示对场景做的一个操作。例如,一个交互文本为:“添加一个水杯到会议桌上,把会议桌上的paper删除一份”,通过nlp生成的操作序列为:os={o1,o2}o1=添加/v一个/m水杯/n到/v会议桌/n上/nd;o2=把/p会议桌/n上/nd的/upaper/n删除/v一/m份/q;所述的文景转换中交互式场景生成的方法,其步骤四,包括:利用步骤2)的高级语义对步骤3)生成的操作序列解析,构建交互操作的结构表达式:oi=v(obji,objj,r,a)oi:表示操作序列中一个具体的操作文本的四元组表示,obji:表示操作对象或目标实体;objj:表示参照对象或在场景中依存的实体;v:表示操作动词的类型v={select,view,insert,move,replace,remove,add,zoom}及选择、查看、插入、移动、替换、删除、添加、缩放等操作;r(relationship):表示实体对象在场景中的空间关系,r={up,down,left,right,front,back,in,out,intersect}及上、下、左、右、前、后、里、外、相交、相离等表示空间关系的信息;a(attribute):表示操作对象自身的实体属性,a={color,texture,size,shape,orientation}及颜色、纹理、大小尺寸、形状等。例如,对交互文本“添加一个水杯到会议桌上,把会议桌上的paper删除一份”的解析过程如下:利用步骤3)通过nlp将交互文本生转换为操作序列:os={o1,o2}。o1=添加/v一个/m水杯/n到/v会议桌/n上/nd;o2=把/p会议桌/n上/nd的/upaper/n删除/v一/m份/q;然后利用步骤2)构建的操作语义,借助哈工大研发的ltp句法分析工具对步骤3)产生的操作做语义依存分析。交互操作o1、o2的语义依存分析分别如图3、图4所示;语义依存分析标签的含义为:root表示句法分析的根节点,cont(content)表示客事关系,esucc(eventsuccessor)表示顺承关系,loc(location)表示空间角色,mdir(directionmarker)表示趋向标记,maux(auxiliary)的字标记,mprep(preposition)介词标记,mrang(range)范围标记,prod(product)表示成事关系,pat(patient)受事关系,qp(quantity-phrase)数量数组,quan(quantity)数量角色。经过步骤2)、步骤3)的处理,将操作序列解析为一个四元组表示的交互动作:oi=v(obji,objj,r,a)。通过对o1序列的解析,解析出o1操作的目标实体obji=水杯,水杯放置位置的接受实体或参考实体objj=会议桌,水杯与会议桌间的空间关系r=上(水杯,会议桌)及r=up(obji,objj),操作序列中未提到实体的属性,则属性集为空a=null。则o1操作的四元组结构表达式为:o1=add(水杯,会议桌,上,obji.num=1)obji.num表示目标实体:水杯的数量。同理o2操作的四元组结构表达式为:o2=delete(paper,会议桌,上,obji.num=1)obji.num表示目标paper的数量。所述的文景转换中交互式场景生成的方法,其步骤五,包括:消除交互文本中涉及的指示代词以及集合名词的模糊语义,结合初始场景对交互操作中的指示代词做推导,还原交互操做中隐含或缺损的具体指代对象;结合初始场景和空间知识库,对交互操作中对象涉及的空间约束进行推导,确定对象在场景中隐含或缺损的空间关系r。利用上述两方面的推导修正步骤4)的操作解析,确定操作集。例如,假设上述操作序列o1的文本描述为“添加一个水杯”经过上述步骤2-4)解析出操作o3的四元组结构表达为:o3=add(水杯,null,null,obji.num=1)由于缺乏参考对象objj,首先,会影响动词操作语义:op=v(am,ar)的确定。其次,无法确定水杯在场景中的空间位置。最终,将导致步骤4)无法完成对交互操作o3的解析。对此,需要结合初始场景补全交互操作中缺少的实体。参考初始场景所包含的实体,即步骤1)生成的初始场景状态:z=(s,sel,viewp,c)中sel元素集合。sel={会议桌,椅子,人,笔记本电脑,文稿},通过计算水杯与sel集合中对象同时出现的概率,选取相关性最强的对象作为补充实体。补全上述缺损对象objj=会议桌。同理根据先验概率以及空间常识,可推导出水杯与会议桌的空间关系r=上(水杯,会议桌)。然后修改操作o3的四元组结构表达为:o3=add(水杯,会议桌,up(水杯,会议桌),obji.num=1)所述的文景转换中交互式场景生成的方法,其步骤六,包括:利用步骤5)的操作集对步骤2)的初始场景状态z=(s,sel,viewp,c)进行修改,建立新的场景状态z′=(s′,sel′,viewp′,c′)。例如,对上述步骤1-5)例子的操作如下:初始场景状态z=(s,sel,viewp,c):s=会议室,候选场景为:会议室;sel={1张会议桌,6把椅子,4个人,1台笔记本电脑,两份文稿},候选对象集合;对象集obji:实体属性obji.a=null,实体数量obji.num={1,6,4,1,2};viewp=forward,场景视点:正面向前;c.r={up(laptop,meetingtable),up(paper,meetingtable),left(laptop,paper),front(chair1,meetingtable),front(chair2,meetingtable),back(chair3,meetingtable),back(chair4,meetingtable),left(chair5,meetingtable),left(chair6,meetingtable),up(personi,chairi)},场景约束中对象间的空间关系集;经过交互操作“添加一个水杯到会议桌上,把会议桌上的paper删除一份”后的场景状态z′=(s′,sel′,viewp′,c′):s′=会议室,候选场景为:会议室;sel′={1张会议桌,6把椅子,4个人,1台笔记本电脑,1份文稿,1个水杯};对象集obji′:实体属性obji′.a=null,实体数量obji′.num={1,6,4,1,1,1};viewp′=forward,场景视点:正面向前;c′={up(laptop,meetingtable),up(paper,meetingtable),left(laptop,paper),front(chair1,meetingtable),front(chair2,meetingtable),back(chair3,meetingtable),back(chair4,meetingtable),left(chair5,meetingtable),left(chair6,meetingtable),up(personi,chairi),up(cup,meetingtable)};所述的文景转换中交互式场景生成的方法,其步骤七,包括:借助可视化工具和3d模型库将交互后的场景z′生成交互后的三维场景。以上这些实施例应理解为仅用于说明本发明而不用于限制本发明的保护范围。在阅读了本发明的记载的内容之后,技术人员可以对本发明作各种改动或修改,这些等效变化和修饰同样落入本发明权利要求所限定的范围。当前第1页12当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1