一种句法依存树动态可视化方法及系统与流程

文档序号:17000032发布日期:2019-03-02 01:42阅读:214来源:国知局
一种句法依存树动态可视化方法及系统与流程

本发明涉及数据处理领域,具体涉及一种句法依存树动态可视化方法及系统。



背景技术:

当前存在一部分依存树的图像可视化工具,它可以将一条句子转换为句法树的形式以图片进行保存,现有技术中采用静态句法树的可视化表示,它很好地展示词语之间的层级关系和依赖关系,相比较结构化文本的表示方式更便于人们理解其句法结构。现有技术中以图片这种采用静态句法树的可视化表示形式有以下三个缺点:

1)不利于传递数据,通常在前后端分离的架构中,数据的传输通过简单的api即可,一种简单的实现是json格式,但是只能传送字符串形式的数据;2)由于作图等在后端(服务器端)完成,可能会给服务器带来较大的压力;3)当前端需要对结果进行进步一修改时,由于图片是不可变的,前端不能根据特定需求进一步修改或者实现某种动画效果。



技术实现要素:

因此,本发明提供一种句法依存树动态可视化方法及系统,克服了现有技术中以静态形式对文本进行句法树的可视化的不足。

本发明实施例提供一种句法依存树动态可视化方法,包括如下步骤:获取待进行句法依存树动态可视化的文本;将所述文本转换成html标准的svg对象;根据所述svg对象的属性信息进行动态可视化显示。

优选地,所述将所述文本转换成html标准的svg对象的步骤,具体包括:将所述文本根据句法依存树转换成句法树结构化文本格式;利用预设函数获取所述句法树结构化文本格式中的信息;根据所述句法树结构化文本格式中的信息将所述文本转换成html标准的svg对象。

优选地,所述属性信息包括:所述句法依存树中各个节点的属性信息和各个边的属性信息;所述各个节点的属性信息包括:各个节点的入边条数、各个节点的宽度信息和高度信息、各个节点的左上坐标、以及根据所述各个节点的左上坐标确定的所述各个节点的位置信息;所述各个边的属性信息包括:各个节点的边指向的词语的编号列表构成的邻接表、各个节点的边相互交叉的数量、交叉的边的不同的预设高度、各个边对应的位置坐标、以及根据所述位置坐标确定的每个边的位置、长度及宽度信息。

优选地,所述根据所述句法树结构化文本格式中的信息将所述文本转换成html标准的svg对象的步骤,具体包括:根据所述各个节点的宽度信息,获取所述svg对象的宽度信息;根据所述交叉的边的不同的预设高度,获取所述交叉的边的最大高度信息;根据所述交叉的边的最大高度信息,获取所述svg对象的高度信息;根据所述各个节点的属性信息、各个边的属性信息、所述svg对象的宽度信息和高度信息,利用预设函数生成所述html标准的svg对象。

本发明实施例还提供一种句法依存树动态可视化系统,包括:文本获取模块,用于获取待进行句法依存树动态可视化的文本;svg对象转换模块,用于将所述文本转换成html标准的svg对象;显示模块,用于根据所述svg对象的属性信息进行动态可视化显示。

本发明实施例还提供一种计算机设备,包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器执行上述的句法依存树动态可视化方法。

本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使所述计算机执行上述的句法依存树动态可视化方法。

本发明技术方案,具有如下优点:

本发明提供的句法依存树动态可视化系统,从后端获取待进行句法依存树动态可视化的文本,将文本转换成html标准的svg对象,根据svg对象的属性信息进行动态可视化显示,使得其结构更加灵活,有利于进一步实现文本分析,同时将句法依存树可视化的转换过程由现有技术中后端生成图片变换到前端js生成,减轻了服务器计算能力并降低了服务端的存储空间,充分有效的利用了客户端的资源,提高了服务器的响应速度,对网络波动有更强的抵抗力。

附图说明

为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的句法依存树动态可视化方法的一个具体示例的流程图;

图2为本发明实施例提供的将文本转换成html标准的svg对象一个具体示例的流程图;

图3为本发明实施例提供的句法树结构化文本格式的示意图;

图4为本发明实施例提供的句法树结构化文本格式一个具体示例的示意图;

图5为本发明实施例提供的根据句法树结构化文本格式中的信息将文本转换成html标准的svg对象的一个具体示例的流程图;

图6为本发明实施例提供的html标准的svg对象结构示意图;

图7为本发明实施例提供的在html页面中svg的可视化效果示意图;

图8为本发明实施例提供的法依存树动态可视化系统的一个具体示例的组成图;

图9为本发明实施例提供的计算机设备的一个具体示例的组成图。

具体实施方式

下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,还可以是两个元件内部的连通,可以是无线连接,也可以是有线连接。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。

此外,下面所描述的本发明不同实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互结合。

实施例1

本发明实施例提供一种句法依存树动态可视化方法,如图1所示,该句法依存树动态可视化方法包括如下步骤:

步骤s1:获取待进行句法依存树动态可视化的文本。

本发明实施例中,可以从后端(服务器端)中获取待进行句法依存树动态可视化的文本。

步骤s2:将文本转换成html标准的svg对象。

在一较佳实施例中,如图2所示,执行步骤s2中将文本转换成html标准的svg对象的过程,具体包括以下步骤:

步骤s21:将文本根据句法依存树转换成句法树结构化文本格式。

本发明实施例中,将文本根据句法依存树转换成如图3所示的句法树结构化文本格式,其中:

“id”代表当前的词语编号;

“fid”表示箭头指向的词语编号,即边所指向的词语编号;

“word”是当前词语的字符;

“post”表示当前词语的词性;

“dep_type”表示这条箭头所代表的依赖关系。

步骤s22:利用预设函数获取句法树结构化文本格式中的信息。

本发明实施例中,句法依存树中各个节点的属性信息和各个边的属性信息,其中:

各个节点的属性信息包括:各个节点的入边条数、各个节点的宽度信息和高度信息、各个节点的左上坐标、以及根据所述各个节点的左上坐标确定的所述各个节点的位置信息;

各个边的属性信息包括:各个节点的边指向的词语的编号列表构成的邻接表、各个节点的边相互交叉的数量、交叉的边的不同的预设高度、各个边对应的位置坐标、以及根据所述位置坐标确定的每个边的位置、长度及宽度信息。

本发明实施例中,通过以下函数获取上述句法树结构化文本格式中的信息:

get_input_edge_info(node_info.node_list):用来获取每个节点的入边的条数;

get_width_height_info(node_info):用来获取各个节点的宽度信息和高度信息;

get_cid_list(node_info.node_list):用来获取各个节点的边相互交叉的数量,并为交叉的边提供不同的高度来避免交叉重叠;

get_edge_max_deep(node_info.edge_cross_deep):用来获取各个节点有交叉边获取边的最大高度,为后续svg对象的整体高度提供数据;

get_words_translate(node_info):用来获取各个节点的左上坐标,根据各个节点的左上坐标确定的各个节点的位置信息;

get_edge_path(node_info):用来获取各个边对应的位置坐标(四个顶点从左下到右下四个坐标);

get_edge_label_info(node_info):用来根据位置坐标确定的每个边的位置、长度及宽度信息。

在一具体实施例中,如图4所示的句法树结构化文本格式node_list,实现一个从词语“a”指向词语“b”的箭头,具有关系“r”。其中词语“a”具有属性“pa”,词语“b”具有属性“pb”。调用函数varhtml_obj=gdepparser(node_list)可以将函数gdepparser返回的html对象存储到变量html_obj中,最后只需要将html_obj放到html相应的位置。

步骤s23:根据句法树结构化文本格式中的信息将文本转换成html标准的svg对象。

在一较佳实施例中,如图5所示,执行步骤s23中根据句法树结构化文本格式中的信息将文本转换成html标准的svg对象的过程,具体包括:

步骤s231:根据各个节点的宽度信息,获取svg对象的宽度信息。

本发明实施例中,根据各个节点的宽度信息、各个节点之间的间隔及预设的乘法系数来确定svg对象的宽度。

步骤s232:根据交叉的边的不同的预设高度,获取交叉的边的最大高度信息。

本发明实施例中,可以是根据用户输入的参数为交叉的边设置不同的高度来避免交叉重叠。

步骤s233:根据交叉的边的最大高度信息,获取svg对象的高度信息。

本发明实施例中,根据交叉的边的最大高度和一预设的乘法系数来确定svg对象的高度信息。

步骤s234:根据各个节点的属性信息、各个边的属性信息、svg对象的宽度信息和高度信息,利用预设函数生成html标准的svg对象。

本发明实施例中,根据各个节点的属性信息、各个边的属性信息、svg对象的宽度信息和高度信息,通过js(javascript)计算生成html代码通过函数get_html返回html标准的svg对象。如图6所示为一html标准的svg对象结构。

步骤s3:根据svg对象的属性信息进行动态可视化显示。

本发明实施例中,可以是通过html协议将svg对象显示在浏览器中,通过js代码提供的接口函数gdepparser(node_list)实现,可以通过在.html文件中通过

<scripttype=”text/javascript”src=”./js/my_dependency_tree.js></script>加载,并保留所有句法依存树的各个节点属性和各个边的属性,能够通过句法依存树本身的结构使得html页面元素间的距离、位置及长度自适应。

在一具体的实施例中,从后端获取到“我爱北京天安门。”文本后,将其根据句法依存树转换成上述的句法树结构化文本格式,然后获取“我爱北京天安门。”句法依存树中各个节点的属性信息和各个边的属性信息,根据上述的各个属性信息,设置到svg对象的宽度信息和高度信息,利用预设函数生成html标准的svg对象,然后通过html协议将svg对象自适应地显示在浏览器中。在如图7所示,文本“我爱北京天安门。”在html页面中svg的可视化效果。其中,我爱、北京、天安门为节点,name、punct、root为边的属性,边由图中的箭头表示,长、宽、高、颜色和位置属性都可以根据需求由程序和代码动态设定,可以增加其他属性,例如链接方式、指向等。

本发明提供的句法依存树动态可视化方法,从后端获取待进行句法依存树动态可视化的文本,将文本转换成html标准的svg对象,根据svg对象的属性信息进行动态可视化显示,使得其结构更加灵活,有利于进一步实现文本分析,同时将句法依存树可视化的转换过程由现有技术中后端生成图片变换到前端js生成,减轻了服务器计算能力并降低了服务端的存储空间,充分有效的利用了客户端的资源,提高了服务器的响应速度,对网络波动有更强的抵抗力。

实施例2

本发明实施例提供一种句法依存树动态可视化系统,如图8所示,该系统包括:

文本获取模块1,用于获取待进行句法依存树动态可视化的文本。此模块执行上述方法实施例中步骤s1所描述的方法,在此不再赘述。

svg对象转换模块2,用于将文本转换成html标准的svg对象。此模块执行上述方法实施例中步骤s2、步骤s21~步骤s23、步骤s231~步骤s234所描述的方法,在此不再赘述。

显示模块3,用于根据svg对象的属性信息进行动态可视化显示。此模块执行上述方法实施例中步骤s4所描述的方法,在此不再赘述。

本发明提供的句法依存树动态可视化系统,从后端获取待进行句法依存树动态可视化的文本,将文本转换成html标准的svg对象,根据svg对象的属性信息进行动态可视化显示,使得其结构更加灵活,有利于进一步实现文本分析,同时将句法依存树可视化的转换过程由现有技术中后端生成图片变换到前端js生成,减轻了服务器计算能力并降低了服务端的存储空间,充分有效的利用了客户端的资源,提高了服务器的响应速度,对网络波动有更强的抵抗力。

实施例3

本发明实施例提供一种计算机设备,如图9所示,包括:至少一个处理器401,例如cpu(centralprocessingunit,中央处理器),至少一个通信接口403,存储器404,至少一个通信总线402。其中,通信总线402用于实现这些组件之间的连接通信。其中,通信接口403可以包括显示屏(display)、键盘(keyboard),可选通信接口403还可以包括标准的有线接口、无线接口。存储器404可以是高速ram存储器(ramdomaccessmemory,易挥发性随机存取存储器),也可以是非不稳定的存储器(non-volatilememory),例如至少一个磁盘存储器。存储器404可选的还可以是至少一个位于远离前述处理器401的存储装置。其中处理器401可以执行图1描述的基于虚拟节点的多站协同干扰定位方法,存储器404中存储一组程序代码,且处理器401调用存储器404中存储的程序代码,以用于执行实施例1中的句法依存树动态可视化方法。

其中,通信总线402可以是外设部件互连标准(peripheralcomponentinterconnect,简称pci)总线或扩展工业标准结构(extendedindustrystandardarchitecture,简称eisa)总线等。通信总线402可以分为地址总线、数据总线、控制总线等。为便于表示,图9中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。

其中,存储器404可以包括易失性存储器(英文:volatilememory),例如随机存取存储器(英文:random-accessmemory,缩写:ram);存储器也可以包括非易失性存储器(英文:non-volatilememory),例如快闪存储器(英文:flashmemory),硬盘(英文:harddiskdrive,缩写:hdd)或固态硬盘(英文:solid-statedrive,缩写:ssd);存储器404还可以包括上述种类的存储器的组合。

其中,处理器401可以是中央处理器(英文:centralprocessingunit,缩写:cpu),网络处理器(英文:networkprocessor,缩写:np)或者cpu和np的组合。

其中,处理器401还可以进一步包括硬件芯片。上述硬件芯片可以是专用集成电路(英文:application-specificintegratedcircuit,缩写:asic),可编程逻辑器件(英文:programmablelogicdevice,缩写:pld)或其组合。上述pld可以是复杂可编程逻辑器件(英文:complexprogrammablelogicdevice,缩写:cpld),现场可编程逻辑门阵列(英文:field-programmablegatearray,缩写:fpga),通用阵列逻辑(英文:genericarraylogic,缩写:gal)或其任意组合。

可选地,存储器404还用于存储程序指令。处理器401可以调用程序指令,实现如本申请实施例1中提供的句法依存树动态可视化。

本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机可执行指令,该计算机可执行指令可执行上述任意方法实施例中的基于虚拟节点的多站协同干扰定位方法。其中,所述存储介质可为磁碟、光盘、只读存储记忆体(read-onlymemory,rom)、随机存储记忆体(randomaccessmemory,ram)、快闪存储器(flashmemory)、硬盘(harddiskdrive,缩写:hdd)或固态硬盘(solid-statedrive,ssd)等;所述存储介质还可以包括上述种类的存储器的组合。

显然,上述实施例仅仅是为清楚地说明所作的举例,而并非对实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引申出的显而易见的变化或变动仍处于本发明创造的保护范围之中。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1