一种创建超链接的方法和装置与流程

文档序号:15517797发布日期:2018-09-25 18:45阅读:152来源:国知局
本发明涉及文档处理
技术领域
:,尤其涉及一种创建超链接的方法和装置。
背景技术
::现阶段,在各个领域的工作中经常使用电子文档,为了更深层次地理解电子文档中的某些内容,在电子文档中的某些关键词处可以创建超链接,用于与电子文档内部或者其他电子文档中的关键词相关内容连接,基于超链接可以跳转至关键词的相关内容进行阅读等。现有技术中,用户自己在电子文档中找到需要创建超链接的关键词,然后基于该关键词和该关键词的相关内容制作超链接,例如,人为选定关键词后,点击“插入”选项后,再点击“超链接”选项,按照要求进行超链接的制作。发明人经过研究发现,现有技术中必须人为定位到需要创建超链接的关键词、人为制作超链接等,整个创建超链接的方式极大依赖人工,操作流程比较复杂,耗费大量人力精力,工作效率和自动化程度低,花费较多时间,而且容易出现人为错误。技术实现要素:本发明所要解决的技术问题是,提供一种创建超链接的方法和装置,节省人力精力,减少操作耗时时间,提高工作效率和自动化程度,提高创建超链接的准确率。第一方面,本发明实施例提供了一种创建超链接的方法,该方法包括:获取目标文档,所述目标文档具有待创建超链接的关键词信息;通过自然语言处理技术解析所述目标文档,根据标准关键词语料库确定所述目标文档中的关键词;将所述关键词和所述关键词的前后限定词作为目标关键词,确定对应所述目标关键词的目标内容的目标路径;通过关联所述目标路径至所述目标关键词,创建生成超链接。优选的,所述通过自然语言处理技术解析所述目标文档,根据标准关键词语料库确定所述目标文档中的关键词,包括:通过自然语言处理技术解析所述目标文档,获得目标文档内容信息;根据所述目标文档内容信息和所述标准关键词语料库,匹配确定所述目标文档中的关键词。优选的,所述将所述关键词和所述关键词的前后限定词作为目标关键词,确定对应所述目标关键词的目标内容的目标路径,包括:确定对应所述关键词的相关内容集合;将所述关键词和所述关键词的前后限定词设定为目标关键词;从所述相关内容集合中确定对应所述目标关键词的目标内容;确定目标内容的目标路径。优选的,所述目标内容为文档内部内容和/或其他文档内容。优选的,所述目标文档为药品电子通用技术文档。优选的,在所述确定对应所述目标关键词的目标内容的目标路径后,还包括:校验所述目标关键词与所述目标路径是否对应,若对应,执行所述通过关联所述目标路径至所述目标关键词,创建生成超链接的步骤。优选的,所述校验所述目标关键词与所述目标路径是否对应,包括:根据所述目标路径,获得所述目标内容;判断所述目标内容和所述目标关键词是否相关。优选的,所述目标路径包括所述目标内容的关键信息,所述校验所述目标关键词与所述目标路径是否对应,具体为:判断所述目标关键词与所述目标内容的关键信息是否相关。优选的,还包括:获取历史文档中具有超链接的历史关键词;所述历史文档为历史药品电子通用技术文档;根据历史关键词,扩展所述标准关键词语料库。第二方面,本发明实施例提供了一种创建超链接的装置,其特征在于,包括:第一获取单元,用于获取目标文档,所述目标文档具有待创建超链接的关键词信息;第一确定单元,用于通过自然语言处理技术解析所述目标文档,根据标准关键词语料库确定所述目标文档中的关键词;第二确定单元,用于将所述关键词和所述关键词的前后限定词作为目标关键词,确定对应所述目标关键词的目标内容的目标路径;创建生成单元,用于通过关联所述目标路径至所述目标关键词,创建生成超链接。与现有技术相比,本发明至少具有以下优点:采用本发明实施例的技术方案,首先,获取具有待创建超链接的关键词信息的目标文档;其次,通过自然语言处理技术解析所述目标文档,基于标准关键词语料库确定所述目标文档中的关键词;然后,将所述关键词和所述关键词的前后限定词作为目标关键词,确定对应所述目标关键词的目标内容的目标路径;最后,通过关联所述目标路径至所述目标关键词,创建生成超链接。由此可见,自动确定定位目标文档需要创建超链接的关键词,并确定对应的目标路径;基于目标路径和目标关键词自动创建超链接。该方案节省人力精力,减少操作耗时时间,提高工作效率和自动化程度,提高创建超链接的准确率。附图说明为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。图1为本发明实施例中一种应用场景所涉及的系统框架示意图;图2为本发明实施例提供的一种创建超链接的方法的流程示意图;图3为本发明实施例提供的一种创建超链接的装置的结构示意图。具体实施方式为了使本
技术领域
:的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。发明人经过研究发现,药品申报企业向监管机构递交监管需求文档必须采用统一的药品电子通用技术文档(英文:electroniccommontechnicaldocument,缩写:ectd)格式,该ectd格式需要具有大量文档内部超链接以及跨文档超链接,以方便监管机构审阅审评。现有的超链接的创建方式为:用户自己在电子文档中找到需要创建超链接的关键词,然后基于该关键词和该关键词的相关内容制作超链接,例如,人为选定关键词后,点击“插入”选项后,再点击“超链接”选项,按照要求进行超链接的制作。但是,现有技术中采用人为定位到需要创建超链接的关键词、人为制作超链接等方式极大依赖人工,操作流程比较复杂,工作效率和自动化程度低,花费较多时间,而且容易出现人为错误。为了解决这一问题,在本发明实施例中,首先,获取具有待创建超链接的关键词信息的目标文档;其次,通过自然语言处理技术解析所述目标文档,基于标准关键词语料库确定所述目标文档中的关键词;然后,将所述关键词和所述关键词的前后限定词作为目标关键词,确定对应所述目标关键词的目标内容的目标路径;最后,通过关联所述目标路径至所述目标关键词,创建生成超链接。由此可见,自动确定定位目标文档需要创建超链接的关键词,并确定对应的目标路径;基于目标路径和目标关键词自动创建超链接。该方案节省人力精力,减少操作耗时时间,提高工作效率和自动化程度,提高创建超链接的准确率。举例来说,本发明实施例的场景之一,可以是应用到如图1所示的场景中,该场景中包括终端101和处理器102。用户通过终端101传递整套药品电子通用技术文档,并选定其中一个药品电子通用技术文档为目标文档进行自动创建超链接的操作。处理器102响应于上述操作,获取目标文档,所述目标文档具有待创建超链接的关键词信息;处理器102通过自然语言处理技术解析所述目标文档,根据标准关键词语料库确定所述目标文档中的关键词;处理器102将所述关键词和所述关键词的前后限定词作为目标关键词,确定对应所述目标关键词的目标内容的目标路径;处理器102通过关联所述目标路径至所述目标关键词,创建生成超链接。处理器102将生成的超链接保存在数据库中。可以理解的是,在上述应用场景中,虽然将本发明实施方式的动作描述由处理器102执行,但是,本发明在执行主体方面不受限制,只要执行了本发明实施方式所公开的动作即可。可以理解的是,上述场景仅是本发明实施例提供的一个场景示例,本发明实施例并不限于此场景。下面结合附图,通过实施例来详细说明本发明实施例中创建超链接的方法和装置的具体实现方式。示例性方法参见图2,示出了本发明实施例中一种创建超链接的方法的流程示意图。在本实施例中,所述方法例如可以包括以下步骤:步骤201:获取目标文档,所述目标文档具有待创建超链接的关键词信息。需要说明的是,药品申报企业向监管机构递交监管需求文档通常是整套采用ectd格式的文档,为了方便监管机构更深层次的理解文档中的某些内容,以及对文档中的某些内容进行文档内部或者跨文档交叉审阅审评等,该ectd格式一般需要具有大量文档内部超链接和跨文档超链接,即药品电子通用技术文档具有大量需要创建超链接的关键词信息。因此,在本实施例的一些实施方式中,所述目标文档为药品电子通用技术文档。步骤202:通过自然语言处理技术解析所述目标文档,根据标准关键词语料库确定所述目标文档中的关键词。需要说明的是,对于药品电子通用技术文档而言,按照要求、规定或者规则,文档中某些词语是必须创建超链接的,这些词语可以成为标准关键词,因此,可以预先设定一个包括标准关键词的语料库,由于目标文档包括大量内容信息,通过自然语言处理技术解析出大量内容信息,那么,从大量内容信息中确定目标文档中的关键词的方式是:将解析得到的目标文档内容信息与预先设定的包括标准关键词的语料库进行匹配。因此,在本实施例的一些实施方式中,所述步骤202例如可以包括如下步骤:步骤2021:通过自然语言处理技术解析所述目标文档,获得目标文档内容信息;步骤2022:根据所述目标文档内容信息和所述标准关键词语料库,匹配确定所述目标文档中的关键词。需要说明的是,上述标准关键词语料库中的关键词是基于药品电子通用技术文档要求、规定或者规则需要创建超链接的词语得到的,数量并不是很多。为了丰富扩展标准关键词语料库,还可以将获取历史文档中具有超链接的历史关键词,基于历史关键词扩展标准关键词语料库中的关键词。既可以是基于历史关键词直接扩展标准关键词语料库,也可以是基于历史关键词选择部分统计概率较高的历史关键词扩展标准关键词语料库。因此,在本实施例的一些实施方式中,在预先设定一个标准关键词语料库之后,例如还可以包括:步骤a:获取历史文档中具有超链接的历史关键词;所述历史文档为历史药品电子通用技术文档;步骤b:根据历史关键词,扩展所述标准关键词语料库。步骤203:将所述关键词和所述关键词的前后限定词作为目标关键词,确定对应所述目标关键词的目标内容的目标路径。需要说明的是,所述步骤202中的标准关键词语料库中的标准关键词一般不具有限定词,即,其对应的相关内容较多,例如,标准关键词为“table”,其对应的相关内容包括“table1”、“table2”……“tablen”等等。也就是说,所述步骤202中根据标准关键词语料库匹配确定的目标文档中的关键词对应的相关内容较多。为了确定目标文档中实际需要创建超链接的关键词以及其对应的目标内容,应该从目标文档中关键词对应的较多相关内容中筛选出对应由目标文档中关键词和其前后限定词组合的目标关键词的目标内容。因此,在本实施例的一些实施方式中,所述步骤203例如可以包括如下步骤:步骤2031:确定对应所述关键词的相关内容集合;步骤2032:将所述关键词和所述关键词的前后限定词设定为目标关键词;步骤2033:从所述相关内容集合中确定对应所述目标关键词的目标内容;步骤2034:确定目标内容的目标路径。例如,对应目标文档关键词“table”的相关内容集合为{“table1”、“table2”、“table3”、“table4”、“table5”},目标文档中关键词“table”的前后限定词为“3”,因此目标关键词为“table3”,对应的目标内容为相关内容集合中的“table3”,对应的目标路径为“table3”的存储路径。其中,可以理解的是,目标关键词对应的目标内容可能是在同一文档的不同位置,也可能是在其他文档中。因此,在本实施例的一些实施方式中,所述目标内容为文档内部内容和/或其他文档内容。还需要说明的是,由于机器错误等各种原因,步骤203中确定的对应目标关键词的目标内容的目标路径并不一定是正确的,为了确保提高创建超链接的正确率,在判断得到目标关键词与目标路径确实对应后,再执行步骤204。因此,在本实施例的一些实施方式中,在所述步骤203之后例如还可以包括:校验所述目标关键词与所述目标路径是否对应,若对应,执行所述步骤204。需要说明的是,在本实施例的一些实施方式中,校验所述目标关键词与所述目标路径是否对应一般有两种形式:第一种是基于目标路径打开包含目标内容的页面,基于该目标内容与目标关键词相关性确定目标关键词与目标路径是否对应;第二种是基于目标路径中包含的目标内容的关键信息与目标关键词的相关性确定目标关键词与目标路径是否对应。具体实施方式如下所示:第一种,所述校验所述目标关键词与所述目标路径是否对应,例如可以包括:步骤m:根据所述目标路径,获得所述目标内容;步骤n:判断所述目标内容和所述目标关键词是否相关。第二种,所述目标路径包括所述目标内容的关键信息,所述校验所述目标关键词与所述目标路径是否对应,例如具体可以为:判断所述目标关键词与所述目标内容的关键信息是否相关。步骤204:通过关联所述目标路径至所述目标关键词,创建生成超链接。需要说明的是,所述步骤204中是直接将目标路径关联至目标关键词,从而完成创建超链接,然而,在本实施例的一些实施方式中,也可以将目标关键词和对应的目标路径进行存储,直至生成包括多个目标关键词-目标路径的超链接报告,然后将其中的多个目标关键词和其对应的目标路径批量导入目标文档中进行超链接的制动制作,该方式相当于一键创建多个超链接,更能够减少操作耗时时间,提高工作效率和自动化程度。通过本实施例提供的各种实施方式,首先,获取具有待创建超链接的关键词信息的目标文档;其次,通过自然语言处理技术解析所述目标文档,基于标准关键词语料库确定所述目标文档中的关键词;然后,将所述关键词和所述关键词的前后限定词作为目标关键词,确定对应所述目标关键词的目标内容的目标路径;最后,通过关联所述目标路径至所述目标关键词,创建生成超链接。由此可见,自动确定定位目标文档需要创建超链接的关键词,并确定对应的目标路径;基于目标路径和目标关键词自动创建超链接。该方案节省人力精力,减少操作耗时时间,提高工作效率和自动化程度,提高创建超链接的准确率。示例性设备参见图3,示出了本发明实施例中一种创建超链接的装置的结构示意图。在本实施例中,所述装置例如具体可以包括:第一获取单元301,用于获取目标文档,所述目标文档具有待创建超链接的关键词信息;第一确定单元302,用于通过自然语言处理技术解析所述目标文档,根据标准关键词语料库确定所述目标文档中的关键词;第二确定单元303,用于将所述关键词和所述关键词的前后限定词作为目标关键词,确定对应所述目标关键词的目标内容的目标路径;创建生成单元304,用于通过关联所述目标路径至所述目标关键词,创建生成超链接。可选的,所述第一确定单元302包括:第一获得子单元,用于通过自然语言处理技术解析所述目标文档,获得目标文档内容信息;第一确定子单元,用于根据所述目标文档内容信息和所述标准关键词语料库,匹配确定所述目标文档中的关键词。可选的,所述第二确定单元303包括:第二确定子单元,用于确定对应所述关键词的相关内容集合;设定单元,用于将所述关键词和所述关键词的前后限定词设定为目标关键词;第三确定子单元,用于从所述相关内容集合中确定对应所述目标关键词的目标内容;第四确定子单元,用于确定目标内容的目标路径。可选的,所述目标内容为文档内部内容和/或其他文档内容。可选的,所述目标文档为药品电子通用技术文档。可选的,所述装置还包括:校验单元,用于校验所述目标关键词与所述目标路径是否对应,若对应,执行所述通过关联所述目标路径至所述目标关键词,创建生成超链接的步骤。可选的,所述校验单元包括:第二获得子单元,用于根据所述目标路径,获得所述目标内容;判断单元,用于判断所述目标内容和所述目标关键词是否相关。可选的,所述目标路径包括所述目标内容的关键信息,所述校验单元具体用于:判断所述目标关键词与所述目标内容的关键信息是否相关。可选的,所述装置还包括:获取单元,用于获取历史文档中具有超链接的历史关键词;所述历史文档为历史药品电子通用技术文档;扩展单元,用于根据历史关键词,扩展所述标准关键词语料库。通过本实施例提供的各种实施方式,第一获取单元用于获取目标文档,所述目标文档具有待创建超链接的关键词信息;第一确定单元用于通过自然语言处理技术解析所述目标文档,根据标准关键词语料库确定所述目标文档中的关键词;第二确定单元用于将所述关键词和所述关键词的前后限定词作为目标关键词,确定对应所述目标关键词的目标内容的目标路径;创建生成单元用于通过关联所述目标路径至所述目标关键词,创建生成超链接。由此可见,自动确定定位目标文档需要创建超链接的关键词,并确定对应的目标路径;基于目标路径和目标关键词自动创建超链接。该方案节省人力精力,减少操作耗时时间,提高工作效率和自动化程度,提高创建超链接的准确率。本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。以上所述,仅是本发明的较佳实施例而已,并非对本发明作任何形式上的限制。虽然本发明已以较佳实施例揭露如上,然而并非用以限定本发明。任何熟悉本领域的技术人员,在不脱离本发明技术方案范围情况下,都可利用上述揭示的方法和技术内容对本发明技术方案做出许多可能的变动和修饰,或修改为等同变化的等效实施例。因此,凡是未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所做的任何简单修改、等同变化及修饰,均仍属于本发明技术方案保护的范围内。当前第1页12当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1