对文档进行注释的方法和输入法系统的制作方法
【专利摘要】本发明提供了对文档进行注释的方法和输入法系统,涉及输入法【技术领域】,以解决文档注释过程繁琐且效率较低的问题。所述的方法包括:用户进行文档编写时,输入法客户端实时选取当前输入内容发送至服务器;服务器依据所述当前输入内容对应的目标查询串进行搜索,得到所述当前输入内容对应的目标释义;将所述目标释义下发至所述输入法客户端进行反馈。在文档输入过程中通过输入法快速获取由服务器确定的输入内容对应的释义,实现边输入、边批注的效果,简化了文档注释的操作过程并提高了注释的效率。
【专利说明】对文档进行注释的方法和输入法系统
【技术领域】
[0001]本发明涉及输入法【技术领域】,特别是涉及一种对文档进行注释的方法和一种输入法系统。
【背景技术】
[0002]用户在编写文档的时候,对某些特定词的含义往往了解的不够精确,难以通过文字的形式准确表述,这时就需要逐一到搜索引擎进行搜索的方式获取该特定词的精确释义,再将光标移动到该名词处,并采用手动输入或者复制粘贴的形式在光标处形成文档的标注,从而便于其他阅读者理解。其中,释义是指对于该特定词的精确解释和阐述。
[0003]例如,用户在输入到“硅酸盐沉着病”的时候,往往无法准确的进行描述,则需要通过搜索引擎搜索“硅酸盐沉着病”的精确释义,复制到本地标注框生成一个批注,从而在某些特殊情况需要转发给他人时,便于其他的阅读者理解。
[0004]但是,上述过程不但需要逐一暂停文字输入,转而手动输入或者复制粘贴对应的释义来完成批注,而且由于搜索引擎返回的结果往往比较繁杂,需要综合多个搜索结果对应的内容方可获得对应的精确释义以撰写批注,操作过程复杂,降低了文字输入的效率。
【发明内容】
[0005]本发明实施例提供一种对文档进行注释的方法,以解决文档注释过程繁琐且效率较低的问题。
[0006]相应的,本发明实施例还提供了一种输入法系统,用以保证上述方法的实现及应用。
[0007]为了解决上述问题,本发明公开了一种对文档进行注释的方法,包括:用户进行文档编写时,输入法客户端实时选取当前输入内容发送至服务器;服务器依据所述当前输入内容对应的目标查询串进行搜索,得到所述当前输入内容对应的目标释义;将所述目标释义下发至所述输入法客户端进行反馈。
[0008]相应的,本发明实施例还公开了一种输入法系统,包括:服务器和输入法客户端;其中服务器包括:搜索模块,用于依据当前输入内容对应的目标查询串进行搜索,得到所述当前输入内容对应的目标释义;通信模块,用于将所述目标释义下发至所述输入法客户端进行反馈;所述输入法客户端,包括:上传模块,用于在用户进行文档编写时,实时选取当前输入内容发送至服务器。
[0009]与现有技术相比,本发明实施例包括以下优点:
[0010]用户在进行文档编写时,输入法客户端不同于现有技术中将待释义信息输入到特定的文本框中进行查询,而是将当前输入内容实时发送给服务器,服务器据此在网络中对目标查询串进行搜索,快速得到所述待释义信息对应的目标释义,提高释义的准确性,然后将所述目标释义下发至所述输入法客户端进行反馈。可以在输入过程中通过运行中的输入法快速获取由服务器确定的输入内容对应的释义,在不影响文字输入的同时可以快速的从网络获取全面、准确的目标释义,实现边输入、边批注的效果,且具有良好的版面交互效果,简化了注释的操作过程并提高了注释的效率。
【专利附图】
【附图说明】
[0011]图1是本发明的一种对文档进行注释的方法实施例的步骤流程图;
[0012]图2是本发明的一种对文档进行注释的方法可选实施例的步骤流程图;
[0013]图3是本发明实施例二中批注的预览信息示意图;
[0014]图4是本发明实施例二中注释示意图;
[0015]图5是本发明的一种对文档进行注释的方法中客户端与服务器交互实施例的步骤流程图;
[0016]图6是本发明实施例三中批注的预览信息示意图;
[0017]图7是本发明实施例三中第一种注释示意图;
[0018]图8是本发明实施例三中第二种注释示意图;
[0019]图9是本发明一种输入法系统实施例的结构框图。
【具体实施方式】
[0020]为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和【具体实施方式】对本发明作进一步详细的说明。
[0021]本发明实施例的核心构思之一在于,提供一种对文档进行注释的方法,以解决文档注释过程繁琐且效率较低的问题。输入法客户端在进行输入时将待释义信息实时发送给服务器,服务器据此在网络中对当前输入内容对应的目标查询串进行搜索,快速得到所述待释义信息对应的目标释义,提高释义的准确性,然后将所述目标释义下发至所述输入法客户端进行反馈。可以在输入过程中快速获取由服务器确定的输入内容对应的释义,在不影响文字输入的同时可以快速的从网络获取全面、准确的目标释义,实现边输入、边批注的效果,简化了注释的操作过程并提高了注释的效率。
[0022]实施例一
[0023]参照图1,示出了本发明的一种对文档进行注释的方法实施例的步骤流程图,具体可以包括如下步骤:
[0024]步骤102,输入法客户端进行文档编写时,实时选取当前输入内容进行上传,发送至服务器;
[0025]用户在采用输入法客户端进行输入编辑撰写文档时,输入法客户端会选取用户在输入过程中产生输入内容,调用快捷键触发对应的操作,将实时选取的当前输入内容构成待释义信息,然后发送给服务器端。
[0026]如用户在输入到“硅酸盐沉着病”的时候,在“硅酸盐沉着病”作为当前输入内容上屏后,调用快捷键“ctrl+〈”触发本方法对应的流程,刚上屏的“硅酸盐沉着病”被输入法客户端实时选取,并发送至服务器,从而快速完成了作为查询串的当前输入内容发送到搜索引擎服务器的过程。
[0027]在其他实施例中,当前输入内容包括用户选中的文字内容,即当前输入内容通过用户手动确定。用户输入完毕一段文字后,根据用户控制的“shift+方向键”选取文字内容,将选中的文字内容调用快捷键进行触发,从而将所述文字内容实时发送至服务器端。
[0028]步骤104,服务器依据所述当前输入内容对应的目标查询串进行搜索,得到所述当前输入内容对应的目标释义。
[0029]服务器依据上传的当前输入内容,确定至少一个目标查询串,其中目标查询串指的是依据当前输入内容确定的待查询释义的输入内容。
[0030]本实施例中,搜索引擎的服务器采用目标查询串在网络中进行查询,如在搜索引擎对目标查询串进行搜索,依据搜索查询的结果确定每个目标查询串对应的目标释义,如某一目标串在网络百科中的释义,或介绍该目标查询串的网页等,如目标查询串为“山西”,则可以查询到其在百度百科、搜狗百科等网络百科中的释义,也可以查询到山西旅游的攻略、旅游介绍页面等网页信息,将这些得到的信息作为目标释义。
[0031]步骤106,将所述目标释义下发至所述输入法客户端进行反馈。
[0032]通过上述搜索步骤确定目标释义对应的信息后,服务器将目标释义反馈给输入法客户端,且服务器可能同时向客户端反馈一个目标查询串的多个目标释义。
[0033]在其他实施例中,所述输入法客户端将所述目标释义引入至所述待释义信息对应的批注内容,并将所述批注内容关联于所述待释义信息进行显示。另外,在以B/S为架构的云输入中,当用户在浏览器中的特定区域输入拼音时,对应的数据传输到后台云服务器进行处理,并在浏览器中的对应区域显示匹配的汉字,则输入法客户端为浏览器本身。
[0034]输入法客户端后续可以依据目标释义为待释义信息建立批注,即将所述目标释义引入至所述待释义信息对应的批注内容,并所述批注内容关联于所述待释义信息进行显示。如直接在文档中的当前输入内容处引入所述目标释义作为所述当前输入内容对应的批注,其中标注当前输入内容对应的目标释义,即将当前输入内容进行标记(高亮、加粗显示等),并通过特定触发调用目标释义进行关联显示。如当用户鼠标移至文档中已建立过批注的高亮文字时,文档调用存储的所述高亮文字对应的目标释义,供文档进行加载,加载时以批注的形式同所述高亮文字一起显示。还可以将所述目标释义引入至输入法客户端中作为该文档对应的批注内容进行存储:在当前输入内容被触发时,输入法客户端调用该批注内容进行关联显示,如当用户鼠标移至文档中已建立过批注的高亮文字时,输入法客户端调用自身存储的所述高亮文字对应的目标释义,以批注的形式同所述高亮文字一起显示。
[0035]其中,当服务器同时向客户端反馈一个目标查询串的多个释义信息时,依据用户的选择确定上屏的目标释义建立批注。
[0036]综上所述,用户进行文档编写时,输入法客户端不同于现有技术中将待释义信息输入到特定的文本框中进行查询,而是将当前输入内容实时发送给服务器,服务器据此在网络中对每个目标查询串进行搜索,快速得到所述待释义信息对应的目标释义,提高释义的准确性,然后将所述目标释义下发至所述输入法客户端进行反馈。可以在文档输入过程中快速获取由服务器确定的输入内容对应的释义,在不影响文字输入的同时可以快速的从网络获取全面、准确的目标释义,实现边输入、边批注的效果,简化了文档注释的操作过程并提闻了注释的效率。
[0037]本发明实施例中,待释义信息中的当前输入内容自动进行确定,可以是已上屏的文字内容即当前上屏文字,也可以是待转化的字符串即当前输入字符串,不同的输入内容在确定释义时存在差别,下面分别采用不同的实施例进行论述。
[0038]实施例二
[0039]首先,以当前输入字符串为当前输入内容论述服务器端确定释义信息的流程。
[0040]参照图2,示出了本发明的一种对文档进行注释的方法可选实施例的步骤流程图,具体可以包括如下步骤:
[0041]步骤202,用户进行文档编写时,输入法客户端实时选取当前输入内容发送至服务器;
[0042]用户在采用输入法客户端进行输入编辑撰写文档时,输入法客户端会实时选取用户在输入过程中产生输入内容,并构成待释义信息发送给服务器端。
[0043]步骤204,当所述当前输入内容为当前输入字符串时,所述服务器对所述当前输入字符串进行转化得各候选项。
[0044]步骤206,采用所述当前输入字符串的上下文信息对所述候选项进行筛选,筛选得到至少一个目标查询串。
[0045]本发明实施例中,在输入法客户端实时发送当前输入内容时,同时会上传当前输入内容的上下文信息,以便于后续获取准确的目标释义。
[0046]当所述当前输入内容为当前输入字符串时,首先要采用服务器对当前输入字符串进行分词、转换等操作,获取所述当前输入字符串的各候选项,如输入法客户端经触发后实时发送给搜索引擎的当前输入字符串“shanxi”,则对应得到输入法的候选项“山西、陕西、山溪、山系”等。
[0047]由于当前输入字符串会转换得到多个候选项,而当前输入字符串对应选择的候选项通常与所处的语言环境有关,因此要依据上下文信息确定其所处的语言环境,依据语言环境确定可能出现的候选项,将该候选项作为目标查询串,当语言环境无法唯一确定一个候选项时,目标查询串可能有多个。
[0048]其中上下文信息包括上文信息和下文信息,若当前输入字符串位于文档的最后,即其后无文档内容,单纯进行文字输入时,则此时获取当前输入字符串的上文信息;对应的若当前输入字符串位于文档的最前端,即其前无文档内容,则此时获取当前输入字符串的下文信息;若当前输入字符串位于文档的中间,如对文档进行编辑修改时,其前后均存在文档内容,则同时获取其上文信息和下文信息。
[0049]并且,为了减少数据量,还可以限制上下文信息的数量,如限制汉字的字符,仅获取当前输入内容的前后10个汉字。如对于上述输入字符串“shanxi”,在字数限制为10个汉字的情况下,其上下文信息为“西安古称长安,现位于”。
[0050]本发明一个可选实施例中,所述服务器依据输入法客户端上传的当前输入内容确定至少一个目标查询串之后,还包括:对所述当前输入内容的上下文信息进行预处理;对预处理后的上下文信息进行分词并对分词结果进行筛选,得到筛选后的上下文信息。
[0051]由于上下文信息中可能会存在噪声,如包括标点符号、语气助词等信息,因此可以对上下文信息进行预处理,如通过清洗、筛选等操作消除其中的噪声,保证上下文信息的准确性并提高后续采用上下文信息处理时的效率。
[0052]即对上下文信息进行数据预处理,如去掉包含的标点符号等与文字无关的信息,如上例预处理后为“西安古称长安现位于”。然后在对预处理后的上下文信息进行分词,并对分词结果进行筛选,如分词后删除无效的语气词、介词等信息,筛选得到上下文信息,主要是名词等,如上例得到“西安”、“长安”。
[0053]本发明一个可选实施例中,所述采用所述当前输入字符串的上下文信息对所述候选项进行筛选,筛选得到至少一个目标查询串,包括:分别计算每个候选项与所述当前输入字符串的上下文信息的相关度;采用预设的阈值对各候选项的相关度进行筛选,将所述相关度超过所述阈值的候选项作为所述目标查询串。
[0054]预处理完上下文信息后,可以采用上下文信息对候选项进行进一步筛选,如分别计算每个候选项与所述上下文信息的相关度,可以保留相关度最大的候选项作为目标查询串,若有多个候选项的相关度并列最高,则取所有候选项作为目标查询串构成目标查询串
口 O
[0055]当然,也可以预设一阈值,采用该阈值对各候选项的相关度进行筛选,如依次采用各候选项的相关度与所述阈值进行比较,然后将相关度超过所述阈值的候选项作为目标查询串。
[0056]如上例预处理后的上下文信息为“西安”、“长安”,依次计算各候选项与预处理后的上下文信息的相关度,其中各候选项中,“陕西”的相关度超过阈值,以候选项“陕西”作为目标查询串。
[0057]步骤208,在搜索引擎中对每个目标查询串进行检索,分别获取每个查询目标的检索结果集合。
[0058]步骤210,依据所述上下文信息对所述检索结果集合中的每个搜索结果分别进行语义分析,筛选得到所述目标查询串的至少一个目标释义。
[0059]将每个目标查询串分别在搜索引擎的海量数据中进行检索,基于海量数据对每个查询目标均可以检索到全面的搜索结果,将检索到的多个搜索结果构成检索结果集合。
[0060]然后采用上下文信息对检索结果集合中的每个搜索结果分别进行语义分析,确定每个释义结果和目标查询串的匹配度,并依据该匹配度筛选得到所述目标查询串的至少一个目标释义。通过上下文筛选可以使释义更加符合当前的语言环境,提高释义的准确性。
[0061]步骤212,对所述目标释义进行文本分析,抽取其中的关键信息作为所述目标释义的摘要。
[0062]由于目标释义通常是一网页、百科的内容,包含比较多的信息,难以在文档批注中一一展示,因此本发明实施例还对目标结果进行文本分析,以抽取出关键信息构成目标释义的摘要,为用户提供最重要的信息便于用户理解。
[0063]本发明一个可选实施例中,对所述释义结果进行文本分析,抽取其中的关键信息作为所述目标释义的摘要,包括:对所述每个目标释义结果分别进行切分,获取对应的各段切分释义;将所述切分释义分别与所述目标查询串进行相关性分析,根据相关性抽取所述切分释义构成所述目标释义的关键信息,并分别生成所述目标释义对应的摘要。在其他实施例中,也可以指定目标释义的一部分,如首段文字,或者目标释义对应的子标题“概述”下的文字内容作为摘要。
[0064]可以获取目标释义的文字信息,如释义结果为网页内容则可以通过解析网页获取其中的标题、正文等文字内容,然后对目标释义进行文本分析并切分,将其切分成一段一段的切分释义,进一步还可以对切分释义进行分词。然后进行切分释义与所述目标查询串的相关性分析,如分别计算各切分释义与所述目标查询串的相关度,抽取出相关性最高的切分释义或分词组合构成所述目标释义的关键信息,然后采用该关键信息生成该释义结果的摘要,从而实现缩小数据信息规模的目的,为用户提供简要、准确的注释信息。
[0065]步骤214,获取所述目标释义的摘要,以及所述目标释义的网址信息构成所述当前输入内容对应的释义信息。
[0066]步骤216,将所述释义信息反馈给所述输入法客户端。
[0067]然后获取该目标释义的摘要,以及该目标释义对应网页的网址信息,将摘要和网址信息构成该当前输入内容对应的释义信息,并将释义信息反馈给所述输入法客户端。
[0068]输入法客户端在接收到该释义信息后,可以采用该释义信息对输入内容进行批注,如将摘要作为批注的显示内容,在用户点击该批注是还可以依据该网页地址调用浏览器开启相应的页面。
[0069]其中,输入法在收到释义信息后可以展开一个预览框提示用户当前输入内容对应的目标释义,可以选择进行标注,如对于上例中,输入法的候选项“陕西”为目标查询串时对应的释义信息为例,其在文档中批注的预览示意图如图3所示(当前输入字符串“shanxi”对应的其余候选项图中未示出)。用户可以根据预览的目标释义决定是否在光标处(当前输入内容所处的位置)添加批注,如果确定引入该目标释义添加批注,则在光标处形成一个展开的标注框,其中上例中候选项“陕西”对应的批注示意图如图4所示(当前输入字符串“shanxi”对应的其余候选项图中未示出),通过点击灯泡图标可以将批注收起,再次点击之后打开,随着候选项“陕西”上屏,则批注添加完毕。进一步点击目标释义还可以开启对应的网页,直接通过浏览器打开“陕西”对应的百科页面。在其他实施例中,一旦用户在输入法中上屏的候选项为“山西”,则如图4所示“陕西”的批注则消失,输入法客户端自动引入已上屏的“山西”对应的目标释义作为批注内容添加在批注中。
[0070]综上所述,由于上下文信息中可能会存在噪声,如包括标点符号、语气助词等信息,通过对上下文信息进行预处理来清洗、筛选以消除其中的噪声,保证上下文信息的准确性并提高后续采用上下文信息处理时的效率。
[0071]其次,将目标查询串在搜索引擎的海量数据中进行检索,基于海量数据对每个查询目标均可以检索到全面的检索结果。
[0072]再次,由于目标释义通常是一网页、百科的内容,包含比较多的信息,难以在文档批注中一一展示,本发明实施例还对目标释义进行文本分析,以抽取出关键信息构成目标释义的摘要,为用户提供最重要的信息便于用户理解。
[0073]本发明实施例在文本输入过程中,不同于现有技术中将待释义信息输入到特定的文本框中进行查询,而是由输入法客户端触发进行输入时的当前输入字符串实时发送给服务器,通过服务器对输入字符串进行转换,将多个候选项经筛选后获取其对应目标释义,月艮务器对目标释义进行分析,形成当前输入字符串对应的批注内容,并对当前输入字符串与对应的批注内容进行关联存储,从而在文本输入时即形成该特定词的标引进行显示。本实施例通过输入法在输入过程中对当前输入字符串进行筛选,将得到的与当前上下文最为匹配的候选项作为查询串进行查询,即在当前输入内容尚未输入完毕,处于字符串阶段时即以该输入字符串对应的候选项的形式开始批注内容的查询,并将得到的目标释义作为批注内容添加批注,快速获取了目标释义,从而提高了添加批注时文字输入的效率,实现了边输入、边批注的技术效果。
[0074]实施例三
[0075]本实施例中,以当前上屏文字为当前输入内容论述输入法的客户端与服务器确定释义信息的交互过程。
[0076]参照图5,示出了本发明的一种对文档进行注释的方法中客户端与服务器交互实施例的步骤流程图,具体可以包括如下步骤:
[0077]步骤502,输入法客户端在进行文档编写时,实时获取用户输入的当前输入内容。
[0078]步骤504,输入法客户端将当前输入内容发送给服务器。
[0079]本实施例中,当前输入内容对应的当前输入内容为当前上屏文字。输入法客户端采集当前上屏文字,及其上下文信息构成当前输入内容。其中当前上屏文字指的是输入法将输入字符串转换得到候选项后用户选择上屏的候选项,且此时还未输入其他字符串、文字等内容,即输入法客户端当前上屏的文字内容,如用户输入字符串“weicheng”后从候选项“围城、围成、潍城、未成”中选择“围城”上屏,且未进行其他输入操作,则当前上屏文字为“围城”。
[0080]本发明实施例中,输入法客户端会记录用户在使用输入法时上屏的候选项历史、键盘的删除操作和当前输入字符串等输入内容。并且,记录的上下文信息终保持不少于一定数量的字符数,保证上文信息的完整性。如上例中记录的上下文信息为“陈道明老师的电视剧”。
[0081]步骤506,服务器将所述当前上屏文字作为所述目标查询串。
[0082]服务器收到由当前上屏文字“围城”和上下文信息“陈道明老师的电视剧”构成的释义信息,将“围城”直接作为目标查询串。
[0083]步骤508,服务器在搜索引擎中对目标查询串进行检索,获取查询目标的检索结果隹A
口 O
[0084]在其他实施例中,可以结合所述当前上屏文字的上下文信息进行语义分析,将语义分析对应得到分词结果连同所述当前上屏文字作为所述目标查询串在搜索引擎中进行搜索。如用户分别输入“中国”和“人民”上屏,再输入“大学”上屏时,调用快捷键进行自动触发,即将上下文信息“中国人民”结合当前上屏文字“大学”进行语义分析,得到经组合的当前上屏文字和上下文信息,即“中国人民大学”的分值最高,则将“中国人民大学” 一起作为目标查询串在搜索引擎中进行检索,直接目标释义。
[0085]步骤510,服务器依据所述上下文信息对所述检索结果集合中的每个搜索结果分别进行语义分析,筛选得到所述目标查询串的至少一个目标释义。
[0086]以“围城”作为目标查询串进行检索,得到“围城”对应的多个百科类型的检索结果构成检索结果集合,分别包括:“钱钟书先生的小说” “1990年的同名电视剧” “汉语词语” “2008年香港电影”、“流行歌曲”和“Marvel Comics作漫画”等。
[0087]通过上下文信息对检索结果集合中的各检索结果分别进行语义分析,抽取出关键的特征名词“陈道明”和“电视剧”,则检索结果集合中“1990年的同名电视剧”相关度较高,但“钱钟书先生的小说”中有“电视剧”字样的描述,因此也通过了语义分析的筛选,而其他检索结果则未通过筛选,将通过筛选的两项检索结果称为目标查询串的目标释义。
[0088]步骤512,服务器对所述目标释义进行文本分析,抽取其中的关键信息作为所述目标释义的摘要。
[0089]本实施例中,对两目标释义进行文本分析后,分别抽取两检索结果中文本内容的第一段文字概述作为两目标释义对应的摘要。
[0090]步骤514,服务器获取所述目标释义的摘要,以及所述目标释义的网址信息构成所述当前输入内容对应的释义信息。
[0091]步骤516,服务器将所述释义信息反馈给所述输入法客户端。
[0092]如图6所示,当前上屏文字的“围城”对应目标释义的预览信息为“钱钟书先生的小说”和“1990年的同名电视剧”两项,其中,“1990年的同名电视剧”相关度较大,对应的检索结果摘要排在首位,“钱钟书先生的小说”相关度较小,对应的检索结果摘要排在次位。当然,在其他实施例中,也可以仅显示首位的“1990年的同名电视剧”,供当前用户直接选择。
[0093]步骤518,输入法客户端将释义信息展示给用户信息选择。
[0094]步骤520,输入法客户端依据用户选择为当前输入内容建立批注,并引入释义信息作为待释义内容对应的批注内容。
[0095]获取上述“围城”两个释义结果展示给用户时,其候选项“围城”为目标查询串时对应目标释义的预览信息如图6所示。用户可以直接触发,选择位于首位的电视剧百科信息,则将对应的目标释义引入当前输入内容“围城”,在文档中形成批注内容与当前输入内容“围城”进行关联显示,形成标注如图7所示;若用户选择位于次位的小说的百科信息,则同理其批注如图8所示。用户可以通过触发控制将批注进行收起或展开,进一步点击目标释义还可以开启对应的网页,直接通过浏览器打开“钱钟书先生的小说”或“1990年的同名电视剧”对应的百科页面。
[0096]在其他实施例中,还可以在整篇文档撰写完毕后,另行触发指令,输入法客户端分别提取整篇文档中的各待释义信息和对应的批注内容,独立于该文档生成存储批注内容的文件,供所文档或所述输入法客户端进行加载,或者将所述文档中的各当前输入内容对应的目标释义分别进行提取后,并在文档中集中加载,在文档尾部等位置统一生成该文档所有的待释义信息和对应的批注明细,使该篇文档在被转发时供其他用户统一地对批注进行查看。
[0097]目前,常用词语往往存在一个以上的释义,本发明实施例在文本输入过程中,不同于现有技术中将待释义信息输入到特定的文本框中进行查询,而是由输入法客户端触发进行输入时的当前上屏文字实时发送给服务器获取其对应的至少一个目标释义,服务器对目标释义进行分析筛选形成当前上屏文字对应的批注内容,并对当前上屏文字与对应的批注内容进行关联存储,从而在文本的过程中快速获取该特定词的标引进行显示,能够有效地在输入过程中通过输入法将筛选得到的,与当前上下文最为匹配的目标释义作为批注内容添加批注,从而提高了添加批注时文字输入的效率,实现了边输入、边批注的技术效果。
[0098]在其他实施例中,将批注关联于所述当前输入内容进行显示时,所述目标释义随所述用户的特定触发变换显示位置,并与所述当前输入内容进行关联显示。如为了用户的阅读方便,可将批注进行拖动,使各目标释义根据用户指定的位置进行显示。
[0099]本方法还可以应用于用户间的文本聊天,用户聊天的过程相当于聊天日志的文档撰写,即当前用户和对方好友通过即时通信软件进行聊天时,遇到一些怠于解释或不知道精确释义的名词,则实时选取聊天文本中的当前输入内容发送至服务器,服务器依据所述当前输入内容对应的目标查询串进行搜索,得到所述当前输入内容对应的目标释义;将所述目标释义下发至所述当前用户在即时通信软件中使用的第一输入法客户端进行反馈。在当前用户将聊天文本中的当前输入内容发送至对方好友后,将目标释义存储至即时通信软件对应的聊天日志中作为所述当前输入内容对应的批注,分别根据当前用户和对方好友的触发对目标释义进行显示。
[0100]如当前用户向对方好友发送的聊天信息为“周末有个快闪活动,你去么?”,并在输入至“快闪”时,调用快捷键实时选取“快闪”作为当前输入内容发送至服务器,服务器将“快闪”进行百科搜索,得到“快闪”对应的百科释义;并将“快闪”的百科释义下发至当前用户的输入法客户端进行预览。在当前用户将聊天信息发送至对方好友后,将“快闪”的百科释义存储至即时通信软件对应的聊天日志中作为“快闪”对应的批注,并将聊天信息中的“快闪”被高亮显示,在对方好友的鼠标移至“快闪”附近时,调用对应的百科释义“新近在国际流行开的一种嬉皮行为,可视为一种短暂的行为艺术。简单地说就是:许多利用网络联系的人,通过短信或bbs约定一个指定的地点,在明确指定的时间同时做一个指定的不犯法却很引人注意的动作,然后赶快走人……”进行显示,快速地为聊天中出现的待解释词语添加了目标释义,从而提高了添加批注时文字输入的效率,实现了边输入、边批注的技术效果。当然,在其他实施例中,也可将当前用户使用的计算机作为输入法客户端,对于所述目标释义不经过预览,直接将目标释义分别下发至当前用户和对方好友使用的计算机中的即时通信软件对应的聊天日志中,在当前用户将所述当前输入内容发送至对方好友后,于聊天信息中根据当前用户和对方好友的触发显示该目标释义。
[0101]需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。
[0102]实施例四
[0103]在上述实施例的基础上,本实施例还提供了一种输入法系统。
[0104]参照图9,示出了本发明一种输入法系统实施例的结构框图,具体可以包括:服务器901和输入法客户端902。
[0105]其中,服务器901包括:
[0106]搜索模块9011,用于依据当前输入内容对应的目标查询串进行搜索,得到所述当前输入内容对应的目标释义。
[0107]通信模块9012,用于将所述目标释义下发至所述输入法客户端进行反馈。
[0108]所述输入法客户端902包括:
[0109]上传模块9021,用于在用户进行文档编写时,实时选取当前输入内容进行上传。
[0110]综上所述,用户进行文档编写时,输入法客户端不同于现有技术中将待释义信息输入到特定的文本框中进行查询,而是将当前输入内容实时发送给服务器,服务器据此在网络中对每个目标查询串进行搜索,快速得到所述待释义信息对应的目标释义,提高释义的准确性,然后将所述目标释义下发至所述输入法客户端进行反馈。可以在文档输入过程中快速获取由服务器确定的输入内容对应的释义,在不影响文字输入的同时可以快速的从网络获取全面、准确的目标释义,实现边输入、边批注的效果,简化了文档注释的操作过程并提闻了注释的效率。
[0111]可选的,所述上传模块中还包括:触发子模块,用于调用快捷键进行触发,将所述当前输入内容选取后实时发送至服务器。
[0112]可选的,所述当前输入内容包括用户选中的文字内容;相应的,所述触发子模块具体用于根据用户选中的文字内容,调用快捷键进行触发,将所述文字内容实时发送至服务器。
[0113]可选的,所述输入法客户端还包括存储模块,用于将所述目标释义存储至所述输入法客户端中作为所述文档在所述当前输入内容对应的批注,供所述输入法客户端进行加载;和/或,用于将所述目标释义存储至所述文档中作为所述当前输入内容对应的批注,供所述文档进行加载;和/或,用于将所述目标释义存储为独立文件,供所述文档或所述输入法客户端进行加载。
[0114]可选的,所述输入法客户端还包括加载模块,包括:引入子模块,用于将所述目标释义引入至所述当前输入内容对应的批注;显示子模块,用于将所述批注关联于所述当前输入内容进行显示。
[0115]可选的,所述引入子模块,具体用于在所述文档的当前输入内容处引入所述目标释义作为所述当前输入内容对应的批注;或者,具体用于在所述输入法客户端中引入所述目标释义作为所述文档中所述当前输入内容对应的批注。
[0116]可选的,所述显示子模块,具体用于将所述当前输入内容进行标记,并通过特定触发调用所述目标释义进行关联显示。
[0117]可选的,所述显示子模块,具体用于将所述目标释义随所述用户的特定触发变换显示位置,并与所述当前输入内容进行关联显示。
[0118]可选的,所述装置还包括,汇总模块,用于分别将所述文档中的各当前输入内容对应的目标释义进行提取,并在文档中集中加载,统一生成所述文档对应的各批注明细。
[0119]可选的,所述通信模块,具体用于将所述目标释义下发至所述用户在即时通信软件中使用的第一输入法客户端;所述用户将所述当前输入内容发送至所述即时通信软件中的对方好友后,将所述目标释义存储至所述即时通信软件对应的聊天日志中作为所述当前输入内容对应的批注。
[0120]所述搜索模块,包括:确定子模块,用于当所述当前输入内容为当前上屏文字时,所述服务器将所述当前上屏文字作为所述目标查询串。或者包括:转化子模块,用于当所述当前输入内容为当前输入字符串时,所述服务器对所述当前输入字符串进行转化得各候选项;筛选子模块,用于采用所述当前输入字符串的上下文信息对所述候选项进行筛选,筛选得到至少一个目标查询串。
[0121]可选的,所述筛选子模块,用于分别计算每个候选项与所述当前输入字符串的上下文信息的相关度;采用预设的阈值对各候选项的相关度进行筛选,将所述相关度超过所述阈值的候选项作为所述目标查询串。
[0122]可选的,服务器还包括:预处理模块,用于对所述当前输入内容的上下文信息进行预处理;对预处理后的上下文信息进行分词并对分词结果进行筛选,得到筛选后的上下文信息。
[0123]可选的,所述搜索模块,包括:搜索子模块,用于在搜索引擎中对每个目标查询串进行检索,分别获取每个查询目标的检索结果集合;筛选子模块,用于依据所述上下文信息对所述检索结果集合中的每个搜索结果分别进行语义分析,筛选得到所述目标查询串的至少一个目标释义。
[0124]可选的,还包括:摘要抽取模块,用于对所述目标释义进行文本分析,抽取其中的关键信息作为所述目标释义的摘要。
[0125]可选的,所述摘要抽取模块,用于对所述每个目标释义分别进行切分,获取对应的各段切分释义;将所述切分释义分别与所述目标查询串进行相关性分析,根据相关性抽取所述切分释义构成所述目标释义的关键信息,并分别生成所述目标释义对应的摘要。
[0126]可选的,所述通信模块,用于获取所述摘要,以及所述目标释义的网址信息构成所述当前输入内容对应的释义信息;将所述目标释义的释义信息反馈给所述输入法客户端。
[0127]综上所述,由于上下文信息中可能会存在噪声,如包括标点符号、语气助词等信息,通过对上下文信息进行预处理来清洗、筛选以消除其中的噪声,保证上下文信息的准确性并提高后续采用上下文信息处理时的效率。
[0128]其次,将目标查询串在搜索引擎的海量数据中进行检索,基于海量数据对每个查询目标均可以检索到全面的检索结果。
[0129]再次,由于目标释义通常是一网页、百科的内容,包含比较多的信息,难以在文档批注中一一展示,本发明实施例还对目标释义进行文本分析,以抽取出关键信息构成目标释义的摘要,为用户提供最重要的信息便于用户理解。
[0130]对于系统实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
[0131]本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
[0132]本领域内的技术人员应明白,本发明实施例的实施例可提供为方法、装置、或计算机程序产品。因此,本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
[0133]本发明实施例是参照根据本发明实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0134]这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0135]这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0136]尽管已描述了本发明实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。
[0137]最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
[0138]以上对本发明所提供的一种对文档进行注释的方法和一种输入法系统,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在【具体实施方式】及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
【权利要求】
1.一种对文档进行注释的方法,其特征在于,包括: 用户进行文档编写时,输入法客户端实时选取当前输入内容发送至服务器; 服务器依据所述当前输入内容对应的目标查询串进行搜索,得到所述当前输入内容对应的目标释义; 将所述目标释义下发至所述输入法客户端进行反馈。
2.根据权利要求1所述的方法,其特征在于,所述输入法客户端实时选取当前输入内容发送至服务器时,调用快捷键进行触发,将所述当前输入内容选取后实时发送至服务器。
3.根据权利要求2所述的方法,其特征在于,所述当前输入内容包括用户选中的文字内容; 相应的,所述输入法客户端实时选取当前输入内容发送至服务器包括: 根据用户选中的文字内容,调用快捷键进行触发,将所述文字内容实时发送至服务器。
4.根据权利要求2所述的方法,其特征在于,所述服务器依据所述当前输入内容对应的目标查询串进行搜索,包括: 当所述当前输入内容为当前上屏文字时,所述服务器将所述当前上屏文字作为所述目标查询串。
5.根据权利要求2所述的方法,其特征在于,所述服务器依据所述当前输入内容对应的目标查询串进行搜索,包括: 当所述当前输入内容为当前输入字符串时,所述服务器对所述当前输入字符串进行转化得到各候选项; 采用所述当前输入字符串的上下文信息对所述候选项进行筛选,筛选得到至少一个目标查询串。
6.根据权利要求5所述的方法,其特征在于,所述采用所述当前输入字符串的上下文信息对所述候选项进行筛选,筛选得到至少一个目标查询串,包括: 分别计算每个候选项与所述当前输入字符串的上下文信息的相关度; 采用预设的阈值对各候选项的相关度进行筛选,将所述相关度超过所述阈值的候选项作为所述目标查询串。
7.根据权利要求1至6中任一权利要求所述的方法,其特征在于,所述服务器依据所述当前输入内容对应的目标查询串进行搜索,得到所述当前输入内容对应的目标释义,包括: 在搜索引擎中对所述目标查询串进行检索,获取查询目标的检索结果集合; 依据所述当前输入内容的上下文信息对所述检索结果集合中的每个搜索结果分别进行语义分析,筛选得到所述目标查询串的至少一个目标释义。
8.根据权利要求1所述的方法,其特征在于,将所述目标释义下发至所述输入法客户端进行反馈后, 将所述目标释义存储至所述输入法客户端中作为所述文档在所述当前输入内容对应的批注,供所述输入法客户端进行加载; 和/或,将所述目标释义存储至所述文档中作为所述当前输入内容对应的批注,供所述文档进行加载; 和/或,将所述目标释义存储为独立文件,供所述文档或所述输入法客户端进行加载。
9.根据权利要求1所述的方法,其特征在于,还包括: 将所述目标释义引入至所述当前输入内容对应的批注; 将所述批注关联于所述当前输入内容进行显示。
10.根据权利要求9所述的方法,其特征在于,所述输入法客户端将所述目标释义引入至所述当前输入内容对应的批注时,在所述文档的当前输入内容处引入所述目标释义作为所述当前输入内容对应的批注; 或者,在所述输入法客户端中引入所述目标释义作为所述文档中所述当前输入内容对应的批注。
11.根据权利要求9或10所述的方法,其特征在于,所述将所述批注关联于所述当前输入内容进行显示时,将所述当前输入内容进行标记,并通过特定触发调用所述目标释义进行关联显示。
12.根据权利要求9或10所述的方法,其特征在于,所述将所述批注关联于所述当前输入内容进行显示时,所述目标释义随所述用户的特定触发变换显示位置,并与所述当前输入内容进行关联显示。
13.根据权利要求1所述的方法,其特征在于,还包括: 分别将所述文档中的各当前输入内容对应的目标释义进行提取,并在文档中集中加载,统一生成所述文档对应的各批注明细。
14.根据权利要求1所述的方法,其特征在于,所述将所述目标释义下发至所述输入法客户端进行反馈时,将所述目标释义下发至所述用户在即时通信软件中使用的第一输入法客户端;将所述目标释义存储至所述即时通信软件对应的聊天日志中作为所述当前输入内容对应的批注。
15.—种输入法系统,其特征在于,包括:服务器和输入法客户端;其中服务器包括: 搜索模块,用于依据当前输入内容对应的目标查询串进行搜索,得到所述当前输入内容对应的目标释义; 通信模块,用于将所述目标释义下发至所述输入法客户端进行反馈; 所述输入法客户端,包括: 上传模块,用于在用户进行文档编写时,实时选取当前输入内容发送至服务器。
16.根据权利要求15所述的系统,其特征在于,所述上传模块中还包括:触发子模块,用于调用快捷键进行触发,将所述当前输入内容选取后实时发送至服务器。
17.根据权利要求15所述的系统,其特征在于,所述输入法客户端还包括存储模块,用于将所述目标释义存储至所述输入法客户端中作为所述文档在所述当前输入内容对应的批注,供所述输入法客户端进行加载; 和/或,用于将所述目标释义存储至所述文档中作为所述当前输入内容对应的批注,供所述文档进行加载; 和/或,用于将所述目标释义存储为独立文件,供所述文档或所述输入法客户端进行加载。
18.根据权利要求15所述的系统,其特征在于,所述输入法客户端还包括加载模块,包括: 引入子模块,用于将所述目标释义引入至所述当前输入内容对应的批注; 显示子模块,用于将所述批注关联于所述当前输入内容进行显示。
19.根据权利要求18所述的系统,其特征在于,所述引入子模块,具体用于在所述文档的当前输入内容处引入所述目标释义作为所述当前输入内容对应的批注; 或者,具体用于在所述输入法客户端中引入所述目标释义作为所述文档中所述当前输入内容对应的批注。
20.根据权利要求18或19所述的系统,其特征在于,所述显示子模块,具体用于将所述当前输入内容进行标记,并通过特定触发调用所述目标释义进行关联显示。
【文档编号】G06F17/30GK104182469SQ201410361041
【公开日】2014年12月3日 申请日期:2014年7月25日 优先权日:2014年7月25日
【发明者】陈斌, 光芊源, 王东, 余浩, 张阔 申请人:北京搜狗科技发展有限公司