本发明涉及计算机信息处理,尤其涉及一种文档校对方法、装置及设备。
背景技术:
1、在使用文档编辑工具,如word和wps,在进行文档的编辑加工时,通常希望可以通过自动校对等技术发现文档中的错别字、敏感词以及标点符号的不规范使用等。
2、为了实现上述目的,第三方厂商通常会针对word和wps开发一系列的校对插件,将插件与word和wps融为一体。即在word和wps的相应界面中呈现校对结果,用户可以在界面上操作来定位、操作和浏览校对结果。但是,上述通过校对插件对文档内容校对的方法存在一些弊端,例如校对结果无法跨机器浏览;安装校对插件存在一定的门槛,且对于不同的word版本、wps版本以及操作系统版本会存在一系列的兼容性问题,需要重新开发以适应不同的版本和操作系统。
3、因此,现有方法存在重复开发插件以及用户使用不便的问题。
技术实现思路
1、本申请提供一种文档校对方法、装置及设备,以解决现有的重复开发插件以及用户使用不便的问题。
2、第一方面,本申请提供一种文档校对方法,所述方法包括:
3、接收用户设备上传的待校对文档以及用户选择的校对类型;
4、按照预设段落结构对所述待校对文档进行解析,得到所述待校对文档的段落内容;
5、针对每一段落内容,根据所述校对类型对所述段落内容进行校对,得到错误内容以及所述错误内容在所述待校对文档中的位置;
6、根据所述错误内容以及所述错误内容在所述待校对文档中的位置生成校对批注,得到对应的批注文档,将所述批注文档反馈给用户设备进行显示;所述校对批注包括修改建议。
7、可选的,根据所述校对类型对所述段落内容进行校对,得到错误内容以及所述错误内容在所述待校对文档中的位置,包括:
8、针对每一校对类型,当存在错误内容时,确定所述错误内容所在的段落序号以及所述错误内容在所述段落的偏移信息;
9、生成包含所述错误内容、段落序号和偏移信息的集合。
10、可选的,根据所述错误内容以及所述错误内容在所述待校对文档中的位置生成校对批注,包括:
11、读取所述集合中存储的错误内容、段落序号和偏移信息;
12、根据所述段落序号定位到所述错误内容在所述待校对文档中的段落,根据所述偏移信息确定所述错误内容在所述段落中的开始节点位置,根据所述错误内容所对应的字符确定所述错误内容在所述段落中的结束节点位置;
13、根据所述开始节点位置、结束节点位置生成与所述错误内容对应的校对批注。
14、可选的,所述集合还包括所述错误内容对应的校对类型和建议修改词;根据所述开始节点位置、结束节点位置生成与所述错误内容对应的校对批注,包括:
15、根据所述开始节点位置和结束节点位置生成批注框;
16、将所述批注框中作者信息名字设置为所述校对类型;
17、根据所述错误内容、所述建议修改词以及修改建议模板生成修改建议,将所述修改建议作为所述校对批注的内容。
18、可选的,按照预设段落结构对所述待校对文档进行解析,得到所述待校对文档的段落内容,包括:
19、接收到用户触发的开始校对的指令后,检测所述待校对文档的格式;
20、当所述待校对文档的格式为低版本格式时,将所述待校对文档转换为高版本格式的文档;
21、按照与所述高版本格式对应的段落结构对所述待校对文档进行解析,得到段落序号和段落内容。
22、可选的,将所述批注文档反馈给用户设备进行显示,包括:
23、当校对完成后,将所述批注文档保存在预设位置,并将校对进度和下载所述批注文档的操作按钮显示在用户设备的显示界面;
24、当接收到用户触发的下载所述批注文档的指令后,执行下载所述批注文档并保存到指定位置的操作。
25、第二方面,本申请提供一种文档校对装置,所述装置包括:
26、接收模块,用于接收用户设备上传的待校对文档以及用户选择的校对类型;
27、解析模块,用于按照预设段落结构对所述待校对文档进行解析,得到所述待校对文档的段落内容;
28、校对模块,针对每一段落内容,用于根据所述校对类型对所述段落内容进行校对,得到错误内容以及所述错误内容在所述待校对文档中的位置;
29、处理模块,用于根据所述错误内容以及所述错误内容在所述待校对文档中的位置生成校对批注,得到对应的批注文档,将所述批注文档反馈给用户设备进行显示所述校对批注包括修改建议。
30、第三方面,本申请提供一种文档校对设备,包括:至少一个处理器和存储器;
31、所述存储器存储计算机执行指令;
32、所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如第一方面任一项所述的方法。
33、第四方面,本申请提供一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时,实现如第一方面任一项所述的方法。
34、第五方面,本申请提供一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现如第一方面任一项所述的方法。
35、本发明提供一种文档校对方法、装置及设备,所述方法包括:接收用户设备上传的待校对文档以及用户选择的校对类型;按照预设段落结构对所述待校对文档进行解析,得到所述待校对文档的段落内容;针对每一段落内容,根据所述校对类型对所述段落内容进行校对,得到错误内容以及所述错误内容在所述待校对文档中的位置;根据所述错误内容以及所述错误内容在所述待校对文档中的位置生成校对批注,得到对应的批注文档,将所述批注文档反馈给用户设备进行显示;所述校对批注包括修改建议,所述方法能够实现无需针对不同版本的word和wps重复开发插件,且可以实现对校对结果的跨机器浏览,提高用户的使用体验。
1.一种文档校对方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,根据所述校对类型对所述段落内容进行校对,得到错误内容以及所述错误内容在所述待校对文档中的位置,包括:
3.根据权利要求2所述的方法,其特征在于,根据所述错误内容以及所述错误内容在所述待校对文档中的位置生成校对批注,包括:
4.根据权利要求3所述的方法,其特征在于,所述集合还包括所述错误内容对应的校对类型和建议修改词;根据所述开始节点位置、结束节点位置生成与所述错误内容对应的校对批注,包括:
5.根据权利要求1-4任一项所述的方法,其特征在于,按照预设段落结构对所述待校对文档进行解析,得到所述待校对文档的段落内容,包括:
6.根据权利要求1所述的方法,其特征在于,将所述批注文档反馈给用户设备进行显示,包括:
7.一种文档校对装置,其特征在于,所述装置包括:
8.一种文档校对设备,其特征在于,包括:至少一个处理器和存储器;
9.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时,实现如权利要求1-6任一项所述的方法。
10.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1-6任一项所述的方法。