手写输入字符的处理、数据拆分和合并及编解码处理方法与流程

文档序号:34303305发布日期:2023-05-31 17:43阅读:30来源:国知局
手写输入字符的处理、数据拆分和合并及编解码处理方法与流程

本发明涉及数据处理技术,尤其涉及一种手写输入字符的处理、数据拆分和合并及编解码处理方法。


背景技术:

1、目前,随着计算机的发展,编码技术的种类也越来越多,其作为计算机基础的编码技术,已经广泛应用在数据传输、存储和处理中。

2、其中,文字编码是最为基础的编码,以供人类输入、查看和编辑、修改;供计算机分析和处理。从早先的ascii文字编码标准到今天的unicode,标准化的文字编码是人和机器以及各种系统之间传递信息的一个基础。但是,作为记录人类输出的工具,现有的标准化文字编码远远不够。随着计算机的普及,人机交互技术的发展,标准文字编码及其相应的文字输入方法逐渐成为人类的自然输出进入到数字世界的瓶颈。

3、在标准文字编码的基础之上,人们已经开发出一系列的通用的、专用的编码方法,通过标记、控制、转义等一系列手段来用字符及字符序列来表述结构化的数据/文档以及专门的领域数据,我们称其为文本编码;对应的数据格式称为文本格式。通用的如xml/sgml用标记构成的树结构来描述复杂结构、json用javascript语法描述复杂对象;专用的如基于xml的html描述网页、mathml描述数学表达式、svg描述矢量图形;csv用于表达表格数据;rtf、markdown等用于表示格式化文档;各种编程语言也主要使用文本格式;等等。基于标准文字的编码允许人类参与到数据的创建、查看、调试、修改过程,便于不同系统之间的集成和交换,提高了系统开发的速度,降低了系统故障检修的成本。但是,另一方面,文本格式对于符号化数据、二进制数据的表达本身就是冗余的,随着系统所要表达结构复杂性的提高,基于文本编码的标记、语法的复杂性随之大幅度提高,数据冗余也会随之加剧。此外,由于特定文字编码标准中编码个数的有限性,数据内容同编码中语法标记的冲突也不可避免,文字转义也会带来一定的数据冗余。

4、计算机内部的世界是数字的世界,二进制数据是其天然的数据表达形式。人们定义的文本格式数据也会往往通过转换处理成二进制数据,以减少冗余,提高处理、传输效率。目前也有一些通用的基于二进制的编码方法,如国际标准化组织和国际电讯联盟的编码标准ans.1,谷歌的buffer protocol,apache的thrift以及avro,还有bson、messagepack等等。但是同基于文本的编码方式相反,二进制数据具有相对封闭、不利于交换、不利于人类参与等缺点。

5、对于编码来说,无论是文本编码还是二进制编码,都存在两种用途,一个是描述数据对象本身,这又称作序列化,本说明书将其称作数据对象的内容编码。前面提到的编码标准和方法主要是用于内容编码。

6、编码的另一个用途是用于描述数据对象的地址或者引用,本说明书将其称作数据对象的引用编码。基于文本的引用编码有urn、url、ans.1中的对象标识(oid)等等;基于二进制的引用编码有数据库中的键、uuid/guid、ip地址、mac地址、md5、sha-1等,甚至还有基于图形的一维码、二维码(实际上也是通过识别转换成文本编码或者二进制编码)等等。

7、现有引用编码有两个主要问题。一是不利于集成、交换:各种不同领域正在使用着不同的编码标准,面对当今互联网、物联网的发展趋势,这种现状不利于各种领域对象的统一引用。另一个问题就是编码的有效性:随着世界互联性的提高,海量的数字对象随时在线,虽然像uuid(16个字节)、sha-1(20个字节)这样的编码理论上足以对他们提供统一的引用编码,但是这种海量引用编码的传输、处理、存储本身就会占据大量的资源,造成不必要的浪费。


技术实现思路

1、本发明的第一个方面是提供一种手写输入字符的处理方法,包括:

2、在当前激活的第一目标行/列中,采集获取用户输入的笔划以及对应的输入信息;其中,所述输入信息包括所述笔划在所述第一目标行/列中的输入位置;

3、对于每个笔划,根据所述笔划在所述第一目标行/列中的输入位置,或者所述笔划在所述第一目标行/列中的输入位置以及所述第一目标行/列中指定的字符,为所述笔划创建一个新的字符或者确定所述笔划归属的字符。

4、本发明第一个方面的技术效果是:提供了一种手写输入字符的处理方法,能够实现边输入边成字的效果,用户不需要借助明确或隐含的“开始单个文字输入”或“结束单个文字输入”的命令来区分不同的字符,因此,在书写过程中不需要每写完一个字必须停顿一段时间或者与系统进行某些交互,书写过程流畅,效率较高;并且,本方法中直接通过笔划的输入位置来确定笔划归属的字符,而不需要进行标准字符的识别,因此能够保留用户手写输入的个性化信息及书写风格和特征。

5、本发明的第二个方面是提供一种数据拆分方法,包括:

6、在接收到携带有待存储数据标识的存储请求时,根据预设元数据剥离规约,获取所述待存储数据标识对应的数据对象中的元数据,并将获取的元数据从所述数据对象中剥离;

7、根据预设数据内容拆分规约,将所述数据内容划分为至少两个数据片断。

8、本发明第二个方面的技术效果是:提供了一种数据拆分方法,将用户原始数据中的元数据与数据内容分开,并将数据内容划分为多个数据片断,加大了非法获取到用户原始数据的难度,更加可靠地实现了数据存储的安全性。

9、本发明的第三个方面是提供一种数据合并方法,包括:

10、接收携带有标识信息的数据对象获取请求;其中,所述标识信息包括定位信息,且所述定位信息用于定位所述数据对象中部分数据信息的存储地址;

11、获取所述定位信息对应的存储内容,并根据获取到的所述存储内容中的定位信息获取其他存储内容中数据信息,直到获取到所述数据对象的所有数据信息;

12、根据获取到的数据信息中的预设合并规约,将获取到的各个数据信息进行合并处理,得到所述数据对象。

13、本发明第三个方面的技术效果是:提供了一种数据合并方法,通过根据数据对象获取请求中的标识信息中所包含的定位信息,逐步定位获取到各个被拆分存储于各个存储体中的数据信息,从而将各个数据信息根据预设的合并规约进行合并处理,得到用户原始数据对象,从而保证了分散于各个存储体中的数据可以被高效、安全地获取到,保障了用户将分散数据成功合并为原始数据的可靠性。

14、本发明的第四个方面是提供一种编码处理方法,包括:

15、根据接收的编码处理请求,获取待编码的数据对象及其元数据;

16、根据编码仓库和所述数据对象及其元数据,获取所述数据对象的对象编码。

17、本发明第四个方面的技术效果是:通过根据接收的编码处理请求,获取待编码的数据对象及其元数据,并根据编码仓库和数据对象及其元数据,获取该数据对象的对象编码,由于可以依据数据对象的元数据和编码仓库,来实现对数据对象的编码,因此实现了灵活多样的编码方式。

18、本发明的第五个方面是提供一种解码处理方法,包括:

19、接收解码处理请求,并根据所述解码处理请求,获取待解码的对象编码;

20、对所述对象编码进行拆解,获取元编码,或者所述元编码和实例编码;

21、查询编码仓库,根据所述元编码获取对应的元数据和编码规约;

22、根据所述元数据和编码规约,或者所述元数据、编码规约和实例编码,获取与所述对象编码对应的数据对象。

23、本发明第五个方面的技术效果是:通过接收解码处理请求,并根据该解码处理请求,获取待解码的对象编码,对该对象编码进行拆解,获取元编码,或者该元编码和实例编码,查询编码仓库,根据该元编码获取对应的元数据和编码规约,并根据该元数据和编码规约,或者该元数据、编码规约和实例编码,获取与该对象编码对应的数据对象,由于利用元数据和编码仓库,实现对数据对象的编码,因此,不仅实现了灵活的编码方式,在一定程度上节省了空间,相应的,在解码过程中依据拆解的元编码,以及采用编码仓库,有效地提高了解码的效率。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1