1.一种rdp窗口标题文字识别的方法,其特征在于,所述方法包含:
定义文字转换表,其中包含字形特征信息和对应的字符编码信息;
截获、解析包含rdp窗口标题的rdp协议数据,提取出rdp窗口标题中的字形特征信息数据;
将所述rdp窗口标题中的字形特征信息数据输入所述文字转换表,通过查表,获得相对应的字符编码信息数据;
将所述rdp窗口标题的字符编码信息数据存储至数据库中。
2.根据权利要求1所述的方法,其特征在于,所述定义文字转换表的方法包含:
将所述字形特征信息以二进制数表示;
将所述字形特征信息逐一转换为唯一的统一查询码,所述统一查询码是位数为常数c的二进制数;转换所述统一查询码的转换规则具体为:设所述表示字形特征信息的二进制数的最大位数值为c;若待转换的所述表示字形特征信息的二进制数的位数等于c,则所述统一查询码等于所述表示字形特征信息的二进制数;否则,所述统一查询码等于所述表示字形特征信息的二进制数通过补位算法转换成为的位数等于c的二进制数;
将所述字形特征信息及所述统一查询码与其相对应的所述字符编码信息一一对应,生成文字转换表;
将所述文字转换表以二叉树的数据结构存储,所述文字转换表的所述统一查询码存储成二叉树的节点,所述文字转换表中的所述字符编码信息存储成二叉树的叶子节点。
3.根据权利要求2所述的方法,其特征在于,所述将所述rdp窗口标题中的字形特征信息数据输入所述文字转换表,通过查表,获得相应的字符编码信息数据的方法包含:
将所述rdp窗口标题中的字形特征信息数据以二进制数表示;
将所述表示rdp窗口标题中的字形特征信息数据的二进制数按照所述转换统一查询码的转换规则并使用所述补位算法转换为所述统一查询码数据;
将所述统一查询码数据输入所述文字转换表,所述文字转换表以二叉树的数据结构存储;按顺序将所述统一查询码数据的每一位数字与从所述二叉树的根开始的节点一一匹配,形成路径,查找到叶子节点,获得所述rdp窗口标题的字符编码信息数据。
4.根据权利要求1所述的方法,其特征在于,所述定义文字转换表的方法还包含:
将所述字形特征信息以二进制数表示;
将所述字形特征信息和对应的所述字符编码信息,生成一条文字转换记录;
将多条所述文字转换记录组成一张所述文字转换表,其中每条所述文字转换记录中包含的所述表示字形特征信息的二进制数的位数相同;所述文字转换记录中包含的所述表示字形特征信息的二进制数的位数不同,可组成多张所述文字转换表;多张所述文字转换表组成文字转换库;
将每张所述文字转换表分别以二叉树的数据结构存储,所述文字转换表的所述表示字形特征信息存储成二叉树的节点,所述文字转换表中的所述字符编码信息存储成二叉树的叶子节点。
5.根据权利要求4所述的方法,其特征在于,所述将所述rdp窗口标题中的字形特征信息数据输入所述文字转换表,通过查表,获得相应的rdp窗口标题的字符编码信息数据的方法还包含:
将所述rdp窗口标题中的字形特征信息数据以二进制数表示;
按照所述表示rdp窗口标题中的字形特征信息的二进制数的位数,在所述文字转换库中匹配相应的所述文字转换表;
将所述表示rdp窗口标题中的字形特征信息的二进制数输入相匹配的所述文字转换表,所述文字转换表以二叉树的数据结构存储;按顺序将所述表示rdp窗口标题中的字形特征信息的二进制数的每一位数字与从所述二叉树的根开始的节点一一匹配,形成路径,查找到叶子节点,获得所述rdp窗口标题的字符编码信息数据。
6.一种rdp窗口标题文字识别的装置,其特征在于,包含:
转换表定义单元,用于定义文字转换表,其中包含字形特征信息和字符编码信息;
数据提取单元,用于截获、解析包含rdp窗口标题的rdp协议数据,提取出rdp窗口标题的字形特征信息数据;
文字识别单元,用于将从数据提取单元取得的所述rdp窗口标题的字形特征信息数据,输入从转换表定义单元取得的文字转换表,通过查找所述的文字转换表,获得相应的字符编码信息数据,并保存到数据库中。
7.根据权利要求6所述的装置,其特征在于,所述转换表定义单元包含:
字形特征信息数据化模块,用于将所述字形特征信息以二进制数表示;
统一查询码生成模块,用于将从字形特征信息数据化模块取得的所述字形特征信息逐一转换为唯一的统一查询码,所述统一查询码是位数为常数c的二进制数;转换所述统一查询码的转换规则具体为:设所述表示字形特征信息的二进制数的最大位数为c;若待转换的所述表示字形特征信息的二进制数的位数等于c,则所述统一查询码等于所述表示字形特征信息的二进制数;否则,所述统一查询码等于所述表示字形特征信息的二进制数通过补位算法转换成为的位数等于c的二进制数;
文字转换表生成模块,用于将从字形特征信息数据化模块取得的所述字形特征信息及从统一查询码生成模块取得的所述统一查询码与其相对应的所述字符编码信息一一对应,生成文字转换表;
文字转换表存储模块,用于将从文字转换表生成模块取得的所述文字转换表以二叉树的数据结构存储,所述文字转换表的所述统一查询码存储成二叉树的节点,所述文字转换表中的所述字符编码信息存储成二叉树的叶子节点。
8.根据权利要求6所述的装置,其特征在于,所述文字识别单元包含:
字形特征信息数据二进制化模块,用于将从数据提取单元取得的所述rdp窗口标题中的字形特征信息数据以二进制数表示;
统一查询码数据转换模块,用于将从字形特征信息数据二进制化模块取得的所述表示rdp窗口标题中的字形特征信息数据的二进制数按照所述转换统一查询码的转换规则并使用所述补位算法转换为所述统一查询码数据;
查询模块一,用于将从统一查询码数据转换模块取得的所述统一查询码数据输入从文字转换表存储模块取得的所述文字转换表,所述文字转换表以二叉树的数据结构存储;按顺序将所述统一查询码数据的每一位数字与从所述二叉树的根开始的节点一一匹配,形成路径,查找到叶子节点,获得所述rdp窗口标题的字符编码信息数据;并保存到数据库中。
9.根据权利要求6所述的装置,其特征在于,所述转换表定义单元还包含:
字形特征信息数据化模块,用于将所述字形特征信息以二进制数表示;
文字转换库生成模块,用于将从字形特征信息数据化模块取得的所述字形特征信息与其相对应的所述字符编码信息对应,生成一条文字转换记录;将多条所述文字转换记录组成一张所述文字转换表,其中每条所述文字转换记录中包含的所述表示字形特征信息的二进制数的位数相同;所述文字转换记录中包含的所述表示字形特征信息的二进制数的位数不同,可组成多张所述文字转换表;多张所述文字转换表组成文字转换库;
文字转换库存储模块,用于将从文字转换库生成模块取得的每张所述文字转换表分别以二叉树的数据结构存储,所述文字转换表的所述表示字形特征信息存储成二叉树的节点,所述文字转换表中的所述字符编码信息存储成二叉树的叶子节点。
10.根据权利要求6所述的装置,其特征在于,所述文字识别单元还包含:
字形特征信息数据二进制化模块,用于将从数据提取单元取得的所述rdp窗口标题中的字形特征信息数据以二进制数表示;
匹配模块,用于按照从字形特征信息数据二进制化模块取得的所述表示rdp窗口标题中的字形特征信息的二进制数的位数,在从文字转换库存储模块取得的所述文字转换库中匹配相应的所述文字转换表;并将所述文字转换表的特征属性信息发送给查询模块二;
查询模块二,用于将从字形特征信息数据二进制化模块取得的所述表示rdp窗口标题中的字形特征信息的二进制数输入从文字转换库存储模块取得的相匹配的所述文字转换表,所述文字转换表以二叉树的数据结构存储,按顺序将所述表示rdp窗口标题中的字形特征信息的二进制数的每一位数字与从所述二叉树的根开始的节点一一匹配,形成路径,查找到叶子节点,获得所述rdp窗口标题的字符编码信息数据;并保存到数据库中。