输入方式识别方法、相关设备及可读存储介质与流程

文档序号:29468661发布日期:2022-04-02 04:11阅读:65来源:国知局
输入方式识别方法、相关设备及可读存储介质与流程

1.本技术涉及输入法技术领域,更具体的说,是涉及一种输入方式识别方法、相关设备及可读存储介质。


背景技术:

2.随着输入法的发展,各种输入法已经能够实现集语音、手写、拼音、笔画、双拼等多种不同的输入模式于一体,在开启键盘手写功能之后,用户在拼音、笔画、双拼等输入模式的键盘上输入时,需要识别用户的输入是按键输入方式产生的还是手写输入方式产生的。
3.目前,并不存在能够实现上述需求的一种输入方式识别方法。
4.因此,如何提供一种输入方式识别方法,以实现上述需求,成为本领域技术人员亟待解决的技术问题。


技术实现要素:

5.鉴于上述问题,本技术提出了一种输入方式识别方法、相关设备及可读存储介质。具体方案如下:
6.一种输入方式识别方法,所述方法包括:
7.获取用户在输入法键盘上生成的输入轨迹;
8.确定输入框特征、所述用户的历史输入行为特征、n次输入轨迹的操作特征以及所述输入轨迹的手写概率特征,所述n次输入轨迹包含所述输入轨迹以及所述输入轨迹之前产生的近n-1次历史输入轨迹;n为大于等于1的整数;
9.基于所述输入框特征、所述用户的历史输入行为特征、所述n次输入轨迹的操作特征以及所述输入轨迹的手写概率特征,确定所述输入轨迹对应的输入方式。
10.可选地,确定所述输入框特征,包括:
11.确定所述输入法键盘对应的输入框的属性;
12.基于所述输入法键盘对应的输入框的属性,确定所述输入框特征。
13.可选地,所述用户的历史输入行为特征,包括:
14.所述用户的输入模式历史使用频率特征、所述用户的历史输入笔画特征以及所述用户的手写字体特征中的一个或多个。
15.可选地,确定所述用户的输入模式历史使用频率特征,包括:
16.获取所述用户对每种输入模式的历史使用次数;
17.基于所述用户对每种输入模式的历史使用次数,计算得到所述用户对每种输入模式的历史使用频率;
18.所述用户对各种输入模式的历史使用频率,组合得到所述用户的输入模式历史使用频率特征。
19.可选地,确定所述用户的历史输入笔画特征,包括:
20.从所述用户的历史输入数据中,确定所述用户的手写首笔画样本数据;
21.针对每个手写首笔画样本数据,基于所述手写首笔画样本数据,确定所述手写首笔画样本数据的基本笔画特征、区域特征、压力特征、速度特征;
22.基于各个手写首笔画样本数据的基本笔画特征、区域特征、压力特征、速度特征,按照基本笔画聚合平均,得到所述用户的历史输入笔画特征。
23.可选地,确定所述用户的手写字体特征,包括:
24.基于所述用户的历史输入数据,确定所述用户的历史按键特征;
25.基于所述用户的历史按键特征,确定所述用户的手写字体类型;
26.基于所述用户的手写字体类型,确定所述用户的手写字体特征。
27.可选地,确定n次输入轨迹的操作特征,包括:
28.确定所述输入轨迹的轨迹特征;
29.基于所述输入轨迹的轨迹特征,生成所述输入轨迹的操作特征;
30.获取所述输入轨迹之前产生的近n-1次历史输入轨迹的操作特征;
31.将所述输入轨迹的操作特征,以及,所述输入轨迹之前产生的近n-1次输入轨迹的操作特征组合,得到所述n次输入轨迹的操作特征。
32.可选地,确定所述输入轨迹的手写概率特征,包括:
33.从所述用户的历史输入数据中确定所述用户的历史手写输入轨迹特征以及所述用户的历史键盘输入轨迹特征;
34.基于所述用户的历史手写输入轨迹的轨迹特征、所述用户的历史键盘输入轨迹的轨迹特征,以及所述输入轨迹的轨迹特征,确定所述输入轨迹的手写概率特征。
35.可选地,所述轨迹特征,包括:
36.速度特征、压力特征、重叠域特征、中心点偏移特征以及与上一次输入的时间间隔特征中的任意一种或多种。
37.可选地,所述n次输入轨迹的操作特征包括输入有效性维度、按键输入方式识别结果维度、手写输入方式识别结果维度,其他输入方式识别维度;则所述基于所述输入轨迹的轨迹特征,生成所述输入轨迹的操作特征,包括:
38.确定所述输入轨迹的输入有效性特征;
39.将所述输入轨迹的输入有效性特征填充到所述输入有效性维度,将所述输入轨迹的轨迹特征填充到所述其他输入方式识别结果维度;将所述按键输入方式识别结果维度、所述手写输入方式识别结果维度填充0,得到所述输入轨迹的操作特征。
40.可选地,在确定所述输入轨迹对应的输入方式之后,所述方法还包括:
41.获取所述输入轨迹的上屏结果;
42.基于所述输入轨迹的上屏结果,以及所述输入轨迹对应的输入方式,更新所述输入轨迹的操作特征并保存,作为对下次输入轨迹进行输入方式识别时的历史输入轨迹的操作特征。
43.可选地,所述基于所述输入框特征、所述用户的历史输入行为特征、所述n次输入轨迹的操作特征,确定所述输入轨迹对应的输入方式,包括:
44.将所述输入框特征、所述用户的历史输入行为特征、所述n次输入轨迹的操作特征以及所述输入轨迹的手写概率特征,输入至输入方式识别模型,所述输入方式识别模型输出所述输入轨迹对应的输入方式,所述输入方式识别模型以训练用输入轨迹对应的输入框
特征、用户的历史输入行为特征、n次输入轨迹的操作特征以及所述输入轨迹的手写概率特征为训练样本,以训练用输入轨迹标注的输入方式为样本标签,训练得到的。
45.一种输入方式识别装置,所述装置包括:
46.获取单元,用于获取用户在输入法键盘上生成的输入轨迹;
47.特征确定单元,用于确定输入框特征、所述用户的历史输入行为特征、n次输入轨迹的操作特征以及所述输入轨迹的手写概率特征,所述n次输入轨迹包含所述输入轨迹以及所述输入轨迹之前产生的近n-1次历史输入轨迹;n为大于等于1的整数;
48.输入方式确定单元,用于基于所述输入框特征、所述用户的历史输入行为特征、所述n次输入轨迹的操作特征以及所述输入轨迹的手写概率特征,确定所述输入轨迹对应的输入方式。
49.可选地,所述特征确定单元包括:输入框特征确定单元,所述输入框特征确定单元,用于:
50.确定所述输入法键盘对应的输入框的属性;
51.基于所述输入法键盘对应的输入框的属性,确定所述输入框特征。
52.可选地,所述用户的历史输入行为特征,包括:
53.所述用户的输入模式历史使用频率特征、所述用户的历史输入笔画特征以及所述用户的手写字体特征中的一个或多个。
54.可选地,所述特征确定单元包括:用户的输入模式历史使用频率特征确定单元,所述用户的输入模式历史使用频率特征确定单元,用于:
55.获取所述用户对每种输入模式的历史使用次数;
56.基于所述用户对每种输入模式的历史使用次数,计算得到所述用户对每种输入模式的历史使用频率;
57.所述用户对各种输入模式的历史使用频率,组合得到所述用户的输入模式历史使用频率特征。
58.可选地,所述特征确定单元包括:用户的历史输入笔画特征确定单元,所述用户的历史输入笔画特征确定单元,用于:
59.从所述用户的历史输入数据中,确定所述用户的手写首笔画样本数据;
60.针对每个手写首笔画样本数据,基于所述手写首笔画样本数据,确定所述手写首笔画样本数据的基本笔画特征、区域特征、压力特征、速度特征;
61.基于各个手写首笔画样本数据的基本笔画特征、区域特征、压力特征、速度特征,按照基本笔画聚合平均,得到所述用户的历史输入笔画特征。
62.可选地,所述特征确定单元包括:用户的手写字体特征确定单元,所述用户的手写字体特征确定单元,用于:
63.基于所述用户的历史输入数据,确定所述用户的历史按键特征;
64.基于所述用户的历史按键特征,确定所述用户的手写字体类型;
65.基于所述用户的手写字体类型,确定所述用户的手写字体特征。
66.可选地,所述特征确定单元包括:n次输入轨迹的操作特征确定单元,所述n次输入轨迹的操作特征确定单元,用于:
67.确定所述输入轨迹的轨迹特征;
68.基于所述输入轨迹的轨迹特征,生成所述输入轨迹的操作特征;
69.获取所述输入轨迹之前产生的近n-1次历史输入轨迹的操作特征;
70.将所述输入轨迹的操作特征,以及,所述输入轨迹之前产生的近n-1次输入轨迹的操作特征组合,得到所述n次输入轨迹的操作特征。
71.可选地,所述特征确定单元包括:输入轨迹的手写概率特征确定单元,所述输入轨迹的手写概率特征确定单元,用于:
72.从所述用户的历史输入数据中确定所述用户的历史手写输入轨迹特征以及所述用户的历史键盘输入轨迹特征;
73.基于所述用户的历史手写输入轨迹的轨迹特征、所述用户的历史键盘输入轨迹的轨迹特征,以及所述输入轨迹的轨迹特征,确定所述输入轨迹的手写概率特征。
74.可选地,所述轨迹特征,包括:
75.速度特征、压力特征、重叠域特征、中心点偏移特征以及与上一次输入的时间间隔特征中的任意一种或多种。
76.可选地,所述n次输入轨迹的操作特征包括输入有效性维度、按键输入方式识别结果维度、手写输入方式识别结果维度,其他输入方式识别维度;则所述n次输入轨迹的操作特征确定单元,具体用于:
77.确定所述输入轨迹的输入有效性特征;
78.将所述输入轨迹的输入有效性特征填充到所述输入有效性维度,将所述输入轨迹的轨迹特征填充到所述其他输入方式识别结果维度;将所述按键输入方式识别结果维度、所述手写输入方式识别结果维度填充0,得到所述输入轨迹的操作特征。
79.可选地,所述装置还包括:输入轨迹的操作特征更新保存单元,
80.所述输入轨迹的操作特征更新保存单元,用于在确定所述输入轨迹对应的输入方式之后,获取所述输入轨迹的上屏结果;基于所述输入轨迹的上屏结果,以及所述输入轨迹对应的输入方式,更新所述输入轨迹的操作特征并保存,作为对下次输入轨迹进行输入方式识别时的历史输入轨迹的操作特征。
81.可选地,所述输入方式确定单元,包括:
82.输入方式识别模型应用单元,用于将所述输入框特征、所述用户的历史输入行为特征、所述n次输入轨迹的操作特征以及所述输入轨迹的手写概率特征,输入至输入方式识别模型,所述输入方式识别模型输出所述输入轨迹对应的输入方式,所述输入方式识别模型以训练用输入轨迹对应的输入框特征、用户的历史输入行为特征、n次输入轨迹的操作特征以及所述输入轨迹的手写概率特征为训练样本,以训练用输入轨迹标注的输入方式为样本标签,训练得到的。
83.一种输入方式识别设备,包括存储器和处理器;
84.所述存储器,用于存储程序;
85.所述处理器,用于执行所述程序,实现如上所述的输入方式识别方法的各个步骤。
86.一种可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,实现如上所述的输入方式识别方法的各个步骤。
87.借由上述技术方案,本技术公开了一种输入方式识别方法、相关设备及可读存储介质。该方案中,在获取用户在输入法键盘上生成的输入轨迹之后,先确定输入框特征、所
述用户的历史输入行为特征、n次输入轨迹的操作特征以及所述输入轨迹的手写概率特征,然后基于上述特征确定该输入轨迹对应的输入方式。基于该方案,能够在用户开启键盘手写功能之后,识别用户在拼音、笔画、双拼等输入模式的键盘上的输入轨迹是按键输入方式产生的还是手写输入方式产生的。
附图说明
88.通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本技术的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
89.图1为本技术实施例公开的输入方式识别方法的流程示意图;
90.图2为本技术实施例公开的一种输入方式识别模型结构;
91.图3为本技术实施例公开的一种输入方式识别装置结构示意图;
92.图4为本技术实施例公开的一种输入方式识别设备的硬件结构框图。
具体实施方式
93.下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
94.接下来,通过下述实施例对本技术提供的输入方式识别方法进行介绍。
95.参照图1,图1为本技术实施例公开的输入方式识别方法的流程示意图,该方法可以包括:
96.步骤s101:获取用户在输入法键盘上生成的输入轨迹。
97.步骤s102:确定输入框特征、所述用户的历史输入行为特征、n次输入轨迹的操作特征以及所述输入轨迹的手写概率特征。
98.所述n次输入轨迹包含所述输入轨迹以及所述输入轨迹之前产生的近n-1次历史输入轨迹;n为大于等于1的整数。
99.在本技术中,输入框特征用于表征所述输入法键盘对应的输入框的属性,所述用户的历史输入行为特征用于表征所述用户的历史输入行为,n次输入轨迹的操作特征用于表征近n次输入轨迹的操作行为,输入轨迹的手写概率特征用于表征输入轨迹的手写概率。各个特征的具体确定方式将通过后续实施例详细说明,此处不再展开描述。
100.步骤s103:基于所述输入框特征、所述用户的历史输入行为特征、所述n次输入轨迹的操作特征以及所述输入轨迹的手写概率特征,确定所述输入轨迹对应的输入方式。
101.在本技术中,在确定输入框特征、所述用户的历史输入行为特征、n次输入轨迹的操作特征以及所述输入轨迹的手写概率特征之后,即可基于所述输入框特征、所述用户的历史输入行为特征、所述n次输入轨迹的操作特征以及所述输入轨迹的手写概率特征,确定所述输入轨迹对应的输入方式。具体实现方式将通过后续实施例详细说明,此处不再展开描述。
102.本实施例公开了一种输入方式识别方法,该方法中,在获取用户在输入法键盘上
生成的输入轨迹之后,先确定输入框特征、所述用户的历史输入行为特征、n次输入轨迹的操作特征以及所述输入轨迹的手写概率特征,然后基于上述特征确定该输入轨迹对应的输入方式。基于该方法,能够在用户开启键盘手写功能之后,识别用户在拼音、笔画、双拼等输入模式的键盘上的输入轨迹是按键输入方式产生的还是手写输入方式产生的。
103.在本技术的一个实施例中,对确定所述输入框特征的实现方式进行了介绍,该方式可以包括如下步骤:
104.步骤s201:确定所述输入法键盘对应的输入框的属性。
105.不同应用的输入框的属性不同,有的应用(如,即时聊天app)的输入框是聊天框,有的应用(如,浏览器)的输入框是搜索框,有的应用(如,记事本)的输入框是普通文本框等,在不同应用中,输入框的不同属性通过不同标识表示。用户在使用某个应用的过程中,如果有输入需求,会点击该应用的输入框,用户点击输入框后,输入法键盘弹起,用户即可在输入法键盘上进行输入操作,产生输入轨迹。在本技术中,输入法键盘对应的输入框即为触发输入法键盘弹起的输入框的属性。
106.步骤s202:基于所述输入法键盘对应的输入框的属性,确定所述输入框特征。
107.在本技术中,可以根据所述输入法键盘对应的输入框的属性,以及预设的全部输入框的属性,生成one-hot特征作为所述输入框特征。为便于理解,假设预设的全部输入框的属性有n种,如聊天框、搜索框、普通文本框等,则输入框特征为i表示输入框的不同属性对应的编码,所述输入法键盘对应的输入框的属性对应的编码为1,其他属性对应的编码为0,比如,i1对应的输入框属性为聊天框,所述输入法键盘对应的输入框的属性为聊天框,则所述输入框特征为(1,0,
……
,0)。
108.在本技术的一个实施例中,对确定所述用户的历史输入行为特征的实现方式进行了介绍,该方式可以包括:确定所述用户的输入模式历史使用频率特征、所述用户的历史输入笔画特征以及所述用户的手写字体特征中的一个或多个特征作为所述用户的历史输入行为特征。
109.其中,所述用户的手写字体特征用于表征用户的手写字体的连笔程度。作为一种可实施方式,连笔程度可以分为无连带笔画、连笔程度一般、连笔程度高这三种。
110.在本技术的一个实施例中,对确定所述用户的输入模式历史使用频率特征的方式进行了介绍,该方式可以包括如下步骤:
111.步骤s301:获取所述用户对每种输入模式的历史使用次数。
112.在本技术中,输入模式指的是:九键键盘输入、二十六键键盘输入、手写面板输入、九键键盘手写、二十六键键盘手写等。
113.步骤s302:基于所述用户对每种输入模式的历史使用次数,计算得到所述用户对每种输入模式的历史使用频率。
114.假设一共包含m种输入模式,所述用户对输入模式m的历史使用次数为numm,所述用户对所有输入模式的历史使用次数为num
all
,所述用户对所有输入模式的历史使用次数即为所述用户对各个输入模式的历史使用次数的和,则所述用户对输入模式m的历史使用频率可以采用如下公式计算得到:
[0115][0116]
步骤s303:所述用户对各种输入模式的历史使用频率,组合得到所述用户的输入模式历史使用频率特征。
[0117]
以上述步骤说明为例,假设一共包含m种输入模式,则,所述用户的输入模式历史使用频率特征为
[0118]
在本技术的一个实施例中,对确定所述用户的历史输入笔画特征的方式进行了介绍,该方式可以包括如下步骤:
[0119]
步骤s401:从所述用户的历史输入数据中,确定所述用户的手写首笔画样本数据。
[0120]
在本技术中,可以从所述用户的历史输入数据中筛选用户手写后选定上屏的数据,针对每个数据,从中提取得到首笔画采样点的信息集合作为所述用户的一个手写首笔画样本数据。需要说明的是,如果所述用户为新用户,所述用户的历史输入数据可以为目前所有用户的历史输入数据。
[0121]
需要说明的是,一个手写后选定上屏的数据中包括多个采样点的信息,每个采样点的信息包括x坐标、y坐标、采样点压力、采样点时间戳,数据样例如下:
[0122]
motionevent.x=263.30048;
[0123]
motionevent.y=419.67273;
[0124]
motionevent.pressure=0.2;
[0125]
t=1630553084000。
[0126]
在本技术中,可以基于用户手写后选定上屏的数据中各采样点的信息,计算各采样点之间x和y坐标的相对位移,并基于各采样点之间x和y坐标的相对位移,确定出首笔画采样点。
[0127]
作为一种可实施方式,如果从首个采样点开始连续多个采样点中,相邻两个采样点x和y坐标的相对位移均小于设定值,之后一个采样点与连续多个采样点中最后一个采样点的x和y坐标的相对位移超出设定值,则确定上述从首个采样点开始连续多个采样点为首笔画采样点。这一部分采样点的信息集合即为所述用户的一个手写首笔画样本。
[0128]
步骤s402:针对每个手写首笔画样本数据,基于所述手写首笔画样本数据,确定所述手写首笔画样本数据的基本笔画特征、区域特征、压力特征、速度特征。
[0129]
作为一种可实施方式,确定所述手写首笔画样本数据的基本笔画特征,包括:
[0130]
对所述手写首笔画样本数据的坐标进行标准化,得到标准化后的手写首笔画样本数据;将所述标准化后的手写首笔画样本数据,输入高斯混合模型,得到所述手写首笔画样本数据的基本笔画特征。
[0131]
作为一种对所述手写首笔画样本数据的坐标进行标准化的可实施方式,可以对所述手写首笔画样本数据对应的手写字的边缘进行处理,以长方形边框图定该手写字,将长方形边框左下角定点作为所述手写首笔画的起点坐标,各个采用点坐标使用起点坐标的相对坐标。
[0132]
作为一种可实施方式,确定所述手写首笔画样本数据的区域特征,包括:
[0133]
确定所述手写首笔画样本数据中所有采样点x坐标的最小值和最大值、y坐标的最
小值和最大值;基于所述手写首笔画样本数据中所有采样点x坐标的最小值和最大值、y坐标的最小值和最大值,确定所述手写首笔画样本数据的区域特征。
[0134]
为便于理解,假设x
left
表示一个手写首笔画样本数据中所有采样点x坐标的最小值,x
right
表示一个手写首笔画样本数据中所有采样点x坐标的最大值,y
up
表示一个手写首笔画样本数据中所有采样点y坐标的最大值,y
down
表示一个手写首笔画样本数据中所有采样点y坐标的最小值,则所述手写首笔画样本数据的区域特征为x
left
,x
right
,y
up
,y
down

[0135]
作为一种可实施方式,确定所述手写首笔画样本数据的压力特征,包括:基于所述手写首笔画样本数据中所有采样点的压力,计算所述手写首笔画样本数据中所有采样点的平均压力,作为所述手写首笔画样本数据的压力特征。
[0136]
作为一种可实施方式,确定所述手写首笔画样本数据的速度特征,包括:计算所述手写首笔画样本数据中,相邻采样点间的速度;基于各个相邻采样点间的速度,计算所述手写首笔画样本数据中所有采样点的平均速度,作为所述手写首笔画样本数据的速度特征。其中,相邻采样点间的速度可以基于相邻采样点间的距离和时间差计算得到。
[0137]
步骤s403:基于各个手写首笔画样本数据的基本笔画特征、区域特征、压力特征、速度特征,按照基本笔画聚合平均,得到所述用户的历史输入笔画特征。
[0138]
在本步骤中,可以将基本笔画相同的各个手写首笔画样本数据的基本笔画特征、区域特征、压力特征、速度特征进行平均,得到所述用户历史输入该基本笔画对应的基本笔画特征、区域特征、压力特征、速度特征,所述用户历史输入各个基本笔画对应的基本笔画特征、区域特征、压力特征、速度特征组合得到所述用户的历史输入笔画特征。
[0139]
为便于理解,基本笔画有48种,则所述用户的历史输入笔画特征可以如下表所示:
[0140][0141]
在本技术的一个实施例中,对确定所述用户的手写字体特征的方式进行了介绍,该方式可以包括如下步骤:
[0142]
步骤s501:基于所述用户的历史输入数据,确定所述用户的历史按键特征。
[0143]
在本技术中,可以基于所述用户的历史输入数据,确定所述用户的按键压力和按键速度作为所述用户的历史按键特征。
[0144]
步骤s502:基于所述用户的历史按键特征,确定所述用户的手写字体类型。
[0145]
在本技术中,可以将所述用户的历史按键特征输入训练好的分类模型,所述分类模型输出所述用户的手写字体类型,所述分类模型是以训练用按键特征为训练样本,以训练用按键特征标注的手写字体类型为样本标签训练得到的。
[0146]
作为一种可实施方式,手写字体类型可以包括无连带笔画、连笔程度一般、连笔程
度高三种。
[0147]
步骤s503:基于所述用户的手写字体类型,确定所述用户的手写字体特征。
[0148]
手写字体特征可以为三维特征,每个维度对应一个手写字体类型,比如,第一维对应无连带笔画、第二维对应连笔程度一般、第三维对应连笔程度高,如果用户的手写字体类型为连笔程度一般,则所述用户的手写字体特征为(0,1,0)。
[0149]
在本技术的另一个实施例中,对确定n次输入轨迹的操作特征的实现方式进行了介绍,该方式可以包括如下步骤:
[0150]
步骤s601:确定所述输入轨迹的轨迹特征;
[0151]
在本技术中,所述轨迹特征,包括:速度特征、压力特征、重叠域特征、中心点偏移特征以及与上一次输入的时间间隔特征中的任意一种或多种。
[0152]
作为一种可实施方式,可以确定用户在输入法键盘上生成输入轨迹时采用的输入模式,并获取所述输入模式下,输入法键盘上各按键的边缘坐标;以及,获取所述输入轨迹的采样点信息,其中,采样点信息包括采样点坐标、采样压力、采样时间,采样点信息可以从客户端中获取,以安卓客户端为例,每个采样点中可以通过motionevent类里的getx(),gety(),getpressure()方法分别获取x坐标,y坐标和压力数值,同时记录当前时间,输入轨迹信息记为((x1,y1,p1,t1),(x2,y2,p2,t2),...(xn,yn,pn,tn))。
[0153]
将所述输入轨迹的采样点两两组合,计算各组采样点瞬时速度,再基于各组采样点的瞬时速度,计算输入轨迹的速度特征。
[0154]
对所述输入轨迹的采样点的坐标进行分析,结合所述输入模式下,输入法键盘上各按键的边缘坐标,计算重叠域特征。
[0155]
对所述输入轨迹的采样点的坐标进行分析,结合所述输入模式下,输入法键盘上各按键的边缘坐标,计算中心点偏移特征。
[0156]
所述输入轨迹的与上一次输入的时间间隔特征可以基于本次输入轨迹的特定采样点的采样时间与上一次输入的输入轨迹的特定采样点的采样时间的时间间隔确定,特定采样点可以为首个采样点,也可以为最后一个采样点,对此,本技术不进行任何限定。
[0157]
作为一种可实施方式,可以基于公式s=(x
max-x
min
)(y
max-y
min
)/s
func
计算重叠域特征s,其中,x
max
为输入轨迹x坐标最大值,其他值含义以此类推,s
func
为基于所述输入模式下,输入法键盘上各按键的边缘坐标计算得出的按键区域面积,若输入轨迹坐标同时穿越多个按键区域,则s
func
为多个按键区域的面积和。
[0158]
作为一种可实施方式,可以基于以下公式计算中心点偏移特征d:
[0159][0160]
d=max{distance1,distance2,...,distancei}
[0161]
其中,(xcentre,ycentre)表示按键中心点的坐标,若输入轨迹只穿过一个按键区域,则计算输入轨迹中心点与该按键中心点的直线距离作为中心点偏移特征,如果穿过多个按键区域,取轨迹中心点与各按键中心点的直线距离的最大值作为中心点偏移特征。
[0162]
步骤s602:基于所述输入轨迹的轨迹特征,生成所述输入轨迹的操作特征。
[0163]
在本技术中,所述n次输入轨迹的操作特征包括输入有效性维度、按键输入方式识
别结果维度、手写输入方式识别结果维度,其他输入方式识别维度;则所述基于所述输入轨迹的轨迹特征,生成所述输入轨迹的操作特征,包括:确定所述输入轨迹的输入有效性特征;将所述输入轨迹的输入有效性特征填充到所述输入有效性维度,将所述输入轨迹的轨迹特征填充到所述其他输入方式识别结果维度;将所述按键输入方式识别结果维度、所述手写输入方式识别结果维度填充0,得到所述输入轨迹的操作特征。
[0164]
需要说明的是,在本技术中,所述输入轨迹的输入有效性特征为预设的有效性特征(比如,0.5)。
[0165]
步骤s603:获取所述输入轨迹之前产生的近n-1次历史输入轨迹的操作特征。
[0166]
在本技术中,所述输入轨迹之前产生的近n-1次历史输入轨迹的操作特征可以为预先存储的,所述输入轨迹之前产生的近n-1次历史输入轨迹的操作特征中,每次历史输入轨迹的操作特征的输入有效性维度填充有输入有效性特征,作为一种可实施方式,如果该历史输入轨迹在识别后选中上屏,则确定其输入有效性特征为1,如果该历史输入轨迹在识别后未选中上屏,则确定其输入有效性特征为0。每次历史输入轨迹的输入识别结果对应的输入方式识别结果维度填充有本次历史输入轨迹的轨迹特征;本次历史输入识别结果不对应的输入方式识别结果维度填充的特征为0。
[0167]
步骤s604:将所述输入轨迹的操作特征,以及,所述输入轨迹之前产生的近n-1次输入轨迹的操作特征组合,得到所述n次输入轨迹的操作特征。
[0168]
为便于理解,假设n=3,n次输入轨迹的操作特征可以如下表所示:
[0169][0170][0171]
其中,[v,p,s,d,t]表示输入轨迹或历史输入轨迹的轨迹特征。
[0172]
在本技术的另一个实施例中,对确定所述输入轨迹的手写概率特征的具体方式进行了介绍,该方式可以包括以下步骤:
[0173]
步骤s701:从所述用户的历史输入数据中确定所述用户的历史手写输入轨迹特征以及所述用户的历史键盘输入轨迹特征。
[0174]
需要说明的是,上述实施例中以用户在输入法键盘上生成的输入轨迹为例,对轨迹特征的生成方式进行了说明,所述用户的历史手写输入轨迹的轨迹特征、所述用户的历史键盘输入轨迹的轨迹特征的计算方式均可参考该方式,本技术中不再赘述。
[0175]
步骤s702:基于所述用户的历史手写输入轨迹的轨迹特征、所述用户的历史键盘输入轨迹的轨迹特征,以及所述输入轨迹的轨迹特征,确定所述输入轨迹的手写概率特征。
[0176]
作为一种可实施方式,可基于以下公式计算所述输入轨迹的手写概率特征p
handwriting

[0177]
p
handwriting
=(sim(trace
input
,tracei),sim(trace
his
,tracei))
[0178]
其中,trace
input
为所述用户的历史键盘输入轨迹的轨迹特征;trace
his
为所述用户的历史手写输入轨迹的轨迹特征;tracei为所述输入轨迹的轨迹特征。
[0179]
在本技术的另一个实施例中,在确定所述输入轨迹对应的输入方式之后,所述方法还包括:获取所述输入轨迹的上屏结果;基于所述输入轨迹的上屏结果,以及所述输入轨迹对应的输入方式,更新所述输入轨迹的操作特征并保存,作为对下次输入轨迹进行输入方式识别时的历史输入轨迹的操作特征。
[0180]
需要说明的是,更新所述输入轨迹的操作特征,包括,基于所述输入轨迹的上屏结果确定所述输入轨迹的输入有效性特征,以及,基于所述输入轨迹对应的输入方式,确定其轨迹特征的填充维度,具体方式可参见n-1次历史输入轨迹的操作特征的相关介绍,此处不再赘述。
[0181]
在本技术的另一个实施例中,对基于所述输入框特征、所述用户的历史输入行为特征、所述n次输入轨迹的操作特征,确定所述输入轨迹对应的输入方式的方式进行了介绍,该方式可以包括:
[0182]
将所述输入框特征、所述用户的历史输入行为特征、所述n次输入轨迹的操作特征以及所述输入轨迹的手写概率特征,输入至输入方式识别模型,所述输入方式识别模型输出所述输入轨迹对应的输入方式,所述输入方式识别模型以训练用输入轨迹对应的输入框特征、用户的历史输入行为特征、n次输入轨迹的操作特征以及所述输入轨迹的手写概率特征为训练样本,以训练用输入轨迹标注的输入方式为样本标签,训练得到的。
[0183]
需要说明的是,输入方式识别模型可以采用多种神经网络模型结构。
[0184]
作为一种可实施方式,请参阅附图2,图2为本技术实施例公开的一种输入方式识别模型结构,基于图2所示的输入方式识别模型,所述用户的历史输入笔画特征通过embedding模块后,与经过两层隐层的n次输入轨迹的操作特征联合,输入attention模块;输入框特征,所述用户的输入模式历史使用频率特征,所述用户的手写字体特征,所述输入轨迹的手写概率特征联合后输入隐层,最终两部分向量拼接经softmax层输出二维预测结果y。
[0185]
下面对本技术实施例公开的输入方式识别装置进行描述,下文描述的输入方式识别装置与上文描述的输入方式识别方法可相互对应参照。
[0186]
参照图3,图3为本技术实施例公开的一种输入方式识别装置结构示意图。如图3所示,该输入方式识别装置可以包括:
[0187]
获取单元31,用于获取用户在输入法键盘上生成的输入轨迹;
[0188]
特征确定单元32,用于确定输入框特征、所述用户的历史输入行为特征、n次输入轨迹的操作特征以及所述输入轨迹的手写概率特征,所述n次输入轨迹包含所述输入轨迹以及所述输入轨迹之前产生的近n-1次历史输入轨迹;n为大于等于1的整数;
[0189]
输入方式确定单元33,用于基于所述输入框特征、所述用户的历史输入行为特征、所述n次输入轨迹的操作特征以及所述输入轨迹的手写概率特征,确定所述输入轨迹对应的输入方式。
[0190]
作为一种可实施方式,所述特征确定单元包括:输入框特征确定单元,所述输入框特征确定单元,用于:
[0191]
确定所述输入法键盘对应的输入框的属性;
[0192]
基于所述输入法键盘对应的输入框的属性,确定所述输入框特征。
[0193]
作为一种可实施方式,所述用户的历史输入行为特征,包括:
[0194]
所述用户的输入模式历史使用频率特征、所述用户的历史输入笔画特征以及所述用户的手写字体特征中的一个或多个。
[0195]
作为一种可实施方式,所述特征确定单元包括:用户的输入模式历史使用频率特征确定单元,所述用户的输入模式历史使用频率特征确定单元,用于:
[0196]
获取所述用户对每种输入模式的历史使用次数;
[0197]
基于所述用户对每种输入模式的历史使用次数,计算得到所述用户对每种输入模式的历史使用频率;
[0198]
所述用户对各种输入模式的历史使用频率,组合得到所述用户的输入模式历史使用频率特征。
[0199]
作为一种可实施方式,所述特征确定单元包括:用户的历史输入笔画特征确定单元,所述用户的历史输入笔画特征确定单元,用于:
[0200]
从所述用户的历史输入数据中,确定所述用户的手写首笔画样本数据;
[0201]
针对每个手写首笔画样本数据,基于所述手写首笔画样本数据,确定所述手写首笔画样本数据的基本笔画特征、区域特征、压力特征、速度特征;
[0202]
基于各个手写首笔画样本数据的基本笔画特征、区域特征、压力特征、速度特征,按照基本笔画聚合平均,得到所述用户的历史输入笔画特征。
[0203]
作为一种可实施方式,所述特征确定单元包括:用户的手写字体特征确定单元,所述用户的手写字体特征确定单元,用于:
[0204]
基于所述用户的历史输入数据,确定所述用户的历史按键特征;
[0205]
基于所述用户的历史按键特征,确定所述用户的手写字体类型;
[0206]
基于所述用户的手写字体类型,确定所述用户的手写字体特征。
[0207]
作为一种可实施方式,所述特征确定单元包括:n次输入轨迹的操作特征确定单元,所述n次输入轨迹的操作特征确定单元,用于:
[0208]
确定所述输入轨迹的轨迹特征;
[0209]
基于所述输入轨迹的轨迹特征,生成所述输入轨迹的操作特征;
[0210]
获取所述输入轨迹之前产生的近n-1次历史输入轨迹的操作特征;
[0211]
将所述输入轨迹的操作特征,以及,所述输入轨迹之前产生的近n-1次输入轨迹的操作特征组合,得到所述n次输入轨迹的操作特征。
[0212]
作为一种可实施方式,所述特征确定单元包括:输入轨迹的手写概率特征确定单元,所述输入轨迹的手写概率特征确定单元,用于:
[0213]
从所述用户的历史输入数据中确定所述用户的历史手写输入轨迹特征以及所述用户的历史键盘输入轨迹特征;
[0214]
基于所述用户的历史手写输入轨迹的轨迹特征、所述用户的历史键盘输入轨迹的轨迹特征,以及所述输入轨迹的轨迹特征,确定所述输入轨迹的手写概率特征。
[0215]
作为一种可实施方式,所述轨迹特征,包括:
[0216]
速度特征、压力特征、重叠域特征、中心点偏移特征以及与上一次输入的时间间隔特征中的任意一种或多种。
[0217]
作为一种可实施方式,所述n次输入轨迹的操作特征包括输入有效性维度、按键输入方式识别结果维度、手写输入方式识别结果维度,其他输入方式识别维度;则所述n次输入轨迹的操作特征确定单元,具体用于:
[0218]
确定所述输入轨迹的输入有效性特征;
[0219]
将所述输入轨迹的输入有效性特征填充到所述输入有效性维度,将所述输入轨迹的轨迹特征填充到所述其他输入方式识别结果维度;将所述按键输入方式识别结果维度、所述手写输入方式识别结果维度填充0,得到所述输入轨迹的操作特征。
[0220]
作为一种可实施方式,所述装置还包括:输入轨迹的操作特征更新保存单元,
[0221]
所述输入轨迹的操作特征更新保存单元,用于在确定所述输入轨迹对应的输入方式之后,获取所述输入轨迹的上屏结果;基于所述输入轨迹的上屏结果,以及所述输入轨迹对应的输入方式,更新所述输入轨迹的操作特征并保存,作为对下次输入轨迹进行输入方式识别时的历史输入轨迹的操作特征。
[0222]
作为一种可实施方式,所述输入方式确定单元,包括:
[0223]
输入方式识别模型应用单元,用于将所述输入框特征、所述用户的历史输入行为特征、所述n次输入轨迹的操作特征以及所述输入轨迹的手写概率特征,输入至输入方式识别模型,所述输入方式识别模型输出所述输入轨迹对应的输入方式,所述输入方式识别模型以训练用输入轨迹对应的输入框特征、用户的历史输入行为特征、n次输入轨迹的操作特征以及所述输入轨迹的手写概率特征为训练样本,以训练用输入轨迹标注的输入方式为样本标签,训练得到的。
[0224]
参照图4,图4为本技术实施例提供的输入方式识别设备的硬件结构框图,参照图4,输入方式识别设备的硬件结构可以包括:至少一个处理器1,至少一个通信接口2,至少一个存储器3和至少一个通信总线4;
[0225]
在本技术实施例中,处理器1、通信接口2、存储器3、通信总线4的数量为至少一个,且处理器1、通信接口2、存储器3通过通信总线4完成相互间的通信;
[0226]
处理器1可能是一个中央处理器cpu,或者是特定集成电路asic(application specific integrated circuit),或者是被配置成实施本发明实施例的一个或多个集成电路等;
[0227]
存储器3可能包含高速ram存储器,也可能还包括非易失性存储器(non-volatile memory)等,例如至少一个磁盘存储器;
[0228]
其中,存储器存储有程序,处理器可调用存储器存储的程序,所述程序用于:
[0229]
获取用户在输入法键盘上生成的输入轨迹;
[0230]
确定输入框特征、所述用户的历史输入行为特征、n次输入轨迹的操作特征以及所述输入轨迹的手写概率特征,所述n次输入轨迹包含所述输入轨迹以及所述输入轨迹之前产生的近n-1次历史输入轨迹;n为大于等于1的整数;
[0231]
基于所述输入框特征、所述用户的历史输入行为特征、所述n次输入轨迹的操作特征以及所述输入轨迹的手写概率特征,确定所述输入轨迹对应的输入方式。
[0232]
可选的,所述程序的细化功能和扩展功能可参照上文描述。
[0233]
本技术实施例还提供一种可读存储介质,该可读存储介质可存储有适于处理器执行的程序,所述程序用于:
[0234]
获取用户在输入法键盘上生成的输入轨迹;
[0235]
确定输入框特征、所述用户的历史输入行为特征、n次输入轨迹的操作特征以及所述输入轨迹的手写概率特征,所述n次输入轨迹包含所述输入轨迹以及所述输入轨迹之前产生的近n-1次历史输入轨迹;n为大于等于1的整数;
[0236]
基于所述输入框特征、所述用户的历史输入行为特征、所述n次输入轨迹的操作特征以及所述输入轨迹的手写概率特征,确定所述输入轨迹对应的输入方式。
[0237]
可选的,所述程序的细化功能和扩展功能可参照上文描述。
[0238]
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
[0239]
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。
[0240]
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本技术。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本技术的精神或范围的情况下,在其它实施例中实现。因此,本技术将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1