翻译方法、装置、存储介质及电子设备与流程

文档序号:28501019发布日期:2022-01-15 04:53阅读:74来源:国知局
翻译方法、装置、存储介质及电子设备与流程

1.本技术涉及计算机技术领域,尤其涉及一种翻译方法、装置、存储介质及电子设备。


背景技术:

2.随着通信技术的发展,越来越多的用户开始使用终端进行影音娱乐体验。用户在日常使用终端的过程中,当用户浏览终端显示界面上的信息诸如遇到看不懂、难以理解的信息时,通常涉及到对这些信息进行翻译的过程。


技术实现要素:

3.本技术实施例提供了一种翻译方法、装置、存储介质及电子设备,所述技术方案如下:
4.第一方面,本技术实施例提供了一种翻译方法,所述方法包括:
5.确定显示页面中的至少一个区域,所述至少一个区域基于对所述显示页面的字符划分结果确定;
6.从所述至少一个区域中确定待识别区域,并获取所述待识别区域中的待识别字符集的翻译结果;
7.显示对所述待识别区域中待识别字符集的翻译结果。
8.第二方面,本技术实施例提供了一种翻译装置,所述装置包括:
9.区域确定模块,用于确定显示页面中的至少一个区域,所述至少一个区域基于对所述显示页面的字符划分结果确定;
10.结果获取模块,用于从所述至少一个区域中确定待识别区域,并获取所述待识别区域中的待识别字符集的翻译结果;
11.结果显示模块,用于显示对所述待识别区域中待识别字符集的翻译结果。
12.第三方面,本技术实施例提供一种计算机存储介质,所述计算机存储介质存储有多条指令,所述指令适于由处理器加载并执行上述的方法步骤。
13.第四方面,本技术实施例提供一种电子设备,可包括:处理器和存储器;其中,所述存储器存储有计算机程序,所述计算机程序适于由所述处理器加载并执行上述的方法步骤。
14.本技术一些实施例提供的技术方案带来的有益效果至少包括:
15.在本技术一个或多个实施例中,终端先确定显示页面中的至少一个区域,通常所述至少一个区域基于对所述显示页面的字符划分结果确定,然后从至少一个区域中确定待识别区域,并获取所述待识别区域中的待识别字符集的翻译结果,最后显示翻译结果。整个翻译过程不需要用户全程逐个框定待识别区域,通过从至少一个区域中预测的用户可能期望选中的待识别区域,就可以实现在用户不框定翻译区域的情况下快速翻译,可以缩短翻译过程中的区域操作路径,节省区域选择时间,提升了翻译的便捷性。
附图说明
16.为了更清楚地说明本技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
17.图1是本技术实施例提供的一种翻译方法的流程示意图;
18.图2a是本技术实施例提供的一种翻译方法的流程示意图;
19.图2b是本技术实施例提供的一种终端显示界面的界面示意图;
20.图3是本技术实施例提供的一种以文本段落划分区域的界面示意图;
21.图4是本技术实施例提供的另一种翻译方法的流程示意图;
22.图5是本技术实施例提供的一种区域确定的界面示意图;
23.图6是本技术实施例提供的一种初始识别区域的界面示意图;
24.图7是本技术实施例提供的另一种翻译方法的流程示意图;
25.图8是本技术实施例提供的一种待识别区域的界面示意图;
26.图9是本技术实施例提供的一种终端显示翻译结果的界面示意图;
27.图10是本技术实施例提供的一种翻译装置的结构示意图;
28.图11是本技术实施例提供的一种区域确定模块的结构示意图;
29.图12是本技术实施例提供的第二确定单元的结构示意图;
30.图13是本技术实施例提供的一种电子设备的结构示意图;
31.图14是本技术实施例提供的操作系统和用户空间的结构示意图;
32.图15是图13中安卓操作系统的架构图;
33.图16是图13中ios操作系统的架构图。
具体实施方式
34.下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
35.在本技术的描述中,需要理解的是,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。在本技术的描述中,需要说明的是,除非另有明确的规定和限定,“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本技术中的具体含义。此外,在本技术的描述中,除非另有说明,“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
36.下面结合具体的实施例对本技术进行详细说明。
37.在一个实施例中,如图1所示,特提出了一种翻译方法,该方法可依赖于计算机程序实现,可运行于基于冯诺依曼体系的翻译装置上。该计算机程序可集成在应用中,也可作为独立的工具类应用运行。所述翻译装置可以为终端,包括但不限于:个人电脑、平板电脑、手持设备、车载设备、可穿戴设备、计算设备或连接到无线调制解调器的其它处理设备等。在不同的网络中终端设备可以叫做不同的名称,例如:用户设备、接入终端、用户单元、用户站、移动站、移动台、远方站、远程终端、移动设备、用户终端、终端、无线通信设备、用户代理或用户装置、蜂窝电话、无绳电话、5g网络或未来演进网络中的终端等。
38.具体的,该翻译方法包括:
39.s001:确定显示页面中的至少一个区域,所述至少一个区域基于对所述显示页面的字符划分结果确定。
40.在一些场景中,用户对显示界面中待识别区域中的字符进行翻译,待识别区域全程需要用户自己框选,可以理解为设备需要用户精准对待识别的待识别区域输入用于区域框选的操作,例如以用户输入滑动操作为例,用户需要从滑动起点一直维持滑动操作至滑动终点,从而完成对滑动起点至滑动终点所对应的待识别区域的选中,整个过程用户需要精准框定整个区域,选定对应的翻译区域操作路径过长、区域选择时间也较长、翻译过程繁琐;
41.在一个或多个实施例中,显示页面中的至少一个区域可以是在生成显示页面时预先设置好的,这些区域通过对显示页面的字符划分结果确定。字符划分结果可以理解为在生成显示页面时所设置的参考待识别字符集,如参考待识别字符集可以是显示页面中的参考句子、参考段落、参考字词等等。这些参考待识别字符集为预先对显示页面进行字符显示信息识别或字符显示信息理解,而标注的用户在浏览显示页面时可能选中的参考待识别字符集,从而以参考待识别字符集作为字符划分结果,字符划分结果在显示界面上所处的显示位置也即所述区域。可以理解为,终端在用户触发翻译功能时,基于针对显示页面设置的至少一个字符划分结果,来获取至少一个字符划分结果分别对应的区域;具体实施中,用户可以针对显示页面输入第一触发操作来触发翻译功能,终端可以响应于针对显示页面的第一触发操作,然后获取所述显示页面中的至少一个区域,也即基于针对显示页面设置的至少一个字符划分结果,来获取至少一个字符划分结果分别对应的区域。
42..在一个或多个实施例中,显示页面中的至少一个区域也可以是实时确定的,可以理解的,在用户触发翻译功能时,终端基于对显示页面的字符划分结果来确定至少一个区域;例如,终端对显示页面进行字符显示信息识别或字符显示信息理解,确定用户在浏览显示页面时可能选中的参考待识别字符集,从而以参考待识别字符集作为字符划分结果,字符划分结果在显示界面上所处的显示位置也即所述区域。
43.s002:从所述至少一个区域中确定待识别区域,并获取所述待识别区域中的待识别字符集的翻译结果。
44.可以理解的,终端可以在用户触发翻译功能(或翻译服务)而用户未选定或即将选定待识别区域之前,确定显示页面中的至少一个区域,以预测用户在翻译时所可能选择的待识别区域(也即用户期望翻译的区域),结合用户触发翻译功能后的输入操作可从至少一个区域中确定待识别区域,对待识别区域中的待识别字符集进行翻译。例如可以基于触发翻译功能后用户输入操作的操作位移位置确定距离最近的所述区域作为待识别区域,这样
可节省用户框定待识别区域的时间,节省了用户的区域选择时间。
45.在一些实施例中,终端在用户触发翻译功能(或翻译服务)确定至少一个区域之后,基于用户的输入操作来确定待识别区域。其中,用户触发翻译功能的操作和后续用户的输入操作可以是一个连续的翻译输入操作,也就是说该翻译输入操作在操作时间内对应两个操作过程:一个是触发翻译功能的操作过程,一个是框选或选择待识别区域的过程。
46.可以理解的,针对整个翻译过程,用户选中某个待识别区域进行翻译,通常会在显示界面中的特定位置来进行区域框选,该特定位置通常为期望识别区域的关键位置,如初始位置、终点位置、中间位置等等,在一些实施例中,终端检测到翻译功能的触发操作之后还获取触发操作指示的操作位移位置。
47.例如:用户拖动用于翻译的控件至待识别的特定位置处然后在特定位置处手动框选待识别区域;这个过程中,一般用户从特定位置开始选中界面中的某个区域作为待识别区域。
48.在这个过程中,通过执行本技术的翻译方法可以缩短用户“手动框选待识别区域”的流程,在用户触发翻译的控件时终端确定至少一个区域,同时监测用户输入操作的操作位移位置,(操作位移位置的获取可以是操作特征参数落入参考参数范围内时操作所指示的位置,如操作力度大于某个力度阈值、操作停留时间大于某个时间阈值、操作终点位置等),终端即可确定距离操作位移位置最近的所述区域作为待识别区域,待识别区域对于用户而言通常高概率可以覆盖到用户下一步即将手动框选的期望识别区域。可以理解的,可避免用户全程对期望识别区域的框选,节省了翻译的用户操作路径,也提高了翻译的效率。
49.在一些实施方式中,终端可以将“基于操作位移位置从至少一个区域确定的目标区域”作为初始识别区域,对初始识别区域进行选中显示处理,所述选中显示处理也即以预设的选中显示方式对初始识别区域进行选中渲染,如对初始识别区域进行背景选中,对初始识别区域中的信息加载选中框等等。可以理解的,此时通常终端显示的初始识别区域高概率为用户期望选中识别的区域,用户此时无需进行区域框选,终端已经预先预测且显示出用户所期望的识别区域,在用户对该初始识别区域进行确认,则该初始识别区域即为待识别区域;进一步的,用户还可在初始识别区域上进行微调,以得到调整之后的待识别区域。整个过程无需从特定位置开始至选择出界面区域的识别终点位置来作为待识别区域。
50.可以理解的,终端从所述至少一个区域中确定待识别区域,并获取所述待识别区域中所有的字符作为待识别字符集,然后对待识别字符集进行翻译得到翻译结果。
51.可选的,终端确定待识别区域之后,获取待识别区域内的待识别字符集(如所有的文字作为待识别字符集),可以通过预设的识别软件接口调用已安装的翻译软件或相应的翻译务对获取到的待识别字符集进行翻译识别,其中,相应的识别软件接口可以为设置的某一识别软件,该识别软件可以是安装在终端本地的识别应用,如金山词典、有道识别、百度识别等,还可以是存在于网络中提供的识别软件服务的识别网络接口,如谷歌网络识别、百度网络识别等等。从而得到翻译结果。
52.s003:显示对所述待识别区域中待识别字符集的翻译结果。
53.可以理解的,翻译结果可通过在终端当前显示界面弹出显示框或特定的显示区域中进行翻译结果显示,例如在待识别区域周侧的区域进行翻译结果的显示。
54.在本技术实施例中,终端先确定显示页面中的至少一个区域,通常所述至少一个
区域基于对所述显示页面的字符划分结果确定,然后从至少一个区域中确定待识别区域,并获取所述待识别区域中的待识别字符集的翻译结果,最后显示翻译结果。整个翻译过程不需要用户全程逐个框定待识别区域,通过从至少一个区域中预测的用户可能期望选中的待识别区域,就可以实现在用户不框定翻译区域的情况下快速翻译,可以缩短翻译过程中的区域操作路径,节省区域选择时间,提升了翻译的便捷性。
55.请参见图2a,图2a是本技术提出的一种翻译方法的另一种实施例的流程示意图。具体的:
56.s101:响应于针对显示页面的第一触发操作,对所述显示页面划分至少一个区域。
57.可以理解的,用户可以在显示页面上输入第一触发操作触发翻译功能,终端可以响应于显示页面上的第一触发操作,确定在所述显示页面的字符集中的至少一个字符划分结果,然后确定所述字符划分结果所处的区域。
58.所述第一触发操作可理解为针对翻译过程的识别触发操作,用于触发终端的翻译功能,在第一触发操作的输入过程中,用户通常仅需触发相应的功能控件或终端按键即可,操作输入时间通常较之于前述用于区域选择的指令的时间较短,第一触发操作可理解为用户不需要对待识别的目标区域的选定,在本技术中,在监测到用于触发翻译的第一触发操作输入之后,终端初步确定至少一个的区域,可以理解为终端基于显示界面上字符集所对应的字符显示信息进行预测,来预测显示界面可能期望被用户选中的至少一个区域。
59.可以理解的,所述区域为终端根据显示界面上的字符显示信息来对显示界面上字符集确定至少一个字符划分结果,字符划分结果在显示界面上对应一个区域,字符划分结果可理解为所预测的用户可能选择的字符。字符划分结果所处的区域内可以包含终端预测的当前用户生僻、不熟悉语言的字符信息等等。例如,以显示界面显示一篇文章为例,字符集可以是文章全部或部分字符,通过对字符集所对应的字符显示信息(可以是字符显示格式特征、字符语义特征、字符段落特征、字符词句特征等等)确定至少一个字符划分结果,字符划分结果在显示界面上对应一个区域。
60.可以理解的,终端检测到用户在显示界面上输入第一触发操作之后,即响应于显示页面上的第一触发操作,然后基于显示页面中的字符显示信息,来确定用户可能选择翻译识别的至少一个区域。
61.第一触发操作可以是在终端的显示界面上输入的,例如滑动、单击、双击或长按某区域位置或设定的信息翻译控件、按下预设的翻译按键、晃动终端以手势体感的方式输入的第一触发操作等操作方式等等。
62.在一种具体的实施场景中,终端可以具有触摸屏,触摸屏可以是能够实现单一触摸功能的触摸屏,例如:电容触摸屏、电磁触摸屏,也可以是能够同时实现电容感应、电磁感应和红外感应的触摸屏。如图2b所示,图2b是一种终端显示界面的界面示意图,终端当前显示界面为“阅读界面”的显示界面,显示界面上包含英文文本信息,用户可以在当前显示界面上阅读英文,在当前显示界面上有一用于进行翻译的翻译控件,翻译控件以指定图像圆形显示在终端的“阅读界面”的显示界面上。示意性的,用户若需要对显示界面中不理解的区域中的英文进行识别,用户可以通过手指触控的方式对翻译控件输入点击操作,所述点击操作可以是单次点击翻译控件的图标以及激活翻译控件的翻译功能,可以理解的点击操作也即用户所输入的第一触发操作。
63.在一种可行的实施方式,终端确定针对所述显示页面中字符显示信息所对应的至少一个区域,可以是对显示页面中字符集对应的字符显示信息进行语义识别处理,经语义识别处理后确定字符显示信息中的关键字段、关键词段、关键句段、字符显示格式等关键信息所处区域中的至少其一,基于字符显示信息来确定至少一个字符划分结果,以字符划分结果在显示界面所处的显示位置(范围)作为区域。可以理解的,终端通过对字符显示信息进行语义提取以及语义理解,确定字符显示信息中的关键字符信息(也即字符划分结果)所处区域,通常该字符划分结果所处显示位置可作为所预测的区域,区域的数量可以是多个,通常字符划分结果所处区域常为用户高概率期望选中识别的区域,终端在用户触发翻译功能或服务时,确定前述至少一个区域,可避免用户全程对期望识别区域的框选,节省了翻译的用户操作路径,也提高了翻译的效率。
64.在一种可行的实施方式,终端确定针对所述显示页面中字符显示信息所对应的至少一个区域,可以是识别显示页面中字符显示信息的段落特征,也即识别字符显示信息中各文本段落,以各文本段落所处的段落显示位置(范围)作为为区域。
65.如图3所示,图3是本技术所涉及的一种以文本段落划分区域的界面示意图,在如图3所示的界面中,终端提高识别显示页面中字符显示信息的段落特征来确定“阅读页面”中的多个自然段落,将每个自然段落作为区域,如阅读页面中第一自然段对应的区域1、第二自然段对应的区域2...
66.可选的,终端可以在确定至少一个区域时,在显示界面在显示至少一个区域,以可视化的形式向用户进行呈现区域确定过程,也可以在显示界面上不进行显示。
67.s102:从所述至少一个区域中确定待识别区域。
68.可以理解的,第一触发操作的通常具有一定的操作时长,也即第一触发操作,如用户触发翻译控件持续拖动翻译控件至某一显示位置,终端可以在监测到第一触发操作输入时持续监测第一触发操作再进一步基于第一触发操作的操作位移位置来随之确定至少一个区域,并基于操作位移位置(如操作终点位置)从至少一个区域中确定待识别区域。这样区域操作路径也较短、可节省区域选择时间、整个过程用户不需要精准框定整个区域信息;另外,此时通常基于区域所确定的初始识别区域可覆盖到用户所期望识别的区域,若初始识别区域高概率包含用户期望识别的信息,如初始识别区域中的某些字词段。
69.s103:从所述至少一个区域中,确定初始识别区域,并对所述初始识别区域进行选中显示处理。
70.可以理解的,前述至少一个区域通常是从显示界面的字符显示信息中所确定的,在本技术,用户输入用于触发翻译功能的第一触发操作时,终端即可快速确定至少一个区域;
71.在一些实施例中,终端在确定至少一个区域之后,基于第一触发操作的操指示位置来确定初始识别区域,可以理解的,用户选中某个区域进行翻译,通常会在显示界面中的特定位置(特定位置也即前述操作指示位置)来进行区域框选,该操作指示位置通常为期望识别区域的关键位置,如初始位置、终点位置、中间位置等等,在本技术中,终端检测到第一触发操作之后还获取第一触发操作的操作指示位置。例如:用户拖动用于翻译的控件至待识别的特定位置处,然后一般用户从特定位置开始选中界面区域作为待识别区域,在这个过程中,待识别的特定位置也即终端所获取的第一触发操作的操作位移位置,(操作位移位
置可以是操作特征参数落入参考参数范围内时操作所指示的位置,如操作力度大于某个力度阈值、操作停留时间大于某个时间阈值),终端即可确定距离操作指示位置最近的区域作为初始识别区域,并对该初始识别区域进行选中显示处理,所述选中显示处理也即以预设的选中显示方式对初始识别区域进行选中渲染,如对初始识别区域进行背景选中,对初始识别区域中的信息加载选中框等等。可以理解的,此时通常终端显示的初始识别区域高概率为用户期望选中识别的区域,用户此时无需进行区域框选,终端已经预先预测已经显示出用户所期望的识别区域,如,无需从特定位置开始至选择出界面区域的识别终点位置来作为待识别区域。
72.在一些实施例中,终端可在显示界面中显示至少一个区域,同时从各区域中确定一个初始识别区域,可理解为确定置信程度最高的区域作为一个初始识别区域,一方面,初始识别区域为终端预测的用户期望选中的区域,向用户进行展示,可节省用户以繁琐的操作选中合适的识别区域,节省操作识别路径;一方面,用户可直接基于显示的各区域作为参考,在初始识别区域不为期望识别区域时,可选中其他区域作为待识别区域,提升识别容错率。一方面,用户可基于初始识别区域作为参考,对初始识别区域进行区域调整(如区域微调),来得到调整后的待识别区域,
73.s104:响应于针对所述初始识别区域的第二触发操作,确定所述第二触发操作对应的待识别区域。
74.所述第二触发操作可以理解为针对终端所预测的初始识别区域的区域确定操作或区域调整操作,在一些实施方式中,第一触发操作和第二触发操作可视作一种翻译操作,第一触发操作和第二触发操作具备关联性,可理解为用户输入的翻译操作包括第一触发操作和第二触发操作两个子操作。例如,第一触发操作为用户将翻译控件移动到相应位置,终端展示初始识别区域,第二触发操作为对初始识别区域的区域确认操作以确认该初始识别区域为待识别区域;或,第二触发操作为对初始识别区域的区域调整操作以调整该初始识别区域从而精确框选住待识别区域。
75.可以理解的,响应于针对所述初始识别区域的第二触发操作,可理解为用户针对终端所预测显示的初始识别区域的确认操作,也即确认初始识别区域为用户所期望识别的区域,则此时终端确定第二触发操作对应的待识别区域,在一些实施方式中第二触发操作的检测可以是:终端检测到用户预设时间内未输入人机交互操作,可以理解为用户默认初始识别区域为待识别区域,而不输入任何操作。
76.可以理解的,响应于针对所述初始识别区域的第二触发操作,也可理解为用户针对终端所预测显示的初始识别区域的区域调整操作,如在初始识别区域的基础上对区域的规格进行修正调整,如扩大或缩小初始识别区域的识别范围,通常第二触发操作常可理解为对初始识别区域的微调,初始识别区域通常可高概率覆盖到用户所期望的识别内容,用户可在此基础以较短的区域操作路径进行微调,较之于“用户全程输入识别起点位置至识别终点位置来确定待识别区域”识别操作路径大大缩短,节省了翻译的效率。
77.s105:获取所述待识别区域中的待识别字符集的翻译结果,显示对所述待识别区域中待识别字符集的翻译结果。
78.具体可参见本技术涉及的其他实施例的方法步骤,此处不再赘述。
79.在本技术实施例中,终端通过响应于显示页面上的第一触发操作,确定针对所述
显示页面中的至少一个区域,然后在至少一个区域中来确定第一触发操作对应的初始识别区域,并对所述初始识别区域进行选中显示处理;再响应于针对所述初始识别区域的第二触发操作,继而对确定所述第二触发操作对应的待识别区域中的待识别字符集进行翻译并进行显示。整个翻译过程不需要用户全程逐个框定待识别区域,通过从至少一个区域中预测的用户可能期望选中的初始识别区域并进行显示,仅需在基于初始识别区域的基础上基于用户操作输入即可确定最后的待识别区域,可以缩短识别过程中的区域操作路径,节省区域选择时间,提升了翻译的便捷性。
80.请参见图4,图4是本技术提出的一种翻译方法的另一种实施例的流程示意图。具体的:
81.s201:响应于针对显示页面的第一触发操作。
82.具体可参见s101,此处不再赘述。
83.s202:获取所述显示页面中的字符显示信息。
84.可以理解为,终端从所述显示页面的所有显示区域中提取字符显示信息。
85.所述字符显示信息用于终端预测用户可能选中的区域,在一些实施例中,若终端当前显示界面中包含用户难以理解或不理解的信息时,就会涉及到诸如用户对终端显示界面中字符显示信息的翻译过程,如需要对显示界面中用户所期望的待识别区域中的待识别字符集进行识别的过程,待待识别字符集可以是句子、段落、词等字符。
86.可以理解的,终端可将显示界面所有显示区域的字符内容所对应的信息作为字符显示信息,具体实施中,终端从当前的显示页面中,从显示页面的所有显示区域中提取字符显示信息,这样终端以显示界面中所有显示内容为字符信息源,来预测显示界面可能被用户选中的至少一个区域。
87.s203:基于第一触发操作的操作位移位置在所述显示页面上确定目标显示区域,获取目标显示区域中的字符显示信息。。
88.所述目标显示区域的大小通常小于显示界面的大小,可以理解的,终端以显示界面中部分显示区域也即目标显示区域中的信息内容为数据源,来预测显示界面可能被用户期望选中的至少一个区域。在一些实施例中可节省信息处理量,节省确定区域的时间,提升翻译效率。
89.可以理解的,终端确定所述显示页面中的目标显示区域,具体可以是通过获取第一触发操作的操作位移特征参数,根据所述操作位移特征参数来确定目标显示区域。
90.所述操作位移特征参数包括操作位移位置、触控力度特征、触控方向特征、触控时长特征、触控点数量特征等特征参数中的至少一种。基于操作位移特征参数可实现精准预测所需参考信息内容的目标显示区域,如触控力度特征反馈触控力度较大时,可以将操作位移位置特征反馈的位置作为参考点将大部分周侧的信息内容纳入参考,从而确定出目标显示区域;如触控力度特征反馈触控力度较大时,可以将操作位移位置特征反馈的位置作为参考点将大部分周侧的信息内容纳入参考,可理解为设置一个目标区域规格,例如:以所述操作位移位置为参考点,确定目标区域规格指示的目标显示区域;如触控方向特征反馈指定触控方向时,可以将操作位移位置特征反馈的位置作为基准点将指定触控方向指示的信息内容纳入参考,可理解为基于基准点确定一个目标区域规格,从而确定出目标显示区域;等等。
91.在一种可行的实施方式中,可训练有区域规格模型,获取第一触发操作的操作位移特征参数,将操作位移特征参数输入至训练好的区域规格模型中,输出所述操作位移特征参数对应的目标区域规格,所述目标区域规格包括区域尺寸、区域形状等,然后以所述操作位移位置为参考点,确定目标区域规格指示的目标显示区域,可以理解的操作位移位置作为参考点,目标区域规格可以指示以参考点为参照的目标显示区域,如以参考点为区域中心点,来确定目标区域规格对应的目标显示区域。
92.具体的,在实际应用中,所述区域规格模型可以是基于深度学习的场景分析算法,如卷积神经网络(convolutional neural network,cnn)模型,深度神经网络(deep neural network,dnn)模型、循环神经网络(recurrent neural networks,rnn)、模型、嵌入(embedding)模型、梯度提升决策树(gradient boosting decision tree,gbdt)模型、逻辑回归(logistic regression,lr)模型等模型中的一种或多种的拟合实现的,同时在现有神经网络模型基础上引入误差反向传播算法进行优化,可以提高基于神经网络模型的区域规格模型的输出准确率。在实际应用中,可以基于神经网络模型cnn创建初始区域规格模型,所述区域规格模型是由许多节点中各节点的简单非线性模拟处理要素密集互连配置而成的,是一种模仿了生物神经元的系统模型。所述神经网络模型通过使至少一个节点的输入与每一个节点的输出连接形成,类似于真实神经元的突触连接。每个神经元表达了一种特定的输出函数,即激励函数,每两个神经元之间的连接都包含一个连接强度,即作用于通过该连接的信号的加权值。
93.在本技术实施例中,可以预先获取大量的包含所述操作位移特征(操作位移位置特征、触控力度特征、触控方向特征、触控时长特征、触控点数量特征等样本特征)的样本数据,对所述样本数据进行预处理,提取所述样本数据中的操作特征,并基于对样本数据已经标注的样本区域规格,将所述操作特征输入至初始区域规格进行训练,得到训练之后的区域规格模型,该区域规格模型具有语义特征抽取、语义特征知识概括和学习记忆的能力,通常所述区域规格模型学习到的信息或知识储存在每个单元节点之间的连接矩阵上。
94.需要说明的是,上述对区域规格模型的训练过程可以是在终端上进行的,也可以是在与终端建立通信连接的服务器上进行的,如:服务器可以预先对初始区域规格模型进行训练,以生成训练好的区域规格模型,然后将区域规格模型所对应的安装包推送至终端,终端只需安装所述安装包即可得到训练好的区域规格模型。此处,具体不做限定。
95.在一种可选的实施场景中:终端通过获取第一触发操作对应的操作特征参数之后,可提取操作特征参数中的操作位移位置,目标区域规格也可以是预设的,也即预先设置一个用于确定的区域尺寸,在确定操作位移位置之后基于目标区域规格来确定相应的目标显示区域,从目标显示区域中提取诸如图片、动画、表格等所有显示内容,以获取到目标显示区域中的字符显示信息。从而将目标显示区域中的字符显示信息纳入参考,以确定至少一个目标显示区域。
96.需要说明的是,若第一触发操作持续一段操作时间,则操作位移位置通常对应多个,基于操作位移位置确定的目标显示区域通常随着第一触发操作的位置变化而实时更新。
97.s204:提取所述字符显示信息的信息语义特征,基于所述信息语义特征确定所述显示页面中的至少一个字符划分结果,确定所述至少一个字符划分结果分别对应的区域。
98.所述信息语义特征可理解为以自然语言表达的非结构化数据特有的语义属性,以一篇论文为例,语义特征包括作者创作意图、数据主题说明、底层特征含义等语义要素。信息语义特征是能够表达对象本身的语义以及在环境中语义的多种特征,以字符显示信息为例,信息语义特征可以是组成元素的顺序、句段及字段特征、词的顺序、词的情感信息、互信息、字符显示格式特征等。
99.其中,组成元素可以理解为组成一段话最小的组成单位,以语言为例,最小组成单位是每个字的发音。
100.词顺序为通话过程中表达一句话(一个意思)组成的各个词的先后顺序。
101.词的情感信息为通话过程中该词语在这个句子中所表达的情感含义,所述情感含义可以理解为词在句子是高昂还是低沉、是褒义还是贬义、是欣喜还是悲伤等。
102.互信息是指某个词或字和类别之间的统计独立关系,互信息常应用于度量两个对象之间的相互性。
103.句段及字段特征可理解为字段或句段的划分特征,其可反馈句段或字段的划分位置。
104.字符显示格式特征可以理解为字符字体、字符显示颜色、字符间距、字符缩进格式等等。
105.可以理解的,实际应用中,终端通过对字符显示信息进行语义提取以及语义理解,基于信息语义来预测显示页面的字符集中的至少一个字符划分结果,以便于确定字符划分结果所处显示位置范围作为所述区域,如字符划分结果可以是关键字、关键词、关键句、关键段等等。其字符划分结果的划分过程至少覆盖到关键信息维度、字词句段特征维度、语法特征维度、词频分布维度、字符显示格式维度等。字符划分结果的划分过程更为准确,以便于确定准确的区域。字符划分结果所处区域常为用户高概率期望选中识别的区域,终端在用户触发翻译功能或服务时,确定前述至少一个区域,可避免用户全程对期望识别区域的框选,节省了翻译的用户操作路径,也提高了翻译的效率。
106.实际实施中,终端可训练字符划分模型,预先获取包含样本语义特征的样本特征数据,对样本特征数据预先标注样本区域标签,基于标注样本区域标签的样本特征数据对初始的字符划分模型进行训练,可以得到训练好的字符划分模型。
107.字符划分模型可以为一种神经网络模型,所述神经网络模型是由许多节点中各节点的简单非线性模拟处理要素密集互连配置而成的,是一种模仿了生物神经元的系统模型。所述神经网络模型通过使至少一个节点的输入与每一个节点的输出连接形成,类似于真实神经元的突触连接。每个神经元表达了一种特定的输出函数,即激励函数,每两个神经元之间的连接都包含一个连接强度,即作用于通过该连接的信号的加权值。在本实施例中,将样本数据输入至神经网络模型进行训练,可以得到训练之后的字符划分模型,该字符划分模型具有翻译过程过程中关键信息特征抽取、语义知识概括和学习记忆的能力,通常神经网络模型学习到的信息或知识储存在每个单元节点之间的连接矩阵上。例如,字符划分模型可以是基于卷积神经网络(convolutional neural network,cnn)模型,深度神经网络(deep neural network,dnn)模型、循环神经网络(recurrent neural networks,rnn)、模型、嵌入(embedding)模型、梯度提升决策树(gradient boosting decision tree,gbdt)模型、逻辑回归(logistic regression,lr)模型等模型中的一种或多种的拟合实现的。
108.实施中,终端提取字符显示信息的信息语义特征之后,将信息语义特征输入至字符划分模型中,输出针对显示页面中的至少一个字符划分结果。以便于确定所述至少一个字符划分结果分别对应的区域。
109.在一种可行的实施方式中,基于所述信息语义特征在所述显示页面的字符集中确定至少一个参考字符句段,确定所述至少一个参考字符句段分别对应的区域,也就是说将各所述参考句子段所处的显示位置范围作为所述区域;
110.参考字符句段可以是由至少一个字符组成的参考句子和/或参考段落。
111.可选的,终端可基于信息语义特征中的句段特征及字段特征,确定字符显示信息中的参考句子和/或参考段落,可以理解的,参考句子和/或参考段落即为前述的字符划分结果,然后将各参考句子和/或参考段落所处的显示位置范围作为所述区域。
112.可选的,终端也可将信息语义特征输入至字符划分模型中,字符划分模型可实现确定字符显示信息中的参考句子和/或参考段落,并将参考句子和/或参考段落作为区域,也即基于字符划分模型可输出针对显示页面中的至少一个参考句子和/或参考段落。以便于确定所述至少一个参考句子和/或参考段落分别对应的区域。
113.如图5所示,图5是本技术所涉及的一种区域确定的界面示意图,在如图5所示的界面中,终端提取显示页面中字符显示信息的信息语义特征来确定“阅读页面”中的多个参考句子和/或参考段落,将字符显示信息内的每个“参考句子和/或参考段落”作为区域,如阅读页面中第一自然段的第二句对应的区域1、第二自然段的最后一句对应的区域2...
114.在一种可选的实施方式中,终端可以基于所述信息语义特征确定显示页面的字符集(显示页面中的全部或部分字符的集合)中的至少一个参考字符词,参考字符词作为字符显示信息中的关键信息,可以是关键词字段、词频分布信息指示的词、语法级的实体信息字段、语义级的主题字段等。
115.所述参考字符词可以理解为由字符组成的参考字词。
116.终端也可将信息语义特征输入至字符划分模型中,字符划分模型可实现确定字符显示信息中的参考字符词的识别,并将参考字符词所处的区域作为区域,也即基于字符划分模型可输出针对显示页面中的至少一个参考字符词所处的显示位置范围作为所述区域。
117.在一种可行的实施方式中,终端可确定与所述显示页面相匹配的历史显示页面,从而获取所述历史显示页面的历史翻译记录;
118.所述历史翻译记录包括至少一个用户端在历史显示页面上的翻译数据。在一些实施方式中,终端当前用户所浏览的显示页面会存在其他用户曾经浏览过历史显示页面,或浏览过于该显示页面所属同一类型的历史显示页面;在这些用户浏览历史显示页面时会存在对某区域的历史翻译字符集进行翻译的情况,基于此,本技术在确定区域时可借鉴至少一个用户端在历史显示页面上的历史翻译字符集来确定字符划分结果;例如存在多个用户端在历史显示页面上对多个区域中的信息进行翻译的情况,此时通常对应多个历史翻译字符集(如历史翻译过的词、句子、段落等),则终端可以将历史翻译字符集直接作为本次显示页面的字符划分结果。
119.可以理解的,终端可基于信息语义特征(例如主题词、标题等)可作为显示页面的页面标识,可理解为终端可基于信息语义特征向服务端请求至少一个用户访问历史显示页面时的历史翻译记录,历史显示页面与显示页面的内容可以相同或同一类型;在一些实施
方式中历史显示页面与显示页面显示的为同一内容,区别在于时间维度上,历史显示页面为在先显示内容的界面,显示界面为当前时间的界面。
120.终端获取到历史翻译记录之后,获取用户端历史识别过的一个或多个历史翻译字符集,然后将历史翻译字符集直接作为本次显示页面的字符划分结果,从而确定该字符划分结果所处位置范围以作为前述区域,如确定历史翻译过的词、历史翻译过的句、历史翻译过的段等在本次显示页面上所处的区域。
121.需要说明的,第一触发操作的可以是一个持续的操作,也即第一触发操作维持一段时间,在第一触发操作对应的操作时间内,由于其操作位移位置不断变化,因此基于其操作位移位置进而确定的至少一个区域可以是随之变化的,也即确定的至少一个区域随着第一触发操作的操作移动,各区域不断进行更新。
122.s205:在所述至少一个区域中,确定所述第一触发操作对应的初始识别区域,并对所述初始识别区域进行选中显示处理;
123.根据一些实施例中,终端在确定至少一个区域之后,基于第一触发操作来确定初始识别区域,在本技术中,终端检测到第一触发操作之后还获取第一触发操作指示的操作位移位置。需要理解的,第一触发操作通常从操作开始至操作结束通常会对应多个位置,在本技术中需要确定具有参考价值的操作位移位置,如第一触发操作的特定位置,特定位置通常可反馈用户期望识别的区域位置,操作位移位置选择可基于操作特征参数来设置参考参数范围,当某一时刻第一触发操作对应的位置处的操作特征参数落入参考参数范围内时,即可确定操作位移位置。
124.例如:用户拖动用于翻译的控件至待识别的特定位置处,特定位置可以是操作特征参数落入参考参数范围内时操作所指示的位置,如操作力度大于某个力度阈值、操作停留时间大于某个时间阈值,等等,前述“某个力度阈值”、“某个时间阈值”即对应一个参考参数范围。
125.翻译过程一般用户从特定位置开始选中界面区域作为待识别区域,在这个过程中,待识别的特定位置也即终端所获取的第一触发操作的操作位移位置,终端即可确定距离操作位移位置最近的区域作为初始识别区域,具体而言,每个区域对应一组区域坐标(可以是区域中心点的坐标),计算操作位移位置的坐标与各区域指示的区域坐标的距离,即可确定距离操作位移位置最近的区域作为初始识别区域。
126.如图6所示,图6是本技术涉及的一种初始识别区域的界面示意图,终端通过对图5中的区域1-3的进一步判断,确定了第一触发操作对应的初始识别区域为区域2,然后对所述初始识别区域进行选中显示处理,选中显示处理用于终端向用户展示预测的待识别区域。
127.可以理解的,终端对该初始识别区域进行选中显示处理,所述选中显示处理也即以预设的选中显示方式对初始识别区域进行选中渲染,如对初始识别区域进行背景选中,对初始识别区域中的信息加载选中框等等。可以理解的,此时通常终端显示的初始识别区域高概率为用户期望选中识别的区域,用户此时无需进行区域框选,终端已经预先预测且已经显示出用户所期望的识别区域。
128.s206:响应于针对所述初始识别区域的第二触发操作,确定所述第二触发操作对应的待识别区域。
129.具体可参见本技术的其他实施例的方法步骤,此处不再赘述。
130.s207:获取所述待识别区域中的待识别字符集的翻译结果,显示对所述待识别区域中待识别字符集的翻译结果。
131.具体可参见本技术的其他实施例的方法步骤,此处不再赘述。
132.在本技术实施例中,整个翻译过程不需要用户全程逐个框定待识别区域,通过从预测的用户可能期望选中的至少一个区域中来确定初始识别区域进行选中显示,仅需在基于初始识别区域的基础上基于用户识别操作输入即可确定最后的待识别区域,可以缩短识别过程中的区域操作路径,节省区域选择时间,提升了翻译的便捷性;以及,可采用诸如根据操作特征参数来确定目标显示区域等手段,进而节省信息处理量,节省确定区域的时间,提升翻译效率;以及基于字符显示信息的信息语义来确定区域,可实现用户期望待识别区域的精准预测,提高了翻译的效率。
133.请参见图7,图7是本技术提出的一种翻译方法的另一种实施例的流程示意图。具体的:
134.s301:响应于针对显示页面上第一翻译控件所输入的第一触发操作,确定显示页面中的至少一个区域。
135.所述控件可以理解为用于开发构建终端用户显示界面(即ui界面)的显示内容所对应的“数据和方法的封装”,通过控件可以实现一定的方法功能,如可以提供视窗、文本框、按钮、下拉式菜单等界面元素的功能,通常控件可分为四个类型:
136.命令控件(imperative control):用于启动特定的功能,常见的命令控件有按钮控件、图标控件、超链接控件等;
137.选择控件(selection control):用于选择选项或数据,常见的选择控件有复选框控件、列表框控件、列表控件、文本编辑控件等;
138.输入控件(entry control):用于输入数据,常见的输入控件有微调器控件、刻度盘控件、滑块控件等;
139.显示控件(display control):用于控制应用“如何”及“在哪里”展示特定的数据,常用的显示控件有显示文字的文字控件、显示图像的图像控件等。
140.在本技术实施例中,所述第一翻译控件可以理解用于实现对指定词条、文本、文字、图像进行翻译功能的控件,通常所述第一翻译控件可以为命令控件,用于启动翻译功能,在实际应用中,第一翻译控件通常以某一指定图像(如圆形、三角形)显示在终端的显示界面上,当用户在终端上针对第一翻译控件输入第一触发操作时,即可触发控件的翻译功能,如双击、单击、长按第一翻译控件。
141.在一种具体的实施场景中,终端第一翻译控件通常显示在显示页面上的某位置,如图2所示,在图2所示的阅读页面中,第一翻译控件即为圆形“识”字按钮控件,当用户需要对阅读页面上的文字进行翻译时,可以在当前显示页面上针对“圆形“识”字按钮控件”输入第一触发操作,如触控该“圆形“识”字按钮控件”,终端对第一触发操作进行响应,根据第一触发操作确定针对所述显示页面中字符显示信息所对应的至少一个区域。
142.例如,当用户在图2所示显示界面上阅读英文文本时,遇到生僻词、生僻句的场景下,用户可以通过手指触控的方式对第一翻译控件输入点击操作,所述点击操作可以是单次点击第一翻译控件的图标以及激活第一翻译控件,然后根据第一触发操作确定针对所述
显示页面中字符显示信息所对应的至少一个区域。例如用户以拖动控件方式持续针对第一翻译控件输入第一触发操作,在拖动过程,终端至少可基于第一触发操作的操作触控位置快速在显示页面确定字符显示信息所对应的至少一个区域,并基于第一触发操作的特定的操作位移位置来确定第一触发操作所对应的初始识别区域,需要说明的是第一触发操作的操作过程中用户未主动框选或全程选出某个区域作为待识别区域。
143.可以立即的第一触发操作可理解为用户触发第一翻译控件,通过触发第一翻译控件至某一操作位置意图对此位置周侧的区域进行选中进行识别,本技术为了节省用户下一步输入操作精准选中周侧区域的时间或缩短识别操作路径,在监测到第一触发操作之后,即随之确定至少一个可能选中的区域,并在监测到第一触发操作指示的特定的操作位置之后,如第一触发操作的终点位置,立即从至少一个区域中确定出高概率期望选中的初始识别区域。
144.s302:从所述至少一个区域中,确定初始识别区域,并对所述初始识别区域进行选中显示处理。
145.可以理解的,终端的用户若持续输入第一触发操作,如以滑动、连续点击、连续触控等方式持续输入第一触发操作,第一翻译控件随之移动到相应第一触发操作对应的位置,在这个过程中,由于第一触发操作的位置不断变化,第一翻译控件的位置也不断变化、基于此,终端根据第一触发操作来确定至少一个区域也不断变化,在用户完成第一触发操作的输入之后,如拖动第一翻译控件至某个操作位移位置,意图下一步确定该某个操作位移位置周侧的区域以进行翻译,此时,终端根据第一识别超指示的操作位移位置从第一触发操作的输入过程中所随之确定至少一个区域中,确定第一触发操作对应的初始识别区域。
146.s303:控制第二翻译控件对所述初始识别区域进行选中显示处理,响应于针对所述第二翻译控件的第二触发操作,所述第一翻译控件与所述第二翻译控件相关联。
147.所述第二翻译控件用于选中初始识别区域,从而向用户提示终端所预测的待识别区域,以供用户确定初始识别区域是否准确。通常所述第一翻译控件与所述第二翻译控件相关联。在一些实施方式中,第二翻译控件用于框选中初始识别区域中的待识别信息。如图6所示,图6为本技术涉及的一种翻译控件的界面示意图,在图6所示的界面中,显示有第二翻译控件,终端控制第二翻译控件对初始识别区域进行选中显示处理,初始识别区域经选中显示处理之后,背景为灰色,初始识别区域的边框以虚线形式呈现。
148.在一种具体的实施场景中,终端控制第二翻译控件对所述初始识别区域进行选中显示处理,可以是加载所述第一翻译控件对应的第二翻译控件,控制第二翻译控件的控件显示区域覆盖所述初始识别区域,以对所述初始识别区域进行选中显示,所述第二翻译控件的显示区域范围大于所述第一翻译控件的显示区域范围。例如:第二翻译控件的控件显示区域可以为图6中所示出的初始识别区域。加载第二翻译控件主要用于向用户更好的展示终端所预测的待识别区域,向用户进行展示,可节省用户以繁琐的操作选中合适的识别区域,节省操作识别路径。
149.s304:确定所述第二触发操作对应的待识别区域,并获取所述待识别区域中的待识别字符集的翻译结果;
150.s305:显示对所述待识别区域中待识别字符集的翻译结果。
151.根据一些实施例中,第二触发操作可理解为用户针对终端所预测显示的初始识别区域的确认操作,也即确认初始识别区域为用户所期望识别的区域,则此时终端确定第二触发操作对应的待识别区域,在一些实施方式中第二触发操作的检测可以是:终端检测到用户预设时间内未输入人机交互操作,可以理解为用户默认初始识别区域为待识别区域,而不输入任何操作。
152.根据一些实施例中,第二触发操作可理解为用户针对终端所预测显示的初始识别区域的区域修正操作,如在初始识别区域的基础上对区域的规格进行修正,如扩大或缩小初始识别区域的识别范围,如图8所示,图8是本技术所涉及的一种待识别区域的界面示意图,终端的当前用户可在图6所示出的初始识别区域的基础上进一步缩小初始识别区域的识别范围,通常区域修正操作常可理解为对初始识别区域的微调,初始识别区域通常可高概率覆盖到用户所期望的识别内容,最后的待识别区域如图8所示的虚线框所处的区域,用户可在此初始识别区域的基础以较短的识别操作路径进行微调,较之于“用户全程输入识别起点位置至识别终点位置来确定待识别区域”识别操作路径大大缩短,节省了翻译的效率。
153.可以理解的,终端确定所述第二触发操作对应的待识别区域,对所述待识别区域中的待识别字符集进行翻译,以得到翻译结果。
154.进一步的,待识别区域中的待识别字符集获取可以是基于光学字符识别(ocr)的文本识别方法,对所述第二翻译控件覆盖处的显示元素信息(如文字、图像、图标)进行光学字符识别,也即待识别区域中待识别字符集,其识别方法是获取待识别区域处指示的显示图像,对显示图像检测暗、亮的模式确定其字符形状,然后用字符识别方法将形状翻译成计算机文字的过程;即,针对待识别区域处的字符,采用光学的方式将待识别区域处上的文字转换成为黑白点阵的图像文件,并通过基于光学字符识别(ocr)的文本识别方法将图像中的文字转换成文本格式(如以字符串的形式),从而获取出识别出的信息,进而进行翻译,然后展示翻译的结果。例如,如在图9中,图9是一种终端显示翻译结果的界面示意图,终端查找到英文信息“in a certain army hospital in england”的翻译结果,此时翻译完成,终端取消显示正在加载翻译所对应的图标,在在翻译控件上加载翻译结果显示框,并在所述翻译结果显示框中显示英文文字“in a certain army hospital in england”对应的翻译结果“英格兰的部队医院”。
155.在本技术实施例中,整个翻译过程不需要用户全程逐个框定待识别区域,通过从预测的用户可能期望选中的至少一个区域中确定初始识别区域进行选中显示,仅需在基于初始识别区域的基础上基于用户识别操作输入即可确定最后的待识别区域,可以缩短识别过程中的区域操作路径,节省区域选择时间,提升了翻译的便捷性;以及通可视化的第一翻译控件以及第二翻译控件进行翻译可提升翻译的智能性,可以更直观的展示终端所预测的待识别区域,提升翻译的用户体验效果。
156.下面将结合图10,对本技术实施例提供的翻译装置进行详细介绍。需要说明的是,图10所示的翻译装置,用于执行本技术图1~图9所示实施例的方法,为了便于说明,仅示出了与本技术实施例相关的部分,具体技术细节未揭示的,请参照本技术图1~图9所示的实施例。
157.请参见图10,其示出本技术实施例的翻译装置的结构示意图。该翻译装置1可以通
过软件、硬件或者两者的结合实现成为用户终端的全部或一部分。根据一些实施例,该翻译装置1包括区域确定模块11、结果获取模块12和结果显示模块13,具体用于:
158.区域确定模块11,用于确定显示页面中的至少一个区域,所述至少一个区域基于对所述显示页面的字符划分结果确定;
159.结果获取模块12,用于从所述至少一个区域中确定待识别区域,并获取所述待识别区域中的待识别字符集的翻译结果;
160.结果显示模块13,用于显示对所述待识别区域中待识别字符集的翻译结果。
161.可选的,如图11所示,所述区域确定模块11,包括:
162.第一确定单元111,用于响应于针对显示页面的第一触发操作,获取所述显示页面中的至少一个区域,从所述至少一个区域中确定待识别区域;
163.第二确定单元112,用于响应于针对显示页面的第一触发操作,对所述显示页面划分至少一个区域,从所述至少一个区域中确定待识别区域
164.可选的,所述第二确定单元112,具体用于:
165.获取所述显示页面中的字符显示信息;基于所述字符显示信息对所述显示页面划分至少一个区域,基于第一触发操作的操作终点从所述至少一个区域中确定待识别区域;或
166.基于第一触发操作的操作位移位置在所述显示页面上确定目标显示区域,获取目标显示区域中的字符显示信息;基于所述字符显示信息对所述显示页面划分至少一个区域,基于第一触发操作的操作终点从所述至少一个区域中确定待识别。
167.可选的,所述第二确定单元112,具体用于:
168.获取第一触发操作的操作位移位置,以所述操作位移位置为参考点,确定目标区域规格指示的目标显示区域。
169.可选的,如图12所示,所述第二确定单元112,包括:
170.特征确定子单元1121,用于提取所述字符显示信息的信息语义特征;
171.区域确定子单元1112,用于基于所述信息语义特征确定所述显示页面中的至少一个字符划分结果,确定所述至少一个字符划分结果分别对应的区域。
172.可选的,所述区域确定子单元1112,具体用于:
173.基于所述信息语义特征在所述显示页面的字符集中确定至少一个参考字符句段,确定所述至少一个参考字符句段分别对应的区域;和/或,
174.基于所述信息语义特征在所述显示页面的字符集中确定至少一个参考字符词,确定所述至少一个参考字符词分别对应的区域。
175.可选的,所述区域确定子单元1112,具体用于:
176.基于所述信息语义特征获取历史显示页面的历史翻译记录,所述历史显示页面与所述显示页面相关联;
177.基于所述历史翻译记录中的至少一个历史翻译字符集,确定针对所述显示页面的至少一个字符划分结果。
178.可选的,其特征在于,所述结果获取模块12,具体用于:
179.从所述至少一个区域中,确定初始识别区域,并对所述初始识别区域进行选中显示处理;
180.响应于针对所述初始识别区域的第二触发操作,确定所述第二触发操作对应的待识别区域。
181.可选的,其特征在于,所述结果获取模块12,具体用于:
182.响应于针对显示页面上第一翻译控件所输入的第一触发操作,确定显示页面中的至少一个区域;
183.所述对所述初始识别区域进行选中显示处理,响应于针对所述初始识别区域的第二触发操作,确定所述第二触发操作对应的待识别区域,包括:
184.控制第二翻译控件对所述初始识别区域进行选中显示处理,响应于针对所述第二翻译控件的第二触发操作,所述第一翻译控件与所述第二翻译控件相关联。
185.可选的,其特征在于,所述结果获取模块12,具体用于:
186.加载所述第一翻译控件对应的第二翻译控件,控制第二翻译控件的控件显示区域覆盖所述初始识别区域,以对所述初始识别区域进行选中显示,所述第二翻译控件的显示区域范围大于所述第一翻译控件的显示区域范围。
187.需要说明的是,上述实施例提供的翻译装置在执行翻译方法时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的翻译装置与翻译方法实施例属于同一构思,其体现实现过程详见方法实施例,这里不再赘述。
188.上述本技术实施例序号仅仅为了描述,不代表实施例的优劣。
189.本技术实施例还提供了一种计算机存储介质,所述计算机存储介质可以存储有多条指令,所述指令适于由处理器加载并执行如上述图1~图9所示实施例的所述翻译方法,具体执行过程可以参见图1~图9所示实施例的具体说明,在此不进行赘述。
190.本技术还提供了一种计算机程序产品,该计算机程序产品存储有至少一条指令,所述至少一条指令由所述处理器加载并执行如上述图1~图9所示实施例的所述翻译方法,具体执行过程可以参见图1~图9所示实施例的具体说明,在此不进行赘述。
191.请参考图13,其示出了本技术一个示例性实施例提供的电子设备的结构方框图。本技术中的电子设备可以包括一个或多个如下部件:处理器110、存储器120、输入装置130、输出装置140和总线150。处理器110、存储器120、输入装置130和输出装置140之间可以通过总线150连接。
192.处理器110可以包括一个或者多个处理核心。处理器110利用各种接口和线路连接整个电子设备内的各个部分,通过运行或执行存储在存储器120内的指令、程序、代码集或指令集,以及调用存储在存储器120内的数据,执行电子设备100的各种功能和处理数据。可选地,处理器110可以采用数字信号处理(digital signal processing,dsp)、现场可编程门阵列(field-programmable gate array,fpga)、可编程逻辑阵列(programmable logic array,pla)中的至少一种硬件形式来实现。处理器110可集成中央处理器(central processing unit,cpu)、图像处理器(graphics processing unit,gpu)和调制解调器等中的一种或几种的组合。其中,cpu主要处理操作系统、用户界面和应用程序等;gpu用于负责显示内容的渲染和绘制;调制解调器用于处理无线通信。可以理解的是,上述调制解调器也可以不集成到处理器110中,单独通过一块通信芯片进行实现。
193.存储器120可以包括随机存储器(random access memory,ram),也可以包括只读存储器(read-only memory,rom)。可选地,该存储器120包括非瞬时性计算机可读介质(non-transitory computer-readable storage medium)。存储器120可用于存储指令、程序、代码、代码集或指令集。存储器120可包括存储程序区和存储数据区,其中,存储程序区可存储用于实现操作系统的指令、用于实现至少一个功能的指令(比如触控功能、声音播放功能、图像播放功能等)、用于实现下述各个方法实施例的指令等,该操作系统可以是安卓(android)系统,包括基于android系统深度开发的系统、苹果公司开发的ios系统,包括基于ios系统深度开发的系统或其它系统。存储数据区还可以存储电子设备在使用中所创建的数据比如电话本、音视频数据、聊天记录数据,等。
194.参见图14所示,存储器120可分为操作系统空间和用户空间,操作系统即运行于操作系统空间,原生及第三方应用程序即运行于用户空间。为了保证不同第三方应用程序均能够达到较好的运行效果,操作系统针对不同第三方应用程序为其分配相应的系统资源。然而,同一第三方应用程序中不同应用场景对系统资源的需求也存在差异,比如,在本地资源加载场景下,第三方应用程序对磁盘读取速度的要求较高;在动画渲染场景下,第三方应用程序则对gpu性能的要求较高。而操作系统与第三方应用程序之间相互独立,操作系统往往不能及时感知第三方应用程序当前的应用场景,导致操作系统无法根据第三方应用程序的具体应用场景进行针对性的系统资源适配。
195.为了使操作系统能够区分第三方应用程序的具体应用场景,需要打通第三方应用程序与操作系统之间的数据通信,使得操作系统能够随时获取第三方应用程序当前的场景信息,进而基于当前场景进行针对性的系统资源适配。
196.以操作系统为android系统为例,存储器120中存储的程序和数据如图15所示,存储器120中可存储有linux内核层320、系统运行时库层340、应用框架层360和应用层380,其中,linux内核层320、系统运行库层340和应用框架层360属于操作系统空间,应用层380属于用户空间。linux内核层320为电子设备的各种硬件提供了底层的驱动,如显示驱动、音频驱动、摄像头驱动、蓝牙驱动、wi-fi驱动、电源管理等。系统运行库层340通过一些c/c++库来为android系统提供了主要的特性支持。如sqlite库提供了数据库的支持,opengl/es库提供了3d绘图的支持,webkit库提供了浏览器内核的支持等。在系统运行时库层340中还提供有安卓运行时库(android runtime),它主要提供了一些核心库,能够允许开发者使用java语言来编写android应用。应用框架层360提供了构建应用程序时可能用到的各种api,开发者也可以通过使用这些api来构建自己的应用程序,比如活动管理、窗口管理、视图管理、通知管理、内容提供者、包管理、通话管理、资源管理、定位管理。应用层380中运行有至少一个应用程序,这些应用程序可以是操作系统自带的原生应用程序,比如联系人程序、短信程序、时钟程序、相机应用等;也可以是第三方开发者所开发的第三方应用程序,比如游戏类应用程序、即时通信程序、相片美化程序等。
197.以操作系统为ios系统为例,存储器120中存储的程序和数据如图16所示,ios系统包括:核心操作系统层420(core os layer)、核心服务层440(core services layer)、媒体层460(media layer)、可触摸层480(cocoa touch layer)。核心操作系统层420包括了操作系统内核、驱动程序以及底层程序框架,这些底层程序框架提供更接近硬件的功能,以供位于核心服务层440的程序框架所使用。核心服务层440提供给应用程序所需要的系统服务
和/或程序框架,比如基础(foundation)框架、账户框架、广告框架、数据存储框架、网络连接框架、地理位置框架、运动框架等等。媒体层460为应用程序提供有关视听方面的接口,如图形图像相关的接口、音频技术相关的接口、视频技术相关的接口、音视频传输技术的无线播放(airplay)接口等。可触摸层480为应用程序开发提供了各种常用的界面相关的框架,可触摸层480负责用户在电子设备上的触摸交互操作。比如本地通知服务、远程推送服务、广告框架、游戏工具框架、消息用户界面接口(user interface,ui)框架、用户界面uikit框架、地图框架等等。
198.在图16所示出的框架中,与大部分应用程序有关的框架包括但不限于:核心服务层440中的基础框架和可触摸层480中的uikit框架。基础框架提供许多基本的对象类和数据类型,为所有应用程序提供最基本的系统服务,和ui无关。而uikit框架提供的类是基础的ui类库,用于创建基于触摸的用户界面,ios应用程序可以基于uikit框架来提供ui,所以它提供了应用程序的基础架构,用于构建用户界面,绘图、处理和用户交互事件,响应手势等等。
199.其中,在ios系统中实现第三方应用程序与操作系统数据通信的方式以及原理可参考android系统,本技术在此不再赘述。
200.其中,输入装置130用于接收输入的指令或数据,输入装置130包括但不限于键盘、鼠标、摄像头、麦克风或触控设备。输出装置140用于输出指令或数据,输出装置140包括但不限于显示设备和扬声器等。在一个示例中,输入装置130和输出装置140可以合设,输入装置130和输出装置140为触摸显示屏,该触摸显示屏用于接收用户使用手指、触摸笔等任何适合的物体在其上或附近的触摸操作,以及显示各个应用程序的用户界面。触摸显示屏通常设置在电子设备的前面板。触摸显示屏可被设计成为全面屏、曲面屏或异型屏。触摸显示屏还可被设计成为全面屏与曲面屏的结合,异型屏与曲面屏的结合,本技术实施例对此不加以限定。
201.除此之外,本领域技术人员可以理解,上述附图所示出的电子设备的结构并不构成对电子设备的限定,电子设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。比如,电子设备中还包括射频电路、输入单元、传感器、音频电路、无线保真(wireless fidelity,wifi)模块、电源、蓝牙模块等部件,在此不再赘述。
202.在本技术实施例中,各步骤的执行主体可以是上文介绍的电子设备。可选地,各步骤的执行主体为电子设备的操作系统。操作系统可以是安卓系统,也可以是ios系统,或者其它操作系统,本技术实施例对此不作限定。
203.本技术实施例的电子设备,其上还可以安装有显示设备,显示设备可以是各种能实现显示功能的设备,例如:阴极射线管显示器(cathode ray tubedisplay,简称cr)、发光二极管显示器(light-emitting diode display,简称led)、电子墨水屏、液晶显示屏(liquid crystal display,简称lcd)、等离子显示面板(plasma display panel,简称pdp)等。用户可以利用电子设备101上的显示设备,来查看显示的文字、图像、视频等信息。所述电子设备可以是智能手机、平板电脑、游戏设备、ar(augmented reality,增强现实)设备、汽车、数据存储装置、音频播放装置、视频播放装置、笔记本、桌面计算设备、可穿戴设备诸如电子手表、电子眼镜、电子头盔、电子手链、电子项链、电子衣物等设备。
204.在图13所示的电子设备中,其中电子设备可以是一种终端,处理器110可以用于调
用存储器120中存储的应用程序,并具体执行以下操作:
205.确定显示页面中的至少一个区域,所述至少一个区域基于对所述显示页面的字符划分结果确定;
206.从所述至少一个区域中确定待识别区域,并获取所述待识别区域中的待识别字符集的翻译结果;
207.显示对所述待识别区域中待识别字符集的翻译结果。
208.在一个实施例中,所述处理器1001在执行所述确定显示页面中的至少一个区域时,具体执行以下操作:
209.响应于针对显示页面的第一触发操作,获取所述显示页面中的至少一个区域,从所述至少一个区域中确定待识别区域;或,
210.响应于针对显示页面的第一触发操作,对所述显示页面划分至少一个区域,从所述至少一个区域中确定待识别区域。
211.在一个实施例中,所述处理器1001在执行所述对所述显示页面划分至少一个区域,从所述至少一个区域中确定待识别区域时,具体执行以下操作:
212.获取所述显示页面中的字符显示信息;基于所述字符显示信息对所述显示页面划分至少一个区域,基于第一触发操作的操作终点从所述至少一个区域中确定待识别区域;或,
213.基于第一触发操作的操作位移位置在所述显示页面上确定目标显示区域,获取目标显示区域中的字符显示信息;基于所述字符显示信息对所述显示页面划分至少一个区域,基于第一触发操作的操作终点从所述至少一个区域中确定待识别区域。
214.在一个实施例中,所述处理器1001在执行所述基于第一触发操作的操作位移位置在所述显示页面上确定目标显示区域时,具体执行以下操作:
215.获取第一触发操作的操作位移位置,以所述操作位移位置为参考点,确定目标区域规格指示的目标显示区域。
216.在一个实施例中,所述处理器1001在执行所述基于所述字符显示信息对所述显示页面划分至少一个区域时,具体执行以下操作:
217.提取所述字符显示信息的信息语义特征,基于所述信息语义特征确定所述显示页面中的至少一个字符划分结果,确定所述至少一个字符划分结果分别对应的区域。
218.在一个实施例中,所述处理器1001在执行所述基于所述信息语义特征确定所述显示页面中的至少一个字符划分结果,确定所述至少一个字符划分结果分别对应的区域时,具体执行以下操作:
219.基于所述信息语义特征在所述显示页面的字符集中确定至少一个参考字符句段,确定所述至少一个参考字符句段分别对应的区域;和/或,
220.基于所述信息语义特征在所述显示页面的字符集中确定至少一个参考字符词,确定所述至少一个参考字符词分别对应的区域。
221.在一个实施例中,所述处理器1001在执行所述基于所述信息语义特征确定所述显示页面中的至少一个字符划分结果时,具体执行以下操作:
222.基于所述信息语义特征获取历史显示页面的历史翻译记录,所述历史显示页面与所述显示页面相关联;
223.基于所述历史翻译记录中的至少一个历史翻译字符集,确定针对所述显示页面的至少一个字符划分结果。
224.在一个实施例中,所述处理器1001在执行所述从所述至少一个区域中确定待识别区域时,具体执行以下操作:
225.从所述至少一个区域中,确定初始识别区域,并对所述初始识别区域进行选中显示处理;
226.响应于针对所述初始识别区域的第二触发操作,确定所述第二触发操作对应的待识别区域。
227.在一个实施例中,所述处理器1001在执行所述确定显示页面中的至少一个区域时,具体执行以下操作:
228.响应于针对显示页面上第一翻译控件所输入的第一触发操作,确定显示页面中的至少一个区域;
229.所述对所述初始识别区域进行选中显示处理,响应于针对所述初始识别区域的第二触发操作,确定所述第二触发操作对应的待识别区域,包括:
230.控制第二翻译控件对所述初始识别区域进行选中显示处理,响应于针对所述第二翻译控件的第二触发操作,所述第一翻译控件与所述第二翻译控件相关联。
231.在一个实施例中,所述处理器1001在执行所述控制第二翻译控件对所述初始识别区域进行选中显示处理时,具体执行以下操作:
232.加载所述第一翻译控件对应的第二翻译控件,控制第二翻译控件的控件显示区域覆盖所述初始识别区域,以对所述初始识别区域进行选中显示,所述第二翻译控件的显示区域范围大于所述第一翻译控件的显示区域范围。
233.本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体或随机存储记忆体等。
234.以上所揭露的仅为本技术较佳实施例而已,当然不能以此来限定本技术之权利范围,因此依本技术权利要求所作的等同变化,仍属本技术所涵盖的范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1