在具有触摸屏的电子智能设备中获取词条的方法及装置制造方法

文档序号:6527015阅读:144来源:国知局
在具有触摸屏的电子智能设备中获取词条的方法及装置制造方法
【专利摘要】提供了一种在具有触摸屏的电子智能设备中获取词条的方法及装置,所述方法包括:接收在具有文本信息的用户界面上进行的预定操作;获取通过所述预定操作选中的文本信息;对获取到的文本信息进行切词;确定该切词结果中的新词和/或热词。采用本发明所述方法及装置不仅能够将人们在日常通信交流过程中不断出现的新词、热词及时整理和收录到输入法的字典中,同时还进一步提高了输入法首选的准确率。
【专利说明】在具有触摸屏的电子智能设备中获取词条的方法及装置
【技术领域】
[0001]本发明涉及一种在具有触摸屏的电子智能设备中获取词条的方法及装置,尤其涉及一种在具有触摸屏的电子智能设备中根据用户在具有文本信息的用户界面上进行的预定操作获取新词、热词的技术。
【背景技术】
[0002]目前,简、繁、日、韩等输入法系统基本上都是采用字典(即词库)以及字典中包含的词频信息向用户展现各类候选词的排序,因此输入法首选词准确率的高低直接决定了这类输入法输入的准确率的高低。现有技术为提高首选词的准确率,主要采用以下技术手段来实现,例如,在输入法中加载各类专业细胞字典,通过服务器更新输入法字典,进而扩充字典中的包含的各类词条,可以说,这些方法虽然可以在一定程度上提高输入法首选词的准确率,但是随着互联网日新月异的发展,对于一些在互联网中实时出现的新词、热词来说,这些方法对网络中出现的新词、热词的技术处理上显得相对滞后。
[0003]随着各种智能上网设备的飞速发展,通过微博、微信、博客等各种通信客户端工具进行网络交流成为人们日常生活中必不可少的通信交流手段,因此一些新词在互联网不断涌现,例如,赶脚、有木有、肿么了、给力等,而一些特定词条的热度会随着某个重大事件的突然出现而在某个时间段内不断出现,例如,台风海燕等,因此,这些新词和热词是随着时间的推移而实时变化的,但是,采用上述方法难以将这些新词、热词及时整理和扩充到字典中,从而难以进一步提高输入法首选的准确率,这影响了人们对信息输入的体验。

【发明内容】

[0004]本发明的目的在于提供一种在具有触摸屏的电子智能设备中获取词条的方法及装置,不仅能够将人们在日常通信交流过程中不断出现的新词、热词及时整理和收录到输入法的字典中,同时还进一步提高了输入法首选的准确率。
[0005]根据本发明的一方面,提供一种在具有触摸屏的电子智能设备中获取词条的方法,包括:接收在具有文本信息的用户界面上进行的预定操作;获取通过所述预定操作选中的文本信息;对获取到的文本信息进行切词;确定该切词结果中的新词和/或热词。
[0006]优选地,所述预定操作为沿文字方向的滑动操作。
[0007]优选地,获取通过所述预定操作选中的文本信息的步骤包括:获取滑动操作的起点和终点;将起点和终点之间的文本信息确定为选中的文本信息。
[0008]优选地,所述预定操作为在具有文本信息的用户界面上绘制的闭合形状。
[0009]优选地,获取通过所述预定操作选中的文本信息的步骤包括:将闭合形状包围的文本信息确定为选中的文本信息。
[0010]优选地,确定该切词结果中的新词的步骤包括:获取该切词结果中的任一词条;将切词结果中的没有出现在预置的输入法字典中的词条确定为新词。
[0011]优选地,确定该切词结果中的热词的步骤包括:根据从预置的输入法字典获取的切词结果中的词条在最近预设时间段内出现的词频信息,确定词条的热度;将热度不小于预设热度阈值的词条确定为热词。
[0012]根据本发明的一方面,提供一种在具有触摸屏的电子智能设备中获取词条的装置,包括:接口单元,用于接收在具有文本信息的用户界面上进行的预定操作;获取单元,用于获取通过所述预定操作选中的文本信息;切词单元,用于对获取到的文本信息进行切词;确定单元,用于确定该切词结果中的新词和/或热词。
[0013]优选地,所述预定操作为沿文字方向的滑动操作。
[0014]优选地,所述获取单元获取滑动操作的起点和终点;将起点和终点之间的文本信息确定为选中的文本信息。
[0015]优选地,所述预定操作为在具有文本信息的用户界面上绘制的闭合形状。
[0016]优选地,所述获取单元将闭合形状包围的文本信息确定为选中的文本信息。
[0017]优选地,所述确定单元将切词结果中的没有出现在预置的输入法字典中的词条确定为新词。
[0018]优选地,所述确定单元根据从预置的输入法字典获取的切词结果中的词条在最近预设时间段内出现的词频信息,确定词条的热度;将热度不小于预设热度阈值的词条确定为热词。
[0019]有益效果
[0020]与现有技术相比,本发明具有以下优点:本发明不仅能够将人们在日常通信交流过程中不断出现的新词、热词及时整理和收录到输入法的字典中,同时还进一步提高了输入法首选的准确率,从而进一步增强了用户体验。
【专利附图】

【附图说明】
[0021]通过下面结合附图进行的描述,本发明的上述和其他目的和特点将会变得更加清楚,其中:
[0022]图1是示出根据本发明的示例性实施例的在具有触摸屏的电子智能设备中获取词条的方法的流程图;
[0023]图2是示出根据本发明的示例性实施例的在具有触摸屏的电子智能设备中获取词条的装置的结构框图;
[0024]图3是示出根据本发明的示例性实施例的在具有触摸屏的电子智能设备中通过沿文字方向绘制线条获取词条的屏幕截图;
[0025]图4是示出根据本发明的示例性实施例的在具有触摸屏的电子智能设备中通过沿文字方向滑动选择词条的屏幕截图;
[0026]图5是示出根据本发明的示例性实施例的在具有触摸屏的电子智能设备中通过绘制的闭合曲线获取词条的屏幕截图。
【具体实施方式】
[0027]以下,将参照附图来详细说明本发明的实施例。
[0028]图1示出了本发明一种在具有触摸屏的电子智能设备中获取词条的方法的优选实施例的流程图。图2示出的一种在具有触摸屏的电子智能设备中获取词条的装置可用于实现图1中所述的方法。
[0029]参照图1,在110中,所述装置接收在具有文本信息的用户界面上进行的预定操作。
[0030]在120中,所述装置获取通过所述预定操作选中的文本信息。
[0031]该用户界面可以是用户在智能设备中正在浏览的网页的界面,也可以是电子邮件或其他文本编辑应用(如:pdf、txt等),对此本发明不做限制,只要是能够向所述用户展示文本信息的用户界面即可。
[0032]根据本发明的一个示例性实施例,所述预定操作为沿文字方向的滑动操作。
[0033]该文字方向可以是横向,也可以是竖向,还可以是与水平方向呈预设角度的斜向,对此本发明不作限制,只要所述预定操作沿文字方向的滑动即可。需要说明的是,沿文字方向的滑动操作可以是用户在触摸屏上绘制的单划线,也可以是双划线,还可以是波浪线,对此本发明也不作限制,只要沿文字方向的滑动操作能够指示选中的文本信息即可。另外,还需要进一步说明的是,沿文字方向的滑动操作可以是在智能设备显示的任意一段文本信息的下方,也可以穿越智能设备显示的任意一段文本信息,对此本发明也不作限制。
[0034]图3示出了本发明在具有触摸屏的电子智能设备中通过沿文字方向绘制线条获取词条的屏幕截图。图中所示的3A为所述装置在具有触摸屏的电子智能设备中绘制的单划线;图中所示的3B为所述装置在具有触摸屏的电子智能设备中绘制的双划线;图中所示的3C为所述装置在具有触摸屏的电子智能设备中绘制的波浪线。
[0035]具体地,根据本发明所述预定操作为沿文字方向的滑动操作的示例性实施例,所述装置获取通过所述预定操作选中的文本信息的具体步骤为:所述装置获取滑动操作的起点和终点;将起点和终点之间的文本信息确定为选中的文本信息。
[0036]更为具体地,所述装置将起点和终点之间的文本信息确定为选中的文本信息的具体步骤为:所述装置获取智能设备用户界面的显示字体的字高;根据获取到的字高及起点和终点的纵坐标,确定划动操作在智能设备用户界面中对应的行;根据确定的行及起点和终点的横坐标,确定起点和终点之间的文本信息,将确定的文本信息确定为选中的文本信
肩、O
[0037]以下结合具体实施例对上述实施过程进行详细说明,如果沿文字方向的滑动操作为单划线,则所述装置通过如下过程获取通过所述预定操作选中的文本信息:
[0038]1、所述装置可通过系统提供的操作 API (Application Programming Interface,应用程序编程接口)获得下划线起点和终点的屏幕坐标:(XI,Yl)和(X2,Y2)。
[0039]2、所述装置可通过系统提供的API获得智能设备用户界面中各行字体的字高H,根据起点和终点的屏幕坐标确定下划线所在的行。
[0040]3、所述装置获取该行的文本数据流,通过对该行包含的文本信息(字或者符号)进行循环计算,计算下划线在起点和终点之间的文本信息。
[0041]需要说明的是,所述装置还可在上述实施方法进行适当变形,采用各种现有技术获得通过绘制下划线、双划线以及波浪线等各种沿文字方向滑动选中的文本信息。
[0042]图4示出了本发明在具有触摸屏的电子智能设备中通过沿文字方向滑动选择词条的屏幕截图。图中所示的4A为所述装置在具有文本信息的用户界面上选中的部分文本信息。[0043]具体地,根据本发明所述预定操作为沿文字方向的滑动操作的示例性实施例所述装置获取通过所述预定操作选中的文本信息的具体步骤为:所述装置从所述设备的剪切板中获取用户在具有文本信息的用户界面上选中的文本信息;将所述获取到的文本信息确定为选中的文本信息。
[0044]此外,所述装置还可以采用各种现有技术将沿文字方向滑动选中的文本信息确定为选中的文本信息。
[0045]根据本发明的一个示例性实施例,所述预定操作为在具有文本信息的用户界面上绘制的闭合形状。
[0046]其中,所述闭合形状可以是完全闭合的曲线,也可以是半闭合的曲线,只要该闭合形状能够包围住智能设备在用户界面中显示的部分或全部文本信息即可。
[0047]图5示出了本发明在具有触摸屏的电子智能设备中通过绘制的闭合形状获取词条的屏幕截图。图中所示的5A为所述装置在具有触摸屏的电子智能设备中绘制的完全闭合曲线;图中所示的5B为所述装置在具有触摸屏的电子智能设备中绘制的半闭合曲线。
[0048]具体地,根据本发明所述预定操作为在具有文本信息的用户界面上绘制的闭合形状的示例性实施例,所述装置获取通过所述预定操作选中的文本信息的具体步骤为:所述装置将闭合形状包围的文本信息确定为选中的文本信息。
[0049]具体实施时,所述装置可以获取该闭合形状在具有文本信息的用户界面上包围的局部屏幕截图;对获取到的局部屏幕截图进行文本识别;将识别的文本信息确定为选中的文本信息。
[0050]此外,所述装置还可以采用各种现有技术获取该闭合形状选中的文本信息,例如,所述装置还可以根据该闭合形状的位置及大小确定该闭合形状选中的文本信息。
[0051]在120中,所述装置对获取到的文本信息进行切词。
[0052]具体实施时,所述装置可采用各种现有技术对获取到的文本信息进行切词,例如,基于字符串匹配的分词方法、基于理解的分词方法以及基于统计的分词方法,对此本发明不再赘述。
[0053]在130中,所述装置确定该切词结果中的新词/热词。
[0054]具体地,根据本发明的一个示例性实施例,所述装置确定切词的结果中的新词的具体步骤为:所述装置获取该切词结果中的任一词条;如果该词条没有出现在预置的输入法字典中,则将该词条确定为新词。
[0055]具体实施时,所述装置可将该词条与预置的输入法字典中的各个词条进行比对,以确定该词条是否为新词。
[0056]需要指出的是,预置的输入法字典可以在云端,也可以在本地设备中。
[0057]具体实施时,根据本发明预置的输入法字典在云端的示例性实施例,所述装置将120中的切词得到的多个词条上传到云端,通过云端将所述装置上传的词条与所述云端预置的输入法字典中的各个词条进行比较,如果上传的词条没有出现在云端的输入法字典中,则将上传的词条标记为新词,然后将所述新词反馈给所述装置对应的客户端,以便其更新该客户端所在设备中预置的输入法字典,也可以将该新词反馈给多个客户端,以便多个客户端所在设备中预置的输入法字典得到更新。
[0058]具体实施时,根据本发明预置的输入法字典在本地的示例性实施例,所述装置将120中的切词得到多个词条与本地设备预置的输入法字典中的词条进行比较,如果上传的词条没有出现在本地设备预置的输入法字典,则将上传的词条标记为新词,并添加至本地设备预置的输入法字典。
[0059]具体地,根据本发明的一个示例性实施例,所述装置确定切词结果中的热词的具体步骤为:所述装置获取该切词结果中的任一词条;根据从预置的输入法字典获取该词条在最近预设时间段内出现的词频信息,确定该词条的热度;将热度不小于预设热度阈值的词条确定为热词。
[0060]更为具体地,根据本发明的一个示例性实施例,所述装置可采用加权打分法确定该词条的热度。具体的计算公式如下:
[0061]词条热度=(所有词条的平均得分*所有词条的平均词频+单个词条的得分*单个词条的总词频)/ (所有词条的平均词频+单个词条的总词频)
[0062]其中,单个词条的得分=最近一天的词频/单个词条的总词频。
[0063]以下结合具体的实施例对上述实施过程进行详细说明,假设有四个词A、B、C、D在2013-11-10和2013-11-11这两天内出现的次数的如下如下表所示:
[0064]
【权利要求】
1.一种在具有触摸屏的电子智能设备中获取词条的方法,包括: 接收在具有文本信息的用户界面上进行的预定操作; 获取通过所述预定操作选中的文本信息; 对获取到的文本信息进行切词; 确定该切词结果中的新词和/或热词。
2.如权利要求1所述的方法,其特征在于,所述预定操作为沿文字方向的滑动操作。
3.如权利要求2所述的方法,其特征在于,获取通过所述预定操作选中的文本信息的步骤包括: 获取滑动操作的起点和终点; 将起点和终点之间的文本信息确定为选中的文本信息。
4.如权利要求1所述的方法,其特征在于,所述预定操作为在具有文本信息的用户界面上绘制的闭合形状。
5.如权利要求4所述的方法,其特征在于,获取通过所述预定操作选中的文本信息的步骤包括: 将闭合形状包围的文本信息确定为选中的文本信息。
6.如权利要求1~5任·一项所述的方法,其特征在于,确定该切词结果中的新词的步骤包括: 将切词结果中的没有出现在预置的输入法字典中的词条确定为新词。
7.如权利要求1~5任一项所述的方法,其特征在于,确定该切词结果中的热词的步骤包括: 根据从预置的输入法字典获取的切词结果中的词条在最近预设时间段内出现的词频信息,确定词条的热度; 将热度不小于预设热度阈值的词条确定为热词。
8.一种在具有触摸屏的电子智能设备中获取词条的装置,包括: 接口单元,用于接收在具有文本信息的用户界面上进行的预定操作; 获取单元,用于获取通过所述预定操作选中的文本信息; 切词单元,用于对获取到的文本信息进行切词; 确定单元,用于确定该切词结果中的新词和/或热词。
9.如权利要求8所述的装置,其特征在于,所述预定操作为沿文字方向的滑动操作。
10.如权利要求9所述的装置,其特征在于,所述获取单元获取滑动操作的起点和终点;将起点和终点之间的文本信息确定为选中的文本信息。
11.如权利要求8所述的装置,其特征在于,所述预定操作为在具有文本信息的用户界面上绘制的闭合形状。
12.如权利要求11所述的装置,其特征在于,所述获取单元将闭合形状包围的文本信息确定为选中的文本信息。
13.如权利要求8~12任一项所述的装置,其特征在于,所述确定单元将切词结果中的没有出现在预置的输入法字典中的词条确定为新词。
14.如权利要求8~12任一项所述的装置,其特征在于,所述确定单元根据从预置的输入法字典获取的切词结果中的词条在最近预设时间段内出现的词频信息,确定词条的热度;将热 度不小于预设热度阈值的词条确定为热词。
【文档编号】G06F17/30GK103714168SQ201310752329
【公开日】2014年4月9日 申请日期:2013年12月31日 优先权日:2013年12月31日
【发明者】陈晓昕, 吴先超, 肖日新 申请人:百度国际科技(深圳)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1