文字输入方法和装置、计算机可读存储介质、终端与流程

文档序号:15492951发布日期:2018-09-21 21:00阅读:125来源:国知局

本发明涉及计算机输入法技术领域,特别是涉及一种文字输入方法和装置、计算机可读存储介质、终端。



背景技术:

随着终端设备进入智能时代,手机、通讯平板等移动终端在人们的生活中扮演越来越重要的角色。在向终端设备输入指令时常使用文字输入方法。

文字输入法采用的技术一般都是根据用户输入字型或者字音与字典之间的映射关系得到候选词供用户选择。为了提高输入法的输入效率,进一步采用个性化功能,通过获取输入的字型或字音与各用户历史输入记录之间的映射关系得到针对各个用户的个性化候选词。但存在的问题是,当其他人借用手机或自己在公共场合使用手机进行文字输入时,输入法显示的个性化候选词容易暴露用户的隐私。



技术实现要素:

本申请实施例提供一种文字输入方法和装置、计算机可读存储介质、终端,可以在公共场景下对文字输入过程进行私密化处理,避免文字输入过程暴露用户的隐私。

一种文字输入方法,包括:

当处于输入状态时,接收输入并根据输入实时提取候选词;候选词来自于核心词库、基于用户词频统计的个性词库以及关联用户输入习惯的联想词库;

检测当前的输入环境;输入环境包括公共环境和私密环境;

若当前的输入环境为公共环境,则获取敏感词列表,并对包含在敏感词列表中的候选词进行私密化处理;

显示处理后的候选词以供选择,并将被选择的候选词输入。

一种文字输入装置,包括:

候选词提取模块,用于当处于输入状态时,接收输入并根据输入实时提取候选词;候选词来自于核心词库、基于用户词频统计的个性词库以及关联用户输入习惯的联想词库;

检测模块,用于检测当前的输入环境;输入环境包括公共环境和私密环境;

处理模块,用于当输入环境为公共环境时,获取敏感词列表,并对包含在敏感词列表中的候选词进行私密化处理。

显示输入模块,用于显示处理后的候选词以供选择,并将被选择的候选词输入。

一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现本申请各个实施例中的信息处理方法的步骤。

一种终端,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现本申请各个实施例中的信息处理方法的步骤。

上述文字输入方法和装置、计算机可读存储介质、终端,通过对输入过程中提取的候选词以及其他反映输入历史记录的信息进行私密化处理,避免了输入过程中显示的候选词或其他输入历史记录泄露用户隐私。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为一个实施例中文字输入方法的应用环境图;

图2为一个实施例中终端的架构示意图;

图3为一个实施例中文字输入方法的流程图;

图4为一个实施例中文字输入方法的终端界面示意图;

图5为一个实施例中对包含在敏感词列表中的候选词进行私密化处理后的终端界面示意图;

图6为一个实施例中形成或补充敏感词列表步骤的流程图;

图7为另一个实施例中形成或补充敏感词列表步骤的流程图;

图8为一个实施例中检测当前的输入环境的流程图;

图9为一个实施例中检测并判断处于前台运行状态的应用的类型特征是否符合公共应用特征的流程图;

图10为另一个实施例中检测当前的输入环境的流程图;

图11为一个实施例中检测并判断当前的用户地理特征是否符合公共地理特征的步骤的流程图;

图12为一个实施例中文字输入装置的结构框图;

图13为与本申请实施例提供的终端相关的手机的部分结构的框图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。

图1为一个实施例中的文字输入方法的应用环境示意图。如图1所示,该应用环境包括终端110和服务器120。终端110的交互界面采集用户的交互操作以接收输入指令,在输入文字指令时需要采用文字输入方法,所述文字输入法是指为了将文字输入计算机或其他设备(如手机)而采用的软件方法。终端110通过服务器120获取文字输入过程中所需的词库。其中,既可以实时通过网络与服务器120连接以获取各类词库,也可以预先通过网络从服务器120获取各类词库并将该词库存储在终端110的存储单元中,从而在未联网条件下也可以在文字输入过程中调取各类词库。

图2为一个实施例中终端110的架构示意图。如图2所示,提供了一种终端110的内部结构示意图。该终端110包括通过系统总线连接的处理器、存储器和显示屏。其中,该处理器用于提供计算和控制能力,支撑整个终端110的运行。存储器用于存储数据、程序、和/或指令代码等,存储器上存储至少一个计算机程序,该计算机程序可被处理器执行,以实现本申请实施例中提供的适用于终端的文字输入方法。存储器可包括磁碟、光盘、只读存储记忆体(read-onlymemory,rom)等非易失性存储介质,或随机存储记忆体(random-access-memory,ram)等。例如,在一个实施例中,存储器包括非易失性存储介质及内存储器。非易失性存储介质存储有操作系统、数据库和计算机程序。该数据库中存储有用于实现以下各个实施例所提供的一种文字输入方法相关的数据,比如可存储候选词库或预存用户输入记录等。该计算机程序可被处理器所执行,以用于实现本申请各个实施例所提供的一种文字输入方法。内存储器为非易失性存储介质中的操作系统、数据库和计算机程序提供高速缓存的运行环境。显示屏可以是触摸屏,比如为电容屏或电子屏,用于显示终端的界面信息以及检测用户操作动作。该终端110可以是手机、平板电脑或者个人数字助理或穿戴式设备等。

图3为一个实施例中的文字输入方法的流程图。本实施例中的文字输入方法,以运行于图1中的终端110上为例进行描述。如图3所示,文字输入方法包括步骤302至步骤308。图4为一个实施例中文字输入方法的终端界面示意图。接下来将结合图3和图4对文字输入方法进行进一步举例说明。

步骤302,当处于输入状态时,接收输入并根据输入实时提取候选词;候选词来自于核心词库、基于用户词频统计的个性词库以及关联用户输入习惯的联想词库。

输入状态是指当前终端设备处于文字输入状态,在此状态下可实时检测用户的输入操作以生成输入指令。例如,当图4界面显示的文字输入框420内光标422闪烁,则表明当前处于输入状态,此时通常会在界面上同步显示模拟键盘430以供用户进行输入操作。接收输入是指接收输入指令,输入指令用于输入某个字型或某个字音,例如,图4界面上显示的汉字字音“shi’b”450即为在接收用于输入字音“shi’b”的输入指令后反映在显示界面上的情形。根据“shi’b”在词库中提取并显示相应的多个候选词。所述多个候选词可以以候选词列表的形式提取,按照各个候选词在列表中的顺序依次显示在候选词框470中,以供用户选择。例如图4中的候选词框470内显示的多个词语“是不”、“四辩”、“识别”等都是候选词在终端上的显示形式。候选词不一定是一个词语,还可以是一段短语,例如“是不是在路上”“是不是饿了”等。

词库包括核心词库、基于用户词频统计的个性词库以及关联用户输入习惯的联想词库。核心词库通常来自于字典、词典等基础型词库,是一种标准词库。个性词库通过统计用户输入各类词语的频率形成,高频输入的词语将在候选词框470中优先显示,由此可知,不同用户的个性词库是不同的,个性词库中可能涉及用户的隐私数据(如高频输入的是某个人名则表明用户对此人十分关注,可能是重要客户、男女朋友之类的)。联想词库可以包括但不限于通讯录的名字、电话号码和邮箱地址信息等。例如,联想词库中预先存储了“acip@xxx.com”这个邮件地址信息,输入“acip”后,根据输入在联想词库中提取候选词“@xxx.com”并优先显示在候选词框470中。同理,联想词库中也可能涉及用户的隐私数据。

优先显示可以是将候选词以醒目的字体或颜色显示在候选词框470,或者将候选词排列在首位或第二位等靠前的位置显示。由于候选词的显示顺序可按照候选词在候选词列表中的排列顺序决定,排在列表前列的候选词优先显示,因此可以通过更改候选词在列表中的位置信息更改候选词的显示优先级。

需要说明的是,词库还可以包括包含某技术领域专业名词的专业词库、用户自行创建的自定义词库等。词库的范围不限,只要可用于提取相应的候选词即可。

步骤s304,检测当前的输入环境;输入环境包括公共环境和私密环境。

文字输入过程中,由于个性词库和联想词库等可能涉及用户的隐私数据,在根据个性词库和联想词库提高用户的输入效率的同时,这种优先显示可能让其他人察觉用户近期关注热点,无形中暴露了用户隐私。因此需要在不同的输入环境下对候选词显示进行相应的处理,以达到即保证输入效率又避免泄露隐私的目的。

用户通常希望在自己单独使用手机时允许查看所有与隐私相关的数据,而在公共场合使用手机或者其他人借用手机的情况下,不允许查看与隐私相关的数据。由此可将终端上的输入环境划分为公共环境和私密环境,并针对这两类环境采取不同的候选词处理方法(后文详述)。所谓公共环境是指终端限制隐私数据的显示输出的场景,私密环境是指允许与隐私相关的数据输出显示的场景。例如传统技术中存在访客模式和非访客模式,可将访客模式设置为一种公共环境,非访客模式设置为一种私密环境,通过检测当前是否处于访客模式下,可判断当前终端的输入环境。还可通过检测前台运行软件的类型以及所处的地理位置判断是否处于公共环境下(后文详述)。

步骤306,若当前的输入环境为公共环境,获取敏感词列表,并对包含在敏感词列表中的候选词进行私密化处理。

敏感词列表是指一系列涉及用户隐私的词语或短句,形式上可以是一个数据包,该数据包内的词句以编码的形式存在。数据包可以存储在终端的非易失性存储介质内,也可以存储在与终端连接的服务器内,进而通过网络从服务器获取该数据包。数据包可采用加密的形式,以防止数据包内的敏感词被泄露而暴露用户隐私。若当前终端上存在多个用户模式,则在不同用户模式下生成不同的数据包,在特定用户模式下只获取与该模式对应的数据包,从而使得不同用户模式下的敏感词列表相互独立,互不干扰,可对不同用户个性化定制专属的敏感词列表。敏感词列表内的各个敏感词可以一次性生成,还可以在生成之后持续地在敏感词列表内补充新的敏感词或移出旧的敏感词。形成和补充敏感词列表的方法可以通过大数据分析形成,还可以根据用户习惯个性化定制(后续详述)。

在根据输入实时提取候选词之后,以及显示候选词之前,对于不同环境下的候选词处理方法不尽相同。具体地,私密环境下,根据输入的文本提取的候选词可不经私密化处理即显示,该实现过程可参照传统技术,在此不再赘述;而公共环境下,根据输入的文本提取的候选词需要进行私密化处理,才可显示处理后的候选词。

在私密化处理过程中,首先可以先判断所提取的候选词中是否有包含在敏感词列表中的敏感性质候选词,对敏感性质的候选词进行私密化处理,对其余非敏感性质的候选词不进行私密化处理,但可为配合私密化处理的进行相应的调整处理。

图5为一个实施例中对包含在敏感词列表中的候选词进行私密化处理后的终端界面示意图。接下来将结合图5和图4说明在某一词语加入隐私词列表后,如何根据该隐私词进行私密化处理。

相比于图4实施例中并未设置敏感词包括“四辩”,图5的实施例中由于将“四辩”设置为敏感词,(由于其暴露了爱好辩论的隐私),则根据输入“shi’b”提取的“是不”、“四辩”、“识别”等候选词中包括“四辩”这一敏感性质的候选词。对“四辩”这个候选词进行私密化处理,如图5所示,将“四辩”这一词从提取的候选词列表中剔除,从而不显示在候选词框570内。或者将“四辩”这一词从候选词显示列表上靠前位置(由于是个性词库中的词语,通常处于候选词列表前列)转而排到表中靠后的列上以避免优先显示,还可以选择只显示“四辩”中的“四”以实现敏感性词语的模糊化显示。对其余的“是不”、“四辩”、“识别”等候选词虽不进行私密化处理,但可以进行相应的调整处理,例如在“四辩”这一词从候选词显示列表上靠前位置转而排到靠后的位置时,其余候选词在候选词框570内的显示顺序均提前一位,防止某个候选词框出现空白等问题。

重新参见图3,步骤s308,显示处理后的候选词以供选择,并将被选择的候选词输入。

显示所述候选词的设备可以是任何显示设备,如计算机显示器,智能手机显示屏以及投影屏幕等。处理是指进行上述提及的私密化处理,还可以包括上述提及的调整处理。而对于不进行私密化处理的非敏感性质的敏感词,则可以直接显示在显示屏上。私密化处理后的敏感性质候选词的显示方式可以是隐藏,也可以是模糊显示(显示词语中的部分字符)。需要说明的是,终端只是显示候选词供用户选择,自身一般不会自动执行选择候选词的步骤。具体情况可以是,在终端检测用户的选择操作,接收到选择指令后,根据所述选择指令将被选择的候选词输入。

在一个实施例中,文字输入方法还包括形成或补充敏感词列表的步骤。图6为一个实施例中形成或补充敏感词列表步骤的流程图,如图6所述,形成或补充敏感词列表步骤包括步骤602至步骤606。

步骤602,获取并比较在公共环境和私密环境的输入记录。

通常而言,用户在一些比较私密的环境下大概率会输入一些涉及隐私数据的文字,例如“身份证号是352229****”,而处在公共环境下输入涉及隐私数据的概率大大降低,同时不可避免的是,有些常用词语在隐私和公共环境下都会输入,而通过剔除在隐私环境下输入的非隐私但常用的数据,可以选择性获得隐私环境下输入的隐私数据。

具体地,通过检测当前的输入环境可以判断当前所处的环境为公共环境还是私密环境,并存储在公共环境的公共输入记录和私密环境下的私密输入记录。这两类数据可以是直接存储在终端的存储设备内,也可以上传并存储在服务器中从而在需要时从服务器获取,节省本地的存储空间。比较的过程可以是将隐私输入记录中的某一词语逐个与公共输入记录中的词语相比较,若存在一致,则剔除该隐私输入记录中的词语。还可以反过来将公共输入记录中的某一词语逐个与私密输入记录中的词语相比较,若存在一致,则剔除隐私输入记录中的词语。

步骤604,获取在私密环境下输入,而未在公共环境下输入的输入信息作为私密文本信息。

在上述过程中,经过比较、剔除步骤后获得的私密输入记录即可作为私密文本信息。进一步地,对该私密文本信息可进行加密处理,以防止私密文本信息中涉及隐私的文字数据被泄露。

步骤606,根据私密文本信息,形成或补充所述敏感词列表。

若之前未存在敏感词列表,则可根据私密文本信息形成敏感词列表,例如可将私密文本信息转化为文字列表的形式,从而可直接作为敏感词列表使用。若事先已经存在敏感词列表,则可以将私密文本信息补充进敏感词列表中,补充方式可以是在原敏感词列表上新增私密文本信息中包含的词语,实现敏感词列表的扩充更新;还可以是替换敏感词列表中现存的最早添入的敏感词以实现敏感词的替换更新,因为随着用户的生活习惯变化,敏感词列表也在变化,若已经在很长一段时间内未输入某一特定敏感词,那么可在更新时顺便将该敏感词剔除,从而减少敏感词的数量,提升敏感词私密化处理的速度。再者,私密文本信息作为一个中间状态文件,可在根据私密文本信息形成或补充敏感词列表后立即自动将原本的私密文本信息删除,以避免涉及隐私的文字数据泄露。

图7为另一个实施例中形成或补充敏感词列表步骤的流程图。如图7所述,形成或补充敏感词列表步骤包括步骤702至步骤706。

步骤702,采用大数据手段分析用户在私密环境中的输入样本,生成敏感词推荐列表;敏感词推荐列表包括至少两个待选的敏感词。

大数据手段是指一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。

可通过对大量用户在私密环境中的输入样本进行分析挖掘,剔除同样也会在公共环境下输入的基本用语后,获得用户只会在私密环境下输入的私密输入数据,该私密输入数据是大数据分析的对象。大数据分析技术将大量用户的私密输入数据按输入频次进行排列,提取私密输入数据中高频次的词语生成敏感词推荐列表。

还可以先根据私密环境中的输入样本对用户进行类型划分,因为拥有相同兴趣或生活习惯的用户的隐私词语往往存在一定相似性。再对同类用户的私密输入数据进行上述大数据分析,提取该类用户高频输入词语生成针对该类用户的敏感词推荐列表。从而提高敏感词推荐列表的准确性。提高了设置敏感词的效率。

步骤704,获取敏感词推荐列表。

该获取可以是定时获取,该时间间隔可以自动设定,也可以用户根据自身需求设置。该获取也可以定条件获取,该条件可以在检测到用户相应的触发操作后执行该获取步骤,也可以检测到相应的网络环境后执行该获取步骤。具体地,在数据网络等按流量付费的网络环境下,不执行获取敏感词推荐列表的步骤,在wifi网络等不限流量的网络环境下,允许获取敏感词推荐列表。

步骤706,接收选择指令,并根据选择指令选择部分或全部待选的敏感词以形成敏感词列表。

可检测用户的触控操作,生成一键选择指令。即可自动选择敏感词推荐列表中的全部敏感词,从而补充或形成敏感词列表。还可以是先显示输出敏感词推荐列表,再检测用户的选择操作,生成部分选择指令,即可选择用户选定的敏感词推荐列表中的部分敏感词,以补充或形成敏感词列表。

图8为一个实施例中检测当前的输入环境的流程图。如图8所示,检测当前的输入环境包括步骤802至步骤804。

步骤802,检测并判断处于前台运行状态的应用的类型特征是否符合公共应用特征。步骤804,若是,则判定处在公共环境下。

应用的类型可以分为即时通讯类应用,金融类应用,视频类应用和系统应用等。通常不产生与隐私相关的数据的应用可作为公共应用,如视频类应用、系统应用等,大概率上易产生与隐私相关的数据的应用可作非公共应用,如金融类应用,在处于前台运行状态的应用为金融类应用(即用户在使用金融应用)时,文字输入法输入的信息包括身份证号、密码、银行账户信息等。

定义某类应用为公共应用的方法可以是接收用户的公共应用选择指令,将终端上的相应应用设置为公共应用,携带公共应用标识;相应地,也可以接收用户的非公共应用选择指令,将终端上的相应应用设置为非公共应用,携带非公共应用标识。在此情况下,若检测到处于前台运行状态的应用携带公共应用标识,则判定该应用符合公共应用特征,当前处于公共环境下;同理,若检测到处于前台运行状态的应用携带非公共应用标识,则判定该应用不符合公共应用特征,当前处于私密环境下。

定义某类应用为公共应用的方法还可以是,将选择作为公共应用的应用名称存入公共应用名称列表中,检测当前前台运行的应用的名称是否符合公共应用名称列表中的任一名称,若符合则判定该应用符合公共应用特征。对于某类特定的公共应用除了进行候选词的私密化处理,还可针对该公共应用自身的特点进行相应的敏感词私密化处理。例如根据获取的敏感词列表对搜索引擎的搜索记录进行私密化处理(后文详述),还可以对公共应用界面上显示的文字进行私密化处理。以进一步保障用户隐私。

图9为一个实施例中检测并判断处于前台运行状态的应用的类型特征是否符合公共应用特征的流程图。如图9所示,检测并判断处于前台运行状态的应用的类型特征是否符合公共应用特征包括步骤902至步骤906。

步骤902,设置浏览器应用符合公共应用特征。

浏览器应用是指显示网站服务器或文件系统内的文件,并让用户与这些文件交互的一种应用软件。在实际生活中,浏览器应用作为一种功能齐全的应用公共应用,大概率上被认定为一种最容易被手机借用者使用的应用软件。

用户可自行设定或终端自动设置浏览器应用为公共应用,还可以终端输出显示包含浏览器应用的公共应用推荐列表,再接收用户发出的选择指令,选择公共应用推荐列表中的浏览器应用,从而将浏览器应用设置为公共应用。

具体设置过程可以包括,接收用户的浏览器选择指令,将终端上的浏览器应用设置为公共应用,浏览器的应用名称随之存入公共应用名称列表中。

步骤904,检测并判断处于前台运行状态的应用的类型特征是否符合浏览器应用特征。

检测过程可以是检测当前前台运行的应用的名称是否符合浏览器应用名称。由于在文字输入过程中,浏览器应用也会根据输入的文字提取相应的搜索记录,该搜索记录中也包含着用户的隐私数据。因此为了强化隐私保护效果,除了对输入过程中提取的候选词进行私密化处理外,还需要对浏览器应用根据输入提取的搜索记录进行私密化处理。

步骤906,若是,根据敏感词列表,对包含敏感词的搜索引擎的搜索记录进行隐藏处理。

图10为一个实施例中未设置敏感词时浏览器应用终端界面示意图。图11为一个实施例中设置敏感词后浏览器应用终端界面示意图。如图10所示,在进行搜索时,输入“shi’b”,则根据输入提取候选词“是不”、“四辩”、“识别”,同时浏览器应用还会针对输入提取第一条搜索记录1002和第二条搜索记录1004,搜索记录的条数不限。会提取与输入形成映射关系的搜索记录,例如,输入的字音与某条搜索记录的首个字音相同,则认为形成映射关系。如输入字音“shi’b”,搜索记录中“四辩××××”的字音与输入相同,则浏览器将提取这条搜索记录并显示输出。提取的搜索记录也反映用户的历史输入记录,同理也会泄露用户的隐私,因此进一步地根据敏感词列表对搜索引擎的搜索记录进行私密化处理。私密化处理具体可以是对于涉及隐私数据的搜索记录进行隐藏处理。

相比于图10中未设置敏感词包括“四辩”,图11的实施例中将“四辩”设置为敏感词,因此不仅会在候选词中对“四辩”这个候选词进行私密处理,还会对搜索记录中包含“四辩”的搜索记录进行隐藏处理。如图11所示,第一条搜索记录1002不涉及敏感词,正常显示,在接收用户选择操作后,即可将被选择的第一条搜索记录1002输入搜索框中,对第二条搜索记录1004采取隐藏处理,不显示在界面上。

如此可针对浏览器的特殊应用环境,对输入过程中提取显示的候选词和搜索记录都进行私密化处理,进一步避免了用户隐私的泄露。

在一个实施例中,检测当前的输入环境的步骤包括步骤1002至步骤1004(图中未示出)。

步骤1002,检测并判断用户地理特征是否符合公共地理特征。步骤1004,若是,则判定处于公共环境下。

地理特征包括用户所处的地理位置,该地址可以是家、学校、公司等。公共地理特征是指用户在该地理位置上往往倾向于不输入涉及隐私的文字。例如用户在学校和公司等地方,很少输入涉及隐私数据,而在家中,则涉及隐私文字的概率很高。判断地理特征的方式可以是通过地图地位功能、热点定位功能实现。

在一个实施例中,检测并判断当前的用户地理特征是否符合公共地理特征的步骤包括步骤1102至步骤1104(图中未示出)。

步骤1102,设置公共网络列表,所述公共网络列表包括公共网络标识。

公共网络列表包括多个公共网络标识,公共网络标识用于判断当前连接的网络是否为公共网络。公共网络标识可以是无线网络的名称,也可以是发出无线信号的设备的mac地址。可通过将某一无线网络的名称或mac地址作为公共网络标识导入公共网络列表文件中,即可将该网络设为公共网络。若为有线网络,则公共网络标识可以是有线网络的ip地址,如公司里的公网ip地址。

步骤1104,检测并判断当前网络标识是否与任一所述公共网络标识相符;若是,则判定符合公共地理特征。

终端获取当前连接的网络的网路标识,该网络标识可以是无线网络的名称,发出无线信号设备的mac地址或是网络的ip地址,将获取到的网络标识与预先形成的公共网络标识进行比较,若一致,则判定符合公共地理特征,即当前处于一个公共环境输入下,若不一致,则判定不符合公共地理特征,当前大概率处于一个私密环境输入下。

采用识别网络标识而不是通过地图实时定位,可有效减少终端运行过程的耗电量。

应该理解的是,虽然图1-11的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图1-11中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

图12为一个实施例的文字输入装置的结构框图。如图12所示,文字输入装置包括:

候选词提取模块1202,用于当处于输入状态时,接收输入并根据输入实时提取候选词;候选词来自于核心词库、基于用户词频统计的个性词库以及关联用户输入习惯的联想词库;

检测模块1204,用于检测当前的输入环境;输入环境包括公共环境和私密环境;

处理模块1206,用于当输入环境为公共环境时,获取敏感词列表,并对包含在敏感词列表中的候选词进行私密化处理。

显示输入模块1208,用于显示处理后的候选词以供选择,并将被选择的候选词输入。

本实施例的文字输入装置,在检测模块1204检测到终端的输入环境为公共环境时,通过处理模块1206对候选词提取模块1202提取的候选词进行私密化处理,再通过显示输入模块1208将处理后的候选词显示以供选择,从而避免了输入过程中显示的候选词或其他输入历史记录泄露用户隐私。

在一个实施例中,文字输入装置还包括:

比较单元,用于获取并比较在公共环境和私密环境的输入记录。

设置单元,用于获取在私密环境下输入,而未在公共环境下输入的输入信息作为私密文本信息。

处理单元,用于根据私密文本信息,形成或补充敏感词列表。

在一个实施例中,文字输入模块还包括:

大数据分析单元,用于采用大数据手段分析用户在私密环境中的输入样本,生成敏感词推荐列表;敏感词推荐列表包括至少两个待选的敏感词。

获取单元,用于获取敏感词推荐列表。

选择单元,用于接收选择指令,并根据选择指令选择部分或全部待选的敏感词以形成敏感词列表。

本实施例的文字输入装置,通过大数据分析输入样本,生成针对用户输入情况的敏感词推荐列表,极大提高了设置敏感词列表的效率。

在一个实施例中,检测模块,包括:

前台检测单元,用于检测并判断处于前台运行状态的应用的类型特征是否符合公共应用特征。若是,则判定处在公共环境下。

本实施例中,通过检测前台运行的应用的类型自动判断当前的输入环境,有利于自动根据输入环境切换而采取对应的候选词处理方法,从而既保证了输入的效率又避免泄露用户隐私数据。

在一个实施例中,前台检测单元还用于设置浏览器应用符合公共应用特征。检测并判断处于前台运行状态的应用的类型特征是否符合浏览器应用特征。若是,根据敏感词列表,对包含敏感词的搜索引擎的搜索记录进行隐藏处理。

本实施例中的文字输入装置,进一步将浏览器上的输入环境设置为公共环境,并且除了对候选词进行私密化处理,也对文字输入过程中显示的搜索记录进行私密化处理,进一步保障了用户隐私安全。

在一个实施例中,检测模块,包括:

地理检测单元,用于检测并判断用户地理特征是否符合公共地理特征;若是,则判定处于公共环境下。

本实施例中的文字输入装置,通过检测终端所处的地理位置,自动自动判断当前的输入环境,有利于自动根据输入环境切换而采取对应的候选词处理方法,从而既保证了输入的效率又避免泄露用户隐私数据。

在一个实施例中,地理检测单元还用于设置公共网络列表,公共网络列表包括公共网络标识。检测并判断当前网络标识是否与任一公共网络标识相符。若是,则判定符合公共地理特征。

本实施例中的文字输入装置,通过检测网络标识的手段区分不同的地理位置,避免了使用地图等工具进行实时定位,有利于节省装置的耗电。

上述文字输入装置中各个模块的划分仅用于举例说明,在其他实施例中,可将文字输入装置按照需要划分为不同的模块,以完成上述文字输入装置的全部或部分功能。

关于文字输入装置的具体限定可以参见上文中对于文字输入方法的限定,在此不再赘述。上述文字输入装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。

本申请实施例中提供的而文字输入装置中的各个模块的实现可为计算机程序的形式。该计算机程序可在终端或服务器上运行。该计算机程序构成的程序模块可存储在终端或服务器的存储器上。该计算机程序被处理器执行时,实现本申请实施例中所描述方法的步骤。

本申请实施例还提供了一种计算机可读存储介质。一个或多个包含计算机可执行指令的非易失性计算机可读存储介质,当所述计算机可执行指令被一个或多个处理器执行时,使得所述处理器执行文字输入方法的步骤。

一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行而文字输入方法。

本申请实施例还提供了一种电子设备。如图13所示,为了便于说明,仅示出了与本申请实施例相关的部分,具体技术细节未揭示的,请参照本申请实施例方法部分。该电子设备可以为包括手机、平板电脑、pda(personaldigitalassistant,个人数字助理)、pos(pointofsales,销售终端)、车载电脑、穿戴式设备等任意终端设备,以电子设备为手机为例:

图13为与本申请实施例提供的电子设备相关的手机的部分结构的框图。参考图13,手机包括:射频(radiofrequency,rf)电路1310、存储器1320、输入单元1330、显示单元1340、传感器1350、音频电路1360、无线保真(wirelessfidelity,wifi)模块1370、处理器1380、以及电源1390等部件。本领域技术人员可以理解,图13所示的手机结构并不构成对手机的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。

其中,rf电路1310可用于收发信息或通话过程中,信号的接收和发送,可将基站的下行信息接收后,给处理器1380处理;也可以将上行的数据发送给基站。通常,rf电路包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器(lownoiseamplifier,lna)、双工器等。此外,rf电路1310还可以通过无线通信与网络和其他设备通信。上述无线通信可以使用任一通信标准或协议,包括但不限于全球移动通讯系统(globalsystemofmobilecommunication,gsm)、通用分组无线服务(generalpacketradioservice,gprs)、码分多址(codedivisionmultipleaccess,cdma)、宽带码分多址(widebandcodedivisionmultipleaccess,wcdma)、长期演进(longtermevolution,lte))、电子邮件、短消息服务(shortmessagingservice,sms)等。

存储器1320可用于存储软件程序以及模块,处理器1380通过运行存储在存储器1320的软件程序以及模块,从而执行手机的各种功能应用以及数据处理。存储器1320可主要包括程序存储区和数据存储区,其中,程序存储区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能的应用程序、图像播放功能的应用程序等)等;数据存储区可存储根据手机的使用所创建的数据(比如音频数据、通讯录等)等。此外,存储器1320可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

输入单元1330可用于接收输入的数字或字符信息,以及产生与手机1300的用户设置以及功能控制有关的键信号输入。具体地,输入单元1330可包括触控面板1331以及其他输入设备1332。触控面板1331,也可称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板1331上或在触控面板1331附近的操作),并根据预先设定的程式驱动相应的连接装置。在一个实施例中,触控面板1331可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器1380,并能接收处理器1380发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板1331。除了触控面板1331,输入单元1330还可以包括其他输入设备1332。具体地,其他输入设备1332可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)等中的一种或多种。

显示单元1340可用于显示由用户输入的信息或提供给用户的信息以及手机的各种菜单。显示单元1340可包括显示面板1341。在一个实施例中,可以采用液晶显示器(liquidcrystaldisplay,lcd)、有机发光二极管(organiclight-emittingdiode,oled)等形式来配置显示面板1341。在一个实施例中,触控面板1331可覆盖显示面板1341,当触控面板1331检测到在其上或附近的触摸操作后,传送给处理器1380以确定触摸事件的类型,随后处理器1380根据触摸事件的类型在显示面板1341上提供相应的视觉输出。虽然在图13中,触控面板1331与显示面板1341是作为两个独立的部件来实现手机的输入和输入功能,但是在某些实施例中,可以将触控面板1331与显示面板1341集成而实现手机的输入和输出功能。

手机1300还可包括至少一种传感器1350,比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板1341的亮度,接近传感器可在手机移动到耳边时,关闭显示面板1341和/或背光。运动传感器可包括加速度传感器,通过加速度传感器可检测各个方向上加速度的大小,静止时可检测出重力的大小及方向,可用于识别手机姿态的应用(比如横竖屏切换)、振动识别相关功能(比如计步器、敲击)等;此外,手机还可配置陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器等。

音频电路1360、扬声器1361和传声器1362可提供用户与手机之间的音频接口。音频电路1360可将接收到的音频数据转换后的电信号,传输到扬声器1361,由扬声器1361转换为声音信号输出;另一方面,传声器1362将收集的声音信号转换为电信号,由音频电路1360接收后转换为音频数据,再将音频数据输出处理器1380处理后,经rf电路1310可以发送给另一手机,或者将音频数据输出至存储器1320以便后续处理。

wifi属于短距离无线传输技术,手机通过wifi模块1370可以帮助用户收发电子邮件、浏览网页和访问流式媒体等,它为用户提供了无线的宽带互联网访问。虽然图13示出了wifi模块1370,但是可以理解的是,其并不属于手机1300的必须构成,可以根据需要而省略。

处理器1380是手机的控制中心,利用各种接口和线路连接整个手机的各个部分,通过运行或执行存储在存储器1320内的软件程序和/或模块,以及调用存储在存储器1320内的数据,执行手机的各种功能和处理数据,从而对手机进行整体监控。在一个实施例中,处理器1380可包括一个或多个处理单元。在一个实施例中,处理器1380可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等;调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器1380中。

手机1300还包括给各个部件供电的电源1390(比如电池),优选的,电源可以通过电源管理系统与处理器1380逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。

在一个实施例中,手机1300还可以包括摄像头、蓝牙模块等。

在本申请实施例中,该电子设备所包括的处理器1380执行存储在存储器上的计算机程序时实现文字输入方法的步骤。

本申请所使用的对存储器、存储、数据库或其它介质的任何引用可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram),它用作外部高速缓冲存储器。作为说明而非局限,ram以多种形式可得,诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双数据率sdram(ddrsdram)、增强型sdram(esdram)、同步链路(synchlink)dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)。

以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1