词语数据库的获取方法及装置的制造方法_3

文档序号:9416978阅读:来源:国知局
为意图为“查询或下载学习资料”
[0072]或者,再例如,假设软件环境信息为“淘宝应用”,则可以根据“淘宝应用”这一软件环境信息,确定用户的行为意图为“查询或购买商品”。
[0073]或者,再例如,假设软件环境信息为“应用搜索”,则可以根据“应用搜索”这一软件环境信息,确定用户的行为意图为“查询或下载应用程序”。
[0074]在一个具体的实现过程中,具体可以根据所述用户的输入意图,直接获得一个现有的词语数据库,以为作为所述用户的词语数据库。这样,能够获取个性化的词语数据库,从而有效提高了词语数据库的获取的个性化。
[0075]在另一个具体的实现过程中,具体可以根据所述用户的输入意图,获得若干个词语,然后,则可以将这些词语组成一个词语数据库,以作为所述用户的词语数据库。这样,能够获取动态的词语数据库,从而有效提高了词语数据库的获取的灵活性。
[0076]可选地,在本实施例的一个可能的实现方式中,在102中,具体可以根据所述用户的输入特征数据和预先设置的至少一个候选数据库的输入特征数据,获得所述至少一个候选数据库的匹配度;进而,则可以根据所述至少一个匹配度的匹配度,选择至少一个候选数据库,以作为所述用户的词语数据库。
[0077]所谓的候选数据库,是指根据指定分类规则例如,科学领域等,对现有的词语进行分类处理,所形成的词语数据库,例如,医学词语数据库、电学词语数据库等。
[0078]在一个具体的实现过程中,具体可以采用文本相似度的计算方法,获得所述至少一个候选数据库中每个候选数据库的匹配度。
[0079]在另一个具体的实现过程中,具体可以将所获得的每个候选数据库的匹配度,按照从大到小进行排序,选择排在前面N位的候选数据库,N为大于或等于I的整数,以作为所述用户的词语数据库。
[0080]在另一个具体的实现过程中,具体可以选择匹配度大于预先设置的匹配阈值的候选数据库,作为所述用户的词语数据库。
[0081]可选地,在本实施例的一个可能的实现方式中,在103中,具体可以对所述用户的词语数据库,进行存储处理。这样,输入法应用则可以根据用户输入的输入数据,在用户的词语数据库中进行匹配,以获得候选词条。
[0082]具体地,具体可以将所述用户的词语数据库,存储在终端的存储设备上。
[0083]在一个具体的实现过程中,所述终端的存储设备可以慢速存储设备,具体可以为计算机系统的硬盘,或者还可以为手机的非运行内存即物理内存,例如,只读存储器(Read-Only Memory, ROM)和内存卡等,本实施例对此不进行特别限定。
[0084]在另一个具体的实现过程中,所述终端的存储设备还可以为快速存储设备,具体可以为计算机系统的内存,或者还可以为手机的运行内存即系统内存,例如,随机存储器(Random Access Memory, RAM)等,本实施例对此不进行特别限定。
[0085]具体地,具体还可以将所述用户的词语数据库,存储在云端,与该用户进行关联,这样,就能够实现该用户的云输入。
[0086]需要说明的是,在进行所述存储处理之前,还可以进一步获取输入法应用的硬件环境信息,进而,则可以根据所述输入法应用的硬件环境信息,确定所进行的存储处理的位置,例如,终端设备上或云端。
[0087]其中,所述输入法应用的硬件环境信息可以包括但不限于以下信息中的一种或多种:输入法应用所运行的终端的设备类型信息、终端的操作系统信息、终端的网络信息、终端的地理位置信息。例如,终端的类型信息可以包括手机、平板电脑(Tablet Computer)、个人电脑(Personal Computer,PC)等。终端的操作系统信息例如,可以为苹果的1s操作系统、谷歌的安卓操作系统或者微软的Windows Phone操作系统或者其他的移动终端操作系统。终端的网络信息例如,为3G网络或无线相容性认证(Wireless Fidelity,WiFi)网络或者其他的无线网络。另外,获取所述输入法应用的硬件环境信息,可以采用现有技术中的各种方案,此处不再赘述。
[0088]例如,假设硬件环境信息为“电脑,WiFi网络”,则可以确定所进行的存储处理的位置为电脑。
[0089]或者,再例如,假设硬件环境信息为“手机,1s操作系统,WiFi网络”,则可以确定所进行的存储处理的位置为云端。这样,能够节省手机的存储空间。
[0090]本实施例中,通过获取用户的输入特征数据,所述用户的输入特征数据包括所述用户的属性特征信息和所述用户当前所使用的应用的软件环境信息,进而根据所述用户的输入特征数据,获得所述用户的词语数据库,使得能够对所述用户的词语数据库,进行存储处理,无需用户参与,操作简单,而且正确率高,从而提高了词语数据库的获取的效率和可靠性。
[0091]另外,采用本发明提供的技术方案,通过自动获得用户所需要的词语数据库,使得所加载的词语数据库基本满足用户的输入意图,因此,能够有效提高用户的输入效率,同时提高了词语数据库的准确率。
[0092]需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
[0093]在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
[0094]图2为本发明另一实施例提供的词语数据库的获取装置的结构示意图,如图2所示。本实施例的词语数据库的获取装置可以包括获取单元21、匹配单元22和存储单元23。其中,获取单元21,用于获取用户的输入特征数据,所述用户的输入特征数据包括所述用户的属性特征信息和所述用户当前所使用的应用的软件环境信息;匹配单元22,用于根据所述用户的输入特征数据,获得所述用户的词语数据库;存储单元23,用于对所述用户的词语数据库,进行存储处理。
[0095]需要说明的是,本实施例所提供的词语数据库的获取装置的部分或全部可以为位于本地终端的应用,或者还可以为设置在位于本地终端的应用中的插件或软件开发工具包(Software Development Kit,SDK)等功能单元,或者还可以为位于网络侧服务器中的处理引擎,或者还可以为位于网络侧的分布式系统,本实施例对此不进行特别限定。
[0096]可以理解的是,所述应用可以是安装在终端上的本地程序(nativeApp),或者还可以是终端上的浏览器的一个网页程序(webApp),本实施例对此不进行限定。该应用可以为输入法应用,或者还可以为与输入法应用不同的其他应用,本实施例对此不进行特别限定。
[0097]可选地,在本实施例的一个可能的实现方式中,所述获取单元21,具体可以用于获取所述用户的输入行为信息;以及根据所述用户的输入行为信息,获得所述用户的属性特征信息。
[0098]可选地,在本实施例的一个可能的实现方式中,所述获取单元21,具体可以用于获取所述用户当前所使用的应用的应用信息;以及根据所述应用的应用信息,获得所述用户的软件环境信息。
[0099]可选地,在本实施例的一个可能的实现方式中,所述匹配单元22,具体可以用于根据所
当前第3页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1