词汇的获取方法及装置、推送方法及装置的制造方法_4

文档序号:9349996阅读:来源:国知局
,因此,实现了用户词汇的个性化获取和推送,能够满足用户的个性化输入需求,解决现有技术中输入法词汇无法满足用户的个性化输入需求的问题,从而能够提高用户输入效率、词库首选率和覆盖率。
[0136]另外,向用户提供针对用户的个性化词汇,可以在减少词库数目增长的前提下,仍然满足用户的输入需求,有效提升词库利用率,降低词库扩容,节省存储空间。
[0137]所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
[0138]在本发明所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
[0139]所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0140]另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
[0141]上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机装置(可以是个人计算机,服务器,或者网络装置等)或处理器(Processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory, ROM)、随机存取存储器(Random Access Memory, RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
[0142]以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。
【主权项】
1.一种词汇的获取方法,其特征在于,所述方法包括: 获取用户的兴趣分布信息; 生成个性化词库,所述个性化词库包含基础词汇和新词; 根据所述用户的兴趣分布信息和所述个性化词库,获得针对所述用户的个性化词汇。2.根据权利要求1所述的方法,其特征在于,所述生成个性化词库,包括: 根据已有词库,获取所述基础词汇; 根据热门词汇和时效性词汇,获取所述新词; 根据所述基础词汇和所述新词,生成所述个性化词库。3.根据权利要求2所述的方法,其特征在于,所述根据热门词汇和时效性词汇,获取所述新词之前,所述方法还包括: 获取时效性的页面内容; 对所述时效性的页面内容进行切词处理,以获得至少一个候选词汇; 根据用户输入词汇历史记录和每个候选词汇的标签,对所述至少一个候选词汇进行筛选,以获得所述时效性词汇。4.根据权利要求1或2所述的方法,其特征在于,所述用户的兴趣分布信息包括所述用户的至少一个兴趣标签以及每个所述兴趣标签的权重值;所述根据所述用户的兴趣分布信息和所述个性化词库,获得针对所述用户的个性化词汇,包括: 根据预设的词汇总数和每个所述兴趣标签的权重值,确定每个所述兴趣标签对应的个性化词汇数目; 根据每个所述兴趣标签和每个所述兴趣标签对应的个性化词汇数目,从所述个性化词库获得每个所述兴趣标签对应的个性化词汇,以作为针对所述用户的个性化词汇。5.一种词汇的推送方法,其特征在于,所述方法包括: 接收客户端发送的词汇版本信息和用户标识; 根据所述词汇版本信息和所述用户标识,获得针对使用所述客户端的用户的个性化词汇;所述针对使用所述客户端的用户的个性化词汇为利用权利要求1至4中任一权利要求所述的词汇的获取方法获取的; 将针对使用所述客户端的用户的个性化词汇推送给所述客户端。6.根据权利要求5所述的方法,其特征在于,所述根据所述词汇版本信息和所述用户标识,获得针对使用所述客户端的用户的个性化词汇,包括: 根据所述用户标识,获得最新的词汇版本信息; 将所述最新的词汇版本信息与从所述客户端接收的词汇版本信息进行比较,若两个词汇版本信息不一致,根据所述用户标识,获得针对使用所述客户端的用户的个性化词汇。7.—种词汇的获取装置,其特征在于,所述装置包括: 兴趣获取单元,用于获取用户的兴趣分布信息; 词库生成单元,用于生成个性化词库,所述个性化词库包含基础词汇和新词; 词汇获取单元,用于根据所述用户的兴趣分布信息和所述个性化词库,获得针对所述用户的个性化词汇。8.根据权利要求7所述的装置,其特征在于,所述词库生成单元,具体用于: 根据已有词库,获取所述基础词汇; 根据热门词汇和时效性词汇,获取所述新词; 根据所述基础词汇和所述新词,生成所述个性化词库。9.根据权利要求8所述的装置,其特征在于,所述词库生成单元,还用于: 获取时效性的页面内容; 对所述时效性的页面内容进行切词处理,以获得至少一个候选词汇; 根据用户输入词汇历史记录和每个候选词汇的标签,对所述至少一个候选词汇进行筛选,以获得所述时效性词汇。10.根据权利要求7或8所述的装置,其特征在于,所述用户的兴趣分布信息包括所述用户的至少一个兴趣标签以及每个所述兴趣标签的权重值;所述词汇获取单元,具体用于: 根据预设的词汇总数和每个所述兴趣标签的权重值,确定每个所述兴趣标签对应的个性化词汇数目; 根据每个所述兴趣标签和每个所述兴趣标签对应的个性化词汇数目,从所述个性化词库获得每个所述兴趣标签对应的个性化词汇,以作为针对所述用户的个性化词汇。11.一种词汇的推送装置,其特征在于,所述装置包括: 信息输入单元,用于接收客户端发送的词汇版本信息和用户标识; 词汇处理单元,用于根据所述词汇版本信息和所述用户标识,获得针对使用所述客户端的用户的个性化词汇;所述针对使用所述客户端的用户的个性化词汇为利用权利要求7至10中任一权利要求所述的词汇的获取装置获取的; 信息输出单元,用于将针对使用所述客户端的用户的个性化词汇推送给所述客户端。12.根据权利要求11所述的装置,其特征在于,所述词汇处理单元,具体用于: 根据所述用户标识,获得最新的词汇版本信息; 将所述最新的词汇版本信息与从所述客户端接收的词汇版本信息进行比较,若两个词汇版本信息不一致,根据所述用户标识,获得针对使用所述客户端的用户的个性化词汇。
【专利摘要】本发明实施例提供了一种词汇的获取方法及装置、推送方法及装置。一方面,本发明实施例通过获取用户的兴趣分布信息;从而,生成个性化词库,所述个性化词库包含基础词汇和新词;进而,根据所述用户的兴趣分布信息和所述个性化词库,获得针对所述用户的个性化词汇。因此,本发明实施例提供的技术方案用以解决输入法词汇无法满足用户的个性化输入需求的问题。
【IPC分类】G06F17/30
【公开号】CN105069064
【申请号】CN201510454758
【发明人】李鹏程, 王轶翔
【申请人】百度在线网络技术(北京)有限公司
【公开日】2015年11月18日
【申请日】2015年7月29日
当前第4页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1