1.一种别名获取方法,其特征在于,包括:
获取源领域的别名预测模型和目标领域的训练数据;
根据所述源领域的别名预测模型和所述目标领域的训练数据,计算所述目标领域的别名预测模型;
根据所述目标领域的别名预测模型,确定所述目标领域内的第一全名对应的第一别名集合,所述第一别名集合中包括至少一个别名,所述第一全名为目标领域内的任一全名。
2.根据权利要求1所述的别名获取方法,其特征在于,所述根据所述目标领域的别名预测模型,确定所述目标领域内的第一全名对应的第一别名集合,具体包括:
根据所述目标领域内的第一全名,构造所述第一全名的第二别名集合,所述第二别名集合中包括所述第一全名对应的所有候选别名;
提取所述第一全名和所述所有候选别名中每一个候选别名组成的全名-别名对的特征;
根据所述全名-别名对的特征、所述目标领域的别名预测模型,确定所述第一全名对应的第一别名集合。
3.根据权利要求1或2所述的别名获取方法,其特征在于,所述根据所述目标领域的别名预测模型,确定所述目标领域内的第一全名对应的第一别名集合之后,所述方法还包括:对所述第一别名集合中的所有别名进行优先级排序。
4.根据权利要求3所述的别名获取方法,其特征在于,所述对所述第一别名集合中的所有别名进行优先级排序,具体包括:
在搜索引擎中检索第一全名和第一别名中的至少一个,获取前N个搜索结果,所述第一别名为所述第一别名集合中的任意一个别名;
统计所述第一全名和所述第一别名在前N个搜索结果中共同出现的次数;
根据所述第一全名和所述第一别名在前N个搜索结果中共同出现的次数,为所述第一别名设置优先级。
5.根据权利要求1所述的别名获取方法,其特征在于,所述获取目标领 域的训练数据,具体包括:
根据所述目标领域的训练数据,提取所述目标领域的训练数据的特征,所述目标领域的训练数据的特征为所述训练数据中全名-别名对的特征,所述全名-别名对的特征至少包括所述别名中的字符在所述全名中的位置特征。
6.根据权利要求1所述的别名获取方法,其特征在于,所述根据所述源领域的别名预测模型和所述目标领域的训练数据,计算所述目标领域的别名预测模型,具体包括:
构造所述目标领域的别名预测模型λω+(1-λ)υ,其中,ω为源领域的别名预测模型,λ为权重因子,υ为目标领域的参数;
根据所述目标领域的训练数据,计算所述目标领域的别名预测模型λω+(1-λ)υ的参数υ。
7.一种别名获取装置,其特征在于,包括:
获取模块,用于获取源领域的别名预测模型和目标领域的训练数据;
计算模块,用于根据所述源领域的别名预测模型和所述目标领域的训练数据,计算所述目标领域的别名预测模型;
确定模块,用于根据所述目标领域的别名预测模型,确定所述目标领域内的第一全名对应的第一别名集合,所述第一别名集合中包括至少一个别名,所述第一全名为目标领域内的任一全名。
8.根据权利要求7所述的别名获取装置,其特征在于,所述确定模块,具体包括:
第一构造子模块,用于根据所述目标领域内的第一全名,构造所述第一全名的第二别名集合,所述第二别名集合中包括所述第一全名对应的所有候选别名;
提取子模块,用于提取所述第一全名和所述所有候选别名中每一个候选别名组成的全名-别名对的特征;
确定子模块,用于根据所述全名-别名对的特征、所述目标领域的别名预测模型,确定所述第一全名对应的第一别名集合。
9.根据权利要求7或8所述的别名获取装置,其特征在于,所述装置还包括:
排序模块,用于对所述第一别名集合中的所有别名进行优先级排序。
10.根据权利要求9所述的别名获取装置,其特征在于,所述排序模块,具体包括:
检索子模块,用于在搜索引擎中检索第一全名和第一别名中的至少一个,获取前N个搜索结果,所述第一别名为所述第一别名集合中的任意一个别名;
统计子模块,用于统计所述第一全名和所述第一别名在前N个搜索结果中共同出现的次数;
设置子模块,用于根据所述第一全名和所述第一别名在前N个搜索结果中共同出现的次数,为所述第一别名设置优先级。
11.根据权利要求7所述别名获取装置,其特征在于,
所述获取模块具体用于,根据所述目标领域的训练数据,提取所述目标领域的训练数据的特征,所述目标领域的训练数据的特征为所述训练数据中全名-别名对的特征,所述全名-别名对的特征至少包括所述别名中的字符在所述全名中的位置特征。
12.根据权利要求7所述的别名获取装置,其特征在于,所述计算模块,具体包括:
第二构造子模块,用于构造所述目标领域的别名预测模型λω+(1-λ)υ,其中,ω为源领域的别名预测模型,λ为权重因子,υ为目标领域的参数;
计算子模块,用于根据所述目标领域的训练数据,计算所述目标领域的别名预测模型λω+(1-λ)υ的参数υ。