一种信息挖掘方法及装置与流程

文档序号:12063656阅读:来源:国知局

技术特征:

1.一种信息挖掘方法,其特征在于,包括:

获得待译对象包含的各个关键词,及各个关键词在目标语言中对应的翻译译项;

从各个关键词对应的翻译译项中确定出至少一个译文引导词,所述译文引导词为各个关键词对应的翻译译项中所起的引导作用较大的翻译译项;其中,翻译译项所起的引导作用为:在将待译对象及翻译译项作为检索依据,来利用翻译译项对待译对象进行引导式检索时,翻译译项对检索出所述待译对象对应的翻译参考信息所起到的引导作用;

将所述待译对象及所述译文引导词作为检索依据,检索所述待译对象对应的翻译参考信息,得到检索结果;

基于预定的参考价值评价方式,从所述检索结果包含的各检索条目中获得参考价值较高的至少一个检索条目,并返回所述至少一个检索条目。

2.根据权利要求1所述的方法,其特征在于,所述从各个关键词对应的翻译译项中确定出至少一个译文引导词包括:

对各个关键词的翻译译项按照各翻译译项所起的引导作用的大小进行排序处理,得到一译项序列;

从所述译项序列的相应端获得引导作用较大的至少一个翻译译项作为译文引导词。

3.根据权利要求2所述的方法,其特征在于,所述对各个关键词的翻译译项按照各翻译译项所起的引导作用的大小进行排序处理,包括:

依据各个关键词所对应的翻译译项的数量,对不同关键词的翻译译项进行排序;其中,同一关键词的各个翻译译项作为一个整体参与排序,关键词对应的翻译译项的数量与关键词翻译译项所起引导作用的大小呈反向关系;

当存在所对应的翻译译项数量相同的不同关键词时,按所述不同关键词分别在所述待译对象中的重要度,对所述不同关键词的翻译译项进行排序;其中,关键词在待译对象中的重要度与关键词翻译译项所起的引导作用的大小呈正向关系;

依据采用同一关键词的每个翻译译项对待译对象进行引导式检索时搜索引擎返回的检索条目的个数,对同一关键词的各个翻译译项进行排序;翻译译项对应的检索条目的个数与翻译译项所起的引导作用的大小呈正向关系。

4.根据权利要求1所述的方法,其特征在于,所述将所述待译对象及所述译文引导词作为检索依据,检索所述待译对象对应的翻译参考信息,得到检索结果,包括:

将所述待译对象及所述译文引导词作为检索依据在多个预定的搜索引擎中进行检索,得到多个搜索引擎的检索结果。

5.根据权利要求4所述的方法,其特征在于,基于预定的参考价值评价方式,从所述检索结果包含的各检索条目中获得参考价值较高的至少一个检索条目,包括:

对所述多个搜索引擎的检索结果进行噪音滤除处理,并对滤除噪音后所得的多个搜索引擎的检索结果中相同的检索条目进行合并处理;

依据待译对象及译文引导词在所述合并处理后所得的各检索条目中的出现位置、距离、信息来源,及所述各检索条目在每个搜索引擎返回检索结果中的默认排序中的任意一种或多种,计算合并后所得的各检索条目与所述待译对象的相关度数值;

基于相关度数值,对合并后所得的各个检索条目进行排序;

从排序后所得的条目序列的相应端获得相关度数值较高的至少一个检索条目,并返回所述至少一个检索条目。

6.一种信息挖掘装置,其特征在于,包括:

第一获取单元,用于获得待译对象包含的各个关键词,及各个关键词在目标语言中对应的翻译译项;

确定单元,用于从各个关键词对应的翻译译项中确定出至少一个译文引导词,所述译文引导词为各个关键词对应的翻译译项中所起的引导作用较大的翻译译项;其中,翻译译项所起的引导作用为:在将待译对象及翻译译项作为检索依据,来利用翻译译项对待译对象进行引导式检索时,翻译译项对检索出所述待译对象对应的翻译参考信息所起到的引导作用;

检索单元,用于将所述待译对象及所述译文引导词作为检索依据,检索所述待译对象对应的翻译参考信息,得到检索结果;

第二获取单元,用于基于预定的参考价值评价方式,从所述检索结果包含的各检索条目中获得参考价值较高的至少一个检索条目,并返回所述至少一个检索条目。

7.根据权利要求6所述的装置,其特征在于,所述确定单元,进一步用于:

对各个关键词的翻译译项按照各翻译译项所起的引导作用的大小进行排序处理,得到一译项序列;从所述译项序列的相应端获得引导作用较大的至少一个翻译译项作为译文引导词。

8.根据权利要求7所述的装置,其特征在于,所述确定单元,进一步用于:

依据各个关键词所对应的翻译译项的数量,对不同关键词的翻译译项进行排序;其中,同一关键词的各个翻译译项作为一个整体参与排序,关键词所对应的翻译译项的数量与关键词翻译译项所起引导作用的大小呈反向关系;当存在所对应的翻译译项数量相同的不同关键词时,按所述不同关键词分别在所述待译对象中的重要度,对所述不同关键词的翻译译项进行排序;其中,关键词在待译对象中的重要度与关键词翻译译项所起的引导作用的大小呈正向关系;依据采用同一关键词的每个翻译译项对待译对象进行引导式检索时搜索引擎返回的检索条目的个数,对同一关键词的各个翻译译项进行排序;翻译译项对应的检索条目的个数与翻译译项所起的引导作用的大小呈正向关系。

9.根据权利要求6所述的装置,其特征在于,所述检索单元,进一步用于:将所述待译对象及所述译文引导词作为检索依据在多个预定的搜索引擎中进行检索,得到多个搜索引擎的检索结果。

10.根据权利要求9所述的装置,其特征在于,所述第二获取单元,进一步用于:

对所述多个搜索引擎的检索结果进行噪音滤除处理,并对滤除噪音后所得的多个搜索引擎的检索结果中相同的检索条目进行合并处理;依据待译对象及译文引导词在所述合并处理后所得的各检索条目中的出现位置、距离、信息来源,及所述各检索条目在每个搜索引擎返回检索结果中的默认排序中的任意一种或多种,计算合并后所得的各个检索条目与所述待译对象的相关度数值;基于相关度数值,对合并后所得的各个检索条目进行排序;从排序后所得的条目序列的相应端获得相关度数值较高的至少一个检索条目,并返回所述至少一个检索条目。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1