一种根据文字语意控制空调的方法及系统的制作方法_3

文档序号：9272971阅读：来源：国知局

放置于表1中季节词库的夏季词库内；所述季节词库也可通过人工添加的方式，加速建立「芒果」与夏天的关联。
[0074]本实施例通过以下算法，计算"我"、"想"、"吃"、"芒果"、"双皮奶"五个词语分别与 "春"，"夏"，"秋"，"冬"四个类别的相似度。
[0075]在开始算法以前，所述控制语句已经被拆分为n个词语，记为sentence= [P^P2，…？」，所述i= (1、2…n)，其中分形成的词语（Phrase)，词语的长度记为|P」。
[0076] 计算一个词的时间相似程度，算法如下：
[0077]将词语Pi使用n-gram算法拆解成所有长度的片段集合，其中包含m个片段，记为 G = n-gramTi) = [Wi，，…w」]，G为文字拆解形成的片段集合（Group)，其中j = (1、2… m)J/i^m=|Pi|(|Pi|+l)/2;
[0078]所述时间词典中某一类别内的相关时间词汇为D=QV"Dk]，该类别包括r个相关时间词汇，所述k= (1、2…r)，对所述任一词语？1与015进行相似度（Similarity)计算，计算公式为：Similarity(Pi，Dk) =MAX(Dist(Wj，Dk));其中，Dist为一个距离函数，用来衡量两个词的重复性，Dist=(Overlap(Wj,Dk)/|Dk|) ~3,其中Overlap表示字词重复的长度， DK|为相关时间词汇Dk的长度。
[0079]本算法中由于两词重复越低，其词义差异性应为指数增加，因此使用指数来代表，相似性随着重复字数的减少呈指数性减少，其中Dist介于0-1之间。
[0080] 以"芒果"为例，首先将"芒果"拆成"芒"、"果"、"芒果"三个片段，记为G= n-gram(芒果）=[芒，果，芒果];然后计算所述各片段与表1中夏天类别下各个时间词汇的距离（Dist)，具体如下：
[0081]Dist(芒，烈日炎炎）=(Overlap(芒，烈日炎炎）/4) ~3 = 0;
[0082]Dist(果，烈日炎炎）=(Overlap(果，烈日炎炎）/4) ~3 = 0;
[0083]Dist(芒果，烈日炎炎）=(Overlap(芒果，烈日炎炎）/4) ~3 = 0;
[0084]Dist(芒，芒果）=(Overlap(芒，芒果）/2) ~3 = 0? 5~3 = 0? 125;
[0085] Dist (果，芒果）=(Overlap (果，芒果）/2)~3 = 0? 5~3 = 0? 125;
[0086] Dist (芒果，芒果）=(Overlap (芒果，芒果）/2) ~3 = 1~3 = 1;
[0087] (略）
[0088] Dist (芒果，电风扇）=(Overlap (芒果，电风扇）/3) ~3 = 0;
[0089] 因此，"芒果"与所述季节词库中"夏"这个类别的相似度Similarity = MAX (Dist (Wj，Dk) )= 1.0,即相似度为以上所有取值的最大值"1.0"。采用同样的方法，可以计算得到"芒果"与所述季节词库中"春"、"秋"、"冬"三个类别的相似度均为〇,因此，"芒果"在所述季节词库下的时间相似度集合可以表示为（春：〇,夏：1. 〇,秋：〇,冬：〇);重复上述步骤，可以分别计算出所述"我"、"想"、"吃"、"双皮奶"在所述季节词库下的时间相似度集合均表示为（春：〇,夏：〇,秋：〇,冬：〇)。
[0090] "芒果"对应的时间相似度集合（春：〇,夏：1.〇,秋：〇,冬：〇)中，相似度最大值为 1. 0,即"芒果"对应的第一相似度为"1. 0"，同理，"我"、"想"、"吃"、"双皮奶"对应的第一相似度分别为"〇"，因此所述"芒果"为所述控制语句的时间代表性关键词，"芒果"对应的时间相似度集合（春：〇,夏：1. 0,秋：〇,冬：〇)为所述控制语句的时间相似度集合。
[0091] 如图2所示，步骤203中，从所述若干个词语中选择一个作为所述控制语句的地区代表性关键词，并将所述地区代表性关键词转换为所述控制语句的语意所对应的地点。本发明的实施例，所述步骤203可以采取与所述步骤202同样的方法和算法，所述步骤203具体为：
[0092] 建立地区词库，所述地区词库按照不同的地点划分为y个类别，记为（类别1，类别 2, ……类别y)，每个类别均记录了与所述地点相关联的若干地点词汇；
[0093] 分别计算所述控制语句拆分成的各个词语与所述地区词库的各个类别的地区相似度，生成所述词语的地区相似度集合，所述地区相似度集合表示为（类别1 :地区相似度 1，类别2 :地区相似度2,……类别y :地区相似度y);
[0094] 选择每个词语的地区相似度1~地区相似度y中的最大值作为该词语的第二相似度；比较所有词语的第二相似度大小，并选择第二相似度最大值所对应的地区相似度集合作为所述控制语句的地区相似度集合，将所述第二相似度最大值对应的词语作为所述控制语句的地区代表性关键词。
[0095] 在具体实施例中，由于每个地点的常用词汇、惯用语不同，因此可通过地名、特色名产、惯用词等具有地方特色的词语构建所述地点词库，并根据所述控制语句中是否有地点关联性，进而推理出最有可能的地点。本实施例撷取社交网路或文章，统计出各地常出现的关键词，产生出具有地区特色的地点词库；所述地点词库亦可透过人工增加的方式，加速建立「地点」与文字间的关联。
[0096] 如表2所示，为本实施例的地点词库，划分为中国台湾和广东两个类别，记为（中国台湾，广东），每个类别下均记录了与所述地点相关联的若干个地点词汇，其中"中国台湾"所在类别下包含地点词汇"芒果冰"，"广东"所在类别下包含词汇"双皮奶"。
[0097]表2本实施例的地点词库

[0099] 采用跟上述步骤202中同样的算法，可以生成地区代表性关键词和地区相似度集合，计算过程如下：
[0100] 将「我」、「想」、「吃」、「芒果」、「双皮奶」五个词语对应所述表2中地点词库的词进行相似度（Similarity)计算：
[0101]根据 Similarity = MAX(Dist(Wj, Dk))，得到：
[0102] "芒果"与所述地点词库下"中国台湾"的地点相似度Similarity = Dist(芒果，芒果冰）=(2/3)~3 = 0.296,对于"广东"地点相似度为0,因此"芒果"对应的地区相似度集合为（中国台湾：〇. 296,广东：0);
[0103]"双皮奶"与所述地点词库下"广东"的地点相似度Similarity = Dist (双皮奶，双皮奶）=(3/3)~3= 1，对于"中国台湾"的地点相似度为0,因此"双皮奶"对应的地区相似度集合为（中国台湾：〇,广东：1);
[0104] 其他「我」、「想」、「吃」三个词语对所述地点词库下"中国台湾"、"广东"的地点相似度均为〇。
[0105]"芒果"对应的地区相似度集合（中国台湾：0.296,广东：0)中，相似度最大值为 0. 296,即"芒果"对应的第二相似度为"0. 296"，同理，"双皮奶"对应的第二相似度分别为 "1"，因此所述"双皮奶"为所述控制语句的地区代表性关键词，"双皮奶"对应的地区相似度集合（中国台湾：〇,广东：1)为所述控制语句的地区相似度集合。
[0106] 上述方法可以过滤掉所述控制语句中与时间或者地区无关或者关联性很小的词语，比如「的」、「是」等，取出所述控制语句中最具有时间关联性和地点关联性的词语，并将所述最具有时间关联性的词语作为所述控制语句对应的时间，将所述最具有地点关联性的词语作为所述控制语句对应的地点，当然，在本发明的其他实施例中，可以通过其他算法来进行上述时间相似度计算和地点相似度计算，并获得能够代表所述控制语句的时间代表性关键词、时间相似度集合和能够代表所述控制语句的地区代表性关键词、地区相似度集合。
[0107] 如图2所示，步骤204中，根据所述时间代表性关键词转换的时间点和所述地区代表性关键词转换的地点，生成与所述控制语句的语意相符合的空调运行参数值。在计算出时间相似度与地区相似度后，须要将此模糊的时间点、地点，通过查询气候历史数据库，转换成空调温度。所述步骤204具体为：
[0108] 在气候历史数据库中查找得到与所述时间代表性关键词和所述地区

完整全部详细技术资料下载

当前第3页1 2 3 4 5