用于选择用以代表表格式信息的方法和系统的制作方法_3

文档序号:8395851阅读:来源:国知局
如10的某次幂)的范围内,则包含该数字的两个单 元格相似。例如,
[0039]
【主权项】
1. 一种用于选择用w代表表格式信息的结构的方法,所述方法包括: 从表格结构的汇集中选择与表格对应的表格结构,表格结构函数描述所述表格结构中 的单元格配对中的单元格何时应当彼此相似,所述表格是问答系统(Q&A系统)的语料库的 一部分,其中所述Q&A系统使用所述语料库来回答自然语言问题; 选择单元格相似度函数,其中所述单元格相似度函数根据准则来比较所述表格结构中 的所述单元格配对中的所述单元格并且输出所述单元格配对包括包含有彼此相似的值的 单元格的概率; 根据所述单元格相似度函数来确定所述表格结构中的第一单元格配对中的第一单元 格和第二单元格彼此相似的单元格相似概率; 使用所述单元格相似概率来调整所述表格结构代表所述表格的计算的概率;W及 将所述计算的概率指示为第一模型代表所述表格的概率,其中所述第一模型是所述表 格结构和所选择的单元格相似度函数的函数。
2. 根据权利要求1所述的方法,还包括: 选择与所述表格对应的第二表格结构; 从所述第二表格结构中选择第二单元格配对; 根据所述单元格相似度函数确定所述第二单元格配对中的第一单元格和第二单元格 彼此相似的单元格相似概率; 使用所述单元格相似概率调整所述第二表格结构代表所述表格的第二计算的概率; 将所述第二计算的概率指示为第二模型代表所述表格的概率,其中所述第二模型是所 述第二表格结构和所选择的单元格相似度函数的函数; 从模型的集合中选择具有较高的计算的概率的模型W形成选择的模型,所述模型的集 合包括所述第一模型和所述第二模型;W及 根据所选择的模型形成对所述表格的解释,其中所述Q&A系统使用所述解释来回答所 述自然语言问题。
3. 根据权利要求2所述的方法,还包括: 将第=计算的概率指示为第=模型代表所述表格的概率,其中所述第=模型是第=表 格结构和所选择的单元格相似度函数的函数,其中所述选择从所述模型集的子集中选择, 其中所述子集包括其对应的计算的概率超过概率阔值的那些模型。
4. 根据权利要求1所述的方法,其中所述调整包括: 在对若干单元格配对计算所述表格结构的平均单元格相似概率时使用所述单元格相 似概率。
5. 根据权利要求1所述的方法,其中针对所述表格结构中存在的所有单元格配对的 集合的子集执行所述选择所述第一单元格配对、所述确定所述单元格相似概率W及所述调 整。
6. 根据权利要求1所述的方法,其中所述单元格相似度函数中的所述准则要求给定单 元格配对中的所述单元格中的所述值的类型相匹配。
7. 根据权利要求1所述的方法,其中所述单元格相似度函数中的所述准则要求给定单 元格配对中的所述单元格中的所述值在彼此的范围内。
8. 根据权利要求1所述的方法,其中所述定义还包括: 标识所述表格中的超级单元格,其中所述超级单元格包括相邻单元格的集合,其中所 述相邻单元格的集合中的第一单元格的内容描述所述相邻单元格的集合中的第二单元格 的内容。
9. 根据权利要求8所述的方法,其中所述第一单元格配对包括第一超级单元格和第二 超级单元格。
10. 根据权利要求1所述的方法,还包括: 标识在所述表格中的行首单元格的集合;W及 标识在所述表格中的列首单元格的集合。
11. 根据权利要求10所述的方法,其中所述第一单元格配对包括在所述表格中的第一 行首单元格和第二行首单元格。
12. 根据权利要求10所述的方法,其中所述第一单元格配对包括在所述表格中的第一 列首单元格和第二列首单元格。
13. 根据权利要求1所述的方法,其中所述表格包括行坐标和列坐标并且包括所述表 格式数据,其中所述表格中的至少一个单元格不能用所述表格的所述行坐标和所述列坐标 来标识,并且其中所述至少一个单元格与所述表格中的至少一个其他单元格相关,使得在 所述至少一个单元格中的值提供用于解释在所述至少一个其他单元格中的值的情境信息。
14. 根据权利要求1所述的方法,其中所述表格被包括在具有第二表格的文档中,所述 第二表格包括第二表格式数据,所述方法还包括: 定义与所述第二表格对应的第二表格结构; 选择第二单元格相似度函数; 将第二计算的概率指示为第二模型代表所述第二表格的概率,其中所述第二模型是所 述第二表格结构和所述第二单元格相似度函数的函数;W及 根据所述第二模型形成所述第二表格的第二解释,其中所述Q&A系统还使用所述第二 解释来回答所述自然语言问题。
15. 根据权利要求1所述的方法,还包括: 确定所述表格结构的汇集是否包括适用于所述表格的合适的表格结构,其中所述选择 是汇集表格结构,包括一个合适的表格结构,并且其中所述表格结构是所述合适的表格结 构;化及 响应于确定所述表格结构的汇集不包括所述合适的表格结构,定义所述表格结构。
16. -种用于选择用W代表表格式信息的结构的数据处理系统,所述数据处理系统包 括: 包括存储介质的存储设备,其中所述存储设备存储计算机可用程序代码;W及 处理器,其中所述处理器执行所述计算机可用程序代码,并且其中所述计算机可用程 序代码包括: 用于从表格结构的汇集中选择与表格对应的表格结构的计算机可用代码,表格结构函 数描述所述表格结构中的单元格配对中的单元格何时应当彼此相似,所述表格是问答系统 (Q&A系统)的语料库的一部分,其中所述Q&A系统使用所述语料库来回答自然语言问题; 用于选择单元格相似度函数的计算机可用代码,其中所述单元格相似度函数根据准则 来比较所述表格结构中的所述单元格配对中的所述单元格并且输出所述单元格配对包括 包含有彼此相似的值的单元格的概率; 用于根据所述单元格相似度函数来确定所述表格结构中的第一单元格配对中的第一 单元格和第二单元格彼此相似的单元格相似概率的计算机可用代码; 用于使用所述单元格相似概率来调整所述表格结构代表所述表格的计算的概率的计 算机可用代码;W及 用于将所述计算的概率指示为第一模型代表所述表格的概率的计算机可用代码,其中 所述第一模型是所述表格结构和所选择的单元格相似度函数的函数。
【专利摘要】选择与表格对应的表格结构以描述表格结构中的单元格配对中的单元格何时应当彼此相似。选择单元格相似度函数以根据准则来比较单元格配对中的单元格并且输出单元格配对包括包含有彼此相似的值的单元格的概率。根据单元格相似度函数来确定表格结构中的第一单元格配对中的第一单元格和第二单元格彼此相似的单元格相似概率。使用单元格相似概率来调整表格结构代表表格的计算的概率。将所计算的概率指示为第一模型代表表格的概率,其中第一模型是表格结构和所选择的单元格相似度函数的函数。
【IPC分类】G06F17-21
【公开号】CN104714931
【申请号】CN201410678045
【发明人】D·K·比荣, S·N·格拉德, A·皮科维斯基
【申请人】国际商业机器公司
【公开日】2015年6月17日
【申请日】2014年11月21日
【公告号】US20150169720, US20150169737
当前第3页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1