信息编码方法、系统以及计算机可读介质的制作方法

文档序号:8435878阅读:415来源:国知局
信息编码方法、系统以及计算机可读介质的制作方法
【专利说明】信息编码方法、系统以及计算机可读介质
【背景技术】
[0001] 语义数据是指可以由机器在没有人为干涉的情况下有意义地解读的数据。一般 地,语义数据模型是基于已存储符号、或对象,和现实世界间的关系的软件工程模型。数据 基于对象的二元模型被组织,通常三部分为一组:两个对象以及所述两个对象间的关系。例 如,代表杯子位于桌子上的数据组织可能看起来像"杯子桌子"。对象(即,杯子和桌子) 被就其关系来解读,即:位于其上。数据被线性地组织,并且对象展示给软件的位置是:杯 子位于桌子上而不是其他方式。相应地,语义数据系统被设计为尽可能准确地代表数据集 内的现实世界,并且数据集中的对象被线性地以及分层级地组织来为他们所代表的赋予意 义。
[0002] 在云计算环境下中,用于管理、控制通信和其他应用的数据可以与通过网络被传 送的一般报文一起被发送。此类数据一般较短,并且离散地附加或嵌入在携带其的报文中。

【发明内容】

[0003] 在至少一种实施方式中,方法包括预处理包括用于生成二进制位序列的多个语义 句子的文本报文,所述二进制位序列中的每一位分别对应所述语义句子中的一个,判定所 述文本报文适于在其中携带多位代码,并且响应于所述判定,将所述代码嵌入到所述多个 语义句子的子集中。
[0004] 以上概述仅用于说明并且不旨在以任何方式进行限制。除上述说明性的方面、实 施方式、以及特征外,通过参考附图以及以下详细描述,另外的方面、实施方式、以及特征将 变得显而易见。
【附图说明】
[0005] 结合附图,从以下描述及所附权利要求书,本公开的前述及其他特征将变得更加 充分明显。理解的是,这些附图描绘了根据本公开的多个实施方式,并且因此将不被认为限 制本公开的范围,通过使用附图,本公开的另外的特性及细节将被描述。
[0006] 图1示出根据本文描述的至少一些实施方式布置的、基于语义数据推理的信息编 码的示例方案。
[0007] 图2示出根据本文描述的至少一些实施方式布置的、用于基于语义数据推理的信 息编码的处理流程。
[0008] 图3示出根据本文描述的至少一些实施方式布置的、用于基于语义数据推理的信 息编码的另一处理流程。
[0009] 图4示出根据本文描述的至少一些实施方式布置的、被配置为执行基于语义数据 推理的信息编码的示例系统。
[0010] 图5示出根据本文描述的至少一些实施方式布置的示例计算设备,所述示例计算 设备被配置为实施基于语义数据推理的信息编码的一个或多个实施方式的操作。
【具体实施方式】
[0011] 在以下详细描述中,参考附图,附图构成本描述的一部分。在附图中,除非上下文 另有指明,否则相同符号一般指代相同部件。另外,除非另有注明,每张连续的附图的描述 可以参考一个或多个之前的附图的特征,来提供更清楚的语境以及对当前示例实施方式更 为实质性的解释。尽管如此,在详细描述、附图、以及权利要求书中描述的示例实施方式不 意在限制。在不背离本文呈现的主题的精神或范围的情况下,其他实施方式可以被使用,并 且可以做出其他改变。将很容易理解的是,如本文一般描述的、以及在图中示出的本公开的 方面可以以多种不同配置被布置、替换、结合、分离、以及设计,所有这些都在本文被清晰的 构思。
[0012] 本文描述的是与基于语义数据推理将代码(code)嵌入文本报文相关的系统、装 置、计算机程序产品、方法、以及技术。本文描述的一些示例实施包括通过将所述文本报文 分段成多个单独的语义句子来预处理所述文本报文,并且判定所述文本报文是否适于携带 数据。当判定所述文本报文适于携带代码(code)时,所述多个语义句子的子集被选择并且 所述被选择的子集的语义句子被标记。在语义句子的选择和标记中,包含私有信息的第一 知识库被使用。所述代码被嵌入至所述文本报文中,从而通过对所述文本报文的选择的语 义句子的选择和标记,对所述文本报文进行编码。所述被编码的文本报文被传送至接收方, 所述接收方可以解码所述被编码的文本报文,从而使用所述第一知识库或第二知识库来获 得所述代码,所述第二知识库是所述第一知识库的复本。
[0013] 一般地,报文的内容暗含或反映关于信息作者的特定私有信息。例如,一般地,教 师可以通过学生对测试问题的回答来判定学生是否已经掌握特定学科。换句话说,由该学 生提供的回答反映该学生关于被测试的学科的知识水平。如另一示例,当用户登入系统时, 该用户可能被要求回答简短问题,这样对该简短问题的正确回答暗含用户的真实性或身 份。当然,此类情境不意在以任何方式进行限制。相反,应当理解的是,在特定报文中暗含 的信息可以从所述特定报文的一个或多个语义句子中的每一个被推理或推导出来。
[0014] 假设从语义句子推导结论的结果可以被处理为布尔值(Booleanvalue),与所述 语义句子背后的事实一致的推导结论则可以由位值1来代表,并且与所述语义句子背后的 事实不一致的推导结论可以由位值〇来代表。因此,当所述报文的语义句子中的每一个被 推导出与事实一致或不一致的结论时,包含多个语义句子的报文可以被看作并且处理为一 系列位值0和1。例如,作为使用公共知识的说明,包含以下三个句子的报文M可以被数学 表示为M= {0,1,0}:"二月份天数比三月份多。美国有50个州。夏天天气一般比冬天冷。" 这是因为第一个句子Sl的推导结论与事实不一致,第二个句子s2的推导结论与事实一致, 以及第三个句子s3的推导结论与事实不一致。
[0015] 例如,包含特权信息的知识库,如关于报文作者的私有信息,可以被用于判定推导 结论是否与各个语义句子背后的事实一致。相应地,当报文具有如下解释的足够大量的多 个语义句子时,一个或多个字节的特定代码可以被嵌入或携带入所述报文的选定量的语义 句子中。在所述报文中,所述被选择的语义句子按一定序列被选择,这样每个被选择的语义 句子的推导结论的位值代表所述一个或多个字节的被嵌入代码的相应位。所述被选择的 语义句子被标记,或以其他方式被标记或突出显示,来将其标识为携带所述代码的报文的 多个语义句子中被选择的语义句子。所述被编码报文可以被传送至接收方,所述接收方可 以使用具有同样特权信息的知识库,并且所述接收方可以通过使用所述知识库恢复所述代 码。
[0016] 图1示出根据本文描述的至少一些实施方式布置的、基于语义数据推理的信息编 码的示例方案100。
[0017] 根据方案100,在发送侧,报文可以是文本报文,所述文本报文包含一个或多个语 义句子并且被编码以携带代码作为被编码报文、使用第一知识库、并且被传送至接收侧。在 所述接收侧,第二知识库可以被用来解码所述被编码报文,从而获得原始报文。从数学上 讲,所述报文可以被记为M,所述第一知识库可以被记为K,所述代码可以被记为I,以及所 述被编码报文可以被记为M'。M= ,…,Si,~},以及81是11的一个或多个语义句子 中的任意语义句子。K被用在推导过程中并且^的推导结论可以与各自语义句子背后的事 实一致或不一致,分别对应布尔值1和0。I可以被表达为二进位序列,如I= …t^,,其 中匕是I的第i位。例如,当句子s4至s7的推导结论的布尔值反映代码I的四位时,代码I= 1101可以被嵌入到所述被编码报文中M' = {0, 1,0, 1,1,0, 1,0, 0, 1}。
[0018] 进一步地,存储在所述第一知识库中的所述特权信息以及存储在第二知识库中的 所述特权信息可以相同。在至少一些实施方式中,所述第一知识库和所述第二知识库是可 由发送方和接收方访问的同一知识库。在至少一些其他实施方式中,所述第二知识库是所 述第一知识库的复本。例如,所述第一知识库和所述第二知识库可以是周期性同步的单独 的知识库,这样,存储在所述第一知识库中的所述特权信息和存储在所述第二知识库中的 所述特权信息是相同的。在本文的描述中,数学符号K被用来代表所述第一知识库或所述 第二知识库。
[0019] 参考报文102、代码114、知识库116、和/或知识库118中的一个或多个,示例方案 100可以包括由一个或多个块104、106、108、110、和/或112示出的一个或多个操作、行动、 或功能。虽然方案100被示出为具体的块,多个块可以根据想要的实施被分成另外的块、结 合为较少的块、或消除。处理可以从块104开始。
[0020] 块104(预处理)可以包括通过以下方法来预处理报文102,或M:准备报文102用 来判定报文102是否适于携带代码114以及如果判定报文102适于携带代码104,则用于 后续编码报文102来携带本文中的代码114。例如,在发送侧(例如,由发送方操作)的处 理器或计算设备可以通过将M分成多个单独的语义句子Sl,s2来预处理M。相继 地,所述处理器可以从每个语义句子推导各自的结论并且将所述结论与K中的特权信息相 比较以生成序列R形式的二进制位,即:R= …a,,其中是对应于语义句子si的所述 推导结论与K中的所述特权信息的比较结果的位。如果比较结果是一致的,则ri的值为1, 如果是不一致的,则^的值为0。
[0021] 举例来说,假设接收方,即杰克(Jack),有一个女儿,其名字为艾格尼丝(Agnes)。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1