优化写入方法、优化写入设备及数据产生和写入设备的制作方法

文档序号：6461831阅读：122来源：国知局

专利名称：优化写入方法、优化写入设备及数据产生和写入设备的制作方法
技术领域：
本发明涉及计算机领域，尤其涉及一种优化软件程序所产生的数据的优化写入方法、优化写入设备及数据产生和写入设备。
背景技术：
软件产品通常需要产生并输出一些信息。越是重要的软件产品，产生的输出信息越是重要。软件产生输出信息的过程以及输出信息存储方式也经历了演化。
在计算机使用的早期阶段，软件产生的信息被直接实时送到打印机或控制台。操作员需要监视这些信息。
随着计算机技术的逐步发展，软件产生的信息逐步开始不直接送
到打印机，而是先写到磁盘文件里。一种典型的软件产生的信息是日志信息，来记录软件运行时的执行过程，以供以后进行软件跟踪或统计分析时使用。
图1示出了对日志信息进行记录的一种已有技术。图1所示的记
录产生及写入装置包括记录产生器101，和记录文件102，。记录产生器 101，根据软件运行而产生的日志信息直接写入记录文件102，，生成程序日志文件。日志文件中包含的记录称为日志记录，日志记录通常包括由若干字段的信息条目构成的数据。日志文件又被称为扁平文件。扁平文件意思是文件只包含没有复杂结构的简单信息条目日志记录。除了时间顺序外，日志记录之间没有其他明显关系。如果有多个日志文件，则每一个文件基本上都是独立的。扁平日志文件里的记录是由可读的完全形式的信息组成。这些扁平日志文件没有内在的排序，过滤，分析。当消息文本很长的时候，同样的长消息文本被重复记录许多次，这导致向磁盘写日志记录的效率的下降。而且这种以完全形式写信息会导致存储在磁盘文件中的数据冗余，使日志文件可能会增长到很大，消耗大量系统存储资源。当系统需要写入的记录很多时，还可能造成延迟，无法保证实时性。
例如，软件经常产生包含长字段"Group Names: cn-mygroupl，cn-ibmpolides，o-ibm，，的记录，其中"Group Names，，是字段名，"cn-mygroupl，cn-ibmpolicies，o-ibm"是字段中包含的信息条目。当第一次生成上述字段时，要记录"Group Names: cn=mygroupl,cn=ibmpolicies，o=ibm"。当以后每次生成上述字段时，仍要记录"Group Names: cn=mygroupl，cn=ibmpolicies，o=ibm，，。这造成了系统资源的浪费和运行效率的下降。
随着日志产生和存储技术的进一步发展，如图2所示，出现了在记录产生器101，和记录文件102，之间增加优化写入器202，以便提高写日志记录的效率并节约系统存储空间的技术。在图2中，记录产生及写入装置201，包括记录产生器101，和优化写入器202，。记录产生器 101，产生的记录通过优化写入器202，写入记录文件102，。例如，专利 US6199070公开了一种技术，其把日志信息存储在多个数据库文件里，在多个日志文件之间建立联系，并利用已经有的数据库管理的标准功能实现数据标准化，提高写入效率并节约系统资源。
图3示出了专利US6199070中描述的系统结构。图3的优化写入器202，包括记录接收器20201，、字段分析器20202，、常见长字段表 20203，、匹配识别器20204，、写入执行器20206，。
根据该已有技术，程序设计人员要事先知道哪些字段中容易出现长的、且重复概率高的信息条目。预先对于每一个这样的字段(如上文的"Group Names")设计一个信息符号表20205，-i (i为从1到n 的整数)。开发人员完成程序设计后，系统管理员把该字段中事先了解的重复概率高的信息条目(如上文的 "cn=mygroupl，cn=ibmpolicies，o=ibm")以与一个分酉己的信息符号相对应的方式预写到对应的信息符号表20205，-i中。
下面参考图4描述专利US6199070中的优化写入器202，的工作过程。
当记录接收器20201，接收到记录产生器IOI，产生的日志记录后，把该日志记录所包含的字段逐个地送给字段分析器20202，分析 (S41，)。常见长字段表20203，中记录了事先知道的容易包含长的、且重复概率高的信息条目的字段名(每个字段名对应于一个信息符号表20205，-i)。
当字段分析器20202，判断出日志记录所包含的字段不属于常见长字段表20203，所预先记录的字段时，将该字段及其信息条目直接送入写入执行器20206，以便写入记录文件102， ( S42')。然后前进到步骤S46，继续执行。
当字段分析器20202，判断出日志记录所包含的字段属于常见长字段表20203，所预先记录的字段时，将该字段所包含的信息条目送入匹配识别器20204，进行进一步的匹配识别(S43，)。匹配识别器20204，根据该字段的字段名，找到与该字段名对应的信息符号表20205，-i, 查看该信息符号表20205，-i是否包括与该字段所包含的信息条目完全匹配的信息条目(S44，)。
如果该信息符号表20205，-i不包括与该字段所包含的信息条目完全匹配的信息条目，表明该信息条目不是预先了解的重复概率高的信息条目，匹配识别器20204，将该字段中的信息条目直接送入写入执行器20206，以便写入记录文件102，。
如果该信息符号表20205，-i包括与该字段所包含的信息条目完全匹配的信息条目，表明该信息条目是预先了解的重复概率高的信息条目，匹配识别器20204，将信息符号表20205，-i中存储的与该字段中的信息条目对应的信息符号送入写入执行器20206，以便写入记录文件102， ( S45')。
然后，判断接下来是否还有待写入的日志记录的字段(S46')。如果有，重复执行步骤S41'。
由于写入一个信息符号比写入一个长的信息条目的效率高得多，占用系统资源也少得多，因此这种方法有利地提高了写入效率并节约了系统资源。
但是这种已有技术还是存在问题，例如该方法仅对于那些在信息
符号表20205，中事先存储的、预先了解的重复概率高的信息条目，才能提高写入效率并节约系统资源。对于没有事先存储但可能实际上重复概率高的信息条目，不能提高写入效率并节约系统资源。另外，匹配识别器需要在大量的数据库文件中查找与字段中所含的信息条目的匹配，这导致在一定程度上降低了写入效率。

发明内容
本发明的一个目的是确保动态地将实际上重复概率高的信息条目以信息符号的形式写入，以进一步提高写入效率，节约系统资源。本发明的又一个目的是在对进行数据写入的同时，实时地产生实际上重复概率高的包含有完全信息条目和信息符号的一个或多个分离文件。
为实现上述目的，本发明提供一种记录数据的优化写入方法，包括生成与该数据的预先定义的字段中包含的新的信息条目相关联的新的信息符号，并将该新的信息条目以及该新的信息符号相关联地存储到对应于该字段的辅助文件中；参考在高速緩存中所存储的关于该数据的预先定义的字段中包含的信息条目以及与其相关联的信息符号，将数据写入主文件。
为实现上述目的，本发明提供一种优化写入设备，包括信息符号生成装置，用于生成与该数据的预先定义的字段中包含的新的信息条目相关联的新的信息符号，并将该新的信息条目以及该新的信息符号相关联地存储到对应于该字段的辅助文件中；写入执行装置，用于参考在高速緩存中所存储的关于该数据的预先定义的字段中包含的信息条目以及与其相关联的信息符号，将数据写入主文件。
本发明还提供一种数据产生及写入装置，包括数据产生器和上述优化写入设备。
根据本发明，按照预定的选择策略动态更新在高速緩存中存储的
9关于该数据的预先定义的字段中包含的信息条目以及与其相关联的信息符号。
根据本发明，对于已经选定的选择策略，可以更新与该选择策略相关的参数值。
根据本发明，实时产生的这些分离的辅助文件是作为数据输出的一部分，而不是由系统管理员人工加入的。
由于本发明采用了高速緩存来动态地保留实际上重复概率高的信息条目而不是规定好的信息条目，确保了动态地将实际上重复概率高的信息条目以信息符号写入主文件，从而进一步提高写入效率，节约系统资源，并提高实用性。另外，由于向高速緩存进行匹配查询要比向多个信息符号表进行匹配查询快得多，本发明的方法大大提高了实时性。
本发明通过设计高速緩存和设计程序实时产生包含有输出信息的与主文件有关联的分离的辅助文件，从而减少某些重复长信息文本写入系统存储介质中的次数，在完全意义上实现了在程序运行过程中实时降低由于输出信息造成的系统存储资源中的数据冗余。由于减少了写入存储介质的次数和字节总量数，因而同时又提高了程序运行效率。

图1示出了现有技术中的直接写入型的记录产生及写入装置的总体框图。
图2示出了间接写入型的记录产生及写入装置的总体框图。图3示出了现有技术中的记录产生及写入装置的详细框图。图4示出了图3所示的记录产生及写入装置的工作流程图。图5示出了根据本发明的方法的工作流程图。图6a示出了至多可容纳5个信息条目的高速緩存内存储的信息条目及相关属性列表示例。
图6b示出了在实施例1的选择策略的情况下从高速緩存中剔除一条信息条目后的结果。
图6c示出了在实施例2的选择策略的情况下从高速緩存中剔除一条信息条目后的结果。
图6d示出了在实施例3的选择策略的情况下从高速緩存中剔除一条信息条目后的结果。
图6e示出了根据本发明的变形实施例从高速緩存中剔除l个小时内没有被生成的信息条目后的结果。
图7示出了本发明的记录产生及写入装置的框图。
具体实施例方式
本发明的优点和效果通过以下结合实施例的详细描述将更加清楚。
在以下的描述中，将以日志文件中的日志记录为例进行^说明。但本发明不限于此，根据实际的应用，本发明可以对整个日志文件进行处理，或者对日志记录中的字段进行处理。
图6a-6e示出根据本发明的实施例在高速緩存中可能使用的信息的例子。其中，XD—grouplist表示对应于一个字段的信息条目； XD_crossref表示分配给该信息条目的信息符号，XD_uc表示该信息条目被使用的频率，XD—initialtime表示该信息条目的首次生成时间， XDJastusedtime表示该信息条目最近一次使用时间。根据本发明， XD_grouplist和XD_crossref将在高速緩存中相关联地存在。XD_uc、
XD—initialtime和XD—lastusedtime是作为选择策略参数使用的，根据具体的选择策略可以选择使用这些参数的一个或者多个。
下面以日志记录为例，参考图5和图6描述根据本发明的方法的工作过程。
首先，对于一条日志记录，把该日志记录所包含的一个字段进行分析，判断该字段是否是所定义的字段(S501)。
当判断出日志记录所包含的该字段不属于预先定义的字段时，将该字段的内容直接写入日志主文件(S502)。其中预先定义的字段例
ii如是事先知道的容易包含长的、且重复概率高的信息条目的字段名
(每个字段名对应于一个信息符号表i (i为l到n之间的整数))，例如图6a-6e中的XD-grouplist列下的条目为一个字段名的不同信息条目。
当判断为日志记录所包含的该字段属于预先定义的字段时，针对该字段所包含的信息条目查询高速緩存，检查高速緩存中是否存储有与该字段所包含的信息条目完全匹配的信息条目，即完全信息条目 (S503 )。
如果高速緩存中已经存储有与该字段所包含的信息条目完全匹配的信息条目，则根据所设定的选择策略修改高速緩存中与该信息条目对应的策略选择参数值(S505)。被修改的策略选择参数值可以根据用户选择的选择策略而定。这例如可以通过将XD—uc递增1;将 XDJastusedtime设置为当前时间来实现。经过修改，对于图6a中的 4言息条目"cn-mygroupl，cn-ibmpolicies，o-ibm"来"^兌，^/f吏用的频率被设置为5，首次生成时间为l: 37，最近一次使用时间为8: 55。
然后，将高速緩存中与该信息条目对应的信息符号从高速緩存读出，写入日志主文件(S506)。
例如如图6a所示，高速緩存中存储有 "cn-mygroupl，cn-ibmpolicies，o-ibm"这才羊一条寸言息,条目，其信息'符号为"A"。如果当前接收到的记录字段"Group Names"中的信息条目恰好是"cn=mygroupl，cn=ibmpolicies，o=ibm"，贝'J以"A" 替 "cn-mygroupl，cn-ibmpolicies，o-ibm，，写入日志主文件。
如果高速緩存中未存储与该字段所包含的信息条目完全匹配的信息条目，为该字段中包含的该信息条目分配一个新的信息符号 (S504)，其中该信息符号不同于高速緩存中已经存储的任意一个信息符号。
然后，判断高速緩存是否已满(S508)。如果未满，高速緩存写入器将该信息条目和该信息符号相关联地写入高速緩存(S510)。如果已满，按预定的选择策略从高速緩存中剔除至少一条信息条目及其相关选择策略参数信息(S509)。当高速緩存已满时按预定的选择策略进行高速緩存内容剔除的具体方式将在下面结合图6a-6e具体描述。
然后将该信息条目和信息符号相关联地写入高速緩存(S510)。
然后，按照与步骤S505相同的操作，修改高速緩存中与该信息条目对应的选择策略参数值(S511)，例如，对于新的信息条目来说，可以将XD一initialtime设置为信息条目首次被写入高速緩存的时间。
接着，用分配的新的信息符号代替该字段所包含的新的信息条目，写入日志主文件。将该分配的新的信息符号和该新的信息条目相关联地，即将该所分配的新的信息符号和该新的信息条目的对应关系，写入对应于该字段的信息符号表i中(S512)。
接着，判断接下来是否还有待记录的记录字段(S513)。如果没有待记录的记录字段，过程结束。如果还有待记录的记录字段，过程返回步骤S501。
下面结合图6a-6e具体描述在不同的选择策略模式下步骤S509 按选择策略进行高速緩存内容的剔除的过程。根据本发明，用户可以选择应用于高速緩存的具体的选择策略。
假设将高速緩存设置为最多存储5条信息条目。实施例1
按照实施例1的选择策略，当高速緩存已满时从高速緩存中剔除使用频率最低的信息条目及其相关选择策略参数信息。在图6a示出的5个信息条目中，生成次数最少的信息条目是 "cn=mygroup4，cn=ibmpolicies，o=ibm，，，其生成次数为3，因此当高速緩存已满时从高速緩存中剔除该信息条目及其相关选择策略参数信息。图6b示出了在实施例1的选择策略的情况下从高速緩存中剔除一条信息条目及其相关选择策略参数信息后的结果。
实施例2
按照实施例2的选择策略，当高速緩存已满时从高速緩存中剔除首次生成时间最早的信息条目及其相关选择策略参数信息。在图6a示出的5个信息条目中，首次生成时间最早的信息条目是 "cn=mygroupl，cn=ibmpolicies，o=ibm"，其首次生成时间是l: 37，因此当高速緩存已满时从高速緩存中剔除该信息条目及其相关选择策略参数信息。图6c示出了在实施例2的选择策略的情况下从高速緩存中剔除一条信息条目及其相关选择策略参数信息后的结果。实施例3
按照实施例3的选择策略模式，当高速緩存已满时从高速緩存中剔除最近一次使用时间最早的信息条目及其相关选择策略参数信息。在图6a示出的5个信息条目中，最近一次使用时间最早的信息条目是"cn-mygroup2,cn-ibmpolicies，o-ibm"，其最近一次4吏用时间是8: 30 ，因此当高速緩存已满时从高速緩存中剔除该信息条目及其相关选择策略参数信息。图6d示出了在实施例3的选择策略的情况下从高速緩存中剔除一条信息条目及其相关选择策略参数信息后的结果。
对于本领域技术人员来说，可以根据实际应用选择最适合的选择策略，并可以将上述选择策略进行任意组合。
在上述实施例1到3中，在高速緩存已满的条件下进行高速緩存内容的剔除。根据本发明的一个变形实施例，即使在高速緩存未满时也通过定期对高速緩存内容进行剔除处理，以提高高速緩存的利用率。
按照该变形实施例的选择策略模式，在高速緩存中每隔一个周期剔除掉在这个周期内没有被生成的信息条目。例如将周期设置为1小时。
假设目前时间是10: 00。 "cn=mygroupl，cn=ibmpolicies，o=ibm"、 "cn=mygroup2，cn=ibmpolicies，o=ibm，，、 "cn-mygroup3，cn-ibmpolicies，o-ibm"这三条信息条目的最近一次使用时间分别为8: 55、 8: 30、 8: 51,由于在最近的一个小时内都没有被生成，因此这些信息条目及其相关信息被剔除。
图6e示出了根据该变形实施例从高速緩存中剔除1个小时内没有被生成的信息条目及其相关信息后的结果。根据本发明，可以根据实际的应用调节高速緩存可存储的信息条目的最大条数，刷新或重新布局高速緩存的间隔周期时间。
由于高速緩存中信息条目的更新，同一字段名的相同信息条目在不同时间可能在信息符号列表(辅助文件)中生成了不同的信息符号，根据生成的信息符号列表，很容易恢复主文件。
图7示出了根据本发明的记录产生及写入装置201的功能方框图。如图7所示，根据本发明的一个实施例的记录产生及写入装置201 包括记录产生器101和优化写入器202。其中优化写入器202包括记录接收器20201、字段分析器20202、常见长字段表20203、写入执行器20206、高速緩存查询器20207、选择策略参数值改变器20208、信息符号分配器20210、信息符号生成器20211、高速緩存状态判断器20213、重新布局器20214、高速緩存写入器20215和选择策略模式设定器20216。
但是对于实现本发明来讲以上各功能部件并不都是必须的，而仅仅是例示的。可以根据实际的应用对于上述各功能部件进行合并或者组合。
例如可以将字段分析器20202、写入执行器20206合并起来作为写入执行装置，来参考在高速緩存20209中所存储的关于记录的预先定义的字段中包含的信息条目以及与其相关联的信息符号，将记录写入曰志主文件102。
例如可以将信息符号分配器20210、信息符号生成器20211合并起来作为信息符号生成装置，来生成与该记录的预先定义的字段中包含的新的信息条目相关联的新的信息符号，并将该新的信息条目以及该新的信息符号相关联地存储到对应于该字段的信息符号表(辅助文件)20212-i中。
另外，例如可以将高速緩存查询器20207、选择策略参数值改变器20208、高速緩存状态判断器20213、重新布局器20214、高速緩存写入器20215合并起来作为高速緩存处理装置，来按照预定的选择策略动态更新在高速緩存20209中存储的关于该记录的预先定义的字段中包含的信息条目以及与其相关联的信息符号。
优化写入器202内的各功能部件在需要时将访问高速緩存 20209，修改高速緩存信息或者从高速緩存获取信息条目或其相关信息。而作为优化写入器202的输出，将产生日志主文件102和信息符号表(辅助文件)20212-1到20212-n。
根据本发明的优化写入器202通过使用高速緩存20209进行日志主文件102的写入并同时产生多个信息符号表20212-1到20212-n。
根据本发明，当记录接收器20201接收到记录产生器101产生的一条日志记录后，把该日志记录所包含的字段送给字段分析器 20202分析。
字段分析器20202用于分析数据中是否出现预先定义的字段。当字段分析器20202判断出日志记录所包含的字段不属于所预先记录的字段时，将该字段内容直接送入写入执行器20206以便写入日志主文件102。优选的，字段分析器20202可以通过使用一个常见长字段表 20203来进行判断，其中该常见长字段表20203中记录了事先知道的容易包含长的、且重复概率高的信息条目的字段名(每个字段名对应于一个信息符号表20212-i (i为1到n之间的整数))。
高速緩存查询器20207，用于查询高速緩存20209中是否已存储某个字段中包含的信息条目，当高速緩存20209中已存储该字段中包含的信息条目，即完全信息条目时，通知写入执行器20206用与其相关联的信息符号代替该信息条目写入日志主文件102。
选择策略参数值改变器20208根据用户例如通过选择策略模式设定器20216所设定的选择策略改变高速緩存20209中与相应的信息条目对应的策略选择参数值。
高速緩存状态判断器20213用于判断高速緩存20209是否已满。
重新布局器20214用于在高速緩存20209已满时，按照预定的选择策略从高速緩存20209中剔除至少一条信息条目，
高速緩存写入器20215用于将新的信息条目和新的信息符号相关联地写入高速緩存20209。信息符号分配器20210用于当高速緩存20209中未存储相应字段中包含的新的信息条目时，为该信息条目分配新的信息符号；
信息符号生成器20211用于将为相应字段中包含的新的信息条目所分配的新的信息符号和该新的信息条目相关联地写入对应于该字段的信息符号表20212-i中。
可选的，本发明还可以包括一个选择策略模式设定器20216，用户可以通过它设定对于高速緩存进行信息条目的剔除时使用的选择策略。
优选的，重新布局器20214可以根据选择策略参数值，从高速緩存20209中剔除使用频率最低的信息条目。
优选的，重新布局器20214可以根据选择策略参数值，从高速緩存20209中剔除首次生成时间最早的信息条目。
优选的，重新布局器20214可以根据选择策略参数值，从高速緩存20209中剔除最近一次使用时间最早的信息条目。
优选的，重新布局器20214可以每隔一个选择策略模式设定器 20216所设定的周期在高速緩存20209中剔除掉在该周期内没有被使用的信息条目。
另外，选择策略模式设定器20216可以设定高速緩存20209的最大存储信息条目数来作为判断高速緩存是否已满的基准。
需要注意的是，虽然上述实施例是结合删除一条信息条目及其相关信息进行说明的，但是本发明根据应用的不同，在高速緩存已满时可以选择删除多条信息条目。另外，虽然实施例中将信息条目和其相关信息关联存储在高速緩存中。但是可以仅为信息条目开辟一块高速緩存空间，将其关联信息进行另外存储。因此当剔除高速緩存时仅需把信息条目进行剔除即可。
另外，虽然以上以日志文件的日志记录为例进行了详细说明。但是对于本领域技术人员来说，本发明当然可以对任何其中经常包含大量重复信息的数据进行写入处理。
另外，虽然在对实施例进行描述的时候，将主日志文件和与其关联的信息符号表(辅助文件)分开进行了描述，但是对于本领域技术人员来说，它们可以在一个物理记录介质上实现，或者分别存储在多个物理i己录介质上实现。
另外，虽然未描述从记录介质中读取经过本发明处理后的文件的过程。但是对于本领域技术人员来说，可以按照与写入的过程相反的过程通过参照信息符号表来把存储的文件还原为原始记录文件是显然的。
本发明可以实现为一种计算机程序产品，其包含有用于本发明的方法的存储介质。在使用之前，可以把程序存储在其它计算机系统的存储器中，例如，存储在硬盘或诸如光盘或软盘的可移动的存储器中，或者经由因特网或其它计算机网络进行下载。
上面描述的本发明的具体实现方式是实例性的，而不是限制性的。本领域技术人员在不违背本发明权利要求的范围和精神的前提下，可以对其作出多种修改和变形。
18
权利要求
1.一种数据的优化写入方法，包括生成与该数据的预先定义的字段中包含的新的信息条目相关联的新的信息符号，并将该新的信息条目以及该新的信息符号相关联地存储到对应于该字段的辅助文件中；参考在高速缓存中所存储的关于该数据的预先定义的字段中包含的信息条目以及与其相关联的信息符号，将数据写入主文件。
2. 根据权利要求l的方法，还包括步骤按照预定的选择策略动态更新在高速緩存中存储的关于该数据的预先定义的字段中包含的信息条目以及与其相关联的信息符号。
3. 根据权利要求2的方法，其中将数据写入主文件的步骤包括检查要记录的预先定义的字段中包含的信息条目以及与其相关联的信息符号是否存储在高速緩存中；如果是，以该信息条目的信息符号代替该字段中包含的信息条目写入主文件，如果否，为该信息条目分配一个新的信息符号，以该新的信息符号代替该信息条目写入主文件。
4. 根据权利要求3的方法，其中生成新的信息符号并存储到相应的辅助文件中的步骤包括将该信息条目和该新的信息符号形成的新的对应关系存储到对应于该字段的辅助文件中。
5. 根据权利要求2的方法，其中该数据是以下之一曰志文件；该日志文件中的日志记录；该曰志记录中包含的字段。
6. 根据权利要求3的方法，其中，还包括步骤判断所述高速緩存是否已满；当所述高速緩存未满时，将所述新的对应关系写入高速緩存；当所述高速緩存已满时，按照预定的选择策略从高速緩存中剔除至少一条信息条目，然后将所述新的对应关系写入高速緩存。
7. 根据权利要求6的方法，其中所述预定的选择策略是以下至少一种根据高速緩存中所存储的每条信息条目的使用频率，从高速緩存中剔除使用频率最低的信息条目；根据高速緩存中所存储的每条信息条目的首次生成时间，从高速緩存中剔除首次生成时间最早的信息条目；根据高速緩存中所存储的每条信息条目的最近一次使用时间，从高速緩存中剔除最近一次使用时间最早的信息条目；在高速緩存中每隔一个预定的周期剔除掉在该周期内没有被使用的信息条目。
8. 根据权利要求6所述的方法，其中设定高速緩存最大存储信息条目数来作为判断高速緩存是否已满的基准。
9. 一种优化写入设备，包括信息符号生成装置，用于生成与该数据的预先定义的字段中包含的新的信息条目相关联的新的信息符号，并将该新的信息条目以及该新的信息符号相关联地存储到对应于该字段的辅助文件中；写入执行装置，用于参考在高速緩存中所存储的关于该数据的预先定义的字段中包含的信息条目以及与其相关联的信息符号，将数据写入主文件。
10. 根据权利要求9的优化写入设备，还包括高速緩存处理装置，该装置按照预定的选择策略动态更新在高速緩存中存储的关于该数据的预先定义的字段中包含的信息条目以及与其相关联的信息符号。
11. 根据权利要求9的优化写入设备，所述写入执行装置包括字段分析器，用于分析数据中是否出现预先定义的字段，写入执行器，当数据中出现预先定义的字段时，以信息符号代替该字段中包含的信息条目写入主文件。
12. 根据权利要求10的优化写入设备，所述高速緩存处理装置包括高速緩存查询器，用于查询高速緩存中是否已存储所述字段中包含的信息条目，当高速緩存中已存储所述字段中包含的信息条目时，通知写入执行器用与其相关联的信息符号代替所述信息条目写入主文件；选择策略参数值改变器，用于每次在高速緩存中的信息条目被使用时更新与该信息信息条目有关的选择策略参数的参数值。
13. 根据权利要求10的优化写入设备，所述信息符号生成装置包括信息符号分配器，用于当高速緩存中未存储所述字段中包含的新的信息条目时，为所述信息条目分配新的信息符号；信息符号生成器，将所分配的新的信息符号和所述新的信息条目相关联地写入对应于该字段的辅助文件中，所述写入执行器用所述新的信息符号代替所述新的信息条目写入主文件。
14. 根据权利要求13的优化写入设备，所述高速緩存处理装置还包括高速緩存状态判断器，判断高速緩存是否已满；重新布局器，用于在高速緩存已满时，按照预定的选择策略从高速緩存中剔除至少一条信息条目，高速緩存写入器，将新的信息条目和新的信息符号相关联地写入高速緩存。
15. 根据权利要求9的优化写入设备，其中该数据是以下之一曰志文件；该曰志文件中的曰志记录；该日志记录中包含的字段。
16. 根据权利要求14的优化写入设备，所述高速緩存处理装置还包括选择策略模式设定器，用于设定选择策略；其中所述选择策略的参数是以下信息的至少一种信息条目被使用的频率，信息条目首次被生成的时间，信息条目最近一次被使用的时间；其中所述重新布局器根据选择策略参数，从高速緩存中剔除以下至少一种剔除使用频率最低的信息条目；剔除首次生成时间最早的信息条目；剔除最近一次使用时间最早的信息条目；每隔一个所述选择策略模式设定器所设定的周期在高速緩存中剔除掉在该周期内没有被使用的信息条目。
17. 根据权利要求16的优化写入设备，其中所述选择策略模式设定器设定高速緩存最大存储信息条目数来作为判断高速緩存是否已满的基准。
18. —种数据产生及写入装置，包括数据产生器；根据权利要求9-17中的任一项所述的优化写入设备。
全文摘要
本发明提供了记录的优化写入方法、优化写入设备和数据产生及写入设备。该方法包括生成与该数据的预先定义的字段中包含的新的信息条目相关联的新的信息符号，并将该新的信息条目以及该新的信息符号相关联地存储到对应于该字段的辅助文件中；参考在高速缓存中所存储的关于该数据的预先定义的字段中包含的信息条目以及与其相关联的信息符号，将数据写入主文件。本发明确保了动态地将实际上重复概率高的信息条目以信息符号写入记录文件，实时输出多个分离而又互相联系的文件，进一步提高了程序写入效率，节约了系统资源，并提高了实时性。
文档编号G06F17/30GK101539921SQ20081008712
公开日2009年9月23日申请日期2008年3月19日优先权日2008年3月19日
发明者J·麦克米金, K·布鲁因斯玛, 余啸海, 刘光保申请人:国际商业机器公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：J.麦克米金;刘光保;K.布鲁因斯玛;余啸海
技术所有人：国际商业机器公司
我是此专利的发明人

上一篇：结构化数据序列的压缩方法
上一篇：包括主机设备及打印装置的打印系统的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。