档案内容格式的搜寻系统及其方法

文档序号:6465802阅读:99来源:国知局

专利名称::档案内容格式的搜寻系统及其方法
技术领域
:本发明涉及一种搜寻系统及其方法,特别是指一种可搜寻档案内容的格式的搜寻系统及其方法。
背景技术
:随着数字装置的普及,许多的文件已由纸本的档案转变为电子的档案,而在这样的转变中,除了电子档案不像纸本档案需要占用大量的空间之外,使用电子档案最大的好处就是可以通过数字装置的帮助来搜寻档案内容,因此在搜寻档案内容时非常的方便。不过,目前大部分的文字处理软件所提供的「搜寻」功能,仅仅只能搜寻档案内容的数据部分(要表达的某些信息的文/数字或者符号),而不能搜寻档案内容的格式设定的部分,也就是说,若档案中有一个「粗体字」的「测试」的词,目前的搜寻功能就只能提供使用者搜寻「测试」这个词,而不能搜寻「粗体字」,如此,当使用者希望查找「粗体字」或是其它格式的文字数据时,并没有办法通过文书处里软件所提供的搜寻功能进行查找,而只能以人工的方式在档案中寻找「粗体字」或是其它格式的文字数据,除了不方便之外,也还有可能发生失误而漏掉某些重要的文字数据没有找到。综上所述,可知现有技术中长期以来一直存在无法对文字数据的格式进行搜寻的问题,因此有必要提出改进的技术手段,来解决上述问题。
发明内容有鉴于现有技术存在的无法对文字数据的格式进行搜寻的问题,本发明揭示一种档案内容格式的搜寻系统及其方法,其中本发明所揭示的档案内容格式的搜寻系统,其包括有储存模块、档案读取模块、接收模块、转换模块以及搜寻模块,其通过储存模块储存包含格式设定参数以及数据区段的档案,在转换模块将接收模块所接收的搜寻数据转换为搜寻条件后,由搜寻模块比对包含于相同之格式设定集中的搜寻条件以及各个数据区段所对应的格式设定参数,由此以解决现有技术所存在的问题。本发明所揭示的档案内容格式的搜寻方法,其包括有下列步骤读取包含格式设定参数与数据区段的档案,其中,各格式设定参数分别与数据区段相对应,且格式设定参数包含于定义数据区段之格式的格式定义集;接收搜寻数据;转换搜寻数据为相对应的搜寻条件,其中,该些搜寻条件包含于该格式定义集;比对各数据区段所对应的格式设定参数与转换后的搜寻条件,由此以产生搜寻结果,其通过比对包含于相同的格式定义集中的搜寻条件与各个数据区段所对应的格式设定参数,由此以解决现有技术所存在的问题。本发明所揭示的系统与方法如上,其与现有技术之间的差异在于本发明会将搜寻数据转换为搜寻条件,使定义数据区段之格式的格式设定参数与搜寻条件包含于相同的格式定义集之中,并比对搜寻条件与定义数据区段之格式的格式设定参数来搜寻符合搜寻条件的格式设定参数所对应的数据区段。通过上述的技术手段,本发明可以达成可便利的搜寻具有特定格式的档案内容的技术功效。图1是本发明所述的档案内容格式的搜导系统的系统架构图;图2是本发明实施例所述的搜寻条件输入接口示意图;图3A是本发明所述的档案内容格式的搜寻方法的方法流程图;图3B是本发明所述的档案内容格式的搜寻方法的方法流程图;图4是本发明实施例所述的档案内容示意图;图5是本发明实施例所述的比对结果的清单示意图。具体实施例方式以下将配合图式及实施例来详细说明本发明的详细特征与实施方式,内容足以使任何本领域技术人员轻易地理解本发明解决技术问题所应用的技术手段并据以实施,及理解实现本发明可达成的功效。以下先以图1本发明所述的档案内容格式的搜寻系统的系统架构图来说明本发明的系统运作。如图所示,本发明的系统包括有储存模块110、档案读取模块120、接收模块130、转换模块150以及搜寻模块160。储存模块110负责储存包含至少一个格式设定参数与至少一个数据区段的档案。上述的数据区段为该档案中用来传递讯息的数据部分,通常由文字、数字或者符号组合而成。上述的格式设定参数用来设定上述数据区段的字型、字体大小、字体颜色、是否为粗体、是否为斜体、是否加底线、字体的背景颜色、是否包含表格、是否包含图形等,但本发明所述的格式设定参数并不以上述为限。也就是说,若某一档案中有「测试」两个文字,且「测试」的两个文字是由「粗体」与「细明体」表示,则「测试」两个文字即为本发明所述的一个资料区段,而用来表示「测试」的格式为「粗体」与「细明体」的部分即为本发明所述的格式设定参数。因此,由上述可知,格式设定参数将会对应到档案中的某一个数据区段,且表示数据区段的格式设定参数与数据区段具有多对一的对应关系。另外,上述的格式设定参数包括在格式定义集之中,格式定义集是一个用来定义数据区段的格式的集合,格式定义集可以任何的形式来定义数据区段的格式,例如使用XML或是其它自订的符号组来定义数据区段的格式。档案读取模块120负责由储存模块110中读取将被搜寻的档案。接收模块130负责接收搜寻数据。搜寻数据通常由使用者所输入,但并不以此为限,且搜寻数据可以提供使用者从档案读取模块120所读出的档案中搜寻满足使用者期望的数据区段,使用者可以由如图2所示的输入接口200输入搜寻数据,但本发明所提之输入接口200并不以图2为限。例如使用者可以在字型选择组件220中选择要搜寻的字型、在字体大小选择组件230中选择要搜寻的字体大小、在字体颜色选择组件251中选择要搜寻的字体颜色、在背景颜色选择组件252中选择要搜寻的字体的背景颜色以及点选粗体字符件241/斜体字符件242/底线字符件243来搜寻档案中的粗体字/斜体字/底线字等等,另外,搜寻资料并不一定只限于一个,使用者可以同时设定多个组件来输入多个搜寻数据。在本发明中,使用者输入搜寻数据之方式并不以上述方式为限。另外,若使用者点选了输入接口200中的字体颜色选择组件251或背景颜色选择组件252,则本发明可以提供档案中已被使用的颜色、提供预定的颜色、提供可以选择颜色的调色盘或是提供色码的输入区域等方式给使用者输入欲搜寻的颜色。转换模块150负责将接收模块130所接收的搜寻数据转换为搜寻条件,搜寻条件包含于包含格式设定参数的格式定义集之中,也就是说,搜寻条件的形式与用来定义数据区段之格式的格式设定参数的形式相同。搜寻模块160负责比对转换模块150转换产生的搜寻条件与各个数据区段所对应的格式设定参数,并在比对完成之后产生搜寻结果。由于每个数据区段可能对应有多个格式设定参数,因此需要以每个数据区段作为比对的单位,比对各个数据区段所对应的所有的格式设定参数以及所有的搜寻条件,当被比对的数据区段所对应的格式设定参数包含接收模块130所接收的所有搜寻条件时,搜寻模块160会判断出进行比对的数据区段满足搜寻条件。上述的搜寻结果可以是档案中是否有格式设定参数满足搜寻条件的数据区段的信息,不过一般而言,比对结果通常包含格式设定参数满足搜寻条件的数据区段在档案中的起始地址,甚至还包含格式设定参数满足搜寻条件的所有数据区段等数据,但本发明所述的搜寻结果并不以此为限。本发明除了上述几个模块之外,本发明其它实施状态中还包含有显示模块190,显示模块190负责显示搜寻模块160所产生的搜寻结果,但本发明所述的搜寻结果并不仅以提供给显示模块190显示为限,搜寻结果也可以直接被储存为档案或直接被传送给其它装置。显示模块190可以依据搜寻结果直接在显示区域上标示出满足搜寻条件的资料区段,例如,在数据区段上加高亮度、加底线等醒目、或是将输入提示字符或游标移动到数据区段起始位置等方式来告知使用者搜寻结果,但本发明所述的标示的方法并不以此为限。上述的显示区域为执行有本发明的软件显示档案内容的区域。若搜寻结果还包含格式设定参数满足搜寻条件的各个数据区段的起始地址,则显示模块190更可以依据搜寻结果中的某一起始地址,将显示档案内容的显示区域定位到该起始地址所表示的数据区段,使得该起始地址所表示的数据区段被显示在显示区域中。若搜寻结果除了包含格式设定参数满足搜寻条件的各个数据区段的起始地址之外,还包含格式设定参数满足搜寻条件的所有数据区段,则显示模块190将可以在显示区域上显示一个列出搜寻结果中数据区段的清单,由此以提供使用者快速浏览符合使用者所输入的搜寻条件的数据区段。使用者可以在显示模块190所显示的清单中选择一个数据区段,在接收模块130接收到使用者所选择的数据区段之后,显示模块190会将显示区域定位到被使用者所选择的数据区段,使得显示区域中可以显示被使用者选择的数据区段给使用者。接着以第一实施例来解说本发明的运作系统与方法,并请参照图3A本发明所述的档案内容格式的搜寻方法的方法流程图。本实施例以使用者希望在如图4所示的档案400中搜寻字体大小为24点的文字为例。在档案400中,包含文字「数字元图像」(第二数据区段412)、文字「位图」(第四数据区段414)、文字「向量图」(第六数据区段416)、表格420(第八数据区段)、长条图431(第九资料区段)、圆饼图432(第十数据区段)等有格式设定参数对应的数据区段,以及没有格式设定参数对应的第一数据区段、第三数据区段、第五资料区段、第七资料区段。假设在本实施例中,格式定义集以XML的形式来定义数据区段的格式,且定义卷标「<u>」与卷标「</u>」所形成的格式设定参数(以下以「<u>...</u>」简称)用来表示在卷标「<u>」与卷标「</u>」之间的数据区段会加上底线、定义「size=24pt」的格式设定参数表示数据区段的字号为24点、卷标「<table>」与卷标「</table>」所形成的格式设定参数(以下以「<table>...</table>」简称)表示在卷标「<table>」与卷标「</table>」之间的数据区段为表格、卷标「<img>」与卷标「</img>」所形成的格式设定参数(以下以「<img>...</img>」简称)表示在卷标「<img>」与卷标「</img>」之间的数据区段为图形,因此,第二数据区段412所对应的格式设定参数为「<u>...</u>」,而字体为24点的第四资料区段414以及第六数据区段416所对应的格式设定参数则为「<u>...</u>」以及「size=24pt」,而第八数据区段的表格420所对应的格式设定参数则为「<table>...</table>」、第九数据区段的长条图431与第十资料区段的圆饼图432所对应的格式设定参数则同为「<img>...</img>」。当使用者要在档案400中搜寻字体大小为24点的文字时,档案读取模块120会先由储存模块110中读取档案400(步骤310),且使用者需要在包含但不限于图2所示的输入接口200中点选字体大小组件230,由此以输入搜寻数据「字体大小24点」,使得接收模块130可以接收到使用者所输入的「字体大小24点」的搜寻数据(步骤320a)。上述的档案读取模块120读取档案400的步骤(步骤310)以及接收模块130接收「字体大小24点」的搜寻数据的步骤(步骤320a)并没有先后次序的关系,档案读取模块120也可以在接收模块130先接收到使用者所输入的搜寻数据(步骤320a)后,再至储存模块110中将档案400读取出来(步骤310)。在档案读取模块120读取档案400(步骤310)以及接收模块130接收搜寻数据(步骤320a)之后,转换模块150会将搜寻数据转换为形式包含于格式定义集之中的搜寻条件(步骤330),使得表示搜寻条件的格式的形式与定义数据区段之格式的格式设定参数的形式相同,也就是将搜寻数据「字体大小24点」转换为「size=24pt」的搜寻条件。之后,搜寻模块160会开始比对档案400中的各个数据区段所对应的格式设定参数是否有满足转换模块150转换产生的搜寻条件「size=24pt」。因为第一数据区段、第三资料区段、第五资料区段、第七数据区段没有格式设定参数对应,因此,搜寻模块160在进行比对时,会比对第二数据区段412、第四数据区段414、第六料区段416、第八到第十数据区段所对应的格式设定参数。由于第一数据区段412所对应的格式设定参数为「<u>...</u>」,因此不符合搜寻条件「size=24pt」;第四数据区段414以及第六数据区段416所对应的格式设定参数都为「<u>...</u>」与「size=24pt」,因此搜寻模块160会判断出第四数据区段414以及第六资料区段416满足搜寻条件「size=24pt」。假设在本实施例中,本发明还包含显示模块190,且显示模块190将自动定位到满足使用者所输入的搜寻条件的数据区段,则搜寻模块160会将第四数据区段414以及第六数据区段416的起始地址加入搜寻结果中(步骤350)。接着,显示模块190会取得包含第四资料区段414的起始地址以及第六数据区段416的起始地址的搜寻结果,并依据搜寻结果中,第四数据区段414在档案400中的起始地址,将显示区域定位到标示出第四资料区段414,使得显示区域显示出第四数据区段414,甚至让第四数据区段414显示在显示区域的第一行,及/或以高亮度的方式来提示使用者满足搜寻条件的第四数据区段414的位置(步骤361、步骤362)。若使用者在如图2所示的输入接口200中点选字体大小组件230以及点选了底线字符件243,如此接收模块130所接收到搜寻数据为「字体大小24点」以及「底线字」(步骤320a)。在转换模块150将「字体大小24点」以及「底线字」的搜寻数据转换为「size=24」、「<u>...</u>」等搜寻条件(步骤330)之后,搜寻模块160会比对档案400中所有的数据区段所对应的格式设定参数,虽然第二数据区段412的「数字图像」满足了「<u>...</u>(底线字)」的搜寻条件,但并没有符合「size=24(字体大小24点)」的搜寻条件,因此不会被搜寻模块160加入搜寻结果中,而第四数据区段414、第六数据区段416所对应的两个格式设定参数刚好分别符合了搜寻条件,因此同样会是第四数据区段414、第六数据区段416的起始地址被加入搜寻结果中(步骤350)。另外,若使用者点选了输入接口200中的字体颜色选择组件251或背景颜色选择组件252,因为颜色种类太多,因此使用者可能因为包含但不限于对颜色不熟悉或是屏幕有色差等问题而输入相近但不相同的颜色,因此搜寻模块160更可以增加比对时的允许范围,使得搜寻条件与格式设定参数在一定的误差值之内(例如RGB值分别相差3%内)时,搜寻模块160会将在误差值内的格式设定参数视为符合搜寻条件,因而将在误差值内的格式设定参数所对应的数据区段加入搜寻结果中。除上述之外,本发明更可以包含取代模块170,负责在接收模块130接收到搜寻数据以及取代数据且转换模块150将搜寻数据以及取代数据分别转换为包含于格式定义集的搜寻条件以及取代参数之后,以取代参数取代满足搜寻条件的格式设定参数。上述的取代数据通常为使用者输入,一般而言,使用者会在输入搜寻数据时一并输入取代数据。请参照图3B本发明所述的档案内容格式的搜寻方法的方法流程图,当使用者希望在数据区段的文字不改变的情况下,将数据区段的格式由底线字更改为斜体字,因此,使用者会输入「底线字」的搜寻数据以及「斜体字」的取代数据(步骤320b),而在转换模块150会将「底线字」的搜寻数据转换为「<u>...</u>」的搜寻条件(步骤330)之后,搜寻模块160会比对档案400中所有的数据区段所对应的格式设定参数之后,判断出第二数据区段412、第四资料区段414以及第六资料区段416都满足「<u>...</u>」的搜寻条件,同时产生搜寻结果(步骤350),接着,转换模块150会将取代数据「斜体字」转换为格式定义集所包含的取代参数,也就是「<i>...</i>(表示由卷标<i>与卷标</i>之间的数据区段将显示为斜体字)」,并由取代模块170依据搜寻结果,将搜寻模块160所搜寻出满足搜寻条件的格式取代参数「<u>...</u>」取代为「<i>...</i>」(步骤369),如此,当第二数据区段412、第四资料区段414以及第六数据区段416被显示模块190显示时,将会以斜体字的形式表现,而非加上底线。以下再以第二实施例来解说本发明的运作系统与方法。假设在本实施例中,使用者欲搜寻档案400中的图形,因此使用者可以直接点选「图形搜寻」的按钮281,如此接收模块130所接收到使用者所输入的搜寻数据就会是「搜寻图形」(步骤320a),而在转换模块150将「搜寻图形」的搜寻数据转换为「<img>...</img>」的搜寻条件(步骤330)之后,搜寻模块160便会比对档案400中的各个数据区段所对应的格式设定参数,进而判断出第九数据区段的长条图431与第十资料区段的圆饼图432满足搜寻条件,因此搜寻模块160会将长条图431与圆饼图432的起始地址加入搜寻结果中(步骤350)。由于图形可能没有文字叙述的部分,所以显示模块190除了将显示区域定位到图形的位置之外,并不容易以其它方式表现搜寻结果,因此,本发明更可以包含一个缩图模块180,负责将满足搜寻条件的图形等数据区段进行缩图,使得显示模块190可以如图5所示,以缩图的方式列出搜寻到的图形的清单500(步骤363),而在使用者点选清单500中的长条图的缩图531之后,显示模块190会将显示区域定位到档案中的长条图431的位置,使得长条图431可以显示在显示区域之中。以下再以第三实施例来解说本发明的运作系统与方法。假设在本实施例中,使用者欲得知档案400中是否包含有表格,因此使用者可以直接点选「表格搜寻」的按钮282,如此接收模块130所接收到的搜寻数据就会是「搜寻表格」(步骤320a),而在转换模块150将搜寻数据转换为搜寻条件「<table>...</table>」(步骤330)之后,搜寻模块160便会比对档案400中的各个数据区段所对应的格式设定参数,进而判断出档案400中的第八数据区段为表格420,因此搜寻模块160所产生的搜寻结果将为表示档案400中存在表格的信息(步骤350),由此以提供使用者后续使用。综上所述,可知本发明与现有技术之间的差异在于具有将搜寻数据转换搜寻条件,使定义数据区段之格式的格式设定参数与搜寻条件包含于相同的格式定义集之中,并比对搜寻条件与定义数据区段之格式的格式设定参数来搜寻符合搜寻条件的格式设定参数所对应的资料区段,由此一技术手段可以解决现有技术所存在无法搜寻资料区段的格式的问题,进而达成可便利的搜寻具有特定格式的档案内容的技术功效。再者,本发明的档案内容格式的搜寻方法,可实现于硬件、软件或硬件与软件之组合中,也可在计算机系统中以集中方式实现或以不同组件散布于若干互连的计算机系统的分散方式实现。虽然本发明所揭露的实施方式如上,惟所述之内容并非用以直接限定本发明之专利保护范围。任何本发明所属
技术领域
中具有通常知识者,在不脱离本发明所揭露的精神和范围之内,在实施的形式上及细节上所为的更动或润饰,均属本发明的专利保护范围。因此本发明的专利保护范围仍须以本说明书所附的申请专利范围所界定者为准。权利要求1、一种档案内容格式的搜寻方法,其特征在于,包括下列步骤读取包含至少一格式设定参数与至少一数据区段的一档案,其中,各所述格式设定参数分别与所述这些数据区段其中之一相对应,且所述这些格式设定参数包含于用以定义所述这些数据区段之格式的一格式定义集之中;接收至少一搜寻数据;转换所述这些搜寻数据为相对应的一搜寻条件,其中,所述这些搜寻条件包含于所述格式定义集之中;及比对各该数据区段所对应的格式设定参数与所述这些搜寻条件,由此以产生一搜寻结果。2、如权利要求1所述的档案内容格式的搜寻方法,其特征在于,所述产生所述搜寻结果的步骤包括将满足所述这些搜寻条件的所述这些格式设定参数所对应的数据区段的起始地址加入所述搜寻结果中的步骤。3、如权利要求2所述的档案内容格式的搜寻方法,其特征在于,所述方法进一步包括依据所述这些起始地址在一显示区域上显示满足所述这些搜寻条件的所述这些格式设定参数所对应的数据区段其中之一的步骤。4、如权利要求2所述的档案内容格式的搜寻方法,其特征在于,所述产生所述搜寻结果的步骤进一步包括将满足所述这些搜寻条件的所述这些格式设定参数所对应的数据区段加入所述搜寻结果中的步骤。5、如权利要求4所述的档案内容格式的搜寻方法,其特征在于,所述方法进一步包括缩图显示满足所述这些搜寻条件的所述这些格式设定参数所对应的数据区段于一清单中的步骤。6、如权利要求1所述的档案内容格式的搜寻方法,其特征在于,所述方法进一步包括标示满足所述这些搜寻条件的所述这些格式设定参数所对应的数据区段至少其中之一的步骤。7、如权利要求1所述的档案内容格式的搜寻方法,其特征在于,所述比对各该数据区段所对应的格式设定参数与所述这些搜寻条件的步骤进一步包括增加比对时的允许范围的步骤。8、如权利要求1所述的档案内容格式的搜寻方法,其特征在于,所述方法进一步包括接收一取代数据,并转换该些取代数据为相对应之一取代参数,使所述这些取代参数包含于所述格式定义集之中,再将所述这些取代参数取代满足所述这些搜寻条件的所述这些格式设定参数的步骤。9、一种档案内容格式的搜寻系统,其特征在于,包括一储存模块,用以储存包含至少一格式设定参数与至少一数据区段之一档案,其中,各所述格式设定参数分别与所述这些数据区段其中之一相对应,且所述这些格式设定参数包含于用以定义所述这些数据区段的格式之一格式定义集之中;一档案读取模块,用以读取该档案;一接收模块,用以接收至少一搜寻数据;一转换模块,用以将所述这些搜寻数据转换为相对应之一搜寻条件,其中,所述这些搜寻条件包含于所述格式定义集之中;及一搜寻模块,用以分别比对各所述数据区段所对应的格式设定参数以及所述这些搜寻条件,由此以产生一搜寻结果。10、如权利要求9所述的档案内容格式的搜寻系统,其特征在于,所述搜寻模块进一步用以增加比对各所述数据区段所对应的格式设定参数以及所述这些搜寻条件时的允许范围。全文摘要本发明是一种档案内容格式的搜寻系统及其方法,其通过将搜寻数据转换为搜寻条件,使定义数据区段之格式的格式设定参数与搜寻条件包含于相同的格式定义集之中,并比对搜寻条件与定义数据区段之格式的格式设定参数来搜寻符合搜寻条件的格式设定参数所对应的资料区段,可以解决现有技术中所存在无法搜寻资料区段的格式的问题,由此达成可便利的搜寻具有特定格式的档案内容的技术功效。文档编号G06F17/30GK101634989SQ20081013421公开日2010年1月27日申请日期2008年7月21日优先权日2008年7月21日发明者邱全成,周荣辉申请人:英业达股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1