查询索引多媒体标题数据的方法与装置的制作方法

文档序号:6414659阅读:155来源:国知局
专利名称:查询索引多媒体标题数据的方法与装置的制作方法
技术领域
本发明涉及一种查询索引多媒体标题(TITLE)数据的方法及装置,特别是涉及一种可对多媒体数据进行查询索引,使多媒体数据可以重新使用及充分利用的方法及装置。
随着多媒体计算机的流行,使得一些书籍、展示文件等均以计算机展示,且多媒体计算机的影音播放功能,更使得影音光盘盛行。然而,这些多媒体TITLE的数据却只能供其本身所使用,别的产品无法读取此多媒体TITLE的数据,或无法识别其文件格式,而不能对其所包括的任何数据进行浏览,因此限制了这些数据的用途,也使得这些数据无法作进一步的利用,形成资源的浪费,增加数据搜寻的困难与时间。
本发明的目的在于提供一种查询索引多媒体TITLE数据的方法及装置,主要是采用多级索引的方式,将多媒体数据建立索引库,由使用者提出要查询的关键字,通过编码作业获得关键字的各项特征,依据这些特征进行多级查询和索引后,通过浏览器输出所查询的多媒体文件数据,使得多媒体数据可以重新使用,达到充分利用现成数据的目的。
依据前述,本发明在多媒体光盘上由专用工具置放数个索引库,用以针对多媒体数据进行索引,其中一索引库为多媒体数据中所有可用的数据标题表,其余的索引文件则作为标题的索引文件,再在前述的索引库上建立索引,使得用户能有效查询到所需的多媒体数据,并增进查寻的速度。
依据前述,本发明针对关键字的特征所进行的编码操作,是采用逆向排除算法,以达到快速寻找的目的。
本发明的另一目的在于为配合前述的索引功能,在开发标题时,可为其多媒体数据编写两个浏览程序,第一个浏览程序称为电子书,可以浏览整个多媒体的数据,第二个浏览程序可以接收参数,使用者可以通过参数将所要查询的内容提交给此浏览程序,便可将相关的多媒体数据返传给使用者,通过上述的过程,即可使得TITLE上的多媒体可以被以后的ITILE所使用,而使数据资源不会浪费。
本发明的目的是这样实现的,即提供一种查询索引多媒体ITILE数据的方法与装置,主要由通过在多媒体上设置标题关键字表、初级标题索引表、次级标题索引表的数个索引库,由使用者提供所需的关键字后传入浏览器中,利用多级索引的方式,依据关键字的特微进行编码,并进行查找以通过对关键字的各项特征比较,而获得多媒体数据中所有包括关键字的数据,回传至浏览器显现出来,能使多媒体数据可以重新利用,达到充分利用现成数据的目的。
以下将对本发明的结构设计与操作原理,作一详细的说明,并参阅附图,将对本发明的特征作更进一步的了解,其中

图1为本发明的结构及功能原理图;图2为本发明的逆向排除算法的步骤流程图。
本发明主要是提供一种方法,使光盘中的多媒体数据可以重新利用,达到充分利用现成数据的目的。主要是采用多级索引的方式,如图1所示,首先通过在多媒体光盘上设置数个索引库,包括有标题关键字表30(CDINDEX.DAT)、初级标题索引表50(CDINDEX.ID1)、次级标题索引表40(CDINDEX.ID2)。由使用者提供所需的关键字10后传入浏览器20中,依据关键字10的特征(如详后述)产生前述的三种表数据30、40、50,经过多级查询和索引后,将所查询的结果回传至浏览器20,并将此结果显现出来。
使用者所提供的关键字10,可能是一些不规则的短语组合,因此抽取关键字的五项特征进行编码,并以逆向排除的方法进行查找,以通过对关键字10的第一单词首字母、第一单词长度、第二单词的首字母、关键字10的字尾符、关键字长度等特征比较,通过总体到细部的思考模式,对细部的一一确认来确认整体,而获得光盘中所有包括有关键字10的数据。
前述关键字10所取出的五项特征码中,关键字10的第一单词首字母、第一单词长度组成关键字10的第一特征;第二单词的首字母则作为关键字10的第二特征。若关键字10为中文,则第一特征取首字内码的低十二位,第二特征取第二字内码的高八位。
标题关键字表30中包括关键字10、关键字的字尾符及关键字长度三项内容;以表一内容举例说明,标题关键字表30第0位置的关键字10为“Li jian”关键字表中即分别记录Li jian、n、7(包括空格)三项内容,以此类推,即记录所有关键字10的三项内容于标题关键字表30中。
表一 本发明实施例的关键字表<
表二 本发明实施例的次级索引表<
表三 本发明实施例的初级索引表<
次级标题索引表40用来记录第一和第二特征的关键字10在标题关键字表30中的位置,包括有关键字10的第二特征、所有包括第一和第二特征的关键字10在标题关键字表30中的起始位置(FROM)、所有包括第一和第二特征的关键字10在标题关键字表30中的结束位置(TO)三项内容,以表二内容举例说明
关键字“Li jian”的第二特征为j,仅有位置0处拥有此项特征,因此其起始位置与结束位置分别为0、0;而关键字“Wang dong”及“Wangdong sheng”的第二特征均为d,故其启始位置为2,结束位置为3,以此类推,建立出一完整的次级标题索引表40。
初级标题索引表50的大小是固定的,与关键字10的最大长度有关,所有关键字10的第一特征均可通过下列公式计算出其在初级标题索引表50的位置,此位置的内容指向次级标题索引表40该关键字10的第二特征。初级标题索引表50共有两项数据,分别是含有第一特征的所有关键字10在次级标题索引表40中的起始位置(FROM),及含有第二特征的所有关键字10在次级标题索引表40中的结束位置(END)。
位置=(单词的长度-1)×128+单词的首字母ASCII码值若为中文,则位置=(中文内码的低十二位)+(128×32)其中,32为定义关键字的最大长度,128为英文ASCII码值的大小。
当扫描到单词时,首先会根据它的第一特征查询在初级标题索引表50的内容,如果该位置是空,则不存在以此为词头的关键字10,进行下一个词的扫描,否则继续查询次级标题索引表。
前述的索引库30、40、50建立完成后,可采用逆向排除算法以达到快速寻找的目的。如图2所示,为本发明的逆向排除算法的步骤流程图;包括有下列步骤步骤a.由待查字的第一特征求得初级标题索引表50中的位置,若为空,则表无以此单词为首的关键字10,即执行步骤e,否则按初级标题索引表50的结束与起始位置寻找次级标题索引表40的相对应内容。步骤b.以待查字后面的单词第二特征与步骤a所查到次级标题索引表40的第一项内容比较,若不同则表无此二词的关键字10,执行步骤3;否则按其内容的结束与起始位置找寻标题关键字表30的相对应内容。步骤c.取出标题关键字表30中相对应该关键字10的长度与字尾符,比对待查字的字尾符字母是否相等于关键字10的字尾符,若不,则无此待查字为首的关键字,执行步骤e;否则,将关键字10与待查字逐个字符比较,若不同则执行步骤e,相同者则执行步骤d。步骤d.确认待查字是关键字10,再进一步对其进行单词标注等各项操作。步骤e.结束比较。
以表一、表二及表三对逆向排除算法作进一步的执行说明假设待查字为“Wang dong sheng”,其第一特征为W4;依据前述的公式可获得其于初级标题索引表50中的位置为471,由初级标题索引表50中可查出其起始与结束位置分别为“2”与“2”,因此要查询次级标题索引表40中的位置“2”。
待查字的第二特征为“d”,次级标题索引表位置“2”的第一项内容为“d”,起始与结束位置内容分为是“2”、“3”,因此可以得知要查标题关键字表30中位置“3”、“2”的内容。
先取出标题关键字表30中位置“2”的内容,其对应关键字10长度为15,字尾符为“g”,然后再查询待查字的长度与字尾符是否相符,在本例中获得一相同的对比结果,则再对待查字和此关键字10逐字符相比较,比较结果相同即进行步骤e。如此即能将光盘片中所有包括有关键字10的每一笔数据,通过浏览程序20而显现于屏幕上。
再进一步,在关键TITLE时,可为其多媒体数据编写两个浏览程序20,第一个浏览程序称为电子书,可以浏览整个多媒体数据,第二个浏览程序可以接收参数,使用者可以通过参数将所要查询的内容提交给此浏览程序20,便可将相关的多媒体数据返传给使用者,由上述的过程,即可使得TITLE上的多媒体可以被以后的TITLE所使用,而使数据资源不会浪费。
承前所述,本发明所提供的查询索引多媒体TITLE数据的装置及方法,仅需通过关键字查询,即能对现有的或往后的多媒体TITLE数据进一步利用,使数据不致浪费不用,有助与使用者的数据查询与程序设计者缩短数据的输入时间。
以上已将本发明作一详细说明,但以上所述的,仅为本发明的一较佳实施例而已,不能限于本发明实施的范围。因此凡依本发明权利要求所作的各种变化与修饰,均仍属本发明的权利要求范围。
权利要求
1.一种查询索引多媒体标题数据的方法与装置,其特征在于,主要由通过在多媒体上设置标题关键字表、初级标题索引表、次级标题索引表的数个索引库,由使用者提供所需的关键字后传入浏览器中,利用多级索引的方式,依据关键字的特征进行编码,并进行查找以通过对关键字的各项特征比较,而获得多媒体数据中所有包括关键字的数据,回传至浏览器显现出来,能使多媒体数据可以重新利用,达到充分利用现成数据的目的。
2.如权利要求1所述的查询索引多媒体标题数据的方法与装置,其特征在于,该关键字以其第一单词首字母、第一单词长度组成第一特征。
3.如权利要求1所述的查询索引多媒体标题数据的方法与装置,其特征在于,该关键字是以其第二单词的首字母作为第二特征。
4.如权利要求1所述的查询索引多媒体标题数据的方法与装置,其特征在于,该关键字可为多字节内码,其第一特征是取首字内码的低十二位,第二特征取第二字内码的高八位。
5.如权利要求1所述的查询索引多媒体标题数据的方法与装置,其特征在于,该标题关键字表进一步包括关键字、关键字的字尾符及关键字长度三项内容。
6.如权利要求1所述的查询索引多媒体标题数据的方法与装置,其特征在于,该次级标题索引表是记录第一和第二特征的关键字在关键字表中的位置,包括关键字的第二特征、所有包括第一和第二特征的关键字在关键字表中的起始位置、所有包括第一和第二特征的关键字在关键字表中的结束位置。
7.如权利要求1所述的查询索引多媒体标题数据的方法与装置,其特征在于,该初级标题索引表的大小是固定的,与关键字的最大长度有关,包括第一特征的所有关键字在次级标题索引表中的起始位置,及第二特征的所有关键字在次级标题索引表中的结束位置。
8.如权利要求1所述的查询索引多媒体标题数据的方法与装置,其特征在于,可进一步利用逆向排除算法进行查询,通过总体到细部的思考模式,对细部的数据一一确认而确认整体。
9.如权利要求8所述的查询索引多媒体标题数据的方法与装置,其特征在于,该逆向排除算法包括a.由待查字的第一特征求得初级标题索引表中的位置步骤;b.以待查字后面的单词第二特征与步骤a所查到次级标题索引表中第一项内容的比较步骤;c.关键字表中相对应该关键字的长度与字尾符,与待查字的字尾符字母的比较步骤;d.确认待查字是关键字的步骤;e.进行单词标注等各项操作步骤。
全文摘要
一种查询索引多媒体标题数据的方法与装置,主要是采用多级索引的方式,将多媒体数据建立索引库,由使用者下达欲查询的关键字,通过编码操作获得关键字的各项特征,依据这些特征进行多级查询和索引后,通过浏览器输出所查询的多媒体文件数据,使得多媒体数据可以重新使用,达到充分利用现成数据的目的。
文档编号G06F17/30GK1254136SQ98124160
公开日2000年5月24日 申请日期1998年11月12日 优先权日1998年11月12日
发明者林光信, 陈玄同, 穆立源 申请人:英业达股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1