用于操纵数据文件的方法和设备的制作方法

文档序号:6569987阅读:127来源:国知局
专利名称:用于操纵数据文件的方法和设备的制作方法
技术领域
本发明涉及数据文件操纵方法和设备,并更具体地涉及媒体文件操
纵方法和"i殳备。
背景技术
随着在消费电子设备中存储成本的下降和存储能力的增强,消费者 可以处理存储在一个存储单元中的大量的文件。例如,在数字娱乐领域
中,消费者可以在媒体中心、自动唱片点唱机或MP3播放器上存储大 量的媒体文件。40-100GB的存储能力在今天的MP3播放器市场上已不 罕见,从而允许用户在一个播放器中存储超过10,000首MP3歌曲。
除本地存储之外,连通性的发展允许消费者访问庞大的网络/远端的 存储。
与此同时,媒体收藏包括多语言内容,例如中文歌曲、英文歌曲、 法文歌曲、日文歌曲。已知的搜索或分类的方法分别对待不同的语言, 即在输入用于搜索一个给定々某体文件的一个查询之前,用户必须选4奪语 言输入才莫式。
在另一方面,CE设备典型地由一个遥控或其他有限的控制键来控 制。这些设备通常包括一个键盘,其具有比在相关语言的字母表中的字 母数更少的键。例如,使用简化的键盘的许多设备使用如用在一个按键 式电话上的一个三乘四键矩阵。
大型的媒体数据库和有限的控制/显示能力对媒体收藏的浏览或从 一个长长的列表中定位一个特定媒体造成很多问题。典型地,需要许多 键按压并要求用户对他正在寻找的媒体名称很有把握,这使得搜索复杂 化。
已经开发了使用简化的键盘来输入和显示期望的文本的各种方法, 例如,专利申请US 20020126097 y^开了一种方法和i殳备,用于通过一 个简化的键盘使用与上下文相关的字典,将文字数字数据输入到 一个电 子设备中。专利申请US 6307548B1提供了一种简化的键盘的歧义消除 系统。然而,上述现有技术未能提供一种这样的解决方案,其不管语言模 式的差异,使用统一的输入方法来搜索一个目标文件。

发明内容
本发明的一个目的是提出一种改进的编码数据文件的方法,以便于 搜索在 一个存储单元中的该文件。
该目的在一种对存储于一个存储单元中的一个数据文件进行编码 的方法中实现,所述方法包括步骤从所述数据文件抽取一个非字母数
据,所述数据与所述文件相关联;使用从一个第一符号集中获得的符号 将所述数据转换成一个词;以及用一个查找表来编码所述词以生成一个 索引数据,所述查找表将所述符号与一个第二符号集相关联,所述第二 符号集的每个符号与所述第一符号集的一个子集相关联。
该目的还在一种对存储于一个存储单元中的一个数据文件进行编 码的设备中实现,所述设备包括一个抽取装置,用于从所述数据文件抽 取一个非字母数据,所述数据与所述文件相关联;转换装置,用于使用 从一个第 一符号集中获得的符号将所述数据转换成 一 个词;以及编码装 置,用于用一个查找表来编码所述词以生成一个索引数据,所述查找表 将所述符号与一个第二符号集相关联,所述第二符号集的每个符号与所 述第一符号集的一个子集相关联。
本发明的另 一个目的是提出 一种改进的获取存储在一个存储单元 中的数据文件的方法。
该目的在一种获取存储在一个存储单元中的数据文件的方法中实 现,每个所述文件与一个索引数据相关联,所述方法包括步骤使用一 个第一符号集获得的符号来生成一个词;用一个查找表来编码所述词以 生成一个编码数据,所述查找表将所述符号与一个第二符号集相关联, 所述第二符号集的每个符号与所述第一符号集的一个子集相关联;以及 搜索具有与所述编码数据相匹配的索引数据的所有数据文件。
该目的还在一种获取存储在一个存储单元中的数据文件的设备中 实现,每个所述文件都与一个索引数据相关联,所述设备包括;生成装 置,用于使用从第一个符号集获得的符号来生成一个词;编码装置,用 于用一个查找表来编码所述词以生成一个编码数据,所述查找表将所述 符号与一个第二符号集相关联,所述第二符号集的每个符号与所述第一符号集的一个子集相关联;以及搜索装置,用于搜索具有与所述编码数
据相匹配的索引数据的所有数据文件。
因此,本发明提供了一个以不依赖于一种语言的方式处理不同的语 言,以操纵数据文件的解决方案,同时,提供了一个不必确切地知道查 询内容而进行数据文件搜索的解决方案。
通过结合附图参考下列说明书和权利要求书,其他的目的和成就以 及对本发明的一个完整的理解将变得显而易见并易于理解。


本发明将参考附图进行描述,其中
图1示出了一个根据本发明的用于对一个非字母数据文件进行编码 的方法的流程图。
图2示出了一个根据本发明的获取在一个存储单元中的数据文件的 流程图。
图3示出了一个根据本发明的数据记录格式的一个结构。
图4描述了在根据本发明的方法中使用的一个查找表。
图5代表一种根据本发明的用于对存储在一个存储单元中的一个数
据文件进行编码的设备。
图6代表一种根据本发明的用于获取存储在一个存储单元中的数据
文件的设备。
在这些图中,同样的部分用同样的参考标记来标识。
具体实施例方式
图1示出了一个根据本发明的用于对一个非字母数据文件进行编码 的方法的流程图。
本发明提供了一种对存储于一个存储单元中的一个数据文件进行 编码的方法,所述方法包括抽取一个非字母数据的步骤100,所述数据 与所述文件相关联。当一个新的数据文件存储到一个数据文件存储单元 时,在步骤100中抽取与该文件相关联的数据,其中该数据可以包括该 文件的关键字或该文件的元数据,例如一个MP3文件的ID3标签,或 一个图片的可交换图形文件(Exif)数据。例如,对于对应于一首名为 "纸飞机"的中文歌曲并存储在一个MP3播放器中的一个数据文件,通过步骤IOO抽取出文本单词"纸飞机"。
该方法还包括步骤101,用于使用从一个第一符号集获得的符号将
所述非字母数据转换成一个词。因为抽取的数据可以是字母或非字母的
(例如中文,韩文和日文),所以在步骤101中,使用从一个第一符号 集,其可以是26个英文字母A, B, C, D, E, F...Z获得的符号将非 字母数据转换成一个词。任何筒体中文字符或繁体中文字符可以转换成
"拼音"符号,任何韩文字符可以转换成"字母(Jamo)"符号。所以, 在步骤101中,非字母字符"纸飞机',被转换成它的"拼音"形式"zhifeiji"。
该方法还包括步骤102,用一个查找表来编码所述词以生成一个索 引数据320,所述查找表将所述符号与一个第二符号集相关联,所述第 二符号集的每个符号与所述第一符号集的一个子集相关联。
在步骤101之后,非字母数据;故转换成一个词。在步骤102中,用 一个查找表对该词进行编码以生成一个索引数据320。在图4中示出了 一个查找表。继续上面的例子,在步骤102中,根据如图4所示的一个 查找表对词"zhifeiji"进行编码。如果使用这个表,称为索引的编码数 据将是"72322333"。
图4描述了 一个在根据本发明的方法中使用的查找表。在这个表中, 左列代表一个第一符号集A, B, C, D, E, F…Z,以及右列代表一 个第二符号集1, 2, 3, 4, 5, 6, 7。显然,这些符号可以是任何其 他的符号。第二符号集的每个符号与第一符号集的一个子集相关联,例 如,符号"1"与A, B, C, D相关联以及符号"2"与E, F, G, H相 关联。显然,第一符号集的对应的子集可以变化。
另外,本发明提供了一种方法,其包括生成一个数据记录的步骤(未 示出),所述数据记录包括所述索引数据320和一个文件指针,所述文
件指针将所述数据记录与所述文件相链接,以及将所述数据记录存储到 一个数据库中的步骤。
图3示出了根据本发明的一个数据记录格式的结构。所述数据记录 包括一个索引数据320和一个文件指针330,所述文件指针330将所述 数据记录与所述文件相链接,然后将该数据记录存储到一个数据库中。 指针330可以是文件的存储位置(即地址)或是一个到平台的参考,通 过它应用可以定位这个数据记录所代表的文件。附加标签340是细樣吏地 分类文件内容的任何其他的标签,如语言,类别,个人爱好标记等。使用多少或什么样的标签是可选的并取决于应用。本发明也可以用不同的 类别来定位文件,如"专辑名称","艺术家名称"。对每个类别都产 生一个数据记录并添加到数据库中。为识别不同的搜索类别,类别信息
可以添加到数据记录"附加标签,,340中。头部310是一个预定义的标 签用来标记一个新记录的开始。
此外,本发明提供了一种包括生成多个数据记录的步骤(未示出) 的方法,每个所述数据记录包含一个所述索引数据320的子串。假设一 个文件具有名称"ABCDEFGHI",其对应的索引数据为"111 122 223"。 产生下列三个索引数据320的子串
111 122 223
122 223
223
因此,生成了三个数据记录。它们的每一个包含索引数据320的一 个子串。所有这三个数据记录通过使用指针330分别与名为"ABCDEF GHI"的文件相关联。因此,该方法还提供了一个子串编码方法。
另一方面,当所述索引数据320包括多个符号集时,本发明提供了 一种包括通过连接每个符号集的每个第一符号生成一个导出的索引数 据的步骤的方法。在上面的例子中,通过连接每个符号集111 122 223 的每个第一符号,生成一个导出的索引数据112。
图2示出了一个根据本发明的来获取在一个存储单元中的数据文件 的流程图。
本发明提供了 一种获取存储在一个存储单元中的数据文件的方法, 每个所述数据文件与一个索引数据320相关联,所述方法包括使用一个 第一符号集获得的符号来生成一个词的步骤200。在步骤200中,生成 一个查询以搜索存储在一个存储单元中的一个特定数据文件,每个所述 文件与一个索引数据320相关联。如果查询是非字母的,则应该使用从 一个第一符号集,其可以是26个英文字母A, B, C, D, E, F…Z中 获得的符号将其首先转换成一个词。在此的一个实施例中,如果用户想 要查找一首名为"纸飞机,,的中文歌曲,他可以使用拼音形式"zhifeiji,,。 在大多数情况下,用户不需要输入完整的字符串,在获得期望的数据文 件之前通常他只需要按下2-5个键。
该方法还包括一个步骤201,用一个查找表对所述词进行编码以生成一个编码数据,所述查找表将所述符号与一个第二符号集相关联,所 述第二符号集的每个符号与所述第一符号集的一个子集相关联。当用户输入他的词时,由步骤201用一个查找表对该词进4亍编码以生成一个编 码数据。查找表的一个例子由图4说明。 一个简化的键盘可以采用查找 表,其中键盘的每个键与字符的一个子集相关联。该方法还包括一个步骤202,搜索具有与所述编码数据相匹配的索 引数据320的所有数据文件。有两种其中所述索引数据320与所述编码数据相匹配的情况。在一 种情况中,所述搜索步骤202包括一个识别与索引数据320相关联的数 据文件的步骤(未示出),所述索引数据320包括所述编码数据。例如, 如果一个用户想要搜索名为"ABCDEFGHI"的文件,其对应的索引数 据320为"111 122 223",他可以只知道ABC, DEF或GHI,于是他可 以输入ABC或DEF或GHI,每个相应的编码数据分别为111或122或 223。搜索算法将搜索整个索引数据"111 122 223"。因为它发现所述 索引数据"111 122 223"包括所述编码数据"111"或"122"或"223", 它将识别与索引数据320相关联的所有数据文件,所述索引数据320包 括所述编码数据。在另一种情况中,所述搜索步骤202包括一个识别与索引数据320 相关联的数据文件的步骤(未示出),所述索引数据320包括多个符号 集,进一步包括步骤连接(未示出)所述符号集的所有第一符号以生 成一个连接的词;以及将所述连接的词与所述编码数据进行比较。仍然 利用上面的例子用户想要输入名的每个第一字母"ADG"(对应于编 码数据"112")来定位文件,搜索算法连接所述符号集("111 122 223") 的所有第一符号以生成一个连接的词"112"并将连接的词"112"与所 述编码数据"112"进行比较。此外,本发明提供了 一种包括一旦所述词由所述生成步骤进行了改 动,就触发(未示出)所述编码步骤201和搜索步骤202的步骤的方法。 这是本发明的另一个方面,即无论何时用户产生一个单一的按压, 一旦 所述词由所述生成步骤进4亍了改动,它就将触发所述编码步骤201和4叟 索步骤202。如图1和图2所示的方法可以有利地进行组合以形成一种梯:纵存4诸 在一个存储单元的数据文件的方法,所述方法包括步骤从所述数据文件抽取一个非字母数据100,所述数据与所述文件相关联;使用从一个 第一符号集中获得的符号将所述数据转换成一个词101;以及用一个查找表来编码所述词102以生成一个索引数据320,所述查找表将所述符 号与一个第二符号集相关联,所述第二符号集的每个符号与所述第一符号集的一个子集相关联;使用从所述第一符号集获得的符号来生成一个 词200;用所述查找表来编码所述词以生成一个编码数据201;以及^臾 索具有与所述编码数据相匹配的索引数据320的所有数据文件202,每 个所述数据文件与所述索引数据320相关联。图5代表一种根据本发明的用于对存储在一个存储单元中的一个数 据文件进行编码的设备。对一个存储在一个存储单元中的文件511进行编码的一种设备 520,该文件可以是一个例如MP3文件的媒体文件,所述设备包括一个 抽取装置521,用于从所述文件抽取一个非字母数据;转换装置522, 用于使用一个第一符号集获得的符号将所述非字母数据转换成一个词; 以及编码装置523,用于用一个查找表来编码所述词以生成一个索引数 据320,所述查找表将所述符号与一个第二符号集相关联,所述第二符 号集的每个符号与所述第一符号集的一个子集相关联。图6代表一种根据本发明的用于获取存储在一个存储单元中的数据 文件的设备。一种获取存储在一个存储单元中的数据文件的设备610,每个所述 文件都与一个索引数据320相关联。所述设备包括生成装置611,用于 使用一个第一符号集获得的符号来生成一个词;编码装置612,用于用 一个查找表来编码所述词以生成一个编码数据,所述查找表将所述符号 与一个第二符号集相关联,所述第二符号集的每个符号与所述第一符号集的一个子集相关联;以及搜索装置613,用于搜索具有与所述编码数 据相匹配的索引数据320的所有数据文件。如图5和图6所示的设备可以有利地进行组合以形成一种操纵存储 在一个存储单元的数据文件的系统,包括抽取装置521,用于从所述文 件抽取一个非字母数据;转换装置522,用于使用一个第一符号集获得 的符号将所述非字母数据转换成一个词;编码装置523,用于用一个查 找表来编码所述词以生成一个索引数据320,所述查找表将所述符号与 一个第二符号集相关联,所述第二符号集的每个符号与所述第一符号集的一个子集相关联;生成装置611,用于使用所述第一符号集获得的符 号来生成一个词;编码装置612,用于用所述查找表来编码所述词以生 成一个编码数据;以及搜索装置613,用于搜索具有与所述编码数据相 匹配的索引数据320的所有数据文件。应该注意,以示例性而不是限制性的意义采用了上述本发明的实施 方式。本领域的技术人员可以在不违背本发明的范围的情况下对这些实 施方式进4于各种改动。
权利要求
1.一种对存储在一个存储单元中的一个数据文件进行编码的方法,所述方法包括步骤-从所述数据文件抽取(100)一个非字母数据,所述数据与所述文件相关联;-使用从一个第一符号集中获得的符号将所述数据转换(101)成一个词;以及-用一个查找表来编码(102)所述词以生成一个索引数据(320),所述查找表将所述符号与一个第二符号集相关联,所述第二符号集的每个符号与所述第一符号集的一个子集相关联。
2. 根据权利要求1所述的方法,其中所述非字母数据是一个元数据。
3. 根据权利要求1或2所述的方法,进一步包括步骤-生成一个数据记录,所述数据记录包括所述索引数据(320)和一 个文件指针(330),所述文件指针(330)将所述数据记录与所述文件 相链接;-将所述数据记录存储到一个数据库中。
4. 根据权利要求3所述的方法,进一步包括步骤-将一个标签(340)添加到所述数据记录中,所述标签(340)对 所述文件的内容进行分类。
5. 根据权利要求3所述的方法,进一步包括步骤-生成多个数据记录,每个所述数据记录包含所述索引数据(320) 的一个子串。
6. 根据权利要求1所述的方法,其中所述索引数据(320)包括多 个符号集,进一步包括步骤-通过连接每个符号集的每个第一符号,生成一个导出的索引数据。
7. —种获取存储在一个存储单元中的数据文件的方法,每个所述数 据文件与一个索引数据(320 )相关联,所述方法包括步骤-使用从一个第一符号集获得的符号来生成(200) —个词;-用一个查找表来编码(201 )所述词以生成一个编码数据,所述查找表将所述符号与一个第二符号集相关联,所述第二符号集的每个符号与所述第一符号集的一个子集相关联;以及-搜索(202)具有与所述编码数据相匹配的索引数据(320)的所 有数据文件。
8. 根据权利要求7所述的方法,其中所述搜索步骤(202)包括识 别与索引数据(320)相关联的数据文件的步骤,所述索引数据(320) 包括所述编码数据。
9. 根据权利要求7所述的方法,其中所述搜索步骤(202)包括识 别与一个索引数据(320)相关联的数据文件的步骤,所述索引数据(320) 包括多个符号集,所述方法进一步包括步骤-连接所述符号集的所有第一符号以生成一个连接的词;以及 -将所述连接的词与所述编码数据进行比较。
10. 根据权利要求7所述的方法,进一步包括步骤- 一旦所述词由所述生成步骤进行了改动,就触发所述编码步骤 (201 )和搜索步骤(202)。
11. 一种操纵存储在一个存储单元中的数据文件的方法,所述方法 包括步骤-从所述数据文件抽取一个非字母数据(100),所述数据与所述文 件相关联;-使用从一个第一符号集中获得的符号将所述数据转换(101 )成一 个词;-用一个查找表来编码(102)所述词以生成一个索引数据(320), 所述查找表将所述符号与一个第二符号集相关联,所述第二符号集的每 个符号与所述第 一符号集的 一个子集相关联;-使用从所述第一符号集获得的符号来生成(200) —个词; -用所述查找表来编码(201)所述词以生成一个编码数据;以及 -搜索(202)具有与所述编码数据相匹配的索引数据(320)的所 有数据文件,每个所述数据文件与所述索引数据(320)相关联。
12. —种对存储在一个存储单元中的一个数据文件进行编码的设 备,所述设备包括-抽取装置(521),用于从所述数据文件(511)中抽取一个非字母数据,所述数据与所述文件(511)相关联;-转换装置(522 ),用于使用从一个第一符号集中获得的符号将所 述数据转换成一个词;以及-编码装置(523 ),用于用一个查找表来编码所述词以生成一个索 引数据(320),所述查找表将所述符号与一个第二符号集相关联,所 述第二符号集的每个符号与所述第一符号集的一个子集相关联。
13. —种获取存储在一个存储单元中的数据文件的设备,每个所述 数据文件与一个索引数据(320)相关联,所述设备包括-生成装置(611),用于使用从一个第一符号集中获得的符号来生 成一个词;-编码装置(612),用于用一个查找表来编码所述词以生成一个编 码数据,所述查找表将所述符号与一个第二符号集相关联,所述第二符 号集的每个符号与所述第一符号集的一个子集相关联;以及-搜索装置(613),用于搜索具有与所述编码数据相匹配的索引数 据(320)的所有数据文件。
14. 一种操纵存储在一个存储单元中的数据文件的系统,包括-抽取装置(521),用于从所述文件中抽取一个非字母数据,所述 数据与所述文件相关联;-转换装置(522),用于使用从一个第一符号集中获得的符号将所 述数据转换成一个词;-编码装置(523 ),用于用一个查找表来编码所述词以生成一个索 引数据(320),所述查找表将所述符号与一个第二符号集相关联,所 述第二符号集的每个符号与所述第一符号集的一个子集相关联;-生成装置(611),用于使用从所述第一符号集获得的符号来生成 一个词;-编码装置(612),用于用所述查找表来编码所述词以生成一个编 码数据;以及-搜索装置(613),用于搜索具有与所述编码数据相匹配的索引数 据(320)的所有数据文件。
全文摘要
一种对存储在一个存储单元中的一个数据文件进行编码的方法,所述方法包括步骤从所述数据文件中抽取(100)一个非字母数据,所述数据与所述文件相关联;使用从一个第一符号集中获得的符号将所述数据转换(101)成一个词;以及用一个查找表来编码(102)所述词以生成一个索引数据(320),所述查找表将所述符号与一个第二符号集相关联,所述第二符号集的每个符号与所述第一符号集的一个子集相关联。
文档编号G06F17/30GK101331483SQ200680046921
公开日2008年12月24日 申请日期2006年12月11日 优先权日2005年12月14日
发明者于东海, 袁海荣 申请人:皇家飞利浦电子股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1