使用歌词的重复模式提取歌词结构的设备、系统和方法

文档序号：6777434阅读：326来源：国知局

专利名称：使用歌词的重复模式提取歌词结构的设备、系统和方法
技术领域：
本发明涉及一种基于歌词的重复模式(pattern)提取歌词结构的设备、系统和方法，更具体地讲，涉及一种这样一种基于歌词的重复模式提取歌词结构的设备、系统和方法，该设备、系统和方法可通过分析歌词来提取重复的字符串和段落，从而按照树形结构布置歌词信息。
背景技术：
近来，能够再现数字编码的音频文件的便携式音频文件播放器已经被普遍使用。即，能够处理存储在半导体存储器中的数字编码的音频文件的紧凑型手持装置已经变得普及。
此外，随着对提供更高数据存储容量的便携式音频文件播放器的需求的增加，包含紧凑、高容量的硬盘驱动器的下一代播放器已经被开发出来，并迅速普及。
在音频文件播放器中，通过首先将数字音频文件中的数据从音频CD、互联网或其它数字音频装置下载到PC中，来将数字音频文件中的数据加载到数据存储装置中。然后，数据通常根据选择的编码格式被压缩并被加载到音频文件播放器的数据存储装置中。
在重放期间，音频文件播放器根据选择的编码格式对音频文件进行解压缩/解码。可使用各种用于对音频文件进行压缩和解压缩的编码格式。编码格式的例子包括，但不限于，MP3和MP3Pro。
对于MP3编码的音频文件，称为ID3标签的一套特殊框架附在数据文件的前面或后面。ID3标签包含与音频文件相关的描述文本和其它数据。例如，ID3标签可包括标题、艺术家、专辑、年代、流派和备注。ID3标签信息用于基于包含在ID3标签中的信息来搜索、分类和选择特定的音频文件。因为ID3标签信息通常被存储为文本字符，所以该信息可被显示在音频文件播放器的显示屏幕上。
随着技术的进步，各种独立的装置被集成到单个系统中，并且这些装置的尺寸正在变小。紧随这种趋势，音频文件播放器正被小型化，显示窗口的尺寸也正在变小。因此，通过操作密集地布置在显示窗口上的小按钮可导致用户的相当不便。
此外，由于存储在音频文件播放器中的音频文件的数量的增加，导致用户检索期望的音频文件要花费较长时间。
一种有效地搜索期望的音频文件的方法是使用对艺术家名字和歌曲名称的起始索引字符和完整列表的语音识别。另一种方法是使用诸如低唱的音乐曲调。还有一种方法包括创建代表音频文件的特性的标记，并提供具有与当前正被播放的歌曲相似特性(歌手/专辑/曲调)的音频文件。
用于提供音频文件的上述传统方法允许用户根据他们所拥有的音频文件的分类和特性来进行搜索。这些传统方法还要求用户记住关于期望的文件的完整信息。另一缺点是用户识别正被播放的音频文件要花费很多时间，这是因为音频文件必须从该文件的开始部分(即，前奏部分)被播放以进行确认。
第2002-074911号日本公开专利申请提出了一种音频播放器，该音频播放器能够检索包含每首歌曲的特征(诸如前奏、歌词和重复部分)的ID3标签数据中的特定项，并创建包含这些特征的将被检索的信息的列表，其中，所述特征先前已经在音频数据以MP3的形式正被写入到诸如CD的记录介质的同时被记录。但是，这种音频播放器不能提供这样一种技术，该技术用于使用来自音频文件的信息创建树形结构，并且根据用户对服务的请求使用关于该树形结构的信息来提供特定服务部分。

发明内容
本发明的示意性、非限制性的示例性实施例克服以上缺点以及以上没有描述的其它缺点。
与本发明一致的设备、系统和方法使用歌词的重复模式提取歌词结构，该设备、系统和方法可通过分析歌词信息来提取重复的字符串和段落，从而使用关于歌词的信息创建树形结构。
本发明还提供一种使用歌词的重复模式提取歌词结构的设备、系统和方法，该设备、系统和方法可基于提取的歌词结构提取音频文件的主题部分，来减少选择音频文件所需的时间量。
当本领域技术人员阅读下面的描述时，以上提到的本发明的目的以及其它目的、特点和优点将变得更加清楚。
根据本发明的一方面，提供一种使用歌词的重复模式提取歌词结构的设备，所述设备包括歌词提取器，从与音频文件相关的元数据提取歌词信息；字符串信息提取器，基于提取的歌词信息提取间隔部分和重复的字符串；段落提取器，基于重复的字符串提取段落，然后在提取的段落中提取一组具有相同重复模式的段落；歌词结构产生器，按照树形结构布置与音频文件相关的间隔部分、字符串和段落。
根据本发明的另一方面，提供一种使用歌词的重复模式提取歌词结构的方法，所述方法包括从与音频文件相关的元数据提取歌词信息；基于提取的歌词信息提取间隔部分和重复的字符串；基于重复的字符串提取段落；在提取的段落中提取一组具有相同重复模式的段落；按照树形结构布置与音频文件相关的间隔部分、字符串和段落。

通过结合附图详细描述本发明的优选示例性实施例，本发明的以上和/或其它特点及优点将会变得更加清楚，其中图1是根据本发明示例性实施例的使用歌词的重复模式提取歌词结构的设备的内部框图；图2A至图2C示出了根据本发明的修改的示例性实施例的在使用歌词的重复模式提取歌词结构的设备中通过预处理器使用重复模式预处理提取的歌词信息的示例；图3示出了根据本发明的修改的示例性实施例的在使用歌词的重复模式提取歌词结构的设备的间隔部分提取器中从歌词信息提取间隔部分的关键词的示例；图4A至图4B示出了根据本发明的修改的示例性实施例的在使用歌词的重复模式提取歌词结构的设备的字符串重复次数提取器中计算两个字符串之间的距离并提取重复的字符串的示例；图5A至图5C示出了根据本发明的修改的示例性实施例的在使用歌词的重复模式提取歌词结构的设备的第一段落提取器中提取段落的示例；图5D示出了由第一段落提取器提取的并被表示为表的段落图6示出了根据本发明的修改的示例性实施例的在使用歌词的重复模式提取歌词结构的设备的第二段落提取器中提取扩展的段落(EP)的示例；图7示出了根据本发明的修改的示例性实施例的在使用歌词的重复模式提取歌词结构的设备中按照树形结构布置预定歌词信息的示例；图8是示出根据本发明示例性实施例的使用歌词的重复模式提取歌词结构的方法的流程图；图9是根据本发明示例性实施例的使用歌词的重复模式提取歌词结构的系统的内部框图。
具体实施例方式
通过参照下面的优选示例性实施例的详细描述和附图，可更容易地理解本发明的优点和特点以及实现这些优点和特点的方法。但是，可以按照多种不同的形式来实施本发明，而不应被解释为限于这里所阐述的示例性实施例。相反，提供这些示例性实施例，以使得本公开透彻和完整，并将本发明的构思全面地传达给本领域技术人员，并且本发明仅由权利要求限定。在整个说明书中，相同的标号表示相同的部件。
现在将参照附图来更全面地描述本发明，在附图中示出了本发明的优选示例性实施例。
图1是根据本发明示例性实施例的使用歌词的重复模式提取歌词结构的设备的内部框图。例如，所述使用歌词的重复模式提取歌词结构的设备是能够重放预定的音频数据的便携式装置。便携式装置可以是移动电话、个人数字助理(PDA)或MPEG音频层-3(MP3)播放器。
参照图1，所述使用歌词的重复模式提取歌词结构的设备包括歌词提取器110、预处理器120、字符串信息提取器130、段落提取器140、歌词结构产生器150和控制器160。
这里，在此使用的术语“单元”、“模块”或“组件”指的是，但不限于执行特定任务的软件或硬件组件，诸如现场可编程门阵列(FPGA)或专用集成电路(ASIC)。单元可有利地被配置为驻留在可寻址存储介质上，并且被配置为在一个或多个处理器中执行。因此，单元可包括，例如，诸如软件组件、面向对象的软件组件、类组件和任务组件的组件、进程、函数、属性、过程、子程序、程序代码段、驱动程序、固件、微代码、电路、数据、数据库、数据结构、表、数组和变量。布置在这些组件和模块中的功能性可被组合为更少的组件和模块，或者还可被分离为另外的组件和模块。此外，这些组件和模块可被实现为在通信系统的一个或多个CPU中执行。
歌词提取器110从与音频文件相关的元数据提取歌词信息。例如，元数据可按照版本2ID3(ID3v2)标签或水印的形式被存储。
预处理器120删除包含在由歌词提取器110提取的歌词信息中的辅助信息。所述辅助信息是除了歌词信息之外的所有信息，包括特殊字符(例如，-、_、()、<>以及...)、标点符号(例如，‘和”)以及空白(例如，词之间的空格)。
预处理器120还将大写字符转换为小写字符，检查在歌词信息是否存在包含说唱(rap)部分的字符串，并将发现的字符串从歌词信息分离出去。在这种情况下，预处理器120使用与歌词信息一起提供的定时信息以及包含在字符串中的字符的数量来确定说唱部分的存在。随后将参照图2A至图2C来更详细地描述预处理歌词信息的示例。
字符串信息提取器130基于预处理器120预处理的歌词信息提取间隔(interlude)部分和重复的字符串。因为基于字符串信息来提供歌词信息，所以字符串信息提取器130从各个字符串提取间隔部分和重复的字符串。字符串信息提取器130包括间隔部分提取器131和字符串重复次数提取器132。
间隔部分提取器131从歌词信息中的字符串提取与间隔部分的关键词相同的词。关键词可被理解为“正被播放的间隔”和“间隔”。随后将参照图3来更详细地描述从歌词信息字符串重复次数提取器132提取间隔部分的关键词的示例。
字符串重复次数提取器132计算两个字符串之间的距离并提取重复的字符串。通过比较两个字符串中的字符的相同程度或字符串中的相同字符的重复程度(即，相似度)，来获得两个字符串之间的距离。当相同程度或相似度大于阈值(例如，70％)时，这两个字符串被确定为相同。字符串重复次数提取器132使用下面的等式(1)和(2)来计算字符串之间的距离。
等式(1)用于获得具有I个字符的字符串SI和具有J个字符的字符串SJ之间的距离sim(SI，SJ)。
sim(SI，SJ)＝AI，J/max(I，J)...(1)
其中，AI，J表示每个字符串中相同字符的数量，max(I，J)表示字符串SI和字符串SJ中的字符的数量中的较大数量。当两个字符串SI和SJ之间的距离小于70％时，这两个字符串SI和SJ被确定为彼此不相似(或相同)。可根据诸如包含在歌词信息中的打字错误等一些因素来调整阈值70％。
等式(2)定义了每个字符串中的字符之间的相似度a(i，j)。
a(i，j)＝max(a(i，j-1)，a(i-1，j)，a(i-1，j-1)+δ(si，sj))...(2)其中，δ(si，sj)表示被比较的字符之间的相同度。当字符串相同时，δ(si，sj)具有值“1”。当字符不同时，δ(si，sj)具有值“0”。因此，可通过使用等式(1)和(2)来计算两个字符串之间的距离，并可基于计算的距离来提取重复的字符串。随后将参照图4A和图4B来更全面地描述计算两个字符串之间的距离和提取重复的字符串的示例。
段落提取器140使用字符串信息提取器130提取的重复的字符串来提取段落，然后从提取的段落提取一组连续的具有相同重复模式的段落。段落是一组连续的具有相同重复次数的字符串。在下文中，将一组具有相同重复模式的段落称为“扩展的段落(EP)”。段落提取器140包括第一段落提取器141和第二段落提取器142。
第一段落提取器141使用字符串信息提取器130提取的重复的字符串来提取段落。在这种情况下，使用动态编程搜索算法来提取段落。
例如，当歌词信息包括12个字符串A、B、C、D、E、C、D、E、A、B、C和D时，字符串信息提取器130确定字符串A、B、C、D和E中每个的重复次数分别是2、2、3、3和2。
第一段落提取器141在重复的字符串中提取一组连续的具有相同重复次数的字符串作为段落。
例如，因为一组连续的字符串C和D重复3次，并且单独的字符串C和D都重复3次，所以该组字符串C和D被提取作为段落。另一方面，因为一组连续的字符串B和C重复2次，但是单独的字符串B和C分别重复2次和3次，因此，不提取该组连续的字符串B和C作为段落。随后将参照图5A至图5C来更详细地描述提取段落的示例。
第二段落提取器142在第一段落提取器141提取的段落中提取具有相同重复模式的段落(“EP”)。EP是一组两个或更多连续的段落。随后将参照图6来更详细地描述提取EP的示例。
歌词结构产生器150按照树形结构来布置分析的关于歌词的信息。在这种情况下，分析的信息包括关于歌词中的节(verse)(例如，第一节、第二节和第三节)、标题、字符串、段落和EP的信息。随后将参照图7来更详细地描述按照树形结构来布置歌词的示例。
控制器160基于歌词结构产生器150创建的树形结构来提供用户请求的服务。
例如，控制器160在用户检索音频文件期间在提取音频文件的主题部分之后输出主题部分，或者输出适合于根据用户对音频文件的概要版本的请求而设置的定时信息的部分。音频文件的主题部分指的是歌曲的对于用户记忆或印象最深刻的那部分，或者指的是歌曲的包含作曲者期望强调的主题的那部分，或者指的是歌曲的能够被艺术家演唱的最有情感的那部分。随后将参照图5D来更详细地描述提取音频文件的主题部分的示例。
另外，控制器160控制所述基于歌词的重复模式提取歌词结构的设备的所有其它部件(110至150)的操作。
图2A至图2C示出了在使用歌词的重复模式提取歌词结构的设备中通过预处理器预处理提取的歌词信息的示例。
参照图2A，歌词信息包括多个字符串，每个字符串包含多个字符。每个字符串还包含指示其开始的定时信息。
图2A示出歌词信息中的第九字符串包括字符“Fly(My baby) Whateverthe world says”。参照图2B，在被预处理之后，第九字符串包含字符“flywhatevertheworldsays”。
因此，预处理被执行，以删除空白、特殊字符和特殊字符内的内容，并将大写字符转换为小写字符。
然后，如图2A所示，基于第三字符串和第四字符串开始的时间来确定在分配给第三字符串的时间内被播放的字符的数量。
当第三字符串和第四字符串进行比较时，播放第三字符串所需的时间的长度几乎与播放第四字符串所需的时间的长度相等。第三字符串中的字符的数量大于包含在第四字符串中的字符的数量。因此，第三字符串被确定为说唱部分。
类似地，当第四字符串和第五字符串进行比较时，播放第四字符串所需的时间的长度几乎与播放第五字符串所需的时间的长度相等。第四字符串中的字符的数量大于包含在第五字符串中的字符的数量。因此，第四字符串被确定为说唱部分。
因此，作为预处理的结果，如图2C所示，说唱部分(第三字符串和第四字符串)从歌词信息中被分离，以进行单独的处理。
图3示出了根据本发明的修改的示例性实施例的在使用歌词的重复模式提取歌词结构的设备的间隔部分提取器(图1中的131)中从歌词信息提取间隔部分的关键词的示例。
参照图3，间隔部分提取器131基于字符串检查在包括多个字符串的歌词信息中是否存在与关键词“间隔”相同的词。
当在字符串中存在与所述关键词相同的词时，间隔部分提取器131根据包含发现的关键词(例如，间隔)的字符串将歌词信息划分为三节(第一节至第三节)。通过根据间隔部分划分歌词信息而获得的关于节(第一节至第三节)的信息将被用于产生歌词结构。
图4A和图4B示出了根据本发明的修改的示例性实施例的在使用歌词的重复模式提取歌词结构的设备的字符串重复次数提取器(图1中的132)中计算两个字符串之间的距离并提取重复的字符串的示例。
参照图4A，第一字符串和第二字符串分别包含字符“ABCBECD”和“ABABCD”。等式(2)用于测量第一字符串和第二字符串之间的相似程度。
第一字符串和第二字符串的第一字符之间的相似程度a(1，1)等于max(a(1，0)，a(0，1)，a(0，0)+δ(S1，S1))。但是，因为a(1，0)、a(0，1)和a(0，0)没有被定义，所以它们被当作是“0”。因为第一字符串中的第一音节A与第二字符串中的第一音节相同，所以δ(S1，S1)的值是1。因此，a(1，1)为1。
类似地，第一字符串的第六音节和第二字符串的第三音节之间的相似程度a(6，3)等于max(a(6，2)，a(5，3)，a(5，2)+δ(S6，S3))。因为a(6，2)、a(5，3)和a(5，2)为2，δ(S6，S3)的值是0，所以，a(6，3)为2。
即，可基于两个字符以及相邻字符(例如，位于两个字符的上侧、左侧和对角)中的每个之间的相同度来计算这两个字符之间的相似程度。
第一字符串和第二字符串中的所有字符之间的相似程度是5。
基于所得值5搜索相同音节的过程描述如下。参照图4A，字符串重复次数提取器132检查位于参考值(例如，5)的左方向和左上对角方向的值中的任何一个是否大于或等于5。如果存在大于或等于5的值，则参考值被改变为该值。相反，如果不存在大于或等于5的值，则参考值被改变为位于前一参考值a(7，6)的左上对角方向的值。
因为不存在大于或等于5的值，所以参考值被改变为位于参考值a(7，6)的左上对角方向的值a(6，5)。字符串重复次数提取器132然后检查位于参考值a(6，5)的左方向和左上对角方向的值中的任何一个是否大于或等于4。其结果是，因为不存在大于或等于4的值，所以参考值被改变为位于a(6，5)的左上对角方向的值a(5，4)。
然后，因为在a(5，4)的左方向存在与参考值3相等的值，所以参考值被改变为a(4，4)。
类似地，字符串重复次数提取器132检查位于参考值a(4，4)的左方向和左上对角方向的值中的任何一个是否大于或等于3。因为不存在大于或等于3的值，所以参考值被改变为位于a(4，4)的左上对角方向的值a(3，3)。
然后，因为在参考值a(3，3)的左方向和左上对角方向存在大于或等于2的值，所以参考值被改变为位于a(3，3)的左上对角方向的值a(2，2)。
接下来，检查位于参考值a(2，2)的左方向和左上对角方向的值中的任何一个是否大于或等于2。因为不存在大于或等于2的值，所以参考值被改变为位于a(2，2)的左上对角方向的值a(1，1)。
使用等式(2)计算的相同字符的数量是5，并且所述相同字符是位于改变的参考值的位置的A、B、B、C和D。在这种情况下，相同字符的数量AI，J是5，由于第一字符串和第二字符串中的字符的数量分别是7和6，所以max(I，J)是7。将这些值代入等式(1)，计算第一字符串和第二字符串之间的距离为sim(S1，S2)＝5/7＝71％。即，因为第一字符串和第二字符串之间的距离是71％，所以这两个字符串被确定为相似。
图4B是示出基于如上所述计算的两个字符串之间的距离的歌词信息中的每个字符串的重复次数的表。
字符串重复次数提取器132基于两个字符串之间的距离创建列出每个字符串的重复次数的表。
更详细地讲，当两个字符串之间的距离大于70％时，字符串重复次数提取器132确定两个字符串相似(或相同)，检查字符串的重复次数，并且在表中存储检查出的重复次数。在这种情况下，包含关于每个字符串的重复次数的信息的表用于提取段落。
图5A至图5C示出了根据本发明的修改的示例性实施例的在使用歌词的重复模式提取歌词结构的设备的第一段落提取器(图1中的141)中提取段落的示例。
参照图5A，沿着i轴和j轴布置相同的字符串A、B、C、D、E、C、D、E、B、C和D。当i轴和j轴被对角线51划分时，上部关于对角线51与下部52对称，并且仅对上部执行提取段落的过程。
当字符串信息提取器130通过比较每个字符串来检查是否存在相同的字符串时，存在位于对角方向上的具有相同值(例如，1)的连续字符串。具有相同值(例如，1)的连续字符串由“S”表示。
第一段落提取器141如图5B所示检查出现在行上的字符串C的段落的存在，以发现由于出现在行上的字符串C、D和E以及出现在列上的字符串C和D而存在S。在这种情下，第一段落提取器141在包含在S中的字符串中选择较小数量的字符串作为段落53。即，出现在行和列上的字符串C和D被选择作为段落53。
参照图5C，然后，对其中提取了段落的行画出边界线54，并且包含在边界线54之内的其中提取了段落的行的值(“1”)被改变为“0”。然后，第一段落提取器141提取位于该行的字符串E到位于最后一行的字符串D的段落。
图5D示出了由第一段落提取器141提取的并被表示为表的段落。参照图5D，重复次数大于1的字符串被分类为段落。
例如，包含“goodlady”的重复了11次的字符串被分类为段落P0。包含“You with so small and white hands/make me crazy”的重复了6次的字符串被分类为段落P1。
此外，将参照图5D描述提取音频文件的主题部分的示例。
例如，当用户期望检索音频文件时，控制器160从音频文件的树形结构提取音频文件的主题部分。音频文件的主题部分指的是歌曲的对于用户记忆或印象最深刻的那部分，或者指的是歌曲的包含作曲者期望强调的主题的那部分，或者指的是歌曲的能够被艺术家演唱的最有情感的那部分。
然后，提取的音频文件的主题部分被输出给用户，以使得他/她能够更快速地识别音频文件，由此减少选择音频文件所需的时间量。
为了提取音频文件的主题部分，可为每个段落提取下面5个特征。
第一特征是从段落提取器140提取的段落中的最频繁重复的段落的重复次数减去预定段落的重复次数而获得的值。
参照图5D，例如，当最频繁重复的字符串的重复次数是11，并且预定段落的ID是0时，则第一特征的值为0(11-11)。当预定段落的ID是1时，则第一特征的值为5(11-6)。当预定段落的ID是2时，则第一特征的值为6(11-5)。
第二特征是重复的字符串的长度与包含在歌词信息中的所有字符串的长度的比率。
参照图5D，所有字符串的长度是48，段落P0和P1中的字符串的长度分别是1和2。因此，P0中的字符串的长度和所有字符串的长度的比率是1/48，P1中的字符串的长度和所有字符串的长度的比率是2/48。
第三特征是整个歌词信息的特定段落中的字符串的总长度。
例如，当P0中的字符串的长度是1，P2中的字符串的长度是2时，因为P0和P2分别重复11次和6次，则P0中的所有字符串的总长度是11，P1中的所有字符串的总长度是12。
第四特征是其中出现特定段落的所有节的类型。
例如，段落P0出现在第一节至第三节中。
第五特征是关于段落将在间隔之前还是在间隔之后开始的信息。
通过全面地考虑以上5个特征，提取这样的段落作为音频文件的主题部分，所述段落频繁重复，相对于整个歌词具有长的字符串和高的比例，重复出现在多个节中，并且出现在间隔之前/之后。
将段落的特征彼此进行比较的一种方式是使用简单的比较规则。另一种方式是通过将给定的段落与音乐专家预先确定的主题部分进行比较使用模式识别技术来自动创建比较规则。
图6示出了根据本发明的修改的示例性实施例的在使用歌词的重复模式提取歌词结构的设备的第二段落提取器(图1中的142)中提取扩展的段落的示例。
参照图6，第二段落提取器142顺序地组合段落的ID，以检查组合的段落的重复次数。在这种情况下，组合的ID的数量n在2(n＝2)和8(n＝8)之间。下面的表显示了组合的ID的数量在2至4之间的示例。
n＝2

n＝3

n＝4

因此，段落0，1(n＝2)的重复次数与段落0，1，0(n＝3)的重复次数进行比较。因为段落0，1(n＝2)的重复次数不等于段落0，1，0(n＝3)的重复次数，所以段落0，1和段落0，1，0被加入EP。之后，段落0，1，0(n＝3)的重复次数与段落0，1，0，2(n＝4)的重复次数进行比较。
然后，段落1，0(n＝2)的重复次数与段落1，0，2(n＝3)的重复次数进行比较。因为段落1，0(n＝2)的重复次数等于段落1，0，2(n＝3)的重复次数，所以当段落1，0，2(n＝3)成为EP时，段落1，0(n＝2)不是EP。之后，段落1，0，2(n＝3)的重复次数与段落0，1，0，2(n＝4)的重复次数进行比较。
接下来，段落0，2(n＝2)的重复次数与段落0，2，0(n＝3)的重复次数进行比较。因为前者与后者相等，所以当段落0，2，0(n＝3)成为EP时，段落0，2(n＝2)不是EP。之后，段落0，2，0(n＝3)的重复次数与段落0，1，0，2(n＝4)的重复次数进行比较。
然后，作为后来比较的结果，因为段落0，1，0(n＝3)的重复次数等于段落0，1，0，2(n＝4)的重复次数，所以当段落0，1，0，2(n＝4)成为EP时，段落0，1，0(n＝3)不是EP。
然后，段落1，0，2、0，2，0以及2，0，1(n＝3)的重复次数分别与段落0，1，0，2、1，0，2，0以及0，2，0，1(n＝4)的重复次数进行比较。作为比较结果，段落1，0，2、0，2，0以及2，0，1(n＝3)不是EP。
因此，作为提取段落(n为2至8)的EP的结果，段落0，1、0，1，0，2、0，1，0，2，0，1和0，1，0，2，0，1，0，2成为EP。
图7示出了根据本发明的修改的示例性实施例的在使用歌词的重复模式提取歌词结构的设备中按照树形结构布置预定歌词信息的示例。
参照图7，歌词结构产生器(图1中的150)按照树形结构布置关于歌词的各种类型的信息。所述信息包括字符串信息提取器130获得的字符串信息71、段落提取器140提取的EP72和关于歌词节(第一节至第三节)的信息73以及预处理器120提取的标题信息74。
因此，根据用户对重放音频文件的请求，本发明能够基于分析的按照树形结构布置的信息立即提供关于用户期望的部分的信息。本发明还允许根据用户对音频文件的概要版本的请求在用户指定的时间期间播放音频文件的一部分。
图8是示出根据本发明示例性实施例的使用歌词的重复模式提取歌词结构的方法的流程图。现在将参照图1至图8来描述所述提取歌词结构的方法。
参照图8，在步骤S800，歌词提取器110从存储在ID3标签v2和水印中的音频文件的元数据提取标题信息和歌词信息。
在步骤S810，预处理器120对接收的歌词信息进行预处理。更具体地讲，预处理器120删除除了歌词信息之外的信息，包括特殊字符(例如，-、_、()、<>以及...)、标点符号(例如，‘和”)、空白(例如，词之间的空格)以及说唱部分，并且将大写字符转换为小写字符。
在步骤S820和S830，字符串信息提取器130基于预处理器120预处理的歌词信息提取间隔部分和重复的字符串。
例如，字符串信息提取器130从歌词信息中的字符串提取与间隔部分(例如，正被播放的间隔)的关键词相同的词，并计算两个字符串之间的距离以提取重复的字符串。通过比较两个字符串的相同程度或字符串中的相同字符的重复程度(即，相似度)，来获得两个字符串之间的距离。当相同或相似的程度大于阈值(例如，70％)时，这两个字符串被确定为相同。因为前面已经参照图3、图4A和图4B描述了上述过程，所以不再进行详细解释。
在步骤S840，第一段落提取器141使用字符串信息提取器130提取的重复字符串来提取段落。第一段落提取器141可使用动态编程搜索算法来提取段落。
例如，当字符串A、B、C、D和E的重复次数分别是1、2、3、3和2时，第一段落提取器141提取字符串C和D作为段落。由于前面已经参照图5A和图5C描述了上述过程，所以不再进行详细解释。
在步骤S850，第二段落提取器142在第一段落提取器141提取的段落中提取具有相同重复模式的段落(“EP”)。EP是一组两个或更多连续的段落。由于前面已经参照图6描述了上述过程，所以不再进行详细描述。
在步骤S860，歌词结构产生器150按照树形结构来布置通过划分歌词而获得的节(例如，第一节、第二节和第三节)、标题信息、字符串信息和EP。
例如，当用户期望检索音频文件时，控制器160从音频文件的树形结构提取音频文件的主题部分，并将该主题部分输出给用户，以使得他/她能够更快速地识别音频文件，由此减少选择音频文件所需的时间量。
控制器160还可输出音频文件的一部分(例如，EP)，以根据用户对音频文件的概要版本的请求在可被指定的时间(例如，20秒)期间被播放。
图9是根据本发明示例性实施例的使用歌词的重复模式提取歌词结构的系统的内部框图。在本发明中，使用歌词的重复模式提取歌词结构的系统是使用用于使用歌词的重复模式提取歌词结构的技术的MP3移动电话。
参照图9，该系统包括键输入单元200、歌词结构提取器100、音频文件管理单元300、输出单元400和控制器500。
键输入单元200接收通过用户的选择所产生的预定键信号。键信号可被理解为用于进行电话呼叫的各种功能键信号、数字键信号或用于播放音频文件(例如，MP3文件)的操作键(诸如，记录键、播放键和停止键)信号。
歌词结构提取器100分析与音频文件相关的歌词，提取重复的字符串，然后基于重复的字符串提取段落和EP，并且按照树形结构布置关于歌词的信息。因为歌词结构提取器100和功能和结构与图1中的使用歌词的重复模式提取歌词结构的设备的功能和结构相同，所以不再进行详细描述。
音频文件管理单元300管理音频文件的存储和重放。在这种情况下，音频文件是MP3文件。音频文件管理单元300包括数字模拟(D/A)转换器310、解码器320和存储器330。
解码器320使用可从ST微电子技术获得的STA013将以MP3格式压缩的音频数据重构为脉冲编码调制(PCM)格式的数据。
D/A转换器310将解码器320输出的PCM格式的音频数据转换为模拟音频信号。输出单元400输出作为左声道和右声道音频信号的左“L”和右“R”音频信号。
存储器330存储被转换为MP3格式的数字音频数据以及与数字音频数据相关联的辅助信息。输出单元400输出从音频文件管理单元300或其它部件接收的音频信号。控制器500控制包含在使用歌词的重复模式提取歌词结构的系统中的所有其它部件(100至400)的操作。
根据本发明的使用歌词的重复模式提取歌词结构的设备、系统和方法下列优点中的一个或多个。
本发明可通过按照树形结构布置关于歌词的信息来更快速地提供适合于用户请求的音频文件的部分，其中，通过分析歌词而提取重复的字符串和段落，来获得所述于歌词的信息。
本发明还可通过基于提取的歌词结构，根据用户对检索音频文件的请求提供歌词的主题部分，来减少用户选择音频文件所需的时间量。
与分析音乐信号的波形的方法相比，本发明还可通过基于歌词提取字符串和段落，来减少提取主题部分所需的时间量和计算量。
虽然已经参照本发明的示例性实施例具体显示和描述了本发明，但是对于本领域的技术人员明显的是，在本发明的范围由权利要求限定，而不是前面的描述来限定，并且所有落入权利要求的范围内的变化和等同物应被理解为包含在其中。因此，应该理解，上述实施例在各方面不是限制性的，而是示意性的。
权利要求
1.一种使用歌词的重复模式提取歌词结构的设备，所述设备包括歌词提取器，从与音频文件相关的元数据提取歌词信息；字符串信息提取器，基于提取的歌词信息提取间隔部分和重复的字符串；段落提取器，基于重复的字符串提取段落，然后在提取的段落中提取一组具有相同重复模式的段落；歌词结构产生器，按照树形结构布置与音频文件相关的间隔部分、字符串和段落。
2.根据权利要求1所述的设备，其中，字符串信息提取器包括间隔部分提取器，从包含在提取的歌词信息中的字符串提取间隔部分的关键词；字符串重复次数提取器，计算提取的歌词信息中的两个字符串之间的距离，并提取字符串的重复次数。
3.根据权利要求2所述的设备，其中，使用sim(SI，SJ)＝AI，J/max(I，J)来计算两个字符串之间的距离，其中，AI，J是每个字符串中相同字符的数量，max(I，J)是字符串SI和SJ中的字符的数量中的较大数量。
4.根据权利要求3所述的设备，其中，使用a(i，j)＝max(a(i，j-1)，a(i-1，j)，a(i-1，j-1)+δ(si，sj))来计算所述两个字符串中的字符之间的相似程度，其中，i和j表示两个字符串中的字符，δ(si，sj)表示被比较的字符之间相同度。
5.根据权利要求1所述的设备，其中，段落提取器包括第一段落提取器，在重复的字符串中提取一组连续的具有相同重复次数的字符串作为段落；第二段落提取器，在第一段落提取器提取的段落中提取一组具有相同重复模式的段落。
6.根据权利要求1所述的设备，还包括预处理器，删除包含在提取的歌词信息中的辅助信息；控制器，基于创建的树形结构提取音频文件的主题部分。
7.一种使用歌词的重复模式提取歌词结构的方法，所述方法包括从与音频文件相关的元数据提取歌词信息；基于提取的歌词信息提取间隔部分和重复的字符串；基于重复的字符串提取段落；在提取的段落中提取一组具有相同重复模式的段落；按照树形结构布置与音频文件相关的间隔部分、字符串和段落。
8.根据权利要求7所述的方法，其中，使用sim(SI，SJ)＝AI，J/max(I，J)来计算两个字符串之间的距离，其中，AI，J是每个字符串中相同字符的数量，max(I，J)是字符串SI和SJ中的字符的数量中的较大数量。
9.根据权利要求8所述的方法，其中，使用a(i，j)＝max(a(i，j-1)，a(i-1，j)，a(i-1，j-1)+δ(si，sj))来计算所述两个字符串中的字符之间的相似程度，其中，i和j表示两个字符串中的字符，δ(si，sj)表示被比较的字符之间相同度。
10.根据权利要求7所述的方法，还包括进行预处理，以删除包含在提取的歌词信息中的辅助信息。
11.根据权利要求7所述的方法，还包括基于创建的树形结构提取音频文件的主题部分。
12.一种使用歌词的重复模式提取歌词结构的系统，所述系统包括键输入单元，接收通过用户的选择所产生的预定键输入信号；音频文件管理单元，当键输入信号指示请求音频文件时，管理与音频文件相关的操作；歌词结构提取器，分析与音频文件相关的歌词，提取重复的字符串和段落，并且按照树形结构布置关于歌词的信息。
全文摘要
提供一种使用歌词的重复模式提取歌词结构的设备、系统和方法。所述设备包括歌词提取器，从与音频文件相关的元数据提取歌词信息；字符串信息提取器，基于提取的歌词信息提取间隔部分和重复的字符串；段落提取器，基于重复的字符串提取段落，然后在提取的段落中提取一组具有相同重复模式的段落；歌词结构产生器，按照树形结构布置与音频文件相关的间隔部分、字符串和段落。
文档编号G11B27/10GK101017502SQ20071000706
公开日2007年8月15日申请日期2007年2月8日优先权日2006年2月10日
发明者赵诚贞, 崔昌圭, 李蕙汀, 金渊培申请人:三星电子株式会社

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：赵诚贞;崔昌圭;李蕙汀;金渊培
技术所有人：三星电子株式会社
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、毕老师：机构动力学与控制
2、袁老师：1.计算机视觉 2.无线网络及物联网
3、王老师：1.计算机网络安全 2.计算机仿真技术
4、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
5、张老师：1.机械设计的应力分析、强度校核的计算机仿真 2.生物反应器研制 3.生物力学
如您是高校老师，可以点此联系我们加入专家库。