旋律辨识方法与其装置的制作方法

文档序号：2824982阅读：344来源：国知局

专利名称：旋律辨识方法与其装置的制作方法
技术领域：
本发明涉及旋律辨识领域，尤其涉及一种旋律辨识方法与其装置。
背景技术：
传统上，旋律辨识方法的辨识基础为音高与该音高的总长度。目前旋律辨识技术先建立包含多首曲目的音高信息的旋律数据库，当使用者哼唱一段旋律之后，撷取该旋律的音高信息，例如音高与音高的总长度等，然后与旋律数据库作比对，藉以提供可能的对应曲目。一些现有的旋律辨识方法除了比对上述音高信息之外，同时也利用额外输入的歌曲文字信息或歌词来辅助辨识。然而，当使用者哼唱输入不标准时，旋律与旋律数据库的比对极容易发生误差而使旋律辨识的成功辨识率无法提升，尤其在使用者哼唱旋律五音不全时。

发明内容
有鉴于此，本发明的实施例提供一种旋律辨识方法，其根据输入旋律的清晰度并利用二阶段的比对以更精确且更有效率地辨识旋律。该旋律辨识方法包括输入一旋律；取得该旋律的音高追踪信息；取得该旋律的节拍信息；由该音高追踪信息判断该旋律的一清晰度；若该清晰度大于一预设门槛值，先进行一第一比对，以从一数据库中筛选出第一批候选歌曲；再进行一第二比对，以从该等第一批候选歌曲中筛选出第二批候选歌曲；以及根据该等第二批候选歌曲决定至少一最后候选歌曲。本发明的实施例更提供一种旋律辨识装置，包括一接收器，其接收一旋律；一处理器，其取得该旋律的音高追踪信息与节拍信息，并通过该音高追踪信息判断该旋律的一清晰度；以及一比对器，其根据该清晰度进行该旋律与一数据库的比对；其中若该清晰度大于一预设门槛值，该比对器先进行一第一比对，以从该数据库中筛选出第一批候选歌曲；该比对器再进行一第二比对，以从该等第一批候选歌曲中筛选出第二批候选歌曲；其中该比对器根据该等第二批候选歌曲决定至少一最后候选歌曲。本发明实施例旋律辨识方法及装置，根据输入旋律的清晰度并利用二阶段的比对来辨识旋律，可以更精确且更有效率。

此处所说明的附图用来提供对本发明的进一步理解，构成本申请的一部分，并不构成对本发明的限定。在附图中图IA所示为根据本发明一实施例的旋律辨识流程图；图IB所示为根据本发明另一实施例的旋律辨识流程图；图2所示为根据本发明一实施例的旋律辨识装置示意图。附图标号
S100、S110、......S170 步骤；20 旋律辨识装置200 接收器；210 处理器；212 清晰度模块；214 音高追踪模块；216 拍点检测模块；220 比对器；222 音高向量比对模块；2M 节拍比对模块；230 数据库；232 音高语料库；234 节拍数据库；240 显示装置；250 互动装置。
具体实施例方式以下说明为本发明的实施例。其目的是要举例说明本发明一般性的原则，不应视为本发明的限制，本发明的范围当以权利要求范围所界定者为准。目前旋律辨识多用音高与音高总长度等音高信息来辨识。然而歌曲的节拍也是重要的特征，若两首歌曲的音调相近但是节拍不同，则两首歌曲很有可能是完全不相同的，因此，若能结合音高信息与节拍信息就可以更有效地辨识旋律；此外，更由于使用者哼唱旋律五音不全(输入不标准)时，所导致的成功辨识率降低的问题，能得到有效的解决方案。图IA所示为根据本发明一实施例的旋律辨识方法流程图。步骤SlOO为输入旋律，在一实施例中，可通过使用者对着麦克风哼唱一旋律。使用者对麦克风所哼唱的旋律需要经过合适的取样以将此旋律数字化成数字音频(Audio Signal)文件。步骤S120，取得该旋律的音高追踪信息，例如对上述的输入旋律进行音高追踪 (Pitch tracking)以取得音高追踪信息。音高追踪的相关技术将于后再述。步骤S122，取得该旋律的节拍信息，例如对上述的输入旋律进行拍点检测(Onset detection)以取得节拍信息。拍点检测的相关技术将于后再述。步骤S130，由该音高追踪信息判断该旋律的一清晰度，例如，将音高追踪信息正规化(Normalize)之后所得的值作为清晰度，清晰度的相关技术将于后再述。步骤S150，若该清晰度大于一预设门槛值，先进行一第一比对，以从一数据库中筛选出第一批候选歌曲。第一比对可以是音高向量比对。本实施例虽以音高向量比对作为举例说明，但第一比对并不限于音高向量比对。音高向量比对的相关技术将于后再述。步骤S160，进行一第二比对，以从该等第一批候选歌曲中筛选出第二批候选歌曲。第二比对是指相异于第一比对的另一种比对方式。例如当第一比对是音高向量比对时，第二比对可为节拍比对，但第二比对并不限于节拍比对。节拍比对的相关技术将于后再述。步骤S170，根据该等第二批候选歌曲决定至少一最后候选歌曲。例如，输出TOP10首候选歌曲以供使用者参考。图IB所示为根据本发明另一实施例的旋律辨识方法流程图。其中步骤和图IA中步骤相同者，以相同标号进行标示。步骤SlOO为输入旋律。步骤SllO为对输入的旋律进行前置处理，前置处理为一般音频处理时所需要的预处理，包括端点检测(end-point detection)、预强调(pre-emphasis)、音框切割(frame partitioning)等。端点检测用来判断音频中哪些区段是有声段、哪些是无声段或背景噪声；预强调用来补偿高频部分的信号数字化后所造成的失真；音框切割为将音频文件每间隔一固定时间切割成一个又一个的音框，相邻音框之间可以重叠。输入旋律前置处理完成后，步骤S120和步骤S122分别对前置处理过的输入旋律进行音高追踪(Pitch tracking)与拍点检测(Onset detection)，以取得输入旋律的音高追踪信息和节拍信息。在一些实施例中，可利用自相关函数(Auto-Correlation Function, ACF)进行音高追踪，音框s中某个时间点t的自相关函数值计算如下

权利要求
1.一种旋律辨识方法，其特征在于，所述旋律辨识方法包括输入一旋律；取得所述旋律的音高追踪信息；取得所述旋律的节拍信息；由所述音高追踪信息判断所述旋律的一清晰度；若所述清晰度大于一预设门槛值，先进行一第一比对，以从一数据库中筛选出第一批候选歌曲，再进行一第二比对，以从所述第一批候选歌曲中筛选出第二批候选歌曲；以及根据所述第二批候选歌曲决定至少一最后候选歌曲。
2.如权利要求1所述的旋律辨识方法，其特征在于，更包括若所述清晰度小于所述预设门槛值，先进行所述第二比对，以从所述数据库中筛选出第三批候选歌曲，再进行所述第一比对，以从所述第三批候选歌曲中筛选出第四批候选歌曲；以及根据所述第四批候选歌曲决定至少一最后候选歌曲。
3.如权利要求2所述的旋律辨识方法，其特征在于，所述第一比对为音高向量比对，所述第二比对为节拍比对。
4.如权利要求3所述的旋律辨识方法，其特征在于，更包括进行所述旋律的前置处理；其中所述前置处理包括检测所述旋律的端点、预强调处理以及切割所述旋律的音框。
5.如权利要求4所述的旋律辨识方法，其特征在于，更包括使用白相关函数或平均差异量函数取得前置处理过的所述旋律的各个音框的所述音高追踪信息，从所述音高追踪信息取得各个音框的音高值，并将各个音框的所述音高值转换为所述旋律的音高向量。
6.如权利要求4所述的旋律辨识方法，其特征在于，更包括使用相位偏移检测所述旋律的拍点以取得所述旋律的所述节拍信息。
7.如权利要求4所述的旋律辨识方法，其特征在于，更包括使用光谱通量检测所述旋律的拍点以取得所述旋律的所述节拍信息。
8.如权利要求5所述的旋律辨识方法，其特征在于，所述音高向量比对使用线性伸缩将所述旋律的所述音高向量与一音高语料库的所有音高向量数据作比对。
9.如权利要求3所述的旋律辨识方法，其特征在于，所述节拍比对使用以动态规划为基础的一演算法将所述旋律的所述节拍信息与一节拍数据库的所有节拍数据作比对，所述节拍数据库纪录所述数据库中每首歌曲的节拍信息。
10.如权利要求8所述的旋律辨识方法，其特征在于，所述音高语料库纪录所述数据库中每首歌曲的音高向量。
11.如权利要求5所述的旋律辨识方法，其特征在于，所述清晰度为所述音高追踪信息正规化后的值，且所述清晰度越高代表所述音高值越准确。
12.如权利要求1所述的旋律辨识方法，其特征在于，更包括根据所述第一比对产生一第一评估分数；根据所述第二比对产生一第二评估分数；根据所述第一评估分数与所述第二评估分数产生所述至少一最后候选歌曲中每首歌曲的一评估分数；其中所述评估分数为所述第一评估分数与所述第二评估分数根据一权重比例所组成，若所述清晰度大于所述预设门槛值则所述权重比例偏重所述第一评估分数，若所述清晰度小于所述预设门槛值则所述权重比例偏重所述第二评估分数，所述评估分数越高与所述旋律的匹配度越高。
13.一种旋律辨识装置，其特征在于，所述旋律辨识装置包括一接收器，其接收一旋律；一处理器，其取得所述旋律的音高追踪信息与节拍信息，并通过所述音高追踪信息判断所述旋律的一清晰度；以及一比对器，其根据所述清晰度进行所述旋律与一数据库的比对；其中若所述清晰度大于一预设门槛值，所述比对器先进行一第一比对，以从所述数据库中筛选出第一批候选歌曲；所述比对器再进行一第二比对，以从所述第一批候选歌曲中筛选出第二批候选歌曲；其中所述比对器根据所述第二批候选歌曲决定至少一最后候选歌曲。
14.如权利要求13所述的旋律辨识装置，其特征在于，若所述清晰度小于所述预设门槛值，所述比对器先进行所述第二比对，以从所述数据库中筛选出第三批候选歌曲，再进行所述第一比对，以从所述第三批候选歌曲中筛选出第四批候选歌曲，然后根据所述第四批候选歌曲决定至少一最后候选歌曲。
15.如权利要求14所述的旋律辨识装置，其特征在于，所述第一比对为音高向量比对，所述第二比对为节拍比对。
16.如权利要求13所述的旋律辨识装置，其特征在于，更包括一显示装置，其显示所述至少一最后候选歌曲。
17.如权利要求16所述的旋律辨识装置，其特征在于，更包括一互动装置，其根据所述旋律的所述节拍信息透过预定的灯光闪烁与动作做出对应所述节拍信息的互动播放。
全文摘要
本发明公开了一种旋律辨识装置，包括一接收器，其接收一旋律；一处理器，其取得所述旋律的音高追踪信息与节拍信息，并通过所述音高追踪信息判断所述旋律的一清晰度；以及一比对器，其根据所述清晰度进行所述旋律与一数据库的比对；其中若所述清晰度大于一预设门槛值，所述比对器先进行一第一比对，以从所述数据库中筛选出第一批候选歌曲；所述比对器再进行一第二比对，以从所述第一批候选歌曲中筛选出第二批候选歌曲；其中所述比对器根据所述第二批候选歌曲决定至少一最后候选歌曲。本发明实施例旋律辨识方法及装置，根据输入旋律的清晰度并利用二阶段的比对来辨识旋律，可以更精确且更有效率。
文档编号G10L15/00GK102479509SQ20111003214
公开日2012年5月30日申请日期2011年1月28日优先权日2010年11月29日
发明者叶子隽, 张智星, 游信文, 王崇喆, 王文男, 许丞佑申请人:财团法人资讯工业策进会

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：王文男;张智星;叶子隽;王崇喆;游信文;许丞佑
技术所有人：财团法人资讯工业策进会
我是此专利的发明人