一种共享自行车的声纹识别方法与流程

文档序号:11709001阅读:282来源:国知局

本发明涉及共享自行车的识别领域,尤其是一种共享自行车的声纹识别方法。



背景技术:

随着共享自行车的推广,共享自行车的应用越来越个广泛,但是目前共享单车的开锁方式只有扫描二维码开锁一种方式,缺乏更多的信息录入渠道,且二维码开锁的方式需要手机进行手动炒作,不利于共享自行车的快速开锁,而二维码模糊后,其唯一的信息输入渠道不顺畅时,将严重影响共享自行车的使用和用户的体验。



技术实现要素:

本发明的发明目的在于:针对上述存在的问题,提供一种共享自行车的声纹识别方法,提供声纹信号输入方式,提高用户体验,此外,本声纹的识别方法能够提高识别的准确性,能够避免不同环境下声纹度误差对声纹识别的影响。

本发明采用的技术方案如下:

本发明公开了一种共享自行车的声纹识别方法,包括以下步骤:

步骤1:用户向设置于车头处的声音传感器录入声纹,声音传感器将声纹转化为电信号并将该电信号传递mcu,mcu置于共享自行车的车锁内;

步骤2:mcu将电信号识别为字符信号,然后将电信号和字符信号分别编码为声纹数据和字符数据,声纹数据和字符数据加密后由mcu发送至与其通信连接的网络服务器;mcu自带模数转换功能,比如ti的基于cortex-m4的mcu

步骤3:网络服务器中预存用户设置的预存声纹及预存字符,预存声纹及预存字符以数字信号方式存储于网络服务器,网络服务器解密声纹数据和字符数据并分别与预存声纹和预存字符匹配;

步骤4:声纹数据与预存声纹和字符数据与预存字符的匹配度均高于设定值时,网络服务器判断为识别成功;

步骤5:网络服务器发送代表成功识别的数据至mcu,mcu控制位于车锁上代表识别成功的指示灯点亮。

该方法中,将声音通过mcu转化为数据,然后将声纹和字符数据同步匹配,采用两个匹配的方式,有利于保证匹配声音识别的匹配程度,提高识别的有效性和准确性。

进一步,在上述步骤3中,预存声纹及预存字符为用户预先录入至网络服务器的声纹及字符,预存声纹录入至少五次并选取第一次及与其差别更大的两次,预存字符经用户查看并确认。该方法中将声纹进行多次匹配,采用多个声纹作为预存声纹,能够保证网络服务器对mcu录入的声纹的兼容性。

进一步,在步骤4中的字符数据与预存字符匹配过程中,字符数据首先进行网络匹配以建立各个字符的同音字库,然后将字符数据的各个字符与对应的同音字库进行相同匹配;成功匹配的字符数占预存字符数的百分比作为网络服务器判断的匹配度。在网络服务器中,将录入的声纹破译为字符时由于mcu的内置数据库可能不全的问题,可能无法完全破译为用于想要输入的正确的字符,因此进行同音字收集,然后与网络服务器待验证的字符进行匹配,提高容错率。

进一步,在步骤4中的预存声纹与声纹数据符匹配过程中,网络服务器将预存声纹与声纹数据在同一坐标系下分别模拟为时间-波动信号图,在该坐标系下分别选取预存声纹和声纹数据振幅大于设定值的区域进行先后重叠;在重叠区间内,若预存声纹与声纹数据的最大振幅差小于设定振幅差,则视为匹配成功;统计匹配成功的重叠区间占总重叠区间的百分比作为网络服务器的匹配度。该步骤中通过振幅较大的区域的重叠,然后能够方便的进行求差运算,进而简化匹配难度,同时简化匹配有效性和准确性。

进一步,三个预存声纹分别模拟为时间-波动信号图并置于三个坐标系中,声纹数据模拟为时间-波动信号图后分别放入该三个坐标系中,在该三个坐标系下分别选取预存声纹和声纹数据振幅大于设定值的区域进行先后重叠;在重叠区间内,若预存声纹与声纹数据的最大振幅差小于设定振幅差,则视为匹配成功;统计匹配成功的重叠区间占总重叠区间的百分比作为网络服务器的匹配度。该方法中通过三个坐标系的布置,能够提高声纹的参照目标,能够提高不同环境下输入的声纹在网络服务器中的匹配成功率。

进一步,步骤1中的声音传感器设于自行车手柄内,且声音传感器的电连接的柄部设有螺旋导线。通过螺旋线连接的方式,使声音传感器能够拿起和放下,从而方便于声音传感器对声纹的采集。

综上所述,由于采用了上述技术方案,本发明的有益效果是:

1.提高用户体验,本声纹的识别方法能够提高识别的准确性,能够避免不同环境下声纹度误差对声纹识别的影响。

2.提供一种全新的自行车控制指令输入方式,增加共享自行车的开锁渠道,提高共享自行车的实用性,避免单一渠道的开锁方式对共享自行车的使用。

具体实施方式

实施例1

本发明的共享自行车的声纹识别方法,包括以下步骤:

步骤1:用户向设置于自行车的车头处的声音传感器(比如麦克风)录入声纹,声音传感器将声纹转化为电信号并将该电信号传递mcu,mcu置于共享自行车的车锁内;mcu电连接外围电路(比如存储模块),mcu以常规方式连接外围电路以实现mcu对存储模块的读写操作。步骤1中的声音传感器设于自行车手柄内,且声音传感器的电连接的柄部设有螺旋导线。

步骤2:mcu将电信号识别为字符信号,然后将电信号和字符信号分别编码为声纹数据和字符数据,声纹数据和字符数据加密后由mcu发送至与其通信连接的网络服务器;字符信号是mcu根据用户输入的声纹在存储模块中查找到的对应字符,比如:用户口述“一、二、三”mcu根据录入的声纹匹配找到“一”、“二”“三”等几个字符,电信号以波纹线段存在,mcu将电信号和字符编码(若已经为数字型号则无需编码)为数字信号然后进行加密发生。

步骤3:网络服务器中预存用户设置的预存声纹及预存字符,预存声纹及预存字符以数字信号方式存储于网络服务器,网络服务器解密声纹数据和字符数据并分别与预存声纹和预存字符匹配;比如用户预设置的声纹片段和“一”、“二”“三”三个字符。

在该步骤3中,预存声纹及预存字符为用户预先录入至网络服务器的声纹及字符,预存声纹录入至少五次并选取第一次及与其差别更大的两次,预存字符经用户查看并确认。预存字符时,用户想网络服务器输入字符比如“一、二、三”并查看和确认。预存声纹时,用户通过与网络服务器通信连接的话筒输入5次声纹,网络服务器将录入的声纹进行图文展示,用户选取其中一个声纹作为第一次预存的声纹,并选取与该声纹差别较大的两个声纹,共3个。

步骤4:声纹数据与预存声纹和字符数据与预存字符的匹配度均高于设定值时,网络服务器判断为识别成功;

字符匹配方式:从mcu发送的字符数据首先进行网络匹配以建立各个字符的同音字库(比如:“一”匹配的同音字库包括“1”“亿”“壹”“一”等),然后将字符数据的各个字符与对应的同音字库进行相同匹配(比如:“一”能够在对应的同音字库在中查找到“一”,则匹配成功,否者匹配失败);成功匹配的字符数占预存字符数的百分比作为网络服务器判断的匹配度(比如“一、二、三”三个字符匹配成功2个,则匹配度为66.67%)。

声纹匹配方式1:网络服务器将预存声纹与声纹数据在同一坐标系下分别模拟为时间-波动信号图(比如:从三个预存声纹中任意选取一个与声纹数据分别模拟为以时间为x轴-波动大小为y轴的信号图),在该坐标系下分别选取预存声纹和声纹数据振幅大于设定值的区域进行先后重叠(比如选取振幅大于a的区域进行先后重叠,即“一、二、三”的声纹分别对应重叠);在重叠区间内,若预存声纹与声纹数据的最大振幅差小于设定振幅差(比如重叠区间内同一时间坐标上的最大振幅差为b,b小于设定的振幅差b’,这成功匹配),则视为匹配成功;统计匹配成功的重叠区间占总重叠区间的百分比作为网络服务器的匹配度(“一、二、三”各自对应的重叠区域进行匹配度计算)。

声纹匹配方式2:三个预存声纹分别模拟为时间-波动信号图并置于三个坐标系中,声纹数据模拟为时间-波动信号图后分别放入该三个坐标系中,在该三个坐标系下分别选取预存声纹和声纹数据振幅大于设定值的区域进行先后重叠;在重叠区间内,若预存声纹与声纹数据的最大振幅差小于设定振幅差,则视为匹配成功;统计匹配成功的重叠区间占总重叠区间的百分比作为网络服务器的匹配度。(该方式2中采用三个预存声纹进行同时比较,只要有符合条件的声纹则视为通过验证,比如录入的声纹“一”与对应的预存c1“一”、c2“一”、c3“一”三者之一匹配成功,则视为声纹“一”匹配成功,同理匹配“二”和“三”)。

步骤5:网络服务器发送代表成功识别的数据至mcu,mcu控制位于车锁上代表识别成功的指示灯点亮。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1