可记录语音信息的大容量二维条码及阅读器的制作方法

文档序号：6597349阅读：282来源：国知局

专利名称：可记录语音信息的大容量二维条码及阅读器的制作方法
技术领域：
本发明属于条形码技术领域，具体涉及一种可记录语音信息的二维条码及阅读器。
背景技术：
高密度条码技术作为一种新型的自动识别与数据纪录、采集技术，目前在全球范围内受到重视，这种自动识别技术有着其他识别技术无法替代的优势，在出版、交通运输、商贸、制造业、医疗卫生、仓储等领域有广阔应用前景。目前应用面最广的二维码PDF417w由美国Symbol (讯宝)公司研制。Maxi Code[2]是由美国伟林(Welch Allyn)公司推出的，最多可容纳3832个数字或3067个字母字符或917个字节的数据。而另有一家美国公司研制的Data Matrix[3]码主要用于电子行业小零件的标识，如Intel的奔腾处理器的背面就印刷着这种码字。 QR Codew码是由日本Denso公司于1994年9月研制的一种矩阵二维条形码符号，它除具有一维条形码以及其他二维条形码所具有的信息容量大，可靠性高外，还具有可标识汉字及图像多种文字信息、保密防伪性强等优点。相比于其他的二维条形码例如PDF417等等，QR码有着信息容量更大特点，最多可以放入1817个汉字、7089个数字、4200个英文字母。但所有上述二维码两项关键缺点，使得它们的应用领域仍受到较大限制，一是容
量仍然不足，无法承载包括声音信息在内的大容量信息；二是码字格式一旦确定，其承载的
信息量也固定，不可根据记录信息容量的不同而自由调节码字所占的纸张面积大小。 [l]AM， 1994， Uniform Symbology Specification :PDF417. [2]AIM，1996， Internation Symbology Specification :Maxicode. [3]AIM，1997， Internation Symbology Specification :Data Matrix. [4]AM， 1997， Internation Symbology Specification :QR-Code.

发明内容
本发明的目的在于提供一种容量大，并可记录语音信息的二维条码及阅读器。
本发明提供的二维条码，是一种可在普通纸张上黑白两色印刷、可记载声音信息、
容量可根据声音信息量大小自由变化的全新二维条码，其信息承载密度比目前流行的二维
条码高出几十倍；条码不定长，信息容量可变可追加，适应信息的多样性和今后信息种类扩展性；条码的识别以动态方式进行，手持阅读器快速划扫条码即可完成阅读；条码具有较强的纠错和防伪能力，并在此基础上形成一个"会说话的图书和报刊"这样一个新领域，使用者年龄层次从学龄前幼儿到视力有障碍的老人，对条码的阅读具有较大的方向随意性，即只要把条码扫描遍历过一次，不管方向，不管次序，均能确保正常还原出精确声音。
二维条码的基本结构根据图1和图2所示，本发明二维条码的结构描述如下
1)本二维条码是一种组合形式的二维条码，由一定量图形矩阵码(相当于普通二维条码)以一定方式组合构成(见图1所示)； —条条码由可变数量的图形矩阵码组成，宽度固定为四个图形矩阵码，长度为不确定个数的图形矩阵码(取决于承载信息量的大小)，构成矩形形状，通常情况下为一个细长条形状；本二维条码阅读过程为手持阅读器沿长度方向运动并连续识读过程，在宽度方向上处同一列的四个图形矩阵码两两间隔重复，以解决扫描过程中因阅读器手持运动而造成的扫描窗口的晃动；二维条码在长度上图形矩阵码个数不受限止，条码的信息承载总量与长度方向上的图形矩阵码个数有关。每个图形矩阵码的数据中都记录有其唯一的标识，所以长的条码可分拆成若干分段，分散印刷在纸上。在识读时，只要阅读器遍历过所有条码分段，就可正确解读出条码上的所有信息，而且不必在乎对这些条码分段扫描的顺序；
2)每个图形矩阵码由三个部分组成，第一部分为分布于每个图形矩阵码四角的"大黑圆点"，称为定位点；第二部分为分布于宽度方向上相邻定位点之间的呈一定等间隔排列的一列"小黑圆点"，称为校正点；第三部分为图形矩阵码中间区域，称为信息区，信息区中每个小黑点为一个二进制信息存放位置，在实际条码中该位置出现小黑点表示"l"，不出现小黑点表示"0"(见图2所示)；定位点用于图形矩阵码的识别及初步定位，圆形定位点由于从任何角度来看其形状是一致的，与传统的二维条形编码如QR码的方形定位点相比，在抗倾斜、变形、噪声、照度不匀及快速识别等方面具有优势；每一对位处同一列并相邻的两个定位点被识别并初步定位后，通过识读它们之间的校正点可实现定位点中心的精确确定；每一个图形矩阵码的信息区内容包含标识信息和数据信息，二进制信息存放位置的排列呈一定分布，存放的信息经过掩模处理，避免存放"1"的小黑点过度聚集形成干扰定位点识别的大面积黑色区域。
矩阵码数据格式信息区由标识区和数据区两部分构成，标识区存放标识信息，数据区存放用户数据；标识区由2个18位长BCH码构成，对称分布于数据区起始位置和末尾位置，以便在未确定图形矩阵码的方向情况下识读系统也能第一时间了解当前图形矩阵码的标识，决定该图形矩阵码是否已阅读过及放弃重复阅读；图形矩阵码的标识目前暂定为8位二进制数，从零开始编号，意味最多容许连续256个图形矩阵码；每个图形矩阵码的数据区能容纳656 二进位即82字节数据，由于图形矩阵码必然成对出现(宽度方向相邻两个图形矩阵码)，标识为偶数-奇数的连续两个图形矩阵码称为相邻矩阵码，其数据区一共可容纳164字节数据，采用Reed-Solomon纠错编码RS (164， 120)实现纠错和校验。
条码块间纠错当条码中部分图形矩阵码因为污损或"划扫"过程太快没有正确识别时，条码块间纠错技术将帮助恢复缺损的图形矩阵码。具体为每12个相邻图形矩阵码配备4个相邻图形矩阵码构成校验数据块，最多可恢复4个缺损的相邻矩阵码；设k个源数据块B。， Bp， Bk—"编码生成4个同样大小的冗余数据块C。， Q， C2，
Q，块间校验方程如下
'丑o十十… 巩—
=C0
50十a1.5,①…十or*-1 .d = C,< ￡0 a2 .JB! … a2(") , = C250 a4 .札①… a4(") .d = C3 这里，a是有限域GF(28)的一个本原元。编码后得到的k+4个数据块B。，，Bk—p C。， Q， C2， C3，可以证明，该方程的系数矩阵的任意4列均可构成一个4X4阶非奇异方阵，可实现对任意4个差错(或丢失)数据块的恢复，类似也可实现3个、2个、1个差错(或
丢失)数据块的恢复。
掩模由于图形矩阵码的信息区数据存放位置已呈一定的稀疏排列(见附图2)，掩模处理可相对简单，可采用的模式为对数据区内容按字节与四个掩模字之一进行异或运算，避免出现大面积的黑色区域，并减少大面积白色区域的出现可能；四个可选的掩模字为二进制00000000、10101010、01010101、11111111，选择的依
据是最小化黑色和白色4X4区域，可采用的方案是一块矩阵码中出现一个黑色4X4区域罚分20、一个白色4X4区域罚分4、一个4X4区域3个黑点罚分l，最后根据一个矩阵码中累计的罚分最小化来选择最佳的掩模字，掩模字的标识(2位二进制码)也放在标识区中，译码时根据该标识恢复出数据区内容。
数据压縮 1)数据压縮可选择低码率的语音压縮方案，如ITU G. 723. 1的ACELP、 LPC10、MELP、CELP4. 8等； 2)语音数据的开头应标识内容类型、压縮方案、数据长度等信息，以便译码时采取
相应数据处理过程。条码识别过程 1)预处理计算图像帧像素的灰阶统计直方图，确定二值化阈值，在图像帧的四
个角区域进行这个过程，因为当条码出现在图像帧中时，必然覆盖至少一个角区域； 2)定位点识别按连续黑色区域的形状面积确定出图像帧中的所有定位点，初步
确定定位点中心坐标，并根据位置关系来判断它们之间是否构成图形矩阵码； 3)定位点校正将每个定位点中心坐标分别上下左右移动1至3个像素，分别推
算与之相关联的校正点坐标，然后评估与图像帧中实际校正点的契合度选择最佳的定位点
中心； 4)逆透视变换通过每个图形矩阵码的四个定位点坐标确定出每一个数据位的坐标； 5)扫描数据位按图形矩阵码中每一个数据位所处的位置扫描信息区所有数据位，包括标识区和数据区，标识区内容确定该部分数据是否已阅读过、采用的掩模字及在整个语音数据中所处位置，数据区内容为实际语音数据的一部分； 6)扫描完成后，相邻矩阵码的内容分别进行RS(164，120)译码，形成一系列数据块； 7)扫描数据块序列，判定当中是否有缺失，如无缺失进入下一步，如连续16个相邻矩阵码(包括4个为快间纠错而形成的相邻矩阵码)中缺失不超过4个，则可以恢复相应内容，否则识别失败； 8)解压縮语音信息的第一帧内容，启动播放，在播放的同时进行后续帧的解压縮。
阅读器硬件结构附图3是条码手持阅读器的一套硬件实现方案，其结构包括CMOS图像传感器、照明电路、处理机及声音输出、电源五个部分；其中，CMOS图像传感器用于图像采集；处理机用于执行条码识别软件(该识别软件包括前述识别过程的所有步骤)；照明电路用于配合CMOS图像传感器的工作产生驱动高亮度发光二极管的脉冲电流，为CMOS图像传感器提供脉冲式照明；采用SRAM用来存放CMOS图像传感器所采集的图像，采用双缓冲结构可存放两帧图像，与CMOS图像传感器的数据传输，采用DMA方式，因此图像采集与前一帧图像识别可并发进行；声音输出采用P丽技术经低通滤波和功放电路实现；电源部分用于将电池电源转换成两组电源，分别提供给数字电路和模拟电路。
有益效果本发明将改变传统的图书出版模式，形成一个纸介质可记录声音的新局面，从而
提供了一个新的内容载体的平台，开辟一个全新的市场和需求空间。产品可应用在儿童教
育、娱乐、语言教学、旅游文化及盲人读物等各领域，会带动社会文化事业的发展。此产品对于图书的印刷出版并不增加材料和其他成本，没有能耗和环境问题，属
于"绿色出版物"。在儿童初级教育方面和语言教学的辅助手段上将有广泛的应用；出版各类成人外语学习有声读物，帮助读者提高单词记忆和口语学习的质量及效率；作为盲人读物的一种新的形式；贺卡及明信片等卡片类产品上的应用。介绍名胜古迹和旅行服务的中外文有声读物可应用于旅游业；可以进一步开发在商品和各种单证的防伪标识上的应用。

图1为本发明的二维条码的基本结构图示。
图2为本发明的二维条码中，图形矩阵码的结构图示。
图3为本发明的二维条码的阅读器硬件结构图示。
图4为本发明的二维条码生成及使用过程图示。
具体实施例方式
录音声音信息并记录成Wave格式或PCM格式声音文件文件；编码程序将声音文件压縮成编码，再根据条形码格式形成条形码文件；
条形码文件为BMP黑白二值图像，宽度为0. 8cm，长度根据声音长短、采用的压縮方法的不同而不同，一般在1cm至10cm之间，如声音压縮采用码率为4. 8K的CELP方法，大约每1秒时间的声音对应1cm的条码长度；将条形码文件即黑白二值BMP图像排版入图书中，印成书本；
手持条形码阅读器"划扫"书本中条形码，还原声音。
条码手持阅读器的一个实现方案如下处理机选用EPSON公司的微处理器SIC33209，为一个普通的60腿z时钟频率的 RISC处理机；处理机中的条码识别软件根据识别过程进行编制。图像传感选用HYUNDAI公司的HB7121B CMOS图像传感器；照明采用四个高亮度发光二极管，通过升压电路以脉冲照明方式工作；声音输出采用P丽技术经四阶低通滤波进入功放电路实现；电源部分由两节5 号电池通过电源转换芯片形成两组3. 3V电源，一组供数字电路部分，另一组供CMOS图像传感器的模拟电路部分及功放电路，以减少数字电路对模拟电路的干扰。
该实现系统可达到每秒扫描50帧以上图像、识别200个以上矩阵码，用户可以随意以极快速度扫描，并且不管方向、不管次序，只要遍历到大部分矩阵码块，即可还原出原始声音信号。
权利要求
一种可记录语音信息的二维条码，其特征在于该二维条码由可变数量的图形矩阵码组成，宽度固定为四个图形矩阵码，长度为不确定个数的图形矩阵码，构成矩形形状，为一个细长条形状；在宽度方向上处同一列的四个图形矩阵码两两间隔重复；其中，每个图形矩阵码由三个部分组成，第一部分为分布于每个图形矩阵码四角的“大黑圆点”，称为定位点；第二部分为分布于宽度方向上相邻定位点之间的呈一定等间隔排列的一列“小黑圆点”，称为校正点；第三部分为图形矩阵码中间区域，称为信息区，信息区中每个小黑点为一个二进制信息存放位置，在实际条码中该位置出现小黑点表示“1”，不出现小黑点表示“0”；每一个图形矩阵码的信息区内容包含标识信息和数据信息，存放的信息经过掩模处理，避免存放“1”的小黑点过度聚集形成干扰定位点识别的大面积黑色区域。
2. 根据权利要求1所述的可记录语音信息的二维条码，其特征在于所述信息区由标识区和数据区两部分构成，标识区存放标识信息，数据区存放用户数据；标识区由2个18位长BCH码构成，对称分布于数据区起始位置和末尾位置；数据区能容纳656 二进位即82字节数据，采用Reed-Solomon纠错编码RS(164， 120)实现纠错和校验。
3. 根据权利要求2所述的可记录语音信息的二维条码，其特征在于采用如下条码块间纠错每12个相邻图形矩阵码配备4个相邻图形矩阵码构成校验数据块，最多可恢复4个缺损的相邻矩阵码；设k个源数据块B。， B"， Bk—n编码生成4个同样大小的冗余数据块C。， C" C2， C3，块间校验方程如下AA ①…① d =C050①a1-牟①…①= C,.50 or2.5! …①a,')= C250十or4 -苹 … a4(") .d = C3这里，a是有限域GF(28)的一个本原元。
4. 根据权利要求2所述的可记录语音信息的二维条码，其特征在于所述的掩模的处理方式是对数据区内容按字节与四个掩模字之一进行异或运算，四个可选的掩模字为二进制00000000 、10101010 、01010101 、11111111;掩模字的标识也放在标识区中，译码时根据该标识恢复出数据区内容。
5. 根据权利要求2所述的可记录语音信息的二维条码，其特征在于条码的数据压縮采用低码率的语音压縮方案，语音数据的开头标有内容类型、压縮方案、数据长度信息，以便译码时采用相应数据处理过程。
6. —种权利要求1 5之一所述可记录语音信息的二维条码的阅读器，其特征在于其结构包括CM0S图像传感器、照明电路、处理机及声音输出、电源五个部分；其中，CMOS图像传感器用于图像采集；处理机用于执行条码识别软件；照明电路用于配合CM0S图像传感器的工作产生驱动高亮度发光二极管的脉冲电流，为CMOS图像传感器提供脉冲式照明；采用SRAM用来存放CM0S图像传感器所采集的图像，采用双缓冲结构可存放两帧图像，与CMOS图像传感器的数据传输，采用DMA方式；声音输出采用P丽技术经低通滤波和功放电路实现；电源部分用于将电池电源转换成两组电源，分别提供给数字电路和模拟电路。
7. —种权利要求6所述可记录语音信息的二维条码的阅读器，其特征在于所述处理机中用于二维条码识别的软件，包括内容如下1) 预处理计算图像帧像素的灰阶统计直方图，—确定二值化阈值，在图像帧的四个角区域进行这个过程；2) 定位点识别按连续黑色区域的形状面积确定出图像帧中的所有定位点，初步确定定位点中心坐标，并根据位置关系来判断它们之间是否构成图形矩阵码；3) 定位点校正将每个定位点中心坐标分别上下左右移动1至3个像素，分别推算与之相关联的校正点坐标，然后评估与图像帧中实际校正点的契合度选择最佳的定位点中心；4) 逆透视变换通过每个图形矩阵码的四个定位点坐标确定出每一个数据位的坐标；5) 扫描数据位按图形矩阵码中每一个数据位所处的位置扫描信息区所有数据位，包括标识区和数据区，标识区内容确定该部分数据是否已阅读过、采用的掩模字及在整个语音数据中所处位置，数据区内容为实际语音数据的一部分；6) 扫描完成后，相邻矩阵码的内容分别进行RS(164，120)译码，形成一系列数据块；7) 扫描数据块序列，判定当中是否有缺失，如无缺失进入下一步，如连续16个相邻矩阵码中缺失不超过4个，则可以恢复相应内容，否则识别失败；8) 解压縮语音信息的第一帧内容，启动播放，在播放的同时进行后续帧的解压縮。
全文摘要
本发明属于条形码技术领域，具体为一种可记录语音信息的大容量二维条码及阅读器。该二维条码由可变数量的图形矩阵码组成，宽度固定为四个图形矩阵，长度为不确定个数的图形矩阵码，构成矩形形状；每个图形矩阵码由定位点、矫正点和信息区构成，信息区包括存放标识信息的标识区和存放用户数据的数据区。本发明的条码可在普通纸张上黑白两色印刷、可记载声音信息、容量可根据声音信息的容量在几十千字节范围自由变化。基于本发明，可形成一种新型声音信息存取技术及有声读物技术，使得有声读物技术能完全以纸介质方式实现，在成本、体积、能耗、环保等方面具有明显意义。
文档编号G06K19/06GK101751591SQ20101002279
公开日2010年6月23日申请日期2010年1月14日优先权日2010年1月14日
发明者吴百锋, 夏拥政申请人:复旦大学;上海万息智能网络科技有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：吴百锋;夏拥政
技术所有人：复旦大学;上海万息智能网络科技有限公司
我是此专利的发明人

上一篇：一种检测脑血管健康状况的仪器的制作方法
上一篇：计算机软件系统实现云构件部署和配置的平台系统及方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。