一种基于智能语音识别的物流填单方法与流程

文档序号：18295053发布日期：2019-07-31 09:13阅读：583来源：国知局

本发明涉及信息技术应用技术领域，具体涉及一种基于智能语音识别的物流填单方法。

背景技术：

语音识别技术目前已经从概念转向实际应用，从科研转向商业化，很大程度上语音识别技术会不断走进人们生活的方方面面，例如工业、医疗行业、通信行业、以及智能家电行业。在语音识别技术中，如何提高系统性能一直是重要内容。而其关键的因素在于训练数据的匹配和数据的丰富性。

这一过程需要人员长时间对语料的标注和分析进行累积和实践，目前正是大数据兴起的时候，大量的数据组成大规模的基础的语料，由此语音识别技术得到了很快的发展。其次当今互联网技术也在迅猛发展，像智能手机这样的移动终端系统的普及，使得开发人员可以获得更多的语料获取渠道，这也有利于语言模型和声学模型的构建。从而，语音识别技术变得更加的实用且普遍。

目前我国，大多数的互联网公司发现了语音识别技术的商业价值，开始投入较多的人力、物力和资金去做语音识别技术相关的应用产品，希望可以利用这一新颖的智能语音交互概念吸引消费者，增加市场需求，并且占取这一还未被完全发掘的市场。

例如，科大讯飞、搜狗语音助手、百度语音、腾讯语音都在培养各自的用户群体使用语音的习惯，而像天猫精灵和小米的智能音箱这样的产品更是让用户尝试并且喜欢上这种能够通过语音控制家电的智能生活。市面上的这些产品都是使用了最新的语音识别技术，可见语音识别技术的热门程度。再者，语音识别技术对于用户操作要求较低，不管用户的文化水平如何，语音识别系统都可以最大限度识别他们的需求。而对于习惯使用手动输入的用户，语音功能更高的效率和灵活性也会十分吸引他们，最终实现解放双手的目的。

就地址检索方法而言，目前按照国家邮政地址结构要求，虽然街道并不是乡级行政区划单位，但是实际情况中有些地区描述道路是在区县层级之上，所以会保存其作为二级地址中与乡镇同级的内容。而邮政地址中出现的道路一般是指在省级以下行政区划名之后的城际高速路、沟通城郊与城市主干道的快速路、城市主干道、次干道、支路或生活区道路中的一种。例如，“江苏省南京市栖霞区仙林大道”、“南京市玄武区玄武湖街道”等。以前并没有使用模糊查询或者关键字检索和配对的技术，而且限制于复杂的地址填写规则，所以出现了检索简称地名特别是当以简称地名的汉语拼音简写作为关键字检索地名时成功率很低的现象。

地址检索就目前国外研究的典型实例有很多，比如美国邮政地址标准。美国邮政定义的邮政地址标准是一个用户使用邮政的地址规范，本质上是面向用户的，因此该标准对于投递地址进行了非常详细的规定和解释，甚至是一些方位词比如东西南北都有其非常详细的定义。所以这种标准可以很大程度上保证地址的一致性，不会出现类似因为简写地址而带来的问题。

目前，快递物流填单过程中存在耗时耗力、错误率较高且不容易管理的问题。因而亟需发明一种依靠智能语音识别技术的能够极大地减少物流行业的物流填单时间并且错误率低的物流填单方法。

技术实现要素：

本发明的目的是提供一种物流填单过程耗时少并且错误率低的基于智能语音识别的物流填单方法。

为实现上述目的，本发明采用了如下技术方案：一种基于智能语音识别的物流填单方法，包括以下步骤：

步骤(1)：用户手工输入或语音输入用户信息；

步骤(2)：对用户输入的语音依据第三方库pyaudio库进行录制，得到用户信息wav格式的音频文件，再将用户信息wav格式的音频文件转化成文本文件；

步骤(3)：根据关键词对用户输入语音转化成的文本文件或手工输入的用户信息进行信息截取，截取出姓名、地址及电话；

步骤(4)：将截取的电话号码信息与数据库中的用户数据进行匹配，如果数据库中存在匹配的用户数据，则执行步骤(5)，如数据库中不存在匹配的用户数据，则输出截取的姓名、地址及电话，并跳转执行步骤(8)；

步骤(5)：将数据库中匹配的用户数据的地址和姓名输出，让用户进行确认是否是本次操作需要的准确地址及姓名的确认操作，如果正确则将数据填入物流单完成物流信息填写，如果不正确则执行步骤(6)；

步骤(6)：依据地址地名库按级联地址信息对步骤(3)中截取的地址进行分割操作，完成地名提取，然后将截取地址的前四级地名与数据库中的地址的前四级进行对比，若不完全相同，则输出截取的地址；若完全相同则询问用户是否直接提取数据库地址，若是则输出数据库地址，若否则输出截取的地址；

步骤(7)：依据拼音库将数据库中的姓名与步骤(3)中截取的姓名转化为拼音数组，并计算数据库中姓名的拼音字符串与截取姓名的拼音字符串之间的拼音字符串相似度，如拼音字符串相似度大于等于相似度临界值，则输出数据库中姓名，如拼音字符串相似度小于相似度临界值，则输出截取的姓名；

步骤(8)：将输出的姓名、地址及电话信息返回用户确认，如姓名有误，则将姓名中各个字的同音字显示并让用户选择，若地址有误，则询问用户提取的前四级地名是否正确，若前四级地名错误则从错误处上一级开始，显示对应有所有子地名供用户逐级选择，直至提取出正确的前四级地名，再让用户重新输入四级以下的精确地址；若前四级地名正确则让重新输入四级以下的精确地址；若姓名及地址均无误，则将数据填入物流单完成物流信息填写。

进一步地，前述的一种基于智能语音识别的物流填单方法，其中：在步骤(4)中，先判断截取的电话号码格式是否符合我国电话号码的固定格式，如符合再将截取的电话号码信息与数据库中的用户数据进行匹配。

进一步地，前述的一种基于智能语音识别的物流填单方法，其中：在步骤(6)中，对截取地址的分割操作具体包括以下步骤：

步骤(61)：依据国家地级标准按照四级地级，将截取的地址分割为省、市、区等几个部分；

步骤(62)：再对香港等部分特殊的地区名进行处理，找出特殊地名在地名库赋上对应的规范的地区名和地区编号，将地名中地区名的部分去除；

步骤(63)：对截取地址的各级地名在地址地名库中进行逐级搜索，若搜索不到，则报错并从错误处上一级开始，显示对应有所有子地名供用户逐级选择，直至提取出正确地名。

进一步地，前述的一种基于智能语音识别的物流填单方法，其中：在步骤(7)中，相似度临界值取0.9。

通过上述技术方案的实施，本发明的有益效果是：物流填单过程耗时少并且错误率低。

附图说明

图1为本发明所述的一种基于智能语音识别的物流填单方法的填单流程示意图。

图2为地址纠错示意图。

图3为历史信息辅助纠错示意图。

图4为姓名纠错示意图。

图5为地址处理流程图。

图6为姓名处理流程图。

图7为纠错流程图。

具体实施方式

为使发明的目的、技术方案及优点更加清楚，下面将结合附图对本系统的实施例进行详细描述。本实施例以本系统为前提进行实施，给出了详细实施方式和具体操作过程，但本发明的保护范围不限于下述实施例。

本方法考虑到用户可能在不同的情况下使用，所以提供两种输入方式：一是语音输入；二是手动输入；

假设，此时的用户的主要信息为，“发件人姓名是叶钧健，地址是江苏省南京市栖霞区南京邮电大学柳苑，号码是15722921968，收件人是王先生，地址是香港九龙城区某地，电话号码是12345678900”。

下面根据如图1所示的填单流程示意图进行物流填单，本方法中步骤(1)至步骤(3)是完成语音输入到智能识别的过程，步骤(4)至步骤(8)是对获得的信息进行匹配、纠错和确认的过程；

如图1所示，所述的一种基于智能语音识别的物流填单方法，包括以下步骤：

步骤(1)：用户手工输入或语音输入用户信息；

本步骤是提供用户两种操作模式，在本示例中用户叶先生先选择进行语音输入模式；此过程是在代码中设置一个变量为“fin”，当fin＝1时为手动输入模式，fin＝0时为语音输入模式；在本方法中，手动输入也是简单的数字输入形式，整个过程快速易操作；

步骤(2)：通过getword.get_word函数依据第三方库pyaudio库对用户输入的语音进行语音录制，得到用户信息wav格式的音频文件、time录制时间、测试interval时间间隔；

录制时，my_buf为主音频源，buf为测试音频源；time为控制录音时间，获取音频片段后将其添加入my_buf列表中；判断interval是否达到间隔时间；符合要求后，保存测试音频；

录制完成后再依据类似百度语音api的方法self.x.translation，将用户信息wav格式的音频文件转化成文本文件translation；用户语音输入的格式为“收件人姓名/名字为/是_____地址为/是_____电话(号码)/联系电话/手机号码为/是_____，发件人姓名/名字为/是_____地址为/是_____电话(号码)/联系电话/手机号码为/是_____。”；

音频转文字，参数filepath为wav音频地址；参数的类型有语音对象、文件格式、采样率、语种类型等；然后整合wav和translation实现录音和语音识别，将得到的音频文件转换为有效的文本；

步骤(3)：根据关键词对用户输入语音转化成的文本文件或手工输入的用户信息进行信息截取，截取出姓名、地址及电话，获得收、发件人的姓名、地址和电话号码，共六个字段；

本实施例中，用户得到了一组没有经过纠错的文本“收件人是叶军舰，地址是江苏省南京市七侠市南京邮电大学柳苑，号码是987654321，发件人是王先生，地址是香港九龙城另一个地方，号码是123456789”；

步骤(4)：先判断截取的电话号码格式是否符合我国电话号码的固定格式，如符合再将截取的电话号码信息与数据库中的用户数据进行匹配，如果数据库中存在匹配的用户数据，则执行步骤(5)，如数据库中不存在匹配的用户数据，则输出截取的姓名、地址及电话，并跳转执行步骤(8)；

步骤(6)：依据地址地名库按级联地址信息对步骤(3)中截取的地址进行分割操作，完成地名提取，然后将截取地址的前四级地名与数据库中的地址的前四级进行对比，若不完全相同，则输出截取的地址；若完全相同则询问用户是否直接提取数据库地址，若是则输出数据库地址，若否则输出截取的地址；地址处理流程如图5所示；

其中，对截取地址的分割操作具体包括以下步骤：

步骤(61)：依据国家地级标准按照四级地级，将截取的地址分割为省、市、区等几个部分；

步骤(62)：再对香港等部分特殊的省名进行处理，找出特殊地名在地名库赋上对应的规范的省名和省编号，将地名中省名的部分去除；

步骤(63)：对截取地址的各级地名在地址地名库中进行逐级搜索，若搜索不到，则报错并从错误处上一级开始，显示对应有所有子地名供用户逐级选择，直至提取出正确地名；

步骤(7)：通过拼音库pinyin2hanzi中的函数pinyin.get_pinyin将数据库中的姓名与步骤(3)中截取的姓名转化为拼音数组，并计算数据库中姓名的拼音字符串与截取姓名的拼音字符串之间的拼音字符串相似度，如拼音字符串相似度大于等于相似度临界值，则输出数据库中姓名，如拼音字符串相似度小于相似度临界值，则输出截取的姓名；在本实施例中，相似度临界值取0.9，容错率约为一个字母，主要针对前后鼻音和地方口音，比如“兰”和“南”的模糊检索；姓名处理流如图6所示；

本步骤是将姓名中各个字逐个还原为拼音，然后再将同音字显示出来供用户选择，类似于输入法；目前设置显示20个同音字，分两页，可以通过手动输入对应汉字的编号，从而选择正确的汉字；考虑到汉字同音字谐音字的存在，设计了两页共20个选项提供用户选择，通过简单的数字输入确定正确的汉字；

步骤(8)：将输出的姓名、地址及电话信息返回用户确认，如姓名有误，通过pinyin2hanzi库中的input.x_input函数将姓名中各个字的同音字显示并让用户选择，若地址有误，则询问用户提取的前四级地名是否正确，若前四级地名错误则从错误处上一级开始，显示对应有所有子地名供用户逐级选择，直至提取出正确的前四级地名，再让用户重新输入四级以下的精确地址；若前四级地名正确则让重新输入四级以下的精确地址；姓名与地址的纠错过程如图2、图3、图4、图7所示；若姓名及地址均无误，则将数据填入物流单完成物流信息填写；

本发明的优点是：物流填单过程耗时少并且错误率低。

以上所述的具体描述，对发明的目的、技术方案和有益效果进行了进一步详细说明，所应理解的是，以上所述仅为本发明的具体实施例而已，并不用于限定本发明的保护范围，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：薛景;叶钧健;林丹
技术所有人：南京邮电大学
我是此专利的发明人