基于语音信息的药品名称识别方法、装置及电子设备与流程

文档序号：43361625发布日期：2025-10-14 18:52阅读：46来源：国知局

本技术涉及语音识别，具体而言，涉及一种基于语音信息的药品名称识别方法、装置及电子设备。

背景技术：

1、在零售药店场景中，店员与顾客的沟通是药品销售与服务的重要环节。然而，现有技术中针对店员与顾客对话中关于药品名称的语音识别存在显著问题。由于药店环境中存在背景噪声以及药品名称的复杂性，导致语音识别系统难以准确识别顾客提及的药品名称。而且，药品名称的动态性，如季节性疾病相关药品、促销活动药品的变化，增加了识别难度，现有语音识别系统难以根据动态因素及时调整识别策略，不仅影响了顾客的购药体验，还可能导致错误的药品推荐，进而影响药店的服务质量和运营效率。

2、针对上述的问题，目前尚未提出有效的解决方案。

技术实现思路

1、本技术实施例提供了一种基于语音信息的药品名称识别方法、装置及电子设备，以至少解决现有零售药店场景下，针对店员与顾客对话中关于药品名称的语音识别结果准确率低的技术问题。

2、根据本技术实施例的一个方面，提供了一种基于语音信息的药品名称识别方法，包括：在获得用户授权的情况下，采集用户在目标门店的语音信息；根据目标门店销售的每种药品的相关信息，确定该药品对应的权重值，其中，每种药品的相关信息中至少包括：每种药品参与的促销活动、每种药品适应的季节性疾病、每种药品的历史识别频次以及每种药品的历史销售数据；根据每个药品对应的权重值确定目标门店对应的药品热词库，其中，药品热词库用于存储多个药品的名称信息；依据语音信息和热词声学模型，从药品热词库中确定用户期望识别的药品名称，其中，热词声学模型包括与各种人群在药店环境下录制的音频样本相对应的声学特征模板。

3、可选地，根据目标门店销售的每种药品的相关信息，确定该药品对应的权重值，包括：针对药品参与的促销活动、适应的季节性疾病、历史识别频次以及历史销售数据分别设置对应的权重以及权重系数；在初始权重的基础上，对促销活动、适应的季节性疾病、历史识别频次以及历史销售数据相对应的权重以及权重系数进行加权求和计算，得到药品对应的权重值，其中，每个药品对应的药品热词库的信息容量与该药品对应的权重值之间呈负相关的关系，且促销活动对应的权重和适应的季节性疾病对应的权重均随时间变化而动态更新。

4、可选地，依据语音信息和热词声学模型，从药品热词库中确定用户期望识别的药品名称，包括：将语音信息中的静音片段和噪声片段进行去除，保留语音信息中的人声片段作为目标语音信息；从目标语音信息中提取声音特征序列，其中，声音特征序列包括n个声音特征向量，每个声音特征向量与目标语音信息中的一个音频帧相对应，n为大于1的整数；针对声音特征序列设置滑动窗口，其中，滑动窗口的长度依据药品名称的发音时长所确定，滑动窗口的步长依据目标语音信息中的音频帧的帧长所确定；根据滑动窗口、声音特征序列以及热词声学模型，从药品热词库中确定用户期望识别的药品名称。

5、可选地，根据滑动窗口、声音特征序列以及热词声学模型，从药品热词库中确定用户期望识别的药品名称，包括：通过滑动窗口在声音特征序列上滑动多次，得到多个滑动窗口序列；检测每个滑动窗口序列中的特征与热词声学模型包括的每个声学特征模板的距离，并将检测到的最小距离作为该滑动窗口序列的窗口得分；将窗口得分小于预设阈值的滑动窗口序列作为目标窗口序列，并将目标窗口序列在目标语音信息中对应的音频片段作为候选热词片段；对相邻或者重叠的滑动窗口序列所对应的候选热词片段进行合并，得到目标候选音频片段；根据目标候选音频片段的起始时间戳、截止时间戳以及目标候选音频片段对应的匹配声学特征模板，从药品热词库中确定用户期望识别的药品名称，其中，目标候选音频片段对应的匹配声学特征模板为与目标候选音频片段距离最短的声学特征模板。

6、可选地，在依据语音信息和热词声学模型，从药品热词库中确定用户期望识别的药品名称之后，基于语音信息的药品名称识别方法还包括：检测识别的药品名称是否为混淆关系矩阵中的元素，其中，混淆关系矩阵至少包括：目标药品名称、目标药品名称的通用名称/别名、与目标药品名称语义相似度或者读音相似度大于预设阈值的词汇以及该词汇与目标药品名称的易混淆概率；在检测到识别的药品名称为混淆关系矩阵中的元素时，触发用户交互验证操作。

7、可选地，混淆关系矩阵的构建过程包括以下步骤：根据语音识别错误日志确定第一类易混淆药品名称、第二类易混淆药品名称以及第三类易混淆药品名称，其中，第一类易混淆药品名称存在发音相似度大于预设阈值的词汇，第二类易混淆药品名称属于在语音转文字的过程中出现转换错误的名称，第三类易混淆药品名称为存在别名的药品名称；基于第一类易混淆药品名称、第二类易混淆药品名称、第三类易混淆药品名称以及每类易混淆药品名称的易混淆原因，生成混淆关系矩阵。

8、可选地，热词声学模型的构建过程以下步骤：对采集的各种人群在药店环境下录制的音频样本进行音频预处理，并将完成音频预处理后的音频样本作为目标信号样本；对目标信号样本进行傅里叶变换，得到频谱图；计算频谱图的平方值，得到功率谱；将功率谱映射到梅尔刻度上，并且使用三角滤波器对功率谱进行滤波，得到梅尔频谱；对梅尔频谱取自然对数，压缩动态范围，得到目标梅尔频谱；对目标梅尔频谱进行离散余弦变换，且提取频域特征，同时保留前k个系数作为音频样本的目标声学特征，其中，k为大于或等于1的整数；根据音频样本的目标声学特征确定热词声学模型。

9、可选地，根据音频样本的目标声学特征确定热词声学模型，包括：根据音频样本的目标声学特征，从各种人群在药店环境下录制的所有音频样本中确定能量最大的样本作为目标热词对应的参考样本；将所有音频样本的音频帧数与参考样本进行对齐；将对齐后的所有音频样本在相同帧数上所对应的目标声学特征进行平均值计算，得到特征参考序列，其中，特征参考序列中的第i个元素为通过向量形式所表征的所有音频样本在第i帧上所对应的目标声学特征平均值，i为大于或等于1的整数；根据特征参考序列以及各种人群分别对应的用户画像，生成多个声学特征模板；依据生成的多个声学特征模板确定热词声学模型。

10、可选地，对采集的各种人群在药店环境下录制的音频样本进行音频预处理，包括：对音频样本先后进行预加重处理、分帧处理以及加窗处理；其中，预加重处理用于根据音频样本在第一采样点的采样值、第二采样点的采样值以及预加重系数，调整音频样本在第一采样点的采样值，第二采样点为第一采样点的上一个采样点，预加重处理用于补偿音频的高频衰减且抑制低频噪声。

11、可选地，基于语音信息的药品名称识别方法还包括：将语音信息的声音特征输入至方言检测模型中；通过方言检测模型判断用户的口音类型，并根据用户的口音类型调用与该口音类型相对应的解码器，其中，不同的解码器绑定的热词声学模型不同，每种口音类型对应的解码器所绑定的热词声学模型为基于该类口音的音频样本所构建的模型。

12、根据本技术实施例的另一方面，还提供了一种基于语音信息的药品名称识别装置，包括：采集单元，用于在获得用户授权的情况下，采集用户在目标门店的语音信息；第一处理单元，用于根据目标门店销售的每种药品的相关信息，确定该药品对应的权重值，其中，每种药品的相关信息中至少包括：每种药品参与的促销活动、每种药品适应的季节性疾病、每种药品的历史识别频次以及每种药品的历史销售数据；第二处理单元，用于根据每个药品对应的权重值确定目标门店对应的药品热词库，其中，药品热词库用于存储多个药品的名称信息；第三处理单元，用于依据语音信息和热词声学模型，从药品热词库中确定用户期望识别的药品名称，其中，热词声学模型包括与各种人群在药店环境下录制的音频样本相对应的声学特征模板。

13、根据本技术实施例的另一方面，还提供了一种电子设备，包括一个或多个处理器和存储器，存储器用于存储一个或多个程序，其中，当一个或多个程序被一个或多个处理器执行时，使得一个或多个处理器执行上述的基于语音信息的药品名称识别方法。

14、根据本技术实施例的另一方面，还提供了一种计算机可读存储介质，计算机可读存储介质中存储有计算机程序，其中，在计算机程序运行时，使得计算机可读存储介质所在设备执行上述的基于语音信息的药品名称识别方法。

15、在本技术实施例中，首先在获得用户授权的情况下，采集用户在目标门店的语音信息，并根据目标门店销售的每种药品的相关信息，确定该药品对应的权重值，其中，每种药品的相关信息中至少包括：每种药品参与的促销活动、每种药品适应的季节性疾病、每种药品的历史识别频次以及每种药品的历史销售数据，然后，根据每个药品对应的权重值确定目标门店对应的药品热词库，其中，药品热词库用于存储多个药品的名称信息，依据语音信息和热词声学模型，从药品热词库中确定用户期望识别的药品名称，其中，热词声学模型包括与各种人群在药店环境下录制的音频样本相对应的声学特征模板。

16、由上述内容可知，通过采集用户在目标门店的语音信息，并结合药品的促销活动、季节性疾病适应性、历史识别频次和历史销售数据等多维度信息动态计算药品权重值，构建了针对性强的药品热词库，使得系统能够根据门店的实际销售情况和季节变化动态调整热词库内容，优先识别高权重药品，从而大幅提高了识别效率和准确性。例如，在流感季节，与流感相关的药品权重会提高，语音识别系统能够更精准地识别顾客询问的抗流感药品名称。

17、而且，热词声学模型利用在药店环境下录制的音频样本构建，能够有效适应药店特有的背景噪声和语音环境，通过提取音频样本的声学特征模板，能够更精准地匹配用户语音中的药品名称，尤其是在复杂环境下，减少了误识别的概率。例如，对于容易混淆的药品名称，通过声学特征模板的精准匹配，语音识别系统能够更准确地识别顾客的实际需求，进而解决了现有零售药店场景下，针对店员与顾客对话中关于药品名称的语音识别结果准确率低的技术问题。

当前第1页1 2

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：王雪峰,黄炳耀,赵捷,朱欣桐,王树达
技术所有人：北京壹佰壹拾壹医药科技有限公司
我是此专利的发明人

网友询问留言留言:0条

还没有人留言评论。精彩留言会获得点赞！

文明留言，给您点赞！