一种软件设计宠物行为语言的人工智能翻译系统的制作方法

文档序号：21547886发布日期：2020-07-17 18:00阅读：571来源：国知局

本发明涉及一种软件设计宠物行为语言的人工智能翻译系统，属于软件设计与人工智能领域。

背景技术：

针对于宠物行为学的研究，国内研究比国外起步晚，在近几年才兴起对宠物行为学的研究，目前国内外暂无宠物行为语言的人工智能研究专利及软件产品，因此本发明具有独创性。宠物行为语言的研究对加深饲主与宠物沟通、宠物训导和宠物心理疾病的诊疗有非常重要的意义，但是宠物行为语言在国内发展晚，理论基础差且学习难度高，限制了宠物行为语言在生活和临床诊疗中的应用；其次，计算机技术应用于宠物行为语言的难度高，传统人工智能技术需要大量的视频数据库或图片数据库，难以实现智能化，因此国内外暂无相关宠物行为语言的人工智能软件。

目前国内外常用的神经网络识别方法为2dcnn，这种方法主要是通过将视频图像切割成为每一帧，再通过使用2dcnn神经网络识别模型时间维度下逐帧之间的运动信息交互，缺点为识别准确率偏低；而卷积神经网络技术的卷积层，是通过选择连续三个帧的图像进行卷积识别，替代2dcnn的单帧图像识别，保证每一个特征map上都能够与前一帧图像进行相连，来捕捉运动信息，准确率更高且技术更加先进。

由于音频信号存在高维度高冗余的特点，传统的音频情绪识别模型中，往往需要通过先对音频进行音频处理，根据实际需要提取较为合适的音频特征，最后通过建模将所提取到的特征进行模型训练，最终达到音频情绪识别的效果，因此识别准确率低、效率低且难以实践应用。

技术实现要素：

基于背景技术中提到的上述问题，为解决上述问题，本发明拟提供一种宠物行为语言的人工智能翻译系统。

本发明的系统是通过以下步骤实现的：

本发明的工作流程为，第一步，用户根据软件操作提示，用手机等智能终端对犬、猫的动作行为拍一段限定时间的视频或从相册选择已拍好的犬、猫行为视频，提交上传；第二步，数据处理端主要有三个作用，顺序不分先后。首先，对上传视频首先按已设定的各个器官特异点，提取眼睛、鼻子、耳朵、舌头、牙齿、嘴唇和尾巴的器官变化表征；其次，按已设定的运动特异点，提取坐、站立、卧倒、匍匐和跳跃变化的表征；最后，按已设定的声音特异点，提取音高、音调、时间长短和时间频率变化的表征；第三步，分类处理端为固化模型数据库，包含器官固化模型数据库、运动模型数据库和声音模型数据库三个数据库。数据处理端采集的器官、行为和声音表征按已设定的特异点分析方法，匹配分类处理端的固化模型数据库，得到固化模型数据库运算结果，其结果为片段式信息；第四步，信息汇总端对上述大量的片段式信息做信息汇总，删除突兀、矛盾的词汇，建立词汇逻辑来造句表达，得到处理结果；第五步，结果表达端根据用户注册提供的宠物年龄和性别信息，相应匹配男声、女生和童声模式，对信息汇总端的处理结果进行声音表达。

本发明的技术方案为：

一种软件设计宠物行为语言的人工智能翻译系统，由以下部分组成：用户端、数据处理端、分类处理端、信息汇总端和结果表达端

所述的用户端为：以手机app、微信公众号、电脑软件形式设置在手机、平板电脑、电脑等智能终端，使用者根据软件注册操作提示，相应提供宠物的种类、年龄、性别生活环境和生活习惯相关信息；用户根据软件操作提示，用手机等智能终端对犬、猫的动作行为拍一段限定时间的视频或从相册选择已拍好的犬、猫行为视频，提交上传作为提供视频信息。

所述的数据处理端：通过卷积神经网络的人工智能技术、主成成分分析法、深度信念神经网络和softmax函数进行分类处理，提取器官、声音和行为的变化表征，建立生成分析对象，具体体现在：对上传视频首先按已设定的各个器官特异点，提取头部、眼睛、鼻子、耳朵、舌头、牙齿、嘴唇和尾巴的器官变化表征；对上传视频按已设定的运动特异点，提取坐、站立、卧倒、匍匐和跳跃变化的表征；对上传视频按已设定的声音特异点，提取音高、音调、时间长短和时间频率变化的表征。

所述的分类处理端于：分类处理端为固化模型数据库，包含器官固化模型数据库、运动模型数据库和声音模型数据库三个数据库，由数据处理端采集的器官、行为和声音表征作为处理对象，按已设定的特异点分析方法，匹配分类处理端的固化模型数据库，得到固化模型数据库运算结果。

所述的信息汇总端：信息汇总端是语言处理模块，对分类处理端的固化模型数据库运算结果进行再处理，建立逻辑关系通过造句表达，固化模型数据库运算的结果为片段式信息，信息汇总端对上述大量的片段式信息做信息汇总，删除突兀、矛盾的词汇，建立词汇逻辑来造句表达，得到处理结果。

所述的结果表达端：结果表达端是语言匹配模块，根据用户端注册提供的宠物种类、年龄和性别信息，相应匹配男声、女生和童声模式，对信息汇总端的处理结果进行声音表达。

所述器官固化模型数据库、运动模型数据库的建立是通过卷积神经网络的人工智能技术实现；所述声音模型数据库过使用主成成分分析法(pca)、深度信念神经网络(dbn)和softmax函数进行分类处理技术来实现。

所述的卷积神经网络的人工智能技术，具体为以下步骤：

(1)首先，卷积神经网络的卷积层通过选择连续三个帧的图像进行卷积图像识别，保证每一个特征map上都能够与前一帧图像进行相连，来捕捉运动信息；

(2)再将大小为60*40的视频连续帧图像作为输入层元素，同时使用大小为7*7*3的3d卷积和进行卷积操作，其中7*7标识空间维度，7*7*3表示使用三个空间维度的卷积核；

(3)再采用23*2maxpooling操作对数据进行降采样；

(4)最后，再通过7*6*3的卷积核进行卷积操作，通过卷积操作值已经很小，故采用7*4大小的降采样层对数据进行操作，最终识别出动物的各个已设定的器官行为和动作行为。

所述的主成成分分析法、深度信念神经网络和softmax函数，具体由以下步骤组成

(1)通过短时平均能量算法进行音频识别；

(2)再次，通过主成成分分析法(pca)对音频数据的冗余噪音，进行进行降维处理；

(3)处理后的音频数据输入到深度信念神经网络(dbn)中进行训练；

(4)最后通过softmax函数分类处理技术，对音频数据进行运算，从而完成音频情绪识别。

所述可分析的宠物种类包括犬类和猫。

本发明的有益效果为：

(1)本发明采用国内外首例采用卷积神经网络技术来实现宠物行为语言智能化分析的系统，卷积神经网络技术的卷积层，通过选择连续三个帧的图像进行卷积识别，替代2dcnn的单帧图像识别，保证每一个特征map上都能够与前一帧图像进行相连，来捕捉运动信息，准确率更高且技术更加先进。

(2)本发明采用国内外首例采用主成成分分析法(pca)、深度信念神经网络(dbn)和softmax函数进行分类处理技术来实现宠物行为语言智能化分析的系统，逐步自主学习信号特征，不断优化调整参数的特性，能够实现更加高效、更为准确的声音识别。

(3)宠物行为语言实现人工智能化主要有如下五大益处：一、宠物行为学的学习难度高，多数人难以学习和应用，实现智能化可降低应用门槛；二、用户仅需用手机、平板、电脑等多媒体终端对宠物录制视频，即可快速识别宠物行为所表达的语言，实现了真正的人工智能；三、有助于饲主与宠物的交流，帮助饲主即时了解宠物的表达，增进双方的感情；四、有助于宠物训导工作，可帮助大部分普通饲主对宠物进行训导，降低宠物训导的门槛难度；五、由于国内针对宠物心理诊疗较少，且准确率低，智能化有助于宠物医生对宠物心理诊疗和宠物非正向行为纠正诊疗，有助于提高心理疾病诊断准确率。

附图说明

图1为本发明系统的运行示意图。

图2为本发明的数据处理端的运行示意图。

图3为本发明的分类处理端的原理示意图。

图4为卷积神经网络技术的原理路线图

图5为声音提取处理的技术路线图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

实施例1

用户用手机等智能终端对犬的行为动作拍一段15s的视频，提交上传；数据处理端对上传视频按已设定的各个器官特异点，提取出现变化的器官表征，例：出现眯眼、舔口鼻、趴耳、半躺姿势、抓挠身体；分类处理端的固化模型数据库，得出以上变化的片段式信息，如眯眼对应矛盾、逃避、认错；舔口鼻对应矛盾、展示爱意、认错、有压力；趴耳对应恐惧、害怕、服从；半躺对应舒适、邀请、服从、矛盾；抓挠身体对应矛盾、服从、示弱等；信息汇总端对上述片段式信息做删减及信息匹配，删除其中突兀、矛盾的词汇，保留相似或相同词汇，建立感情逻辑来造句表达含义，得出犬内心矛盾感情，想认错示弱又怕被惩罚；结果表达端对上述表达含义信息匹配相应声音模式进行声音表达，如“主人，我知道错了求你原谅我吧，但不能打我喔！”。

实施例2

用户用手机等智能终端对猫的行为动作拍一段15s的视频，提交上传；数据处理端提取出现变化的器官变化表征，例：趴耳、直视、尾巴竖立、站立姿势、腰背拱起、声音尖锐；分类处理端的固化模型数据库匹配变化的器官表征，如趴耳对应恐惧、害怕、服从；直视对应警觉、统治等；尾巴竖立代表统治、攻击、威胁等；声音尖锐代表害怕、威胁、恐吓、期待、疼痛等，得出以上变化的片段式信息；信息汇总端对上述片段式信息做删减及信息匹配，建立感情逻辑来造句表达含义，得出猫内心害怕的感情，行为表达为声音做恐吓，想威胁性攻击；结果表达端对上述表达含义信息匹配相应声音模式进行声音表达，如“我很害怕，不要过来！再过来我就咬你啦！”。

用户通过用手机等智能终端上传对犬或猫的行为动作的视频，通过本宠物行为语言的人工智能翻译系统的翻译处理，获得相应的富有感情的声音表达和文字信息，用户可毫无障碍的理解宠物向主人的表达，消除用户与宠物的交流障碍。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：周升志;邓海英;邓海琳;黄解珠;段凯文;廖健慧;江振东
技术所有人：周升志
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。