基于IOS交互式语音播报系统的制作方法

文档序号:14953218发布日期:2018-07-17 23:01阅读:344来源:国知局

本发明使用objective-c技术,特别涉及ios平台上的声音和语音识别技术。



背景技术:

录音软件是iphone和ipad移动设备必备的工具,给工作、学习和生活带来了很大的便利;ios系统自带的录音机软件是一款操作简单、高质量的软件,具有高音质的录音文件输出和良好的用户体验;但是,系统自带的录音软件的功能也相对较少;同样苹果商店的其他录音软件一般只是实现录音、播放、文件的存储和文件的管理;有的功能强的录音软件还具有录音文件的编辑、网络分享等功能。



技术实现要素:

系统应用核心技术:

1.声音处理包:在ios应用开发中,播放音频主要采用audiotoolbox.framework和avfoundation.framework;前者主要用于短音频的播放,通常用于一些特效音频播放,对于这类音频不需要进行进度、循环等控制;后者常用于播放一些较长的音频,对于这些音频的播放通常需要进行精确的控制;所以,本系统录音机功能的实现使用的是avfoundation框架;

录音机应用程序使用了avfoundation框架中的avaudiorecorder实现录音功能;使用框架中的avaudioplayer来实现播放功能;avaudioplayer可以看成一个播放器,它支持多种音频格式,而且能够进行进度、音量、播放速度等控制;avaudioplayer一次只能播放一个音频文件,本系统中多个音频的播放是通过创建多个播放器对象来完成;要用这两个类,需要添加头文件:#import<avfoundation/avfoundation.h>;

2.语音识别包:关于语音识别功能的核心技术可以采用第三方开发包;诸如此类的语音识别包有很多,本系统采用的是讯飞语音识别开发包;使用这sdk需要做如下事情:

1)到讯飞官方网站的开发者专区(http://open.voicecloud.cn/developer.php)先注册一个开发者账号;

2)登陆之后到自己的个人中心创建一个应用,填写好相关信息,然后等待审核通过;

3)应用审核通过后,选择对应平台的sdk下载;

4)解压下载的压缩包,从包中选择部分framework添加到工程中,具体在buildingphaseslinkbinarywithlibraries中设置;如果使用了离线识别,需要增加libc++.dylib。

系统功能设计:

1.录音功能:主要功能是当用户按下“开始录音”按钮时,系统设置录音的参数并开始录音;当松开按钮,则录音结束,并将以当前的系统时间命名录音文件后再进行本地化存储,同时显示到列表视图中供用户查看和编辑;录制时,有进度条控件显示音频的大小;

2.播放功能:主要功能是当用户点击“开始播放”按钮时,开始按列表视图中音频文件的顺序播放;另外,还具有暂停播放和停止播放功能;

3.语音交互功能:该功能的实现关键问题是系统播放完一个音频后,下一个音频什么时候播放;有两种解决方案:一种方案是播放一个音频后,等待一段时间,等待的时间是音频文件的播放时间乘以一个系数,该系数根据用户写字的速度快慢自行设定;另一种方案是系统暂停播放听写作业,录音机播放一个预先录制好“写好了”的音频文件咨询用户,当用户听写完,说“好了”、“下一个”或“写完了”等关键词时,再继续播放下一个音频文件;当用户说“再来一遍”、“重报”或“重复”等关键词时,系统就再重播一遍刚才的音频;第一种方案适合课堂上的作业听写,不会因为个人个别词的听写慢而等待;而第二种方案采用人机交互,适合个人的作业听写,更加人性化;

4.文件管理:主要功能是向左滑动删除表视图中的音频文件,同样也真正意义上删除沙盒中的文件;也可以点击“全选”和“全部删除”按钮删除所有文件。



技术特征:

技术总结
基于IOS交互式语音播报系统,设计并实现了基于IOS平台交互式语音录播系统;本系统核心技术采用声音处理包和语音识别包,系统功能分为录音功能、播放功能、语音交换功能和文件管理四个方面设计;本系统具有录音、播放、文件管理、语音识别和语音交互功能。

技术研发人员:不公告发明人
受保护的技术使用者:长沙湘佩网络技术有限公司
技术研发日:2017.01.07
技术公布日:2018.07.17
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1