一种基于数字家庭的地理信息的可听化表达方法

文档序号：2823639阅读：201来源：国知局

专利名称：一种基于数字家庭的地理信息的可听化表达方法
技术领域：
本发明涉及数字家庭技术领域，具体涉及一种基于数字家庭的地理信息的可听化表达方法。
背景技术：
地理信息系统(Geographic Information System，简称GIS)作为获取、整理、分析和管理地理空间数据的重要工具、技术和学科，近年来得到了广泛关注和迅猛发展。由于信息技术的发展，数字时代的来临，到今天已经逐渐成为一门相当成熟的技术，并且得到了极广泛的应用。尤其是近些年，GIS更以其强大的地理信息空间分析功能，在GPS及路径优化中发挥着越来越重要的作用。GIS地理信息系统是以地理空间数据库为基础，在软硬件的支持下，运用系统工程和信息科学的理论，科学管理和综合分析具有空间内涵的地理数据，以提供管理、决策、以及应用服务等所需信息的技术系统。可视化应用(Visualization Application)以数字家庭应用为基础，建立城市、区域、或大型建筑工程、著名风景名胜区的可视化模型，与数字电视应用后台结合，实现实景模型浏览实时浏览地理环境、地理信息查询以及购物等一些互动应用服务功能。可听化研究起源于20世纪50年代，21世纪初因计算机信息技术的发展成为研究热点。狭义的可听化是指用非语音信号表达信息，它立足于计算机信息论，侧重于科学数据听觉表达；广义的可听化是为了信息交流或数据解释，将某科学领域的数据联系转化为以听觉信号表现的感知联系，用人类可辨析的声音信号表达信息。可听化有利于人们独立获取或帮助理解从视觉通道获取的信息，是一门涉及认知、声学、艺术、工程学等方面的交叉学科。20世纪90年代可听化开始应用于地理信息表达，除可为有视觉障碍的用户提供表达替代方式外，还广泛应用于地理信息系统和多媒体图集中的音视频和文本注记解说、3维虚拟仿真、车辆语音导航、少儿地理教育等诸多系统和产品中。在对此方法的研究和实践过程中，本发明的发明人发现虽然可视化一直是表达空间信息强有力的工具，网络通信、多媒体以及三维图像等高新科技的融入更使地理信息可视化表达异彩纷呈。但是，海量数据呈现于方寸屏幕间，造成了视觉显示繁杂、地图视觉载负量巨增等矛盾。计算机可听化技术的发展，使听觉获取数据成为可能，并为地理信息提供了新的表达方式。在现实世界中，人类视听觉相得益彰，听觉也是获取信息的重要途径，重要性仅次于视觉。有声信息时刻潜移默化被接收，人类多通道的感知避免了信息单通道过载和信息获取单一化。听觉具有本能或自发感知的独特功效，一些可听化的研究领域正在证明或已经证明听觉通道在某些领域的应用中优于其他通道，特别是在重要的信息突变状态以及视觉通道负荷过重等场合。可听化独立表达或辅助视觉表达，对地理信息传递、表达及认知具有重大意义和实践价值，在解决视觉感知过载，多重界面、大屏幕显示以及信息突发、临界表达等问题方面尤为重要。于是本发明的发明人决定使用一种基于数字家庭的地理信息的可视可听化方法，结合可视可听的优点来设计。
发明内容
本发明提供一种基于数字家庭的地理信息的可听化方法，能够独立表达或辅助视觉表达，对地理信息传递、表达及认知具有重大意义和实践价值，在解决视觉感知过载，多重界面、大屏幕显示以及信息突发、临界表达等问题方面尤为重要，这样使可视可听达到平衡。本发明实施例提供了一种基于数字家庭的地理信息的可听化表达方法，包括步骤1 信息的获取，即进行声源的确定；步骤2 信息的处理，将各种信息作规范化处理，形成后续处理的应用数据，即特征数据；步骤3 信息映射；允许各种输入信号找到相应的映射规则，达到可听化的目的，根据特征数据的不同采用不同的映射模型得到参数化声音；步骤4 声音合成，形成参数化声音；步骤5:声音的播放。所述声音的合成采用的方法分直接合成和间接合成，其中直接合成参照的是傅立叶分析，间接合成则是收到ChernofT模型的影响。所述声音的播放通过Window API、DirectSouncU DirectSound3D中的一种或者多种来实现。由于本发明实施例采用一种基于数字家庭的地理信息的可听化表达，听觉具有本能或自发感知的独特功效。因此多通道的感知避免了信息单通道过载和信息获取单一化，计算机等高新技术提供的良好平台为可听化表达提供了新契机。它的独立表达或辅助表达，在信息突变状态以及视觉通道负荷过重等场合优于其他通道，其表达在地理信息的语音阅读、氛围营造、沉浸表达等方面表现优异。

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。图1为本发明实施例中的地理信息可视化和可听化表达实现流程图；图2是本发明实施例中的地理信息可听化表达实现流程图；图3是本发明实施例中的地理信息的可听化应用分类示意图；图4是本发明实施例中的离散无结构映射示意图；图5是本发明实施例中的结构化离散信息映射示意图；图6是本发明实施例中的高维点数据直接映射法示意图；图7是本发明实施例中的高维点数据间接映射法示意图。
具体实施例方式本发明实施例提供一种基于数字家庭的地理信息的可听化表达方法，能为各单位之间的电子政务信息提供共享。以下分别进行详细说明。
本发明实施例提供一种数字家庭的地理信息的可听化方法，能够独立表达或辅助视觉表达，对地理信息传递、表达及认知具有重大意义和实践价值，在解决视觉感知过载，多重界面、大屏幕显示以及信息突发、临界表达等问题方面尤为重要。本发明实施例还提供相应地理信息可听化表达实现系统。以下分别进行详细说明。完整的地理信息的可视可听流程图如图1所示，其中完整的地理信息的可听表达流程如图2所示。地理数据通过可听化映射出符合人类听觉认知的声音，由听觉感知通道被聆听者所获取。地理信息可听化应用广泛、前景广阔，对此综述如图3所示。一个完整的可听化表达体系包括信息提取、信息处理、声音映射、声音合成和声音播放等5部分。从地理专题数据中提取所需数据后，由等级数值过滤干扰信息并提取特征数据，然后通过数据到声音映射输出声音参数，最后参数合成声音，输出采样值。
地理信息的可听表达各步骤具体如下步骤1 信息的获取(声源的确定)声源的确定即声音数据的存储及与空间实体的对应关系的确定。声音数据一般是以文件或资源的方式存储的，原则上不同的声音对象分别对应不同的空间实体，因此数据获取模块是采集各种数据源的数据，这些数据可以是离散的，也可以是连续的，可以是一维的也可以是高维的。步骤2:信息的处理经过步骤1我们得到了各种原始数据，由于各种原始数据的结构不尽相同，我们需要将各种信息作规范化处理，形成我们可以做后续处理的的应用数据，即特征数据。步骤3:信息映射在可听化应用最重要的是有关的映射模型，所谓映射模型如图一所示，是允许各种输入信号无结构离散的，结构离散的、图形的图象的。他们都可以在这个模型中找到相应的映射规则，达到可听化的目的。输出的则是各种参数化的声音这些声音可以是连续的，也可以是离散的，即它们的分辨颗粒度可以改变。不同的输入数据集，其映射的规则不相同。其最重要的检验标准就是，要使声音信息表达的能力得到最大发挥。一般映射模型如下所述无结构离散化信息的映射是各种映射中最简单的。相当于点对点的映射，例如事件A对应为声音a，事件B对应与声音η。诸如此类，最简单也是最常见的就是windows系统中经常出现的伴随警告信息出现的警告声音。听标是这一类映射的典型例子。这种映射最大的要求就是要是这种一对一的映射尽量自然符合人们交互的习惯。图4所示的是离散无结构信息的映射模型。对于结构化离散信息的映射，首先必须指定一套对应于结构化信息的映射规则，当任意一个属于该信息集的信息输入时，可以按照这种规则自动的生成参数化的可听信号。耳标就是明显的例子。这种映射方法应该在符合人们交互习惯的同时，具备更强的自适应能力，即如果结构发生了一定的变化，应该可以根据规则生成器生成新的映射规则。例如目录增加了一层，那么构成耳标的映射规则应该自动发生改变，构造出新的映射规则，同时又要对用户产生较小的影响。图5所示的是结构化离散信息映射模型。一维连续信息的表达在可听化中是最简单的，因为声音本身就可以看作幅度随时间的变化，因此可以直接将连续信号的值直接映射到声音的幅度或者频率上。一维连续数据从数据集本质上来讲是多维点信号的一种特例。那么多维点数据的可听化可以使用我们在参数化声音章中所采用的加法合成的直接映射法、也可以使用参照Chernoff模型的间接映射法，选择合适的中间参数来控制标准的声音以达到映射的目的。图6、图7分别为多维点数据的直接映射模型和间接映射模型。从步骤2中根据特征数据的不同采用不同的映射模型得到参数化声音。步骤4:声音合成经过步骤3之后形成的参数化声音，声音的合成采用的方法分直接合成和间接合成。直接合成参照的是傅立叶分析，间接合成则是收到ChernofT模型的影响。直接合成利用傅立叶变换的谱线合成声音相当于使用正弦信号线性合成原来的时域波形，比如我们通过奇次整数频率来合成原来的声音信号的话，可以使用原信号频率的奇次整数倍正弦信号来合成原来的方波信号。使用傅立叶分析声音信号将产生一个频谱，在物理世界的任意一个声音信号都可以使用正弦曲线的组合来表示，但是组成这种组合的正弦曲线的数目可能趋向无穷大，我们需要在精度和计算量上作一个折中。如果一个数字采样信号的长度为N个采样点，需要使用N/2个正弦曲线来表示这个这个信号。声音信号按照他们的不同频谱分为分为和声，非和声和噪声，和声从频谱来看，他们的谱线只包括基频的整数倍，它给人强烈的频率的感觉，非和声的频谱，给人比较微弱的频率的感觉。很多打击乐器例如鼓、锣、和钟产生的都是非和声，噪声在频谱上表现没有明显的谱线，在听觉上给人的感觉就是没有固定的音高 (频率)某些打击乐器和辅音都是这些噪音的代表。真实世界的声音都是由这三种声音按照不同的组成比例构成的。如果我们要合成一个声音的话，可以模拟上面的过程，也可以使用不同的振荡器发出不同的频率〔当然频率可以固定也可以在一定范围内改动)，再使用幅度控制设备对幅度进行控制，最后将这些声音合成(以零坐标为原点进行相加)起来。间接合成在科学计算可视化中映射多维点数据时，人们采用的另一种方法是Chernoff脸法[石教英1995]，Chernoff设计了一个可以代表12个信息分量的脸，将各维数据映射到控制脸部不同部分器官的形状的变形量，那么由于在物体分类时一些数据集聚效果将映射到Chernoff脸的几种表情，人们就此可以判断物体的模式，以达到对数据特征本能和自发的感知过程的目的。与此类同，如果我们可以设计一个Chernoff的标准声。将多维点数据分别映射到该声音的频率、幅度、时长、位置、谐波成分。那么同样根据调制后的Chernoff 声我们也可以作类似分类的判决。为了利用以往人们对音乐的知识能够在以后的可听化设计中发挥作用，因为用户的听觉模型是以用户的音乐模型作为基础的[方志刚1997]，我们采用了 A4(440Hz)作为标准音。步骤5:声音的播放1)用 Window API在Window API的支援下，播放小段wAV档的最佳方案就是使用PlaySound ()函数。 PlaySoundO的第1个限制是wAV档案的大小；第2个限制是混音的功能，它每次只能播放一个声音对象；第3个限制是无法体现位置感和空间感，只有音量的大小感觉。
2)用 DirectSound在DirectSound中，基本操作单元是声音缓冲区对象，一种声音对应一个从缓冲区声音对象。所有播放的从缓冲区声音对象都在主缓冲区中进行混音后播放。 DectSoundBuffer对象允许控制从缓冲区对象的3个属性频率、容量和均衡。其函数主要有，SetFrequencyO设置频率，SetPanO设置均衡值，SetVolume ()设置音量。利用 DirectSound配合双声道播放方式，可以实现距离感、左右方向感、音量的变化、声源的运动及混音的效果。根据声源距听者的距离远近而调整音量；通过衰减一边声道的音量或改变均衡值来表现声源的左右方向性；通过增减运动声源的频率来产生多普勒效果等。3)使用 DirectSound3D DirectSound3D使播放的声音从立体声扩展到了 3D声音，放置声源的空间坐标系就是Direct3D所用的坐标系。它主要包括DirectSound3Dbuf f er8以及与此相关的 DirectSound3Dlistener8 两个对象。DirectSound3Dbuffer8 用于控制单个声源的3D属性，即从缓冲区声音对象。其函数主要包括SetPositionO设置声源的位置、SetConeOrientationO设置音锥的方向、SetConeAngles ()设置音锥的内外角度、SetConeOutsideVolume ()设置音锥的外部音量、SetMaxDistance ()设置最大距离值、SetMinDistanceO设置最小距离值以及SetVelocity ()设置声源的速度等。 DirectS0imd3Dlistener8用于放置虚拟的听者，管理3D声音场景的整体属性。其函数主要有SetPositionO设置听者位置、SetOrientation()设置听者方向、SetVelocity ()设置听者速度因子、SetDistanceFactor ()设置听者距离因子以及SetDopplerFactorO设置听者多普勒效果因子等。真正实现DirectSoimd3D，必须配合多音箱的环绕声系统。需要说明的是，上述装置和系统内的各单元之间的信息交互、执行过程等内容，由于与本发明方法实施例基于同一构思，具体内容可参见本发明方法实施例中的叙述，此处不再赘述。本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，该程序可以存储于一计算机可读存储介质中，存储介质可以包括只读存储器(ROM，Read Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁盘或光盘等。以上对本发明实施例所提供的一种数字家庭的地理信息的可视可听化方法，进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式
及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。
权利要求
一种基于数字家庭的地理信息的可听化表达方法，其特征在于，包括步骤1信息的获取，即进行声源的确定；步骤2信息的处理，将各种信息作规范化处理，形成后续处理的应用数据，即特征数据；步骤3信息映射；允许各种输入信号找到相应的映射规则，达到可听化的目的，根据特征数据的不同采用不同的映射模型得到参数化声音；步骤4声音合成，形成参数化声音；步骤5声音的播放。
2.如权利要求1所述的方法，其特征在于，所述声音的合成采用的方法分直接合成和间接合成，其中直接合成参照的是傅立叶分析，间接合成则是收到Chemoff模型的影响。
3.如权利要求1或者2所述的方法，其特征在于，所述声音的播放通过WindowAPI、 DirectSound, DirectSound3D中的一种或者多种来实现。
全文摘要
本发明实施例公开了一种基于数字家庭的地理信息的可听化表达方法，包括步骤1信息的获取，即进行声源的确定；步骤2信息的处理，将各种信息作规范化处理，形成后续处理的应用数据，即特征数据；步骤3信息映射；允许各种输入信号找到相应的映射规则，达到可听化的目的，根据特征数据的不同采用不同的映射模型得到参数化声音；步骤4声音合成，形成参数化声音；步骤5声音的播放。通过实施本发明，在信息突变状态以及视觉通道负荷过重等场合优于其他通道，其表达在地理信息的语音阅读、氛围营造、沉浸表达等方面表现优异。
文档编号G10L19/00GK101872613SQ201010200898
公开日2010年10月27日申请日期2010年6月12日优先权日2010年6月12日
发明者姜军毅, 殷伟, 王栋, 罗笑南, 蔡琼申请人:广东中大讯通软件科技有限公司;东莞市中珩电子科技有限公司;中山大学

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：罗笑南;蔡琼;王栋;殷伟;姜军毅
技术所有人：广东中大讯通软件科技有限公司;东莞市中珩电子科技有限公司;中山大学
我是此专利的发明人

上一篇：边带残差信号生成方法及装置的制作方法
上一篇：演奏训练装置的制作方法