关于面向公共信息传播的音频水印算法

科普小知识2022-12-17 11:17:52

...

作者：张晓明禹召阳李文治

论文摘要：提出了一种基于小波分解和倒谱技术的音频数字水印算法，该算法通过对原始音频进行小波多级分解，从中选取低频系数进行倒谱变换。通过统计均值的计算和调整方法设计，完成了水印的嵌入。实验结果表明该算法能够有效地抵抗a／d和d／a攻击，误码率为o，隐藏容量较大。同时，本算法还能够抵抗一定的amr攻击，为手机音频的安全传播和管理提供了新的前景。

论文关键词：音频水印；小波变换；倒谱；模／数转换；amr格式

0引言

在电视广播、交通台和音乐会等公共信息传播领域，音频的版权管理和安全传输都非常重要。如果采用数字水印技术，则需要水印算法能够抵抗a／d和d／a转换。目前，具有这种变换的类型可以划分为三种。第种是基于电缆传输方式，以电话线传播和直通电缆连接为典型，所受干扰小。电话线方式是公用信道，能够传播很远，传输秘密水印的载体可以是话音或音乐等类型；而直通电缆方式一般在一个办公实验的局部环境中。第二种是基于广播方式，通过广播媒体或专用频道进行传播。WWW.11665.cOM第三种是基于空气直接传播方式，会遭遇各种干扰，通常只能近距离设计。由于音频水印的远程传输和提取具有广泛的应用价值，这些音频传播水印技术在国外已经受到了极大重视并有所成果。在空气传播水印信息方面，德国的steinebach等人…开展了最早的研究，通过设定5—4oocm的多个不同间距，同时使用了4种不同的麦克风，研究了5种音频类型的水印技术，在5～180cm的间距普遍获得了良好的提取效果。随后，日本的achibana等人口研究将水印实时地隐藏到公共环境如音乐演奏会的音乐之中，能够成功地在一个30s音乐片段内隐藏64b的消息，测试的空气传播距离为3m。在电话网络传播方面，加拿大的chen等人开展了模拟电话通道的隐藏，在误码率小于0．001时，其数据带宽达到了265bps。日本的modegi等人设计了一套非接触水印提取方案，通过手机来广播或转存水印音频，然后，通过计算机将秘密从转存的音频文件提取出来。隐藏带宽达到61．5bps，提取率高于90％。但是，这几种研究结果并没有对算法做详细描述。在直通电缆传播方面，项世军等人采用了三段能量比值方法，嵌人的是一串32b信息，虽然提取效果比较好，但由于实验容量太小，实用性不够，且对同步技术有较高的要求；王让定等人采用改进的量化方法、马冀平等人”采用了dct方法，嵌入的都是小图片，但提取效果一般，仅可辨认。雷贽等人在短波广播含水印音频算法方面取得了可喜的进展，通过多种同步方案和算法设计，使水印提取的模拟和实测过程都达到了较好的效果，但实验容量很小。此外，由守杰等人设计了一种相似度计算方法，由于是非盲提取，不适于广播通信领域。作者利用小分段的直方图特性，开展了抗a／d转换的音频水印初步研究，在每段开头总能获得正确提取，但在每段的后续隐藏效果不佳，还需要做许多改进。

可见，在面向公共音频传播方面，如何既能提高隐藏效果又能增大容量，仍然是音频水印算法要解决的一个难题。本文通过数据特性分析，采用倒谱技术和小波分解方法，成功地解决了问题，且能够抵抗一定的手机彩铃amr攻击，为实用化提供了重要基础。

1数据特性描述

音频信号经过具有a／d和d／a转换的传输过程时，必然要涉及到以下问题：

1)音频信号要经历传输过程中的外加干扰，包括50hz的工频电信号，因此，需要选择大于50hz的音频频率信号；

2)因声卡特性不同，音频转换过程不一定具有线性模型；

3)传输中录制的音量往往与播放的音量不一致，这要求水印算法能够抵抗音量的大范围变化；

4)传输中录制开始时刻可能早于也可能晚于播放时刻而且结束时刻也不一定一致，所以水印隐藏的起始位置需要没置标志；

5)转换过程具有一定的滤波特点，可滤除较高频率信号。

1．1音频频率范围选择

对照音频频率响应特性图可以发现，在低频部分的阈值比2khz～4khz的要高得多，不容易察觉；尤其是1khz以下部分，其不可感知性要好得多。文献[4]的实验也表明，音频数据通过a／d和d／a转换后，其低频范围700hz以下的损失非常小。可见，选择在频率为(50，700)范围内的音频数据，用于信息隐藏非常有利。

1．2倒谱系数的选取方法

倒谱变换在音频水印中已经具有了较强的健壮性，能够抵抗噪声、重采样、低通滤波、重量化和音频格式转换等常见攻击。倒谱变换后的数据特征表现为：倒谱系数在中间部分的差异很小，而在两端的变化很大。

图1是对音频进行7级小波分解后，选取5～7级高频数据部分进行倒谱变换情形。在进行统计处理时，如果让全部数据参与，则计算结果在隐藏前后有明显变化；如果不考虑两侧若干个大数据，仅以中间大部分数据参与运算，则计算结果容易保持在一个稳定范围内。

进一步，如果将计算的均值移除，即相当于此时的均值为0。然后，在0的上下两边产生一个偏差，如2，以分别隐藏比特信息“1”和“0”。则在提取时，只需要判断所求均值是否大于0，就可以求得水印比特。这种方法，称之为“数据分离调整”技术。

2算法分析与设计

2．1隐藏算法流程设计

将原始音频分段时，段数至少是水印比特数。然后，对每段数据进行小波分解，取其低频系数进行倒谱变换，采用前述的数据分离调整技术，以实现水印比特嵌入。之后，先后重组倒谱系数和小波系数，获得含有水印信息的音频段，从而构造为新的音频。该算法流程如图2所示。

为了增强可靠性，对水印信息先做纠错处理，采用bch编码方法。算法的主要工作是寻找合理的参数优化配置，使隐藏效果达到最优。参数主要有：小波分解级数、分段的数据帧长度、数据帧的间距、上下分离的阈值将数据帧的间距设置为数据帧长度的倍数，最大为1，最小为0。期间选择多个系数，结果发现都可以成功实现隐藏。

2．2水印嵌入算法设计

1)水印信息处理。

音频载体分段数至少应该大于，才能满足隐藏要求。

假设每段长为，该段经过小波变换的级分解后，各级小波系数长度分别为：

取低频系数部分，使之频率范围位于(50，l000)内，则需要构造一个组合的低频小波系数集合。以8khz音频为例，实施7级小波分解后，所选择的低频系数部分为：

p的长度非常重要。如果太小了，对隐藏不利；反之，就需要更长的音频载体。所以，音频分段与小波分解具有密切的关系。

3)倒谱变换。

复倒谱变换对于信号序列的均值大于或等于0时，其逆变换可逆；否则不可逆。为此，需要计算指定段信号的均值，若均值小于0则取反。然后对所有指定段进行复倒谱变换。

4)倒谱系数的选取。

去掉首尾波动很大的部分，而选择中间平稳的部分嵌入水印。假设两端各去掉l0个数据，则实际用于隐藏水印的倒谱系数长度为：

5)去均值化处理。

计算剩余部分的均值，然后用每一个倒谱系数减去该均值，得到倒谱系数的相对值。

6)嵌入水印。

给定一个阈值t，采用整体上下拉开的思路，对以上的相对倒谱系数进行修改，得到最终的倒谱系数，从而实现水印的嵌入。

7)重构音频信号。

对嵌入水印的段重构后，实施复倒谱反变换。然后进行小波重构，从而得到含有水印比特的音频段。将所有这些段重构，就获得了含全部水印信息的音频。

2．3水印提取

水印提取过程的前半部分与嵌入过程是一样。在提取出比特序列后，再经过bch解码处理，从而得到隐藏的水印比特序列。水印提取的流程如图3所示。

对获得的倒谱系数去两侧数据，计算剩下的倒谱系数平均值。按照以下规则进行隐藏信息的提取：

在信息传播方面．针对a／d和d／a传播采用『_直通电缆的传输方式，在单机上用电缆将音频输入输出口相连。传输线为音频线1．8m和延长线1．8m，共3．6m。此外，针对手机彩铃传播采用了amr方式。隐藏水印设计了三种方案，如图4所示。

小容量的便于amr处理，大容量的便于实用化。

仿真工具为matlab7．2．使用windowsmediapldrver播放器播放音频载体，使用cooleditpro工具进行录音、编辑和攻击处理。

基本参数选择为：选用harr小波进行7级小波分解后，按照式(4)选取低频系数区域，所得频段在77．5～5o0hz范围。式(7)中的为l0，式(9)中t值的合适范围在0．005～0．025中实验选取。式(3)中的取值为3200非常合适，此时，实际参与计算均值的数据为155。

3．2音频载体的影响

音频载体选择了三种，如表1所示，

其采样频率8khz，样本精度为16b，单声道，段的长度为3200。音频转换为8khz的目的是为了今后在电话网上的隐蔽传输，并可以转化为amr文件，传输到手机中，成为手机彩铃的版权管理目的。

经过a／d和d／a传播后，4×4水印提取的误码情况如表1所示。可见，载体的选用非常重要；同时，从音频质量上考虑，选用较小的t值更有利于保证信噪比。所以，以下的实验采用的是“奥运主题歌”。

3．3阈值参数的合理计算

选择了水印“北”进行比较测试，如图5所示。结果表明，在t值为0．016时，误码率为0，效果最佳。为此，后续实验也采用该值。

3．4大容量a／d和d／a传输

采用图像水印“北京”进行大容量测试，音频载体选用“奥运主题歌”。图6为经过a／d和d／a转换前后的数据均值计算对比情况．共有bch编码的555个数据。按照式(10)

提取后，能够完全正确提取，且误码率为0。进一步，将本文算法的实验效果与已有属于盲提取的研究结果相比较，如表2所示。

可见，本文算法虽然带宽小，但水印能够正确提取，而且嵌入容量较大。由于实验中使用了8khz的音频载体，能够广泛应用于语音传输和手机彩铃等场合，所以在电话网络广播方面的实用性强。

3．5抗amr转换

随着手机彩铃的普遍使用，彩铃的安全传播和管理将成为新的问题。本算法在这方面也开展了新的尝试，将水印隐藏在彩铃中，可以起到版权保护或秘密信息传播的作用。

目前手机录音放音格式多数是amr格式，要求算法能够抵抗amr转换攻击。在上述的音频载体中成功完成水印嵌入后，需要将采样精度l6b、采样频率为8000的波形音频转换为amr格式，就可以存入手机中使用或发送给他人。提取时，先将amr文件转换为wav格式，然后再提取水印信息。

amr转换工具为miks0ftmobiieamrconvener，可以进行wave与amr两种格式的相互转换。实验中使用的水印信息为图4(a)水印，采用bch(31，16，3)，闽值设置为0．0195时，b脒达到0，取得了满意的效果。

4结语

鉴于音频信号的低频特征，并综合应用倒谱技术和小波多级分解方法，成功地实现了抗a／d和d／a转换的音频水印算法，误码率为0，不需要同步码；而且，隐藏信息具有较大的容量，具备了一定的实用性；同时，算法还能够抵抗一定的amr攻击，既能实现手机彩铃的安全传播和管理，又能在线录制手机通信中的含水印音频，具有较好的应用前景。今后，需要在amr文件中隐藏大容量水印信息，使之更具有实用性。

上一篇：旅行婚纱摄影服务项目问卷调查

下一篇：大学生眼镜购买行为调查问卷