7.4. Методы маскирования ЦВЗ
7.4. Методы маскирования ЦВЗ
К методам, использующим не только особенности строения аудиосигналов, но и системы слуха человека относится также метод маскирования сигнала. Маскированием называется эффект, при котором слабое, но слышимое звуковое колебание становится неслышимым при наличии другого более громкого (сигнал маскирования). Эффект маскирования зависит от спектральных и временных характеристик маскируемого сигнала и сигнала маскирования.
Можно говорить о маскировании по частоте и маскировании по времени. Первое заключается в следующем: если два сигнала одновременно находятся в ограниченной частотной области, то более слабый сигнал становится неслышимым на фоне более сильного. Порог маскирования зависит от частоты, уровня подавления сигнала и тональной или шумовой характеристик маскируемого сигнала и сигнала маскирования. Легче широкополосным шумовым сигналом маскировать тональное колебание, чем наоборот. Кроме того, более высокочастотные колебания маскировать легче. Маскирование по времени определяет следующий эффект: более слабый сигнал становится не слышимым за 5 — 20 мс до включения колебания маскирования и становится слышимым через 50 — 200 мс после его выключения.
Воспользовавшись информацией о маскировании по частоте для системы слуха человека, мы можем определить спектральные характеристики внедряемой информации. Обработка импульсных сигналов, таких как звук кастаньет, может привести к образованию слышимого пре-эхо. Для устранения этого эффекта при внедрении информации его также необходимо учитывать.
Рассмотрим конкретный метод внедрения ЦВЗ (псевдослучайной последовательности) с использованием эффекта маскирования, предложенный в работе [3]. Каждый аудиосигнал помечается уникальным кодовым словом. Для того, чтобы использовать маскирующие характеристики системы слуха человека по частоте необходимо соотнести ПСП с порогом маскирования сигнала, при этом необходимо также учесть эффект временного маскирования. Невозможно внести большое количество информации в сигнал малой мощности, в противном случае внедренная информация может стать слышимой. Это происходит из-за того, что преобразование Фурье фиксированной длины не может сразу обладать хорошей локализацией в частотной и временной областях. Если время длительности сигнала высокой мощности больше длительности окна, то его энергия распространяется по всем частотам. Следовательно, необходимо взвешивать ЦВЗ с энергией сигнала.
Для внедрения ЦВЗ необходимо вычислить порог маскирования сигнала. Порог маскирования определяется для сегментов аудиосигнала длиной 512 отсчетов, взвешенных при помощи окна Хэмминга, с 50 % перекрытием текущих блоков. Он аппроксимируется идеальным фильтром 10-го порядка, M(w), с использованием критерия наименьших квадратов. ПСП фильтруется с применением фильтра M(w), чтобы обеспечить то, что спектральная плотность мощности ЦВЗ была ниже порога маскирования.
ЦВЗ, находящийся ниже порога маскирования в частотной области, распространяется на все окно 512 отсчетов. Если внутри блока имеются пиковые изменения амплитуды, то области сигнала высокой мощности распространяются на области сигнала низкой мощности, создавая ощутимые искажения. Слышимым эффектом будет шум, предшествующий пиковому изменению амплитуды. Поэтому ЦВЗ взвешивается во временной области с взятой в квадрат и нормированной огибающей сигнала,
Для облегчения обнаружения ЦВЗ нужно увеличить его мощность, но при этом необходимо, чтобы спектральная плотность мощности ЦВЗ оставалась ниже порога маскирования. Если «вычисленный ЦВЗ» меньше шага квантования его нужно увеличить во столько раз, чтобы ЦВЗ в процессе квантования не был потерян.
Если во всех отрезках времени ЦВЗ ниже порога маскирования, то можно утверждать, что ЦВЗ неслышим.
Рис. 7.17. Блок-схема генератора ЦВЗ
На рис. 7.17 изображена блок-схема устройства встраивания ЦВЗ в аудиосигнал. В базовой схеме внедрения ЦВЗ кодовое слово фильтруется при помощи фильтра, приближенного по характеристикам к системе слуха человека. Полученный результат сравнивается во времени с исходным аудиосигналом, для исключения временных эффектов, таких, как пре-эхо. Затем результат добавляется к оригинальному аудиосигналу, давая в результате
где под w понимается отфильтрованная ПСП.
Исследования А. К. Хамди и др. [3] показывают, что ЦВЗ лучше размещать в высокочастотной области сигнала.
Незарегистрированный пользователь будет пытаться сделать невозможным распознавание ЦВЗ, добавляя к нему окрашенный шум, фильтруя его, кодируя, осуществляя над ним цифро-аналоговое и аналогово-цифровое преобразование, сжатие и т. д. При рассмотрении проблемы распознавания предполагается, что оригинальный сигнал доступен, как распознавателю, так и автору ПСП.
Необходимо различить пиратский аудиосигнал
Отметим, что ЦВЗ неслышим, и нас интересуют случаи, когда искажения, вносимые незарегистрированным пользователем также неслышны. Можно использовать взаимную корреляцию между x и w, чтобы обнаружить наличие ЦВЗ с помехами, сравнивая его с порогом. Исследования А.Хамди и др. [3] показывают, что возможно надежно определять наличие ЦВЗ при использовании 50 или более блоков по 512 отсчетов для порога приблизительно равного 0,7. Необходимо отметить, что это определено для 0,8 секунды аудиосигнала (при частоте дискретизации 32 к Гц).
Тогда можно вычислить вероятность определения и вероятность ложного определения для каждого сегмента из 50 блоков по 512 отсчетов. При этом, даже если ЦВЗ произведены при помощи одинаковых псевдослучайных последовательностей для всего аудиосигнала, то в течение сигнала они будут изменяться в зависимости от порога маскирования и мощности сигнала для каждого блока из 512 отсчетов.
Автор должен выбирать различные ПСП для каждого аудиосигнала, чтобы его подписи невозможно было найти сравнением или изучением зависимости между несколькими аудиосигналами.
В работе [3] была проверена возможность удаления ЦВЗ при помощи аддитивных шумов. Был исследован наихудший случай аддитивного искажения ЦВЗ: шум, который «придерживается» порога маскирования сигнала с ЦВЗ. Опыты по обнаружению ЦВЗ были произведены на сегментах аудио сигнала длиной 50 участков по 512 отсчетов с присутствием или без ЦВЗ, при воздействии наихудшего варианта шума. Вероятность обнаружения ЦВЗ и вероятность ложного обнаружения были соответственно равны 1 и 3.1285 * 10-4, для порога 0,7.
Проведенные в [3] исследования показали, что данная система является также стойкой к аналого-цифровым и цифро-аналоговым преобразованиям.
Несмотря на то, что в рассмотренном методе используются свойства, присущие аудиосигналам, он может быть после некоторой модификации успешно применен и для внедрения информации в видео.
Данный текст является ознакомительным фрагментом.