Форматы кодирования аудиоинформации без потерь (loseless).

Сжатие без потерь (англ. Lossless data compression) — метод сжатия информации представленной в цифровом виде, при использовании которого закодированная информация может быть восстановлена с точностью до бита. При этом оригинальные данные полностью восстанавливаются из сжатого состояния. Этот тип сжатия принципиально отличается от сжатия данных с потерями. Для каждого из типов цифровой информации, как правило, существуют свои оптимальные алгоритмы сжатия без потерь. Сжатие данных без потерь используется во многих приложениях. Например, оно используется во всех файловых архиваторах. Оно также используется как компонент в сжатии с потерями. Сжатие без потерь используется, когда важна идентичность сжатых данных оригиналу. Обычный пример — исполняемые файлы и исходный код. Некоторые графические файловые форматы, такие как PNG , используют только сжатие без потерь; тогда как другие (TIFF, MNG) или GIF могут использовать сжатие как с потерями, так и без. В общих чертах смысл сжатия без потерь таков. В исходных данных находят какую-либо закономерность и с учётом этой закономерности генерируют вторую последовательность, которая полностью описывает исходную. Например, для кодирования двоичных последовательностей, в которых много нулей и мало единиц, мы можем использовать такую замену:

00 → 0

01 → 10

10 → 110

11 → 111

Такая подстановка является префиксным кодом, то есть обладает такой особенностью: если мы запишем сжатую строку без пробелов, мы всё равно сможем расставить в ней пробелы — а значит, восстановить исходную последовательность. На этом принципе работает алгоритм Хаффмана. Большинство алгоритмов сжатия без потерь работают в две стадии: на первой генерируется статистическая модель для входящих данных, вторая отображает входящие данные в битовом представлении, используя модель для получения «вероятностных» (то есть часто встречаемых) данных, которые используются чаще, чем «невероятностные».

Статистические модели алгоритмов для текста (или текстовых бинарных данных, таких как исполняемые файлы) включают:

§ Преобразование Барроуза — Уилера (блочно-сортирующая пре-обработка, которая делает сжатие более эффективным)

§ LZ77 и LZ78 (используется DEFLATE)

§ LZW

Алгоритмы кодирования через генерирование битовых последовательностей:

§ Алгоритм Хаффмана (также используется DEFLATE)

§ Арифметическое кодирование

Сжатие аудио

§ Apple Lossless — ALAC (Apple Lossless Audio Codec)

§ Audio Lossless Coding — также известен как MPEG-4 ALS

§ Direct Stream Transfer — DST

§ Dolby TrueHD

§ DTS-HD Master Audio

§ Free Lossless Audio Codec — FLAC

§ Meridian Lossless Packing — MLP

§ Monkey's Audio — Monkey’s Audio APE

§ OptimFROG

§ RealPlayer — RealAudio Lossless

§ Shorten — SHN

§ TAK — (T)om’s verlustfreier (A)udio (K)ompressor (нем.)

§ TTA — True Audio Lossless

§ WavPack — WavPack lossless

§ WMA Lossless — Windows Media Lossless

Форматы кодирования аудиоинформации с потерями. Понятие битрейта.

Сжатие данных с потерями — метод сжатия (компрессии) данных, при использовании которого распакованные данные отличаются от исходных, но степень отличия не является существенной с точки зрения их дальнейшего использования. Этот тип компрессии часто применяется для сжатия аудио- и видеоданных, статических изображений, в Интернете, особенно в потоковой передаче данных, и цифровой телефонии. Альтернативой является сжатие без потерь.

Существуют две основных схемы сжатия с потерями:

§ В трансформирующих кодеках фреймы изображений или звука трансформируются в новое базисное пространство и производится квантование. Трансформация может осуществляться либо для всего фрейма целиком (как, например, в схемах на основе wavelet-преобразования), либо поблочно (характерный пример — JPEG). Результат затем сжимается энтропийными методами.

§ В предсказывающих кодеках предыдущие и/или последующие данные используются для того, чтобы предсказать текущий сэмпл изображения или звука. Ошибка между предсказанными данными и реальными вместе с добавочной информацией, необходимой для производства предсказания, затем квантуется и кодируется.

В некоторых системах эти две техники комбинируются путём использования трансформирующих кодеков для сжатия ошибочных сигналов, сгенерированных на стадии предсказания.

Битрейт (англ. bit rate) — буквально, скорость прохождения битов информации. Битрейт принято использовать при измерении эффективной скорости передачи информации по каналу, то есть скорости передачи «полезной информации» (помимо таковой, по каналу может передаваться служебная информация — например, стартовые и стоповые биты при асинхронной передаче по RS-232 или контрольные символы при избыточном кодировании). Скорость передачи информации, учитывающую полную пропускную способность канала, измеряют в бодах.

Термин битрейт используется в двух основных значениях:

1. Характеристика канала или устройства — максимальное количество бит, которое можно передать в единицу времени.

2. Величина потока данных, передаваемого в реальном времени (минимальный размер канала, который сможет пропустить этот поток без задержек). Частный случай — битрейт сжатого звука или видео.

Битрейт выражается битами в секунду (бит/c, bps), а также производными величинами с приставками кило- (кбит/с, kbit/s, kbps), мега- (Мбит/с, Mbit/s, Mbps) и т. д.

В форматах потокового видео и аудио (например, MPEG и MP3), использующих сжатие c потерей качества, параметр «битрейт» выражает степень сжатия потока и, тем самым, определяет размер канала, для которого сжат поток данных. Чаще всего битрейт звука и видео измеряют в килобитах в секунду (англ. kilobit per second, kbps), реже — в мегабитах в секунду (только для видео).

Существует три режима сжатия потоковых данных:

1. с постоянным битрейтом (англ. Constant bitrate, CBR)

2. с переменным битрейтом (англ. Variable bitrate, VBR)

3. с усреднённым битрейтом (англ. Average bitrate, ABR)

Постоянный битре́йт — вариант кодирования потоковых данных, при котором пользователь изначально задаёт необходимый битрейт, который не меняется на протяжении всего файла.

Его главное достоинство — возможность довольно точно предсказать размер конечного файла.

Однако вариант с постоянным битрейтом не очень подходит для музыкальных произведений, звучание которых динамично изменяется во времени, так как не обеспечивает оптимального соотношения размер/качество.

С переменным битрейтом кодек выбирает значение битрейта исходя из параметров (уровня желаемого качества), причём в течение кодируемого фрагмента битрейт может изменяться. При сжатии звука нужный битрейт определяется на основе психоакустической модели. Данный метод даёт наилучшее качество выходного файла, однако точный его размер оказывается очень плохо предсказуем. В зависимости от характера звука (или изображения, в случае кодирования видео), размер полученного файла может отличаться в несколько раз.

Усреднённый битрейт является гибридом постоянного и переменного битрейтов: битрейт в кбит/c задаётся пользователем, а программа варьирует его в некоторых пределах. Однако, в отличие от VBR, кодер с осторожностью использует максимально и минимально возможные значения битрейта, дабы не рисковать выйти за заданную пользователем среднюю величину. Качество выходного файла получается в результате немного лучше, чем при использовании CBR, но хуже, чем при использовании VBR. С другой стороны, этот метод позволяет наиболее гибко задавать битрейт (для аудио это может быть любым числом между 8 и 320 кбит/с, против чисел, кратных 16 в методе CBR) и с гораздо большей (по сравнению с VBR) точностью предсказывать размер выходного файла.

Форматы кодирования многоканального звука.

Многоканальный звук — воспроизведение звука с использованием более двух каналов усиления и более двух громкоговорителей.

Форматы Dolby

Dolby Stereo - матричный формат записи звука. При записи в формате Dolby Stereo звук, предназначенный для каждого из четырех каналов, кодируется и записывается на два канала, а при воспроизведении декодируется вновь в четыре канала: левый, центральный, правый и задний

Dolby Headphone – стандарт, предназначенный для перекодирования сигнала формата 5.1 в двухканальный сигнал для наушников. Позволяет донести до слушателя объемные звуковые эффекты, обычно используется при просмотре видеофильмов в наушниках.

Dolby Surround (DSS) – система, позволяющая из закодированного двухканального сигнала выделять три звуковых канала: левый, правый и тыловой. При отсутствии декодера воспроизводится обычный двухканальный стереозвук.

Dolby Pro-Logic (DPL) - система, позволяющая из закодированного двухканального сигнала выделять четыре звуковых канала: левый, центральный, правый и тыловой. Система использует дополнительный громкоговоритель центрального канала, который «привязывает» диалоги к экрану, а эффект окружающего звучания воспроизводится через тыловые каналы.

Dolby Pro Logic II - новая усовершенствованная версия формата Dolby Pro Logic. Основное отличие DPL II от DPL заключено в том, что организуется стереофонический тыловой канал, с расширенным диапазонам частот, наличие которого позволяет создать в зрительном зале более реалистичную и стабильную звуковую сцену. Имеется независимый канал низкочастотных эффектов. В общем, декодер позволяет из звуковой дорожки 2.0 (стереофонический звук) создать объемный звук формата 5.1. DPL II имеет два режима: «Movi» (для саундтреков кинофильмов) и «Music» (для музыкальных записей, записанных, например, на CD). Пользователь получает возможность просмотра и прослушивания старых записей своей коллекции с обновленным звучанием, соответствующим новым стандартам.

Dolby Pro Logic IIx — дальнейшее развитие стандарта Dolby Pro Logic II. Декодер Dolby Pro Logic IIx позволяет получить объемный звук стандарта 6.1 или 7.1, используя в качестве источника сигнал в формате 5.1 или простой стереосигнал.

Dolby Pro Logic IIz – новейший стандарт, использующий фронтальные каналы для создания трехмерных эффектов, таким образом добавляя к звуковому полю еще одно измерение в 7.1- и 9.1-конфигурациях. Dolby Pro Logic IIz обратно совместима с Dolby Pro Logic IIx.
Форматы Dolby Digital (AC-3)

Dolbi Digital (AC-3)- самый популярный на сегодняшний день формат многоканального звука, принятый в качестве звукового стандарта для видеодисков формата DVD. Этот полностью цифровой формат содержит 6 независимых каналов звука, из них 5 полнодиапазонных (30 – 20 000 Гц): три фронтальных (левый, центральный и правый) и два тыловых, плюс один низкочастотный (20-120 Гц) канал сабвуфера. Звучание фонограмм, записанное в формате Dolbi Digital, характеризуется очень высоким качеством звука - полностью отсутствует шум носителя

Dolby Digital Live – технология, позволяющая в режиме реального времени конвертировать звук от компьютера или игровой приставки в формат Dolby Digital 5.1, обеспечивая качественное звучание и простое (с помощью одного разъема) подключение к AV ресиверу для воспроизведения.

Dolby Digital Surround EX - стандарт многоканального звука формата 6.1. От Dolby Digital отличается добавлением дополнительного канала (центр-тыл). Сигнал для центрального тылового канала декодер получает из левого и правого тыловых каналов.
Дополнительный канал позволяет добиться более детальной звуковой картины.

Dolby Digital Plus – стандарт, специально разработанный для видеофильмов на носителях HD DVD/Blu-Ray и телевидения высокого разрешения HDTV. Обеспечивает высокое качество объемного звука. Dolby Digital Plus поддерживает обработку потока аудиоданных со скоростью до 6.144 Мбит/с. (для сравнения, для стандарта Dolby Digital эта цифра составляет 640 кбит/с.), поддерживает до 13 независимых звуковых каналов, разрядность 24 бит на канал и частоту дискретизации 96 кГц.

Dolby TrueHD – стандарт, предназначенный для декодирования цифровой звуковой дорожки, записанной на диске, в многоканальный аналоговый сигнал. Стандарт Dolby TrueHD был специально разработан для видеофильмов на носителях HD DVD/Blu-Ray и телевидения высокого разрешения HDTV и обеспечивает высокое качество объемного звука. Он поддерживает до 14 аудиоканалов, разрядность данных 24 бит, частоту дискретизации 96 кГц, полосу пропускания до 18 Мбит/с., позволяет преобразовать звук без потери качества (lossless). Поток данных в стандарте Dolby TrueHD поддерживается интерфейсом HDMI.

Форматы DTS

DTS– аналоговый Dolby Digital формат многоканального звучания, обеспечивающий несколько более высокое по сравнению с первым качество звучания. Основное отличие стандарта DTS от Dolby Digital состоит в том, что скорость аудиоданных у DTS в три раза выше, благодаря чему появляется возможность записать звук с лучшим качеством. В результате становятся слышны все тончайшие оттенки звучания, звуковые эффекты приобретают большую выразительность.

DTS 96/24 — стандарт шестиканального звука более высокого, чем DTS, качества. Поддерживает формат звука с частотой дискретизации 96 кГц и разрядностью 24 бит. Совместим с форматом DTS. Декодер DTS 96/24 необходим для того, чтобы преобразовать цифровую звуковую дорожку, записанную в формате DTS 96/24, в многоканальный аналоговый звук.

DTS ES Matrix 6.1 - улучшенная версия цифрового формата DTS для построения системы домашнего кинотеатра на базе шести акустических систем. Как и в предыдущем случае используется матричный способ кодирования данных для организации центрального тылового канала.

DTS ES Discrete - единственный на сегодняшний день полноценный 6.1-канальный формат. Информация для тылового центра содержится в отдельно записанном звуковом канале.

DTS Neo:6 - музыкальный многоканальный формат, являющийся функциональным аналогом Dolby Pro Logic II. Он способен разложить двухканальный сигнал в 6-канальную конфигурацию.

DTS-HD High Resolution Audio – стандарт, предназначенный для декодирования цифровой звуковой дорожки, записанной на диске, в многоканальный аналоговый сигнал. Стандарт DTS-HD был специально разработан для видеофильмов на носителях HD DVD/Blu-Ray и телевидения высокого разрешения HDTV и обеспечивает высокое качество объемного звука. Он поддерживает неограниченное количество аудиоканалов, разрядность 24 бит, частоту дискретизации 96 кГц и полосу пропускания 3 или 6 Мбит/c, преобразует звук без потери качества (lossless), имеет возможность выводить многоканальный звук (семь и более каналов) в форматах 5.1 и стерео.

DTS-HD Master Audio – стандарт, разработанный специально для использования с видеоформатами высокого разрешения (HD DVD, Blu-Ray). Главное его преимущество - возможность использования звукового формата с кодированием без потерь (lossless). Звук в формате DTS-HD Master Audio соответствует качеству звука с DVD-Audio.
DTS-HD Master Audio поддерживает разрядность 24 бит, частоту дискретизации 192 кГц, полосу пропускания до 24.5 Мбит/с., имеет возможность выводить многоканальный звук (семь и более каналов) в форматах 5.1 и стерео.

THX – формат, определивший новую концепцию пространственного звучания, наиболее естественную и максимально приспособленную к условиям домашнего видеопросмотра. Используя результаты декодирования процессора Dolby Pro-Logic, который образует всего четыре канала, ТНХ дополнительно разделяет монофонический канал эффектов на два псевдостереофонических - левый и правый и создает дополнительный сверхнизкочастотный канал (канал сабвуфера - громкоговорителя специально предназначенного для воспроизведения мощных низкочастотных звуков).

MPEG Multichannel или MPEG-2 Audio – стандарт, применяющийся для записи звука на DVD видеодиски. MPEG-2 Audio и AC-3 обеспечивают примерно одинаковое качество шестиканального звука. Хотя некоторые специалисты отмечают большую гибкость последнего, вследствие возможности переменной скорости записи звуковых данных. Также MPEG-2 Audio более совместим с простыми аудиосистемами, работающими в стереорежиме.

Meridian Lossless Packing (MLP, уплотнение без потерь компании Meridian) – это система кодирования без потерь, предназначенная для высококачественного аудио. Для DVD-Audio MLP осуществляет сжатие без потерь информации при числе каналов материала, достигающем 6, с разрядностью 24 бита и нормой отбора от 44.1 кГц до 192 кГц.

Circle Surround - система, являющаяся адаптацией систем Dolby специально для музыки, поскольку имеет тыловой канал c полным диапазоном частот. Современная версия системы, Circle Surround 5.2.5, может также работать в шестиканальном режиме с раздельными тыловыми каналами и каналом субвуфера. Звук, закодированный посредством системы Circle Surround (в четырехканальном режиме), полностью совместим с декодерами Dolby Pro-Logic. Кроме того, декодер Circle Surround может синтезировать объемный звук из обычного стерео.

SDDS (Sony Dynamic Digital Sound) – цифровой формат, предназначенный исключительно для кино и в виде аудио продукции пока не встречается. Звук SDDS может быть декодирован в четыре, шесть (5.1) или восемь (7.1) каналов, в последнем случае с дополнительными левым центральным и правым центральным каналами. В формате SDDS используется звук с частотой дискретизации 44,1 кГц и применяется сжатие данных с потерями (примерно 5:1).

8. Цифровые преобразователи звука и аудиоэффекты;

Аналого-цифровой преобразователь (англ. Analog-to-digital converter, ADC) — устройство, преобразующее входной аналоговый сигнал в дискретный код (цифровой сигнал). Обратное преобразование осуществляется при помощи ЦАП (цифро-аналогового преобразователя, DAC).

Типы преобразования

Линейные АЦП

Термин линейный применительно к АЦП означает, что диапазон входных значений, отображаемый на выходное цифровое значение, связан по линейному закону с этим выходным значением, то есть выходное значение k достигается при диапазоне входных значений от m(k + b) до m(k + 1 + b), где m и b — некоторые константы. Константа b, как правило, имеет значение 0 или −0.5. Если b = 0, АЦП называют квантователь с ненулевой ступенью (mid-rise), если же b = −0,5, то АЦП называют квантователь с нулём в центре шага квантования (mid-tread).

Нелинейные АЦП

Если бы плотность вероятности амплитуды входного сигнала имела равномерное распределение, то отношение сигнал/шум (применительно к шуму квантования) было бы максимально возможным. По этой причине обычно перед квантованием по амплитуде сигнал пропускают через безынерционный преобразователь, передаточная функция которого повторяет функцию распределения самого сигнала. Это улучшает достоверность передачи сигнала, так как наиболее важные области амплитуды сигнала квантуются с лучшим разрешением. Соответственно, при цифро-аналоговом преобразовании потребуется обработать сигнал функцией, обратной функции распределения исходного сигнала.

Цифро-аналоговый преобразователь (ЦАП) — устройство для преобразования цифрового (обычно двоичного) кода в аналоговый сигнал (ток,напряжение или заряд). Цифро-аналоговые преобразователи являются интерфейсом между дискретным цифровым миром и аналоговыми сигналами.

Аналого-цифровой преобразователь (АЦП) производит обратную операцию.

Звуковой ЦАП обычно получает на вход цифровой сигнал в импульсно-кодовой модуляции (англ. PCM, pulse-code modulation). Задача преобразования различных сжатых форматов в PCM выполняется соответствующими кодеками.

123 4 5 6

Не нашли, что искали? Воспользуйтесь поиском по сайту: