Измерение объема звуковой информации. Кодирование звуковой информации. Определение скорости передачи информации

Вариант 1

Лабораторная работа

«Кодирование и обработка звуковой информации»

Цели:

образовательная
воспитательная –
развивающая –

Ход работы:

Решите

Имя файла

f- частота дискретизации

k -глубина звука

t- время звучания

Тип файла

44,1 кГц

16 бит

1 мин

стерео

1.wav

8 кГц

8 бит

1 мин

моно

2 .wav

16 кГц

16 бит

1 мин

стерео

3 .wav

24 кГц

16 бит

1 мин

моно

4 .wav

32 кГц

16 бит

1 мин

стерео

для заданий 7-9

5.wav

Покажите заполненную частично таблицу учителю.

Запустите звуковой редактор Audacity .

Выполните обрезку звучания предложенного вам файла до 1 минуты, выделив нужный отрезок времени, выполните команду Правка - Обрезать по краям.

Конвертируйте wav .

В звуковом редактореAudacity Например

Сравните

Сдайте отчет учителю для проверки.

Вариант 2

Лабораторная работа

«Кодирование звуковой информации»

Цели:

образовательная - обеспечить формирование и использование учащимися знаний о кодировании звуковой информации с помощью компьютера, а также навыков по её обработке c использованием прикладного программного обеспечения;
воспитательная – воспитывать внимательность, аккуратность, самостоятельность;
развивающая – навыки использования прикладного программного обеспечения; умение решать информационные задачи.

Требования к оборудованию и ПО : наушники, звуковые файлы для учащихся, звуковой редактор Audacity , программа Звукозапись OC Windows .

Ход работы:

Решите задачи из приведенной таблицы.

Найдите объем звуковой информации по формуле V = f *k *t , где

f - частота дискретизации, k - глубина звука, t - время звучания

Решение задач представьте в виде таблицы.

В столбце «Расчетный объем звукового файла» самостоятельно запишите ответы решенных задач. Ответ дать в мегабайтах.

Имя файла

f- частота дискретизации

k -глубина звука

t- время звучания

Тип файла

Расчетный объем звукового файла

Реальный объем звукового файла

44,1 кГц

16 бит

45 с

стерео

1.wav

8 кГц

8 бит

45 с

стерео

2 .wav

1 1,025 кГц

16 бит

45 с

моно

3 .wav

24 кГц

Запустите звуковой редактор Audacity .

Выполните обрезку звучания предложенного вам файла до 45секунд, выделив нужный отрезок времени, выполните команду Правка - Обрезать по краям.

Конвертируйте предложенный вам файл в файл с расширением wav . Сохраните этот файл с этим же именем.

В звуковом редактореAudacity создайте эффекты для предложенного вам звукового файла. Например , последние 10 секунд файла сделать с затуханием

Разделите стереодорожку, а затем удалите одну из дорожек. Преобразуйте данный файл из стерео в моно. Сохраните данный файл с новым именем и расширением wav.

Сравните объемы файлов. Заполните таблицу данными.

Сдайте отчет учителю для проверки.

Временная дискретизация звука.

Звук представляет собой звуковую волну с непрерывно меняющейся амплитудой и частотой. Чем больше амплитуда сигнала, тем он громче для человека, чем больше частота сигнала, тем выше тон. Для того чтобы компьютер мог обрабатывать звук, непрерывный звуковой сигнал должен быть превращен в последовательность электрических импульсов (двоичных нулей и единиц).

В процессе кодирования непрерывного звукового сигнала производится его временная дискретизация. Непрерывная звуковая волна разбивается на отдельные маленькие временные участки, причем для каждого такого участка устанавливается определенная величина амплитуды.
Дискретизация - преобразование непрерывных сигналов в набор дискретных значений, каждому из которых присваивается определенный двоичный код.

Таким образом, непрерывная зависимость амплитуды сигнала от времени A(t) заменяется на дискретную последовательность уровней громкости. На графике это выглядит как замена гладкой кривой на последовательность "ступенек".

Каждой "ступеньке" присваивается значение уровня громкости звука, его код (1, 2, 3 и так далее). Уровни громкости звука можно рассматривать как набор возможных состояний, соответственно, чем большее количество уровней громкости будет выделено в процессе кодирования, тем большее количество информации будет нести значение каждого уровня и тем более качественным будет звучание. Современные звуковые карты обеспечивают 16-битную глубину кодирования звука. Количество различных уровней сигнала (состояний при данном кодировании) можно рассчитать по формуле:
N=2 16 =65356[уровней звука],
где I - глубина кодирования.

Таким образом, современные звуковые карты могут обеспечить кодирование 65536 уровней сигнала. Каждому значению амплитуды звукового сигнала присваивается 16-битный код.

При двоичном кодировании непрерывного звукового сигнала он заменяется последовательностью дискретных уровней сигнала. Качество кодирования зависит от количества измерений уровня сигнала в единицу времени, то есть частоты дискретизации. Чем большее количество измерений производится за 1 секунду (чем больше частота дискретизации), тем точнее процедура двоичного кодирования.

Качество двоичного кодирования звука определяется глубиной кодирования и частотой дискретизации.

Количество измерений в секунду может лежать в диапазоне от 8000 до 96 000, то есть частота дискретизации аналогового звукового сигнала может принимать значения от 8 до 96[кГц]. При частоте 8[кГц] качество дискретизированного звукового сигнала соответствует качеству радиотрансляции, а при частоте 96[кГц] - качеству звучания аудио-CD. Следует также учитывать, что возможны как моно, так и стерео режимы.

Информационный объем звукового файла

Для определения объема звукового файла V зф необходимо умножить количество измерений K изм на глубину кодирования (число бит на уровень) V 1изм:

V зф = K изм * V 1изм

Где количество измерений K изм зависит от:

Задача 1

Домашнее задание

1 Определить объем звукового стерео файла, при частоте дискретизации (дд)[кГц], времени звучания (гг)[с] для (мм)-битного кодирования.

2 Определить время звучания в [с] звукового моно файла, имеющего объем, равный (гг) [КБ], при глубине кодирования (мм)[БИТ] и частоте дискретизации (дд)[кГц].
Где (дд) - дата вашего рождения, (мм) - месяц вашего рождения, (гг) - год вашего рождения.

Основные понятия

Частота дискретизации(f) определяет количество отсчетов, запоминаемых за 1 секунду;

1 Гц (один герц) – это один отсчет в секунду,

а 8 кГц – это 8000 отсчетов в секунду

Глубина кодирования (b) – это количество бит, которое необходимо для кодирования 1 уровня громкости

Время звучания (t)

Объем памяти для хранения данных 1 канала (моно)

I=f·b·t

(для хранения информации о звуке длительностью t секунд, закодированном с частотой дискретизации f Гц и глубиной кодирования b бит требуется I бит памяти)

При двухканальной записи (стерео) объем памяти, необходимый для хранения данных одного канала, умножается на 2

I=f·b·t·2

Единицы измерения I - биты, b -биты, f - Герцы, t – секунды Частота дискретизации 44,1 кГц, 22,05 кГц, 11,025 кГц

Кодирование звуковой информации

Основные теоретические положения

Временная дискретизация звука. Для того чтобы компьютер мог обрабатывать звук, непрерывный звуковой сигнал должен быть преобразован в цифровую дискретную форму с помощью временной дискретизации. Непрерывная звуковая волна разбивается на отдельные маленькие временные участки, для каждого такого участка устанавливается определенная величина интенсивности звука.

Таким образом, непрерывная зависимость громкости звука от времени A(t) заменяется на дискретную последовательность уровней громкости. На графике это выглядит как замена гладкой кривой на последовательность "ступенек".

Частота дискретизации. Для записи аналогового звука и его преобразования в цифровую форму используется микрофон, подключенный к звуковой плате. Качество полученного цифрового звука зависит от количества измерений уровня громкости звука в единицу времени, т.е. частоты дискретизации. Чем большее количество измерений производится за 1 секунду (чем больше частота дискретизации), тем точнее "лесенка" цифрового звукового сигнала повторяет кривую аналогового сигнала.

Частота дискретизации звука - это количество измерений громкости звука за одну секунду, измеряется в герцах (Гц). Обозначим частоту дискретизации буквой f.

Частота дискретизации звука может лежать в диапазоне от 8000 до 48 000 измерений громкости звука за одну секунду. Для кодировки выбирают одну из трех частот: 44,1 КГц, 22,05 КГц, 11,025 КГц.

Глубина кодирования звука. Каждой "ступеньке" присваивается определенное значение уровня громкости звука. Уровни громкости звука можно рассматривать как набор возможных состояний N, для кодирования которых необходимо определенное количество информации b , которое называется глубиной кодирования звука

Глубина кодирования звука - это количество информации, которое необходимо для кодирования дискретных уровней громкости цифрового звука.

Если известна глубина кодирования, то количество уровней громкости цифрового звука можно рассчитать по формуле N = 2 b . Пусть глубина кодирования звука составляет 16 битов, тогда количество уровней громкости звука равно:

N = 2 b = 2 16 = 65 536.

В процессе кодирования каждому уровню громкости звука присваивается свой 16-битовый двоичный код, наименьшему уровню звука будет соответствовать код 0000000000000000, а наибольшему - 1111111111111111.

Качество оцифрованного звука. Чем больше частота и глубина дискретизации звука, тем более качественным будет звучание оцифрованного звука. Самое низкое качество оцифрованного звука, соответствующее качеству телефонной связи, получается при частоте дискретизации 8000 раз в секунду, глубине дискретизации 8 битов и записи одной звуковой дорожки (режим "моно"). Самое высокое качество оцифрованного звука, соответствующее качеству аудио-CD, достигается при частоте дискретизации 48 000 раз в секунду, глубине дискретизации 16 битов и записи двух звуковых дорожек (режим "стерео").

Необходимо помнить, что чем выше качество цифрового звука, тем больше информационный объем звукового файла.

Задачи для самостоятельной подготовки .

1. Рассчитайте объём монофонического аудиофайла длительностью 10 с при 16-битном кодировании и частоте дискретизации 44,1 к Гц. (861 Кбайт)

2. Производится двухканальная (стерео) звукозапись с частотой дискретизации 48 кГц и 24-битным разрешением. Запись длится 1 минуту, ее результаты записываются в файл, сжатие данных не производится. Какое из приведенных ниже чисел наиболее близко к размеру полученного файла, выраженному в мегабайтах?

1)0,3 2) 4 3) 16 4) 132

3. Производится одноканальная (моно) звукозапись с частотой дискретизации 11 кГц и глубиной кодирования 24 бита. Запись длится 7 минут, ее результаты записываются в файл, сжатие данных не производится. Какое из приведенных ниже чисел наиболее близко к размеру полученного файла, выраженному в мегабайтах?

1) 11 2) 13 3) 15 4) 22

4. Производится двухканальная (стерео) звукозапись с частотой дискретизации 11 кГц и глубиной кодирования 16 бит. Запись длится 6 минут, ее результаты записываются в файл, сжатие данных не производится. Какое из приведенных ниже чисел наиболее близко к размеру полученного файла, выраженному в мегабайтах?

1) 11 2) 12 3) 13 4) 15

С меняющейся амплитудой и частотой. Чем выше амплитуда сигнала, тем он громче воспринимается человеком. Чем больше частота сигнала, тем выше его тон.

Рисунок 1. Амплитуда колебаний звуковых волн

Частота звуковой волны определяется количеством колебаний в одну секунду. Данная величина измеряется в герцах (Гц, Hz).

Ухо человека воспринимает звуки в диапазоне от $20$ Гц до $20$ кГц, данный диапазон называют звуковым . Количество бит, которое при этом отводится на один звуковой сигнал, называют глубиной кодирования звука . В современных звуковых картах обеспечивается $16-$, $32-$ или $64-$битная глубина кодирования звука. В процессе кодирования звуковой информации непрерывный сигнал заменяется дискретным , то есть преобразуется в последовательность электрических импульсов, состоящих из двоичных нулей и единиц.

Частота дискретизации звука

Одной из важных характеристик процесса кодирования звука является частота дискретизации, которая представляет собой количество измерений уровня сигнала за $1$ секунду:

одно измерение в одну секунду соответствует частоте $1$ гигагерц (ГГц);
$1000$ измерений в одну секунду соответствует частоте $1$ килогерц (кГц) .

Определение 2

Частота дискретизации звука - это количество измерений громкости звука за одну секунду.

Количество измерений может находиться в диапазоне от $8$ кГц до $48$ кГц, причем первая величина соответствует частоте радиотрансляции, а вторая - качеству звучания музыкальных носителей.

Замечание 1

Чем выше частота и глубина дискретизации звука, тем более качественно будет звучать оцифрованный звук. Самое низкое качество оцифрованного звука, которое соответствует качеству телефонной связи, получается, когда частота дискретизации равна 8000 раз в секунду, глубина дискретизации $8$ битов, что соответствует записи одной звуковой дорожки (режим «моно»). Самое высокое качество оцифрованного звука, которое соответствует качеству аудио -CD, достигается, когда частота дискретизации равна $48000$ раз в секунду, глубина дискретизации $16$ битов, что соответствует записи двух звуковых дорожек (режим «стерео»).

Информационный объем звукового файла

Следует отметить, что чем выше качество цифрового звука, тем больше информационный объем звукового файла .

Оценим информационный объём моноаудиофайла ($V$), это можно сделать, используя формулу:

$V = N \cdot f \cdot k$,

где $N$ - общая длительность звучания, выражаемая в секундах,

$f$ - частота дискретизации (Гц),

$k$ - глубина кодирования (бит).

Пример 1

Например, если длительность звучания равна $1$ минуте и имеем среднее качество звука, при котором частота дискретизации $24$ кГц, а глубина кодирования $16$ бит, то:

$V=60 \cdot 24000 \cdot 16 \ бит=23040000 \ бит=2880000 \ байт = 2812,5 \ Кбайт=2,75 \ Мбайт.$

При кодировании стереозвука процесс дискретизации производится отдельно и независимо для левого и правого каналов, что, соответственно, увеличивает объём звукового файла в два раза по сравнению с монозвуком.

Пример 2

Например, оценим информационный объём цифрового стереозвукового файла, у котрого длительность звучания равна $1$ секунде при среднем качестве звука ($16$ битов, $24000$ измерений в секунду). Для этого глубину кодирования умножим на количество измерений в $1$ секунду и умножить на $2$ (стереозвук):

$V=16 \ бит \cdot 24000 \cdot 2 = 768000 \ бит = 96000 \ байт = 93,75 \ Кбайт.$

Основные методы кодирования звуковой информации

Существуют различные методы кодирования звуковой информации двоичным кодом, среди которых выделяют два основных направления: метод FM и метод Wave-Table .

Метод FM (Frequency Modulation ) основан на том, что теоретически любой сложный звук можно разложить на последовательность простейших гармонических сигналов разных частот, каждый из которых будет представлять собой правильную синусоиду, а это значит, что его можно описать кодом. Процесс разложения звуковых сигналов в гармонические ряды и их представление в виде дискретных цифровых сигналов происходит в специальных устройствах, которые называют «аналогово-цифровые преобразователи» (АЦП).

Рисунок 2. Преобразование звукового сигнала в дискретный сигнал

На рисунке 2а изображен звуковой сигнал на входе АЦП, а на рисунке 2б изображен уже преобразованный дискретный сигнал на выходе АЦП.

Для обратного преобразования при воспроизведении звука, который представлен в виде числового кода, используют цифро-аналоговые преобразователи (ЦАП). Процесс преобразования звука изображен на рис. 3. Данный метод кодирования не даёт хорошего качества звучания, но обеспечивает компактный код.

Рисунок 3. Преобразование дискретного сигнала в звуковой сигнал

На рисунке 3а представлен дискретный сигнал, который мы имеем на входе ЦАП, а на рисунке 3б представлен звуковой сигнал на выходе ЦАП.

Таблично-волновой метод (Wave-Table ) основан на том, что в заранее подготовленных таблицах хранятся образцы звуков окружающего мира, музыкальных инструментов и т. д. Числовые коды выражают высоту тона, продолжительность и интенсивность звука и прочие параметры, характеризующие особенности звука. Поскольку в качестве образцов используются «реальные» звуки, качество звука, полученного в результате синтеза, получается очень высоким и приближается к качеству звучания реальных музыкальных инструментов.

Примеры форматов звуковых файлов

Звуковые файлы имеют несколько форматов. Наиболее популярные из них MIDI, WAV, МРЗ.

Формат MIDI (Musical Instrument Digital Interface) изначально был предназначен для управления музыкальными инструментами. В настоящее время используется в области электронных музыкальных инструментов и компьютерных модулей синтеза.

Формат аудиофайла WAV (waveform) представляет произвольный звук в виде цифрового представления исходного звукового колебания или звуковой волны. Все стандартные звуки Windows имеют расширение WAV.

Формат МРЗ (MPEG-1 Audio Layer 3) - один из цифровых форматов хранения звуковой информации. Он обеспечивает более высокое качество кодирования.

Расчёт информационного объёма аудио-файла можно производить по следующей формуле (4):

V audio = D * T * n каналов * i / k сжатия, (4)

где V – это информационный объём аудио-файла, измеряющийся в байтах, килобайтах, мегабайтах; D – частота дискретизации (количество точек в секунду для описания аудио-записи); T – время аудио-файла; n каналов – число каналов аудио-файла (стерео - 2 канала, система 5.1 - 6 каналов); i – глубина звука, которая измеряется в битах, k сжатия – коэффициент сжатия данных, без сжатия он равен 1.

Расчёт иформационного объема анимации

Расчёт информационного объёма анимации можно производить по следующей формуле (5):

V anim = K * T * v * i / k сжатия, (5)

где V anim – это информационный объём растрового графического изображения, измеряющийся в байтах, килобайтах, мегабайтах; K – количество пикселей (точек) в изображении, определяющееся разрешающей способностью носителя информации (экрана монитора, сканера, принтера); T – время анимации; v – частота смены кадров в секунду; i – глубина цвета, которая измеряется в битах на один пиксель, k сжатия – коэффициент сжатия данных, без сжатия он равен 1.

Расчёт иформационного объема видео-файла

Расчёт информационного объёма видео-файла можно производить по следующей формуле (5):

V video = V anim + V audio + V sub , (5)

где V video – это информационный объём видео-файла, измеряющийся в байтах, килобайтах, мегабайтах; V anim – это информационный объём анимации (видео-ряда), измеряющийся в байтах, килобайтах, мегабайтах; V audio – это информационный объём аудео-файла, измеряющийся в байтах, килобайтах, мегабайтах (в видео-ролике могут содержатся файлы аудио-дорожек для нескольких языков, тогда умножаем объем аудио-файла на количество языковых дорожек); V sub – это информационный объём файла субтитров, измеряющийся в байтах, килобайтах, мегабайтах (если несколько файлов субтитров, то надо сложить размеры каждого файла).

Практическая часть

Параметры / Варианты
Частота кадров
Размер изображения
Глубина цвета, бит
Коэффициент сжатия изображения
Аудио-дорожка
Число языков
Глубина звука, бит
Частота дискретизации аудио-потока, Гц

Коэффициент сжатия аудио-дорожки
Число субтитров, шт.
Кодировка текста субтитров
Число символов в файле субтитров, шт.
Коэффициент сжатия текста

Вам могут быть интересны следующие материалы

Рецепты хорошей типографики

Напечатать ключ можно по фотографии замочной скважины

Windows 7

Windows 8

Windows XP

Windows общее

Железо

Интернет