Кодирование звуковой информации
Как превратить музыку в нули и единицы? Представь: ты слушаешь любимый трек в Spotify, общаешься с друзьями в Discord, смотришь стрим на Twitch. Всё это — оцифрованный звук. Давай разберёмся в этой магии преобразования.
Рис. 1. Путешествие звука: от непрерывной волны к дискретным цифровым значениям
1. Звук — это волна, которую можно измерить
Звук — это механические колебания, распространяющиеся в среде с постоянно меняющейся амплитудой и частотой.
🔊 Амплитуда (громкость)
Это размах колебаний, сила звуковой волны. Чем сильнее колебания — тем громче звук. Измеряется в децибелах (дБ).
🎼 Частота (высота звука)
Это количество колебаний в секунду, измеряется в герцах (Гц). Чем выше частота — тем выше звук.
📊 Шкала уровней звука
| Источник звука | Уровень звука (дБ) |
|---|---|
| Порог слышимости | 0 дБ |
| Шелест листвы, дыхание | 10–20 дБ |
| Разговор средней громкости | 50–60 дБ |
| Шумная улица | 70–80 дБ |
| Самолет на взлёте | 120–130 дБ |
| Болевой порог | 140 дБ |
Рис. 2. Две главные характеристики звука: амплитуда (громкость) и частота (высота тона)
2. Аналоговая запись vs. Цифровая запись
Раньше звук записывали аналоговым способом — создавали его физическую копию (канавки на виниле). Цифровая запись — это другой подход. Мы превращаем непрерывную волну в набор чисел, которые компьютер может обрабатывать и передавать без искажений.
3. Оцифровка звука: как волну превратить в числа?
Процесс оцифровки включает два ключевых этапа:
1️⃣ Временная дискретизация
Мы измеряем громкость звука много раз в секунду. Частота дискретизации — количество таких измерений ("кадров" звука) в секунду.
- 8 кГц — качество телефонного звонка
- 44,1 кГц — качество Audio CD (стандарт)
- 96 кГц — профессиональная студийная запись
Рис. 3. Временная дискретизация: непрерывная волна превращается в ступенчатый график
2️⃣ Квантование (глубина кодирования)
Это точность, с которой мы записываем каждое измерение. Чем больше бит, тем больше уровней громкости мы можем различить.
8 бит → 2^8 = 256 уровней
16 бит → 2^16 = 65 536 уровней (стандарт CD)
24 бит → 2^24 = 16,7 млн уровней
📐 Теорема Котельникова
Частота дискретизации должна быть как минимум в 2 раза выше максимальной частоты звука. Для человека (порог 20 кГц) это означает минимум 40 кГц, поэтому стандарт 44,1 кГц выбран с запасом.
4. Считаем размер аудиофайла
📊 Формула расчёта
I = f * b * t * k
Где: f — частота (Гц), b — глубина (бит), t — время (сек), k — кол-во каналов.
Рис. 4. Компромисс между качеством звука и размером файла
📝 Задачи на понимание
Задача 1
Квадрозапись (4 канала), 32 кГц, 32 бита, 4 минуты. Какой размер в Мбайт?
Посмотреть ответ
32000 * 32 * 240 * 4 = 983 040 000 бит
≈ 117,19 Мбайт
Задача 2
Файл моно 49 Мбайт. Его перевели в стерео, глубину увеличили в 4 раза, частоту снизили в 3,5 раза. Размер?
Посмотреть ответ
49 * 2 (каналы) * 4 (глубина) / 3,5 (частота)
= 112 Мбайт