Как работает сжатие MP3? Это распространенный вопрос, который заслуживает быстрого ответа. Я действительно поискал в сети, прежде чем сесть писать это, и заметил, что все пишут романы на эту тему, но никто не может объяснить это быстро, как нормальный человек. Итак, поехали!
«Любая достаточно продвинутая технология неотличима от магии». — Артур Кларк
Для большинства из нас приведенная выше цитата прекрасно раскрывает тайну сжатия MP3. К сожалению, это также подводит итог большинству существующих объяснений.
Как файлы MP3 могут быть меньше, но хорошо звучать?
ВОПРОС:
Недавно я купил альбом в Интернете, и он был доставлен в виде файла со скоростью 160 кбит / с. Я заметил это только потому, что сам размер файла был намного меньше. Чем несжатые волновые файлы, которые я создал сам.
Чего я не заметил, так это какого-либо снижения качества. Можете ли вы объяснить, как работает это сжатие mp3. Потому что очевидно, что алгоритм сжатия пропускает некоторые данные, чтобы это произошло, верно?
Спасибо,
Мейсон Д.
ОТВЕТ:
Мейсон, это отличный вопрос. Я могу ответить на это прямо только благодаря тому, что потратил много времени. Беспокоясь о том, как распространять свою собственную музыку через Интернет. И конечно, после того, как освежился. Прошло добрых 15 лет с тех пор, как я много размышлял на эту тему.
Что такое сжатие MP3 и почему оно существует
Никому не было дела до этого, когда мы работали в аналоговой области. У нас были виниловые пластинки, 8 дорожек, кассеты и компакт-диски (они цифровые, но не нуждались в сжатии). MP3-файлы стали «вещью» после взрыва Интернета.
Кодирование MP3 обеспечивает огромную экономию, даже больше при скорости передачи данных 128 кбит / с.
Типичный несжатый волновой файл может быть размером до 30 МБ для типичной 3-минутной песни. Но после запуска алгоритмов сжатия MP3, которые могут упасть до 3 МБ без какой-либо серьезной потери качества.
Это было предпочтительнее, когда наши скорости передачи данных были чрезвычайно низкими на модемах удаленного доступа. И у нас, возможно, даже были ограничения пропускной способности в течение месяца. Вместо того, чтобы ждать несколько дней, чтобы загрузить песню. Мы могли бы сделать это за пару часов (а в настоящее время-за пару секунд!).
MP3-плееры сохраняют свое присутствие благодаря MP3-плеерам, таким как iPod. У них ограниченное пространство на жестком диске или флэш-накопителе. Поэтому при сжатии мы можем переносить гораздо больше музыки.
Кроме того, нет необходимости в файлах с полным разрешением, когда мы работаем во дворе или в тренажерном зале, используя крошечные спортивные наушники. Это также огромная экономия пространства и пропускной способности для онлайн-потоковых сервисов.
- MP3 расшифровывается как MPEG Layer 3
MPEG-это тип видеофайлов, который делает то же самое для видео, что и MP3 для аудио. На самом деле, MP3-это всего лишь 3-й слой, выделенный для аудио в видеофайлах. Это все та же технология.
Как сжатие MP3 экономит так много места?
Вот тут-то и начинается безумие. Люди, которые разработали эти алгоритмы сжатия, использовали наши знания в области психоакустики для управления пропускной способностью данных. Психоакустика относится к тому, как наш мозг интерпретирует звуки.
Мозг использует определенные приемы, такие как слуховая маскировка. Чтобы распределить ресурсы и внимание на то, что является наиболее важным звуком. Происходящим в любой момент времени. Используя эту информацию, мы знаем, от чего мы можем избавиться с точки зрения данных.
ПОТЕРЯ СЛУХА У ВЗРОСЛЫХ
Первая и самая простая экономия — это пойти дальше и вырезать определенный частотный диапазон, если музыка позволяет это. Взрослые начинают терять способность слышать выше 16-18 кГц. В то время как верхний предел для людей составляет около 24 кГц. На этом уровне не так уж много происходит с точки зрения разборчивости. Это просто «сверкай, сияй, сияй».
Слева: Несжатое звуковое спектральное изображение. Справа: MP3 Отключает звук выше 16-18 кГц.
В большинстве случаев нам вообще не нужно его иметь или, по крайней мере, мы можем закодировать его в MP3-файл с более низким разрешением.
НЕ ПОДЧЕРКИВАЙТЕ ТИШИНУ
Это относится к тому, что наши уши и мозг делают, называя одновременной маскировкой. В принципе, если громкий звук раздается поверх множества звуков низкой громкости, вы, естественно, сосредоточитесь на громком звуке. Это означает, что мы можем тратить гораздо меньше данных на тихие звуки. В те времена им не нужно было так много деталей, закодированных в них.
ВРЕМЕННАЯ МАСКИРОВКА
Таким же образом, как и выше, если два звуковых события произойдут с интервалом в миллисекунды друг от друга. Мы сможем сосредоточиться только на самом громком. Это то, как мы эволюционно были подготовлены к реагированию. Наши сердца и умы не могут разделить события, которые близки во времени.
Таким образом, алгоритм кодирования игнорирует или, по крайней мере, выделяет гораздо меньше данных для более тихого звука, поскольку мы все равно не будем его воспринимать.
МИНИМАЛЬНЫЙ ПОРОГ ПРОСЛУШИВАНИЯ
Минимальный порог прослушивания относится к громкости. По мере того как голос или звук становятся все тише и тише. Мы можем различать все меньше и меньше деталей. Кодировщик знает об этом и предпочитает не сохранять каждую деталь тихих звуков, так как мы все равно не можем ее использовать. И если звук опускается ниже определенного порога громкости. Когда человеческое ухо его не слышит, то он полностью выбрасывается.
СКОРОСТЬ ПЕРЕДАЧИ ДАННЫХ, РАЗРЯДНОСТЬ И УПРАВЛЕНИЕ ЧАСТОТОЙ ДИСКРЕТИЗАЦИИ
И, наконец, здесь делается настоящая работа. Как только вы обработаете все упомянутые выше сбережения, у вас все равно останется здоровенный файл большого размера. Это потому, что все оставшиеся данные по-прежнему хранятся в максимально возможном разрешении. Вот как гении, стоящие за MP3, решили эту проблему.
Прежде всего, MP3-это метод сжатия данных с потерями по определению. Потому что мы немедленно уменьшаем разрядность звука с 24 бит или выше до 16 бит. Потеря относится к этому снижению разрешения, но не обязательно означает потерю качества звука.
16 бит-это глубина, которая имеет достаточный запас для обеспечения высокого отношения сигнал / шум. Это означает, что каждый образец имеет 16 битов. Для кодирования (с использованием 0 или 1 в двоичном формате). Снизив размер с 24 бит до 16 бит, мы уже добились 25% — ной экономии в размере без заметной разницы в качестве.
Говоря о каждом образце, имеющем по 16 бит каждый… это еще одно место, где делается огромная экономия. Частота дискретизации может достигать 96 000 выборок в секунду! 44,1 кГц-это ваша типичная частота дискретизации для MP3. И это все еще тонна выборок в секунду, но это на 50% меньше объема хранимых данных по сравнению с частотой дискретизации 96 кГц. Вот как это работает, с помощью изображения:
График работы
Суть заключается в том, что более низкая частота дискретизации захватывает меньше «снимков» каждого момента музыки. Вы можете думать об этом как о фильме или видеоигре со скоростью 60 кадров в секунду по сравнению с типичными 24 кадрами в секунду. 24 более чем достаточно, но 60 отлично смотрится во время быстрых сцен. Это работает одинаково для музыки и частоты дискретизации.
И, наконец, мы установили ограничение на пропускную способность данных. Это учитывает все упомянутое выше, а затем устанавливает потолок того. Сколько данных вы можете отправить одновременно. Большинство сервисов потоковой передачи и продажи MP3 используют CBR. Который представляет собой постоянную скорость передачи данных, обычно 128 килобайт в секунду.
Другие распространенные параметры-192 кбит / с и 320 кбит / с. Что является самым высоким из доступных в формате MP3 и соответствует качеству несжатого звука. Некоторые потоковые сервисы будут передавать только 64 кбит / с, и вы можете определенно сказать. Качество серьезно падает ниже 128 кбит / с.
Постоянные скорости передачи данных предпочтительнее для этих служб и потребителей. Поскольку это помогает им прогнозировать свои потребности в пропускной способности и хранилище. Но были сделаны успехи для личного использования, такие как VBR. Который представляет собой переменную скорость передачи данных.
Это позволяет снизить скорость передачи данных во время тихих частей песен. И увеличить скорость передачи данных, в более громких или сложных частях песни. Это предпочтительнее для тех, кто предпочитает звук высочайшего качества, но все же желает сэкономить данные в формате MP3.
На сайте есть не мало информации по теме телефона переходите сюда.
Итак, как работает сжатие MP3? Вот Как!
И это все! Это самое краткое и простое объяснение сжатия MP3, которое вы когда-либо найдете. В следующий раз, когда один из ваших друзей спросит: «Как работает сжатие MP3?». Вы можете отправить их сюда или, если вы помните эти детали. Объяснить им это и заставить их чувствовать себя неполноценными. Вот для чего нужны друзья!
ПОСЛЕДНИЕ ЗАПИСИ В РУБРИКЕ