Lepsze niż MP3

MP3 to format wykorzystujący kompresję stratną do kodowania audio, więc w trakcie tworzenia plików w takim formacie część informacji o dźwięku jest bezpowrotnie tracona.

Kluczowym parametrem jest bitrate, określający, ile bajtów ma być użytych do zapisu sekundy dźwięku. Im wyższy bitrate, tym wynikowy plik bardziej przypomina jakością nieskompresowane audio. Ale nawet dwa zakodowane z identycznymi parametrami nagrania mogą się między sobą różnić. Wszystko zależy od tego, jakim enkoderem zostaną utworzone.

Kodeki MP3

MP3 to format opatentowany. Początkowo, w latach 90., dostępny był do niego tylko kodek autorstwa Instytutu Fraunhoffera, który opracował ten standard.

Szybka popularyzacja formatu MP3 spowodowała, że otwarto jego specyfikację, dzięki czemu powstały alternatywne enkodery, w tym najpopularniejszy dziś, open-source'owy LAME.

Reklama

Artykuł pochodzi z "PC Format 8/2010" (w kioskach od 5 lipca) - sprawdź spis treści

Zaletą LAME jest uniwersalność. Jest dostępny na wszystkie systemy operacyjne w różnych formach. Zapewnia zupełnie zadowalającą jakość generowanych plików.

Innymi enkoderami MP3 są np. BladeEnc (także na licencji GPL) oraz Xing MP3Enc (płatny). Ten pierwszy nie jest już rozwijany i oferuje gorszą jakość niż LAME, Xiph zaś jest optymalizowany do ultraszybkiego generowania plików kosztem jakości audio. Dostępne są też rozwiązania bazujące na zmodyfikowanych kodekach Fraunhoffera. Nie są one dostępne jako same biblioteki, lecz jedynie w pakietach z komercyjnymi aplikacjami.

MP3 w wersji PRO

MP3Pro to odmiana MP3, która oprócz standardowych technik kompresji stosuje podział oryginalnego dźwięku na część próbkowaną z niskimi i wysokimi częstotliwościami. Kodowana jest głównie ta pierwsza, a z drugiej trafiają do wynikowego pliku jedynie najważniejsze informacje. Inaczej niż w zwykłym MP3, tutaj także dekoder "robi różnicę", bo musi na podstawie tych danych zrekonstruować brakujące dźwięki. Dzięki takiemu zabiegowi format MP3Pro pozwala znacząco obniżyć stosowany bitrate bez różnicy w jakości. MP3 o jakości 128 Kb/s brzmi podobnie do MP3Pro 80 Kb/s.

Zwykły odtwarzacz MP3 nie rozpozna jednak dodatkowych danych, przez co odegra tylko główną część ścieżki audio, tę o niskich częstotliwościach. Dźwięk będzie więc zmiękczony i wytłumiony, jak w audycji radiowej FM. Do odtwarzania MP3Pro potrzebny jest specjalny dekoder, który obecnie dostępny jest tylko jako wtyczka do Winampa. Alternatywnie można użyć odtwarzacza JetAudio. Żaden typowy przenośny odtwarzacz MP3 nie poradzi sobie z odegraniem MP3Pro w pełnej jakości.

Także kodowanie do MP3Pro nie jest tak bezproblemowe. Kodek z pełnią funkcji trzeba kupić, nie jest darmowy.

Formaty otwarte

Istnieją dwa otwarte formaty oferujące jakość porównywalną lub lepszą od MP3. Są to dostępne na wiele platform OGG Vorbis oraz MPC (MusePack).

Oba kodeki oferują wiele usprawnień w stosunku do MP3, pracują też tylko w trybie VBR, więc nie ma tu sztywnego określenia jakości. Określone są tylko gotowe profile kodowania odpowiadające za wynikową jakość.

W każdym z nich bitrate jest zawsze dynamicznie dostosowywany do potrzeb.

Vorbis doskonale się sprawdzi przy kodowaniu 128 Kb/s, oferując w tym trybie jakość porównywalną do MP3. Enkoder próbuje rozdzielić dźwięk na poszczególne składowe, osobno traktując zwłaszcza szumy, o których informacja jest praktycznie tracona, zwłaszcza w niższych ustawieniach, jak 64-96 kb/s. Pliki w tym formacie oferuje także internetowy serwis Jamendo, a odtworzyć je można na większości przenośnych odtwarzaczy MP3.

MPC powstał z odwrotną myślą: zapewnić możliwie wysoką jakość przy ok. 160-180 Kb/s. Oficjalny enkoder twórcy dysponuje m.in. algorytmami specjalnie traktującymi głos, co czyni go jednym z lepszych np. do wydajnego kodowania mowy.

Należy jednak przestrzec, że gros optymalizacji kodeka zostało wprowadzonych tylko do trybu "standardowego", operującego we wspomnianym zakresie prędkości bitowych. Można go użyć także przy ok. 128 Kb/s, ale nie da on tu lepszych rezultatów od MP3.

Własnościowe rozwiązania

Oczywiście oprócz otwartych formatów dostępne są przynajmniej dwa "zamknięte" rozwiązania lepsze od MP3. Oba równie powszechne i dość znane. Pierwszy to znany z urządzeń Apple - AAC. Format ten jest dużo bardziej elastyczny od MP3 w sensie sposobu kodowania dźwięku. Daje to np. możliwość lepszej adaptacji bitrate'u do faktycznych potrzeb (wyższa dynamika zmian).

Zaoszczędzone bajty można wykorzystać do kodowania dźwięków o wysokich częstotliwościach, które wycinane są zwykle przez kodeki MP3. Wynikowe nagranie jest więc bogatsze w detale niż podobna empetrójka.

AAC doczekał się też usprawnionego następcy - HE-AAC. Optymalizacje w tym przypadku polegają na wykorzystywaniu powtarzalności sygnałów o niskich częstotliwościach, co pozwala uciąć kolejnych kilka-kilkanaście KB/s bitrate'u wobec AAC bez słyszalnego pogorszenia. Co ważne, HE AAC jest dostępny jako profi l enkodera AAC i jest w pełni zgodny z dekoderami AAC, więc nie ma tu takiej sytuacji jak z MP3Pro.

Drugim ciekawym formatem jest produkt Microsoftu, Windows Media Audio, czyli WMA. Istnieje on w czterech wariantach: podstawowym (Base), profesjonalnym (Pro), bezstratnym (Lossless) i do kodowania mowy (Voice). Pierwsza odmiana, przeznaczona do typowych zastosowań, ma podobne usprawnienia co Vorbis czy AAC, dając tym samym podobną jakość dźwięku. Cechuje się więc niższym poziomem charakterystycznych metalicznych trzasków i pogłosów znanych z MP3.

Wersja Pro bazuje już na nieco innych algorytmach, wprowadzając dodatkowe ulepszenia oczyszczające dźwięk z artefaktów, a także wydobywające niektóre detale muzyczne z tła. Daje też możliwość stosowania wyższego próbkowania, np. 96 kHz zamiast 44,1/48 kHz oraz kodowania dźwięku w standardzie 7.1.

Audio bez żadnych strat

Posiadaczom wysokiej klasy sprzętu audio (oraz wrażliwych uszu) nawet użycie najwyższych jakości, rzędu 256-320 Kb/s w dowolnym formacie stratnym może się nie spodobać. W takich sytuacjach doskonale sprawdzą się formaty używające kompresji bezstratnej. Jednym z nich jest czwarta odmiana WMA - Lossless. Ale są atrakcyjniejsze od niego kodeki.

Artykuł pochodzi z "PC Format 8/2010" (w kioskach od 5 lipca) - sprawdź spis treści

Przykładem może być FLAC, również otwarty kodek autorstwa fundacji Xiph.org. Używa on zupełnie innej klasy metod kompresji danych, traktując muzykę podobnie jak kompresory ZIP czy RAR operujące na zwykłych plikach - jako strumień bajtów.

Enkoder ten wyposażono w funkcje analizujące dźwięki, co pozwala np. wykryć ciszę czy podobnie brzmiące fragmenty (np. refreny piosenek). Mamy więc większą efektywność, ale coś za coś. O ile typowy album CD (74 minuty muzyki) przegrany w MP3 przy 128 Kb/s zajmie ok. 70 MB, o tyle zapisany we FLAC -u zajmuje od 250 do 450 MB, zależnie od skomplikowania dźwięku.

Inne kodeki należące do tej samej klasy to np. TTA (True Audio) oraz WV (WavePack). Generalnie oferują one podobny stopień kompresji, co FLAC. W przypadku FLAC-a i WV można na niego (i czas samej kompresji) jednak nieco wpływać. Te enkodery mają trzy profile ustawień, różniące się liczbą używanych algorytmów optymalizacyjnych. W zależności od wyboru kompresja trwa krócej albo dłużej, ale daje w efekcie mniejszy plik.

-----

Skąd się biorą różnice?

Różnice w jakości plików skompresowanych z taką samą liczbą bitów na sekundę pochodzą z zastosowanych algorytmów kompresji. Bazują one na skomplikowanych regułach psychoakustyki, czyli analizy, jakie detale dźwięku słyszymy dobrze, a jakie nam umykają. Dzięki temu z piosenek usuwane są np. składowe o wysokich częstotliwościach. W zależności od kodeka i trybu jego pracy granica odcięcia może wynosić od 16 do 20 kHz, co już przełoży się na postrzeganie dźwięku jako "płaskiego", bez detali, lub raczej bogatego we wszelkie akustyczne szczegóły.

Źródło informacji

PC Format
Reklama
Reklama
Reklama
Reklama
Reklama
Strona główna INTERIA.PL
Polecamy