Sztuczna inteligencja w telewizorach - jak ona działa?

W jaki sposób sztuczna inteligencja może polepszyć obraz generowany przez najnowsze telewizory? Nowa technologia Samsung AI pozwala osiągnąć rozdzielczość obrazu zbliżoną do 8K i poprawia jakość dźwięku, dostosowując go do rodzaju oglądanej treści. Jak ona działa?

Pierwsza na świecie technologia 8K AI, która pozwala wygenerować rozdzielczość bliską 8K, wykorzystuje system uczenia maszynowego (machine learning). Komputery lub smartfony działają w oparciu o wartości i dane wprowadzane przez ludzi. W przypadku systemów uczących się jest inaczej - sztuczna inteligencja uczy się określonych schematów i podaje zoptymalizowane odpowiedzi na podstawie analizy różnych przykładów.

Reklama

Technologia Machine Learning Super Resolution (MLSR) firmy Samsung porównuje wersje tych samych treści w niskiej oraz wysokiej rozdzielczości i uczy się technologicznych różnic między nimi oraz tworzy olbrzymią bazę danych wynikowych. Następnie analizuje miliony fragmentów treści wideo i odnajduje korelacje. Na tej podstawie jest w stanie wybrać optymalne filtry korygujące błędy poziomu jasności, czerni, proporcji i z szerokiej gamy źródeł. W efekcie treści w niskiej rozdzielczości przekształcane są w materiał wideo, którego rozdzielczość jest bliska 8K i zaskakuje obserwatorów, którzy mieli okazje porównać materiał wyjściowy i efekt końcowy.

Materiał jest rozpoznawany "w czasie rzeczywistym“ na podstawie klatek i ulepszany scena po scenie. Dla widzów oznacza to natychmiastową poprawę jakości obrazu i dźwięku niezależnie od tego, czy źródłem materiału wideo jest streaming czy OTT (Over The Top).

Na czym polega różnica?

Istnieje kilka technologii skalowania do porównywania scen w wysokiej i niskiej rozdzielczości i ich rekonstrukcji. Wymagają jednak wprowadzania danych przez ludzi. Natomiast technologia AI firmy Samsung samodzielnie bada miliony obrazów wykorzystując Machine Learning Super Resolution (MLSR) i dzięki temu osiąga znacznie wyższą precyzję niż konwencjonalne rozwiązania.

Istnieją trzy sposoby poprawy jakości obrazu na ekranie. Po pierwsze można zastosować "tworzenie detalu“, czyli proces wyostrzania szczegółów i poprawy ich faktury w miejscach, w których po kompresji pliku linie są zamazane. Drugą możliwością jest "przywracanie krawędzi“, w ramach którego w materiale wideo definiowane są krawędzie tekstu, postaci lub obiektów. Piksele są przesuwane na krawędziach i cieniowane, co sprawia, że obraz jest czytelniejszy i wyraźniejszy. Jeżeli na przykład tekst jest rozstrzelony wzdłuż krawędzi, wideo wokół tekstu jest korygowane, by zwiększyć jego czytelność. W materiale wideo, na którym widać księżyc, funkcja przywracania krawędzi poprawia detale cienia księżyca i zwiększa poziom czerni tła, tym samym poprawiając kontrast. Trzecim sposobem jest "redukcja szumu“, czyli eliminacja szumów statycznych generowanych podczas kompresji lub dekompresji plików. Przykładowo mogą to być skaczące punkty, kwadratowe piksele itp.

Sztuczna inteligencja a dźwięk

Podczas oglądania filmów czy przedstawień teatralnych, krystaliczne brzmienie jest równie ważne, co jakość obrazu. Właśnie dlatego technologia Machine Learning Super Resolution (MLSR) nie tylko poprawia jakość obrazu materiałów wideo, lecz także optymalizuje dźwięk.

Konwencjonalne telewizory mają szereg ustawień obrazu, takich jak np. tryb filmowy, czy sportowy, dopasowanych do gatunku danej treści, również pod kątem ścieżki audio. Nowa technologia sztucznej inteligencji automatycznie analizuje treści i charakterystykę scen, a następnie generuje jak najlepszy dźwięk. Kiedy na przykład oglądamy film, w którym główny bohater gra koncert, technologia Samsung AI podkreśli te parametry dźwięku, które sprawiają, że będziemy słyszeć taki sam dźwięk, jaki słyszą postaci w filmie. Kiedy po koncercie widzowie biją brawo, będziemy je słyszeć tak, jakbyśmy siedzieli wśród nich. Jeżeli postaci w filmie mówią, AI dostosowuje dźwięk tak, żeby wypowiadane słowa były dobrze słyszalne.

Wyobraźmy sobie, że oglądamy transmisję z biegu sztafetowego na zakończonych niedawno Zimowych Igrzyskach Olimpijskich w PyeongChang 2018. Technologia AI zoptymalizuje głos spikera, byśmy nie przegapili zmian w zespołach. Kiedy rozpoczynają się zawody, technologia zwiększa poziom dźwięku z tła, dzięki czemu mamy wrażenie, że jesteśmy na miejscu - wśród kibiców. Dzięki dostosowaniu dźwięku w poszczególnych scenach możemy cieszyć się jego najlepszą jakością niezależnie od rodzaju treści.

Czy AI 8K ma znaczenie?

 Już teraz niektórzy naziemni nadawcy podjęli działania, zmierzające do nadawania w standardzie UHD, a niektóre telewizje internetowe i kanały kablowe oferują już obraz w jakości 4K UHD (3840 x 2160). Mimo, że producenci telewizorów zaczynają wprowadzać modele oferujące rozdzielczość 8K (7680 x 4320), w rzeczywistości treści w rozdzielczości 4K nie są jeszcze w pełni wykorzystywane w domach użytkowników.

Proces wprowadzania technologii AI do telewizorów 8K LED rozpocznie się w drugiej połowie tego roku, a widzowie już wkrótce będą mogli podziwiać treści dowolnego typu o jakości UHD w rozdzielczości zbliżonej do 8K i ze zoptymalizowanym dźwiękiem. Nadchodzi era rozdzielczości 8K, a firma Samsung wykonała milowy krok w tym kierunku.



Dowiedz się więcej na temat: 8K | samsung | Amnesty International