Reklama

​Cyfrowy prezenter czyta informacje - początek końca telewizyjnych gwiazd?

Chińska Agencja Informacyjna Xinhua stawia na nowych prezenterów wiadomości - będą mogli pracować bez przerwy, 24 godziny na dobę, każdego dnia, a ich stawka będzie zerowa. Jak to możliwe?

"Dzień dobry wszystkim. Jestem sztuczną inteligencją prowadzącą to wydanie. To mój pierwszy dzień w Agencja Informacyjnej Xinhua. Mój wygląd i głos zostały oparte na redaktorze Zhang Zhao" - tak z widownią przywitał się wygenerowany przez komputer, cyfrowy prowadzący serwis informacyjny. 

Reklama

Proste depesze (np. wyniki sportowe, notowania spółek giełdowych) generowane przez maszynę nie są niczym nowym w branży mediów, ale agencja informacyjna korzystająca z cyfrowych odpowiedników dziennikarzy to coś zupełnie nowego. Trójwymiarowa kopia nie tylko przypomina prawdziwego prowadzącego, ale również ma jego mimikę i charakterystyczne gesty - wszystko po to, aby zachować odpowiednią iluzję. Na tym etapie cyfrowy spiker może przeczytać dowolny, przygotowany przez człowieka tekst.

Agencja Xinhua udostępniła informacje czytane przez lektora w wersji chińskiej i angielskiej, może je obejrzeć korzystając z aplikacji mobilnych, strony internetowej telewizji lub korzystając z bardzo popularnego w Chinach komunikatora WeChat. Twórcy zapowiadają dalszą pracę nad udoskonalaniem formy prezentacji wiadomości w tej formie. Nawet na krótkim, 30-sekundowym materiale widać, że prowadzący nie jest człowiekiem.

Ale to może ulec znacznej zmianie w najbliższych latach.

Fałszywy Obama i Google Duplex

Za pomocą dostępnych w internecie (w repozytoriach kodów) narzędzi, a także korzystając z sieci neuronowych i uczenia maszynowego, stworzono wizualizacje przemówień znanych polityków, w tym Baracka Obamy. Wystarczyła do tego analiza ponad 14 godzin przemówień i wywiadów byłego prezydenta USA. Potem, za sprawą specjalnej technologii wideo, połączyła wypowiedzi (audio) Obamy z jednym, konkretnym przemówieniem poprzedniego. Aby odpowiednio dopasować ścieżkę audio do ruchu ust, na dolną część twarzy naniesiono wcześniej zebrane fragmenty wypowiedzi prezydenta. Po procesie obróbki udało się - z drobnymi niedociągnięciami - zsynchronizować ścieżkę audio z ruchem ust. 

Co z tego wynika? Zrealizowanie materiału wideo, który modyfikuje wypowiedzi polityków czy gwiazd już teraz praktycznie nie stanowi problemu. "Sfałszowane" wideo z Obamą prezentujemy poniżej:

Uczenie maszynowe (machine learning) to metoda samouczenia się maszyn w oparciu o analizę danych i odnajdywanie zawartych w nich wzorców. Dzięki algorytmom machine learning komputery mogą samodzielnie analizować dane oraz automatycznie tworzyć i dostosowywać modele w celu samodoskonalenia i nabywania nowej wiedzy, potrzebnej do rozwiązania zadanego problemu. Wszystko odbywa się w sposób zautomatyzowany, bez potrzeby wcześniejszego zaprogramowania przez człowieka. 

W maju podczas konferencji Google I/O zaprezentowano fragmenty rozmowy pomiędzy asystentem głosowym Google, a osobami odpowiedzialnymi za rezerwację miejsca w restauracji i salonie fryzjerskim. Sztuczna inteligencja, korzystając z zaawansowanych możliwości języka naturalnego i sieci neuronowych, jak i z najnowszych osiągnięć syntezy (naśladowania) ludzkiej mowy, była nie do rozróżnienia od człowieka. Technologia nosi nazwę Google Duplex, a twórcy największej wyszukiwarki świata pracowali nad nią od lat. Asystent podczas prowadzenia konwersacji podejmuje autonomiczne decyzje, dopasowując się do zaistniałej sytuacji.

Aby brzmieć bardziej naturalnie, potrafi nawet robić przerwy i dodawać do konwersacji naturalne w rozmowie między ludźmi wtrącenia takie jak: "hmm" czy "yyy". Testy Dupleksa rozpoczną się tego lata. Asystent Google obecnie nie wspiera języka polskiego.

Łatwo wyobrazić sobie przyszłość, w której umiejętne połączenie obu opisanych powyżej technologii z modelem zastosowanym przez Agencję Informacyjną Xinhua, prowadzi do zastąpienia popularnych prezenterów i gwiazd przez ich cyfrowe kopie (jeśli wyrażą zgodę na multiplikowanie ich wizerunku)  lub trójwymiarowe odpowiedniki.

Dowiedz się więcej na temat: Sztuczna inteligencja