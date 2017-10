Asystenci głosowi stają się istotnym elementem technologicznego wyścigu zbrojeń największych firm. Jednym z liderów w tym segmencie jest Amazon. Amerykański gigant w Gdańsku przestawił nowe urządzenia i swoją wizję świata wspieranego przez uczenie maszynowe.

Reklama

Giganci branży technologicznej stawiają na asystentów opartych o mechanizmy uczenia maszynowego, często nazywanych sztuczną inteligencja. Asystenci są obecni w różnej formie w życiu użytkowników - od smartfonów na wolnostojących głośnikach wyposażonych w mikrofon kończąc. Google promuje Google Assistant i głośnik Google Home, Samsung poświęcił przycisk w swoich nowych flagowcach dla Bixby, Microsoft nie składa broni, stawiając na Cortanę, a Apple ma najpopularniejszą na świecie asystentkę, Siri. Jednak najbardziej rozpowszechnionym domowym głośnikiem z asystentem nadal pozostaje Amazon i jego Alexa.

Sztuczna Inteligencja Asystent Google i era sztucznej inteligencji



Nasz własny asystent

Reklama

Dlaczego głośniki są tak ważne? Wszystkie firmy, w tym Amazon, argumentują że interfejs głosowy jest najbardziej naturalnym sposobem komunikacji i wprowadzania oraz otrzymywania danych dla człowieka. Korzystanie z niego nie wymaga wysiłku oraz nie trzeba się uczyć jak z niego korzystać. Co więcej asystenci łączą usługi rozbite do tej pory na wiele aplikacji. Umożliwiają np. rezerwację stolika w restauracji, aktualizację terminu kolacji w kalendarzu, oraz ustawienie jego przypomnienia.

Gdy będzie się zbliżała godzina wydarzenia, asystent sprawdzi dla ciebie prognozę pogody i zamówi taksówkę. Wszystko w trakcie krótkiej rozmowy. Asystenci pełnią nie tylko informacyjną rolę, ale także mogą organizować codzienne życie lub zarządzać domem wyposażonym w rozwiązania smart home. W przyszłości będą tłumaczyć symultanicznie różne języki, będą znały nasze nawyki i przyzwyczajenia, zapewne także zakupowe. Asystenci głosowi zmienią nasze społeczeństwo, jak zrobiły to smartfony, a przed nimi komputery osobiste.

Alexa i 250 tysięcy oświadczyn

Podczas konferencji Innovation@Amazon w Gdańsku zaprezentowano produktu z rodziny Echo i omówiono postęp prac nad asystentem głosowym Alexą. Amazon w ten sposób pokazał możliwości i zastosowania swoich rozwiązań machine learning.

Czym jest asystent głosowy Amazon Alexa? Aleksę możesz zapytać o informacje z Wikipedii, pogodę, zrobić zamówienie na Amazonie na potrzebne produkty lub sterować oświetleniem i innymi elementami smart home. Alexa za pomocą Spotify puści twoją ulubioną muzykę lub opowie twojemu dziecku bajkę. Za sprawą wtyczek, tak zwanych skills, które są ciągle rozwijane, możliwości Alexy zwiększają się każdego dnia. Zaznajomiony z programowaniem użytkownik może także rozbudować asystenta o potrzebne mu funkcje. Dzięki temu Alexa nie jest co prawda open source, ale korzysta z szerokiego grona developerów wzbogacających jej zastosowania.

Zdjęcie Amazon Echo Show / materiały prasowe

Okazuje się, że jej użytkownicy bardzo szybko ją personifikują, nadając ludzkie cechy i wykazując się reakcjami emocjonalni. Jeden z pracowników Amazon przytoczył historię swoich dzieci, które zwróciły mu uwagę, że odzywa się do głośnika niemiłym tonem. Inna ciekawostka dotyczy 250 tysięcy... oświadczyn, jakie Alexa musiała odrzucić.

Głos Alexy był w całości nagrywany w Polsce, w Gdańsku, gdzie znajduje się centrum developerskie pracujące właśnie nad usługami głosowymi. Polska firma Ivona Software, doskonale znana ze swojego syntezatora mowy, została cztery lata temu kupiona przez amerykańskiego giganta. Na jej strukturach utworzono gdańskie centrum badań i rozwoju Amazona.

Echo - już nie tylko głośnik

Echo to seria urządzeń, która umożliwia korzystanie z Alexy w domu. Najmniejszy nosi nazwę Echo spot. Dwa nowe urządzenia z tej serii to Echo Look z wbudowaną kamerą i Echo Show wyposażonym w 7-calowy ekran. Wzbogacenie głośników o ekrany wydaje się naturalną decyzją, dzięki temu rządzenie może pokazać na żądane zdjęcie lub film. Uzupełnia także komunikat głosowy wizualnie. Wszystkie produktu budzą oczywiste obawy związane z prywatnością. Amazon zapewnia, że Echo uruchamiają się tylko "na zawołanie", po wypowiedzeniu frazy "Alexa".

Machine learning

Uczenie maszynowe polega w skrócie na tym, że komputer sam uczy się prawidłowego rozwiązania, a nie jest bezpośrednio zaprogramowany przez zestaw instrukcji jak je osiągnąć. Można powiedzieć, że jest to oparty o architekturę sieci neuronowych model statyczny służący do sortowania danych. Komputer na podstawie dużej ilości danych wejściowych (przykładów), przetwarza wyniki, które następnie są korygowane i system jest poprawiany. W wielu takich cyklach "uczenia się" uzyskujemy model, który działa skutecznie także dla nowych danych. O ile nie brzmi to zbyt zachęcająco, zastosowania robią wrażenie. Najczęstszym jest "widzenie komputerowe", czyli rozpoznawanie i tagowanie obrazów, wykorzystywane zarówno na zdjęciach, które zrobiłeś w trakcie wakacji, jak i do diagnozowania chorób na podstawie wyników badań. Na computer vision oparte są także systemy autonomicznych samochodów analizujące dane z wielu kamer rozmieszczonych na pojeździe.

Ani Alexa, ani urządzenia Echo nie są oficjalnie dostępne Polsce - nic nie wiadomo na temat planów ich wprowadzenia. Jednak Amazon mocno zaznacza swoją obecność w naszym regionie i kraju. Oprócz magazynów w Gdańsku, Amazon ma centrum deweloperskie w Gdańsku i biuro w Warszawie. Sklep Amazon jest dostępny w polskiej wersji językowej

Kolejnym segmentem jest rozpoznawanie i przetwarzanie mowy, z którego korzysta Alexa. Liczba zastosowań tej dziedziny rośnie ekspotencjalnie. Wymieńmy jeszcze tylko system rekomendacyjny Netfliksa i personalizację wyników wyszukiwania przez Google. Wszystkie większe firmy czynią ogromne inwestycje aby ja rozwinąć i przyciągnąć do niej programistów.

Należy pamiętać, że o ile uczenie maszynowe to część badań nad sztuczną inteligencją (AI - Artificial Intelligence), to nie wyczerpuje ono tego terminu. Możemy co najwyżej mówić o słabej sztucznej inteligencji (Weak AI) czyli maszynie doskonale wykonującej określonej zadanie, w przeciwieństwie do ogólnej sztucznej inteligencji (General AI) która potrafi znaleźć rozwiązanie niezależnie od zadania.



Niestety, podobnie jak w przypadku Google, nie ma w tej chwili dokładnego terminu wprowadzenia na polski rynek asystenta głosowego Amazonu. Interfejs głosowy oraz usługi skumulowane w asystentach mają być podstawą przyszłej interakcji z internetem i komputerami. Najwięksi gracze na rynku inwestują ogromne zasoby w rozwój tej technologii. Oby Polacy otrzymali pełny dostęp do tej technologii najszybciej jak to tylko możliwe.

Jakub Wardzała