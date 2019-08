Maszyny nieustannie wznoszą się na coraz wyższy poziom inteligencji, o czym świadczy wyczyn robota Pluribus, który pokonał pięciu elitarnych graczy w Texas Hold'em, bardzo popularnej odmianie pokera. Tym samym pierwszy raz w historii sztuczna inteligencja wyszła zwycięsko z potyczki z więcej niż dwoma przeciwnikami.

Zespół naukowców, odpowiedzialny za powstanie Pluribusa, w przeszłości skonstruował już innego robota o nazwie Libratus, który pokonał profesjonalistów w rozgrywce dwuosobowej. Badacze jednak na tym nie poprzestali i dokonali licznych udoskonaleń, aby sztuczna inteligencja była w stanie poradzić sobie z większą liczbą przeciwników. Podczas 12-dniowej sesji testowej Pluribus pokonał łącznie 15 czołowych graczy na świecie i utarł nosa wszystkim sceptykom ze środowisk akademickich, którzy informowali twórców, że eksperyment nie ma prawa się udać.

O ile boty w przeszłości udowodniły już, że są bezkonkurencyjne w dwuosobowych potyczkach, gdzie występuje prosty scenariusz zerojedynkowy (jeden zwycięzca, jeden przegrany), o tyle gra z większą liczbą przeciwników wymaga zdefiniowania zaawansowanych strategii, co wydawało się przekraczać możliwości sztucznej inteligencji. Okazuje się jednak, że jedynie kwestią czasu było powiększenie zdolności taktycznych botów.



Naukowcy zwrócili uwagę, że Pluribus kładzie podwaliny pod przyszłe systemy sztucznej inteligencji, które będą w stanie rozwiązywać złożone problemy w życiu codziennym. Sukces w pokerze może być milowym krokiem również na innych polach, związanych np. z wykrywaniem przestępstw oraz udoskonalaniem autonomicznych samochodów.



Aby uporać się z pięcioma przeciwnikami, twórcy Pluribusa, Noam Brown i Tuomas Sandholm, radykalnie zmienili algorytm wykorzystywany przez Libratusa. Większość botów zaprojektowanych do grania dokonuje wyborów na podstawie tzw. drzew decyzyjnych, jednakże dodanie dodatkowych przeciwników spowodowało, że ta taktyka okazała się nieefektywna, ponieważ robot nie był w stanie przewidzieć scenariusza do końca rozgrywki. Większa liczba graczy przekłada się na większą liczbę potencjalnych ruchów.



Przełomem było opracowanie metody, która umożliwiła Pluribusowi dokonywanie trafnych wyborów poprzez analizę wyłącznie kilku następnych ruchów, zamiast przewidywania całej rozgrywki aż do końca. Zmiana podejścia bota okazała się kluczowa i przyczyniła się do zwiększenia jego efektywności.



Pluribus uczył się od podstaw i podobnie jak człowiek zdobywał doświadczenie wraz z kolejnymi rozegranymi grami. Zaczynał od losowych strategii, ale po każdym następnym rozdaniu spoglądał wstecz na swoje posunięcia i analizował, jak wypadało się zachować, aby zarobić więcej pieniędzy. Jeśli alternatywne ruchy prowadziły do lepszych wyników, to w przyszłości bot z dużym prawdopodobieństwem nie popełni drugi raz tego samego błędu.

Po rozegraniu wielu pojedynków i zgromadzeniu dużej ilości danych, Pluribus opracował swoją zwycięską strategię. W każdym momencie rozgrywki, bot porównuje obecny stan gry z poprzednimi bataliami i na ich podstawie przewiduje, co wydarzy się w kilku następnych ruchach. Być może najważniejszy w tym wszystkim jest jednak fakt, że Pluribus nauczył się grać bez pomocy człowieka, dzięki czemu ustalił kilka strategii, których ludzie zazwyczaj nie stosują.

Poker okazał się doskonałym sposobem na zmierzenie postępu sztucznej inteligencji, ponieważ boty mogą być oceniane w konfrontacji z czołowymi jednostkami gatunku ludzkiego. Rozwój maszyn może być dla nas wszystkich dobrą informacją, lecz pod warunkiem, że nie wyrwą się one spod naszej kontroli (czego z pewnością byśmy nie chcieli). Jedno jest pewne: jeśli kiedykolwiek spotkacie w kasynie robota, który rzuci wam wyzwanie, to dla dobra własnego portfela, pamiętajcie by grzecznie odmówić.