Żyjemy w dobie post-prywatności. Defetyści biją na alarm, przekonani, że najczarniejsze fantazje George'a Orwella na naszych oczach stają się rzeczywistością. Firmy, które żyją z przetwarzanych danych postawiły sobie nadrzędny cel: okiełznać potencjał Big Data. Czy "wielki brat" kontrolować będzie każdą sferę naszego życia? Jakie informacje na nasz temat krążą po serwerach i czy możemy jeszcze spać spokojnie? Przedstawiamy fakty i obalamy mity o "wszechwiedzących" korporacjach.

W początkowym stadium rozwoju ogólnoświatowej sieci, jej treści tworzone były przede wszystkim przez wydawców serwisów internetowych. Od roku 2001 dynamika na łączach zmieniła się diametralnie. Internet wkroczył w okres zwany Web 2.0, a jak podaje Oracle, liczba danych w Sieci rozrasta się w tempie przekraczającym 40 proc. w skali roku. Ich ogromna część generowana jest przez internautów, którzy przestali być pasywnymi odbiorcami, a stali się współtwórcami cyfrowej rzeczywistości.



Według analiz DOMO tylko w ciągu minuty użytkownicy samego Facebooka tworzą 2 460 000 nowych treści, w serwisie YouTube w tym samym czasie publikuje się 400 godzin materiałów wideo, a na Dropboxie ląduje ponad 833 tys. nowych plików. Poza oczywistymi śladami w sieci, takimi jak np. posty w mediach społecznościowych, pozostawiamy po sobie mniej oczywiste tropy i jest ich więcej niż mogłoby się wydawać. Każda odwiedzona strona internetowa i czas spędzony na jej przeglądaniu, frazy wpisane w wyszukiwarkę, przeglądane produkty i sfinalizowane zakupy, glokalizacja - nasza codzienna aktywność w Internecie nie przepada w próżni. Zarówno najwięksi rynkowi giganci, jak i mniejsze firmy specjalizujące się w analityce Big Data robią wszystko, by dowiedzieć się o niej jak najwięcej. IDC prognozuje, że do końca 2018 roku przepływ danych zewnętrznych w przedsiębiorstwach wzrośnie aż pięciokrotnie, zaś liderzy cyfrowej transformacji zwiększą ilość danych wychodzących co najmniej 500-krotnie.



- By lepiej poznać rynek, zyskać 360 stopniowy obraz klienta lub docierać ze spersonalizowanym przekazem reklamowym do odpowiedniej osoby w odpowiednim czasie, coraz więcej firm sięga po Big Data, czyli wieloaspektową analitykę wielkich, nieustrukturyzowanych zbiorów danych. Cel jest jeden: głęboka analiza, która cyfrowe informacje zamienia w pieniądze - powiedział Piotr Prajsnar z Cloud Technologies, firmy zajmującej się Big Data marketingiem.

Aktualne dane o poczynaniach i upodobaniach użytkowników sieci to dla firm smakowity kąsek, pod warunkiem, że potrafią zrobić z nich użytek. Tu z pomocą przychodzą specjaliści, znani jako data scientists i dostawcy platform DMP (data management platform), służących do zaawansowanej analityki nieustrukturyzowanych cyfrowych informacji pochodzących z licznych źródeł. Mimo szybkiego rozwoju technologii tego typu, obecnie wykorzystuje się jedynie 20 proc. całego wolumenu Big Data. Według ekspertów z IDC, do 2020 r. liczba ta wzrośnie do 30 proc. To wciąż niewiele, choć wystarczająco, by totalnie zrewolucjonizować globalną gospodarkę. Potencjał ukryty w nieokiełznanych zbiorach danych rozpala wyobraźnię ekspertów, a liczy się je w Zettabajtach. Niemniej jednak, bez owianych tajemnicą pokładów cyfrowych informacji, nieosiągalnych dla współczesnej technologii, potentaci Big Data radzą sobie przyzwoicie. Korzystając z będącego w ich zasięgu 20 proc. wolumenu Big Data potrafią dokonać rzeczy, o których nie śnili najwięksi wizjonerzy. Zaawansowane narzędzia analityczne w połączeniu z nowymi technologiami otworzyły przed nimi ogromne możliwości, dając wgląd w prywatność zwykłych obywateli.



Kowalski prześwietlony na wylot

Dane zbierają wszyscy, począwszy od supermarketów, przez firmy ubezpieczeniowe, na dostawcach usług internetowych kończąc. Standardem są dane kontaktowe i demograficzne, takie jak wiek, stan cywilny lub płeć, jednak są one prawdziwie przydatne dopiero wówczas, gdy zestawi się je z potężnymi zasobami Big Data - danymi pochodzącymi z różnych źródeł.



Prawdą jest, że o rodzaju gromadzonych informacji decyduje profil firmy. Tak np. dostawcy Internetu (ISP) rejestrują wszystkie odwiedzane przez nas strony, nawet jeśli korzystamy z przeglądarki w trybie prywatności. Wyszukiwarki internetowe znają historię wyszukiwanych przez nas haseł. Gigant z Montain View, m.in. dzięki przeglądarce Chrome i Google Analytics Solutions, wie nie tylko na jakie strony wchodzimy, ale również ile spędzamy czasu na poszczególnych podstronach. Taką wiedzę posiadają również hurtownie danych, a pozyskują ją m.in. dzięki plikom cookies. Największa taka hurtownia w Europie należy do Cloud Technologies, polskiej spółki notowanej na NewConnect.



- Obecnie przetwarzamy już ponad 3 mld anonimowych profili internautów. Dokładnie analizujemy ich aktywność, zainteresowania i preferencje. Analizujemy dane demograficzne, geolokalizacyjne i tysiące innych zmiennych. Wszystko to odbywa się przy pomocy sztucznej inteligencji i uczenia maszynowego - dodał jej CEO, Piotr Prajsnar.

To wystarczy by stwierdzić, czym się interesujemy, czego szukamy w sieci, jakie są nasze ulubione marki, czy jesteśmy w związku i jaki jest stan naszej zamożności. Użytkownicy telefonów z systemem Android, posiadającym usługę Google Now, mogą być pewni, że kalifornijska firma wie gdzie mieszkają i chodzą do pracy i wcale się z tym nie kryje. By sprawdzić historię glokalizacji wystarczy wejść na Google.com/maps/timeline/. Facebook również ma swoje za uszami. Analizując aktywność użytkowników i treść wiadomości potrafi z niespotykaną precyzją przewidzieć rozstania osób będących ze sobą w związku. Banki z kolei w procesach scoringowych analizują m.in. historię płatności kartą i aktywność w mediach społecznościowych.



Algorytm przewidzi ciążę

W sprzedaży detalicznej dane o klientach już od lat są wyznacznikiem strategii sprzedażowych i działań marketingowych. W Stanach Zjednoczonych, każdy znaczący sprzedawca detaliczny posiada departament analityki predyktywnej, starający się zrozumieć nie tylko nawyki zakupowe swoich klientów, lecz także ich osobiste przyzwyczajenia i upodobania. Target Corporation, jedna z najlepiej zarabiających amerykańskich sieci handlowych zbiera ogromne ilości danych o każdej osobie, która przekroczy próg należącego do niej sklepu. Jej klienci otrzymują unikalne numery identyfikacyjne, powiązane z ich kartami płatniczymi, adresami e-mail i danymi pozyskanymi z zewnętrznych źródeł, a wszystkie produkty przez nich kupowane są skrupulatnie rejestrowane i analizowane przez system. By trafić z przekazem marketingowym do kobiet będących w 3 trymestrze ciąży, data mainerzy z Target Corporation przypisali każdemu klientowi punkty, mające określić prawdopodobieństwo ciąży na podstawie historii zakupów. Udało się im zidentyfikować 25 produktów kupowanych przez kobiety w stanie błogosławionym.



- Weźmy za przykład fikcyjną klientkę sklepu. Jenny Ward ma 23 lat, mieszka w Atlancie, a w marcu kupiła kokosowe masło do ciała, wystarczająco dużą torebkę, by nosić w niej pieluchy, suplementy z cynkiem i magnezem i jasnoniebieski pled. Istnieje 87 proc. prawdopodobieństwo, że jest w ciąży, a termin rozwiązania wyznaczono na sierpień. Dzięki danym połączonym z jej Guest ID, Target potrafi pobudzić jej nawyki. System wie, że jeśli dostanie wiadomość mailem, to prawdopodobnie skłoni ją to do dokonania zakupu online, ale jeśli w piątek dostanie kupon drogą pocztową, to wykorzysta go podczas weekendowych zakupów - wytłumaczył działanie systemu Andrew Pole, Marketing BI manager w Target.

To, że sieć handlowa zna swoich klientów lepiej niż ich bliscy, okazało się, gdy poddenerwowany ojciec licealistki pojawił się w jednym ze sklepów z pretensjami, że reklamy przesyłane niepełnoletniej dziewczynie są niemoralne, bo zachęcają ją do zajścia w ciążę. Gdy jeden z managerów po jakimś czasie zadzwonił do niego, by wyjaśnić sprawę, zamiast oskarżeń usłyszał przeprosiny. Okazało się bowiem, że uczennica jednej z amerykańskich szkół jest brzemienna, a system do analityki danych wychwycił ten fakt szybciej, niż jej własny ojciec.



Wielki brat nie taki zły, jak go malują?

Od digitalizacji społeczeństwa nie da się uciec. Zdaniem Macieja Klepackiego, eksperta ds. cyfryzacji, wraz z rozwojem technologii mobilnych i Internetu rzeczy, wdziera się ona do naszego życia drzwiami i oknami.



- Sceptycy widzą w niej same niebezpieczeństwa, jednak to z powodu udogodnień coraz częściej rezygnujemy z prywatności. To, w jaki sposób nowe technologie rewolucjonizują i ułatwiają naszą codzienną egzystencję sprawia, że jesteśmy w stanie przymknąć oko na inwazyjne działanie serwisów internetowych czy aplikacji mobilnych - wyjaśnił Klepacki.



W przypadku reklamy, gromadzenie anonimowych informacji o internautach przekłada się na liczne korzyści. Dotychczasowy sposób dystrybucji takich treści dorowadził popularyzacji adblocków i kryzysu w branży wydawnicze. W Polsce, według raportu OnAudience.com, blokuje się najwięcej, bo aż 42 proc. odsłon reklam w Internecie. Jak podaje serwis eMarketer, w 2016 r. z powodu takiego oprogramowania, globalne straty wydawców sięgnęły nawet 27 mld dolarów. Zastąpienie nachalnych kreacji wyświetlanych na chybił trafił reklamą precyzyjnie dopasowaną do potrzeb i zainteresowań internautów, ma przyczynić się do naprawy sytuacji na rynku wydawniczym i poprawy jakości surfowania w sieci.