Kako se veliki podaci mijenjaju svakodnevni život diljem Amerike?

Ideja o 'velikim podacima' postala je sveprisutna, no što je to i kako se mijenja način na koji živimo? Sjeli smo s znanstvenicom podataka, doktoratom Harvarda i nominacijom Nacionalne nagrade za knjigu Cathy O'Neil da to otkrijemo.

CT: Započnimo s osnovama - što je točno "veliki podaci"?

CO: Veliki podaci novi je pristup predviđanju stvari. Konkretnije, "veliki podaci" upotreba je slučajno prikupljenih podataka - poput načina pretraživanja preglednika ili onoga što radite na Facebooku - da bi se zaključilo o vama, poput onoga što ćete kupiti ili kakve su vaše političke pripadnosti. To je neizravan način otkrivanja ljudi. Na primjer, kamera koja nas pregledava ne pita "Što radite?" - tek se vidi što radimo.

CT: A što je algoritam?

CO: Algoritmi su proračuni koji [tumače] podatke koji su prikupljeni o vama kako bi stvorili predviđanje. Zamislite to kao matematičku jednadžbu koja pokušava odgovoriti na pitanje koje je uokvireno kao predviđanje, poput: "Hoće li ova osoba kupiti nešto?" ili "Hoće li ova osoba glasati za nekoga?"

CT: Zašto sada toliko toga čujem?

CO: Prije 'velikih podataka', statističari bi radili skupe stvari poput anketiranja ljudi da bi shvatili budućnost. Na primjer, postavljati ljudima direktna pitanja poput: "Za koga ćete glasati?" Sada se sve više oslanjamo na 'iscrpljivanje podataka', tako ja nazivam podatke koji se neprestano prikupljaju o vama, kako bismo zaključili stvari o vama.

Prije 'velikih podataka', tvrtke su imale samo divlja nagađanja. Sada imamo bolje od divljih nagađanja. Ono što je iznenađujuće je da su većina algoritama velikih podataka divlje netačni i nema razloga da mislite da su u pravu. Ali bolji su od divljih nagađanja. I zato su se veliki podaci skinuli kao i do sad.

CT: Ako su netočni, što onda odražavaju?

CO: Pogrešni skupovi podataka kojima ih hranimo. Algoritmi ne znaju ništa osim onoga što im kažemo. Kad imamo neravne podatke i hranimo ih algoritmom ili pristrasnim podacima, pomislit ćemo da je to stvarnost.

Ailsa Johnson / © Kulturno putovanje

CT: Koji je primjer u stvarnom svijetu?

CO: Primjer može biti da su u Sjedinjenim Državama crnački ljudi pet puta vjerojatnije da će biti uhićeni zbog pušenja, nego bijelci. To nije zato što crnci puše lonac češće - obje skupine puše lonac istom brzinom. Crnci imaju samo mnogo veću vjerojatnost da će biti uhićeni zbog toga. Ako to predate algoritmu, koji mi radimo, ispravno je zaključiti da je vjerovatno da će crnci ubuduće biti uhapšeni zbog pušenja. I tada će crnci dati veće ocjene rizika za kriminal, što ima utjecaja na kaznene kazne.

Drugi primjer je misaoni eksperiment. Koristit ću Fox News, jer je Fox News nedavno imao erupcije povezane s unutarnjom kulturom seksizma. Eksperiment je: "Što bi se dogodilo kada bi Fox News pokušao koristiti vlastite podatke za izradu algoritma strojnog učenja kako bi u budućnosti zaposlio ljude?"

Recimo da tražimo ljude koji su primjerice bili uspješni na Fox Newsu. Ovisi kako biste definirali uspjeh, ali obično biste gledali ljude koji dobivaju povišice, napredovanja ili ostaju dugo. Po bilo kojoj od tih mjera, podaci bi odražavali da žene ne uspijevaju na Fox Newsu. Ako se koristi kao algoritam zapošljavanja, to bi propagiralo taj problem. Pogledao bi skup podnositelja zahtjeva i rekao bi: „Ne želim zaposliti nijednu ženu, jer ovdje nisu uspješne. Nisu dobri zaposlenici. ' I ne moraju to biti samo Fox News - svaka korporativna kultura ima pristranosti. Kad unesete podatke algoritma, tada pristranost algoritma to prenosi. Ono nastavlja jačati pristranosti koja već postoje u društvu.

CT: Jesu li pristranosti namjerne?

CO: Mislim da znanstvenici ne pokušavaju napraviti seksističke ili rasističke algoritme. Ali algoritmi strojnog učenja izuzetno su dobri u odabiru relativno nijansiranih obrazaca i zatim njihovom širenju. To nije nešto što znanstvenici namjerno rade, ali svejedno je pristranost.

CT: Kakvu ulogu igraju netačni algoritmi u našem svakodnevnom životu?

CO: Koriste ih u svim vrstama odluka za život ljudi - od prijema na fakultetu do pronalaska posla.

Postoje algoritmi koji odlučuju kako će policija vršiti policijsku četvrt, kao i algoritmi koji odlučuju kako će suci izricati kazne okrivljenicima. Postoje algoritmi koji odlučuju koliko ćete platiti osiguranje ili kakvu travanj (kamatnu stopu) dobijete na svojoj kreditnoj kartici. Postoje algoritmi koji određuju kako ćete raditi na svom poslu i koji se koriste za određivanje porasta plaća. Postoje algoritmi na svakom koraku, od rođenja do smrti.

CT: Pa gdje nas to ostavlja?

CO: Uskočili smo u doba velikih podataka i bacili algoritme na svaki pojedini problem koji imamo, pretpostavljajući da ti algoritmi moraju biti pošteniji od ljudi - ali zapravo su jednako nepošteni kao i ljudi. Moramo bolje.

Kliknite ovdje za čitanje drugog dijela našeg intervjua s dr. O'Neilom. Njezina knjiga "Oružje uništenja matematike: Kako veliki podaci povećavaju nejednakost i prijeti demokratiji" je sada dostupna.