Hver safnar stórum gögnum og hvers vegna?

Haustið 2019 kom upp hneykslismál með Apple Card þjónustunni: við skráningu gaf hún út mismunandi lánsheimildir fyrir karla og konur. Jafnvel Steve Wozniak var ekki heppinn:

Ári áður kom í ljós að Netflix pallurinn sýnir notendum mismunandi veggspjöld og stríðni, allt eftir kyni, aldri og þjóðerni. Fyrir þetta var þjónustan sökuð um kynþáttafordóma.

Að lokum er Mark Zuckerberg reglulega áminntur fyrir meinta söfnun, sölu og meðhöndlun á gögnum notenda sinna af Facebook. Í gegnum árin var hann ákærður og jafnvel dæmdur fyrir meðferð í bandarísku kosningunum, aðstoðað rússnesku sérþjónustuna, kynt undir hatri og róttækum skoðunum, óviðeigandi auglýsingar, leka notendagögnum, hindrað rannsóknir á barnaníðingum.

Facebook færsla eftir zuck

Á sama tíma birtir Pornhub netþjónustan árlega skýrslur um hvers konar klám fólk af mismunandi þjóðerni, kyni og aldri er að leita að. Og af einhverjum ástæðum truflar þetta engan. Þó allar þessar sögur séu svipaðar: í hverri þeirra erum við að fást við stór gögn, sem á XNUMXst öldinni er kölluð „ný olía“.

Hvað eru stór gögn

Stór gögn – þau eru líka stór gögn (eng. Big Data) eða lýsigögn – eru gagnamagn sem berast reglulega og í miklu magni. Þeim er safnað, unnið og greind, sem leiðir til skýrra líkana og mynsturs.

Sláandi dæmi eru gögnin frá Large Hadron Collider, sem koma stöðugt og í miklu magni. Með hjálp þeirra leysa vísindamenn mörg vandamál.

En stór gögn á vefnum eru ekki aðeins tölfræði fyrir vísindarannsóknir. Hægt er að nota þær til að fylgjast með því hvernig notendur mismunandi hópa og þjóðerna haga sér, hverju þeir veita athygli og hvernig þeir hafa samskipti við efni. Stundum, fyrir þetta, er gögnum ekki safnað frá einum uppruna, heldur frá nokkrum, borin saman og auðkennd ákveðin mynstur.

Um hversu mikilvæg stór gögn eru á netinu byrjuðu þeir að tala þegar það var mjög mikið af þeim. Í upphafi árs 2020 voru 4,5 milljarðar netnotenda í heiminum, þar af 3,8 milljarðar skráðir á samfélagsmiðla.

Hver hefur aðgang að Big Data

Samkvæmt könnunum telur meira en helmingur landa okkar að gögn þeirra á netinu séu notuð af þriðja aðila. Á sama tíma birta margir persónulegar upplýsingar, myndir og jafnvel símanúmer á samfélagsnetum og forritum.

Hver safnar stórum gögnum og hvers vegna?
Hver safnar stórum gögnum og hvers vegna?
Hver safnar stórum gögnum og hvers vegna?
Hver safnar stórum gögnum og hvers vegna?

Það þarf að útskýra það hér: fyrsti maður er notandinn sjálfur, sem setur gögn sín á hvaða auðlind eða forrit sem er. Um leið samþykkir hann (setur hak í samninginn) við vinnslu þessara gagna annar aðili – það er að segja eigendur auðlindarinnar. Þriðji aðili er þeir sem eigendur auðlindarinnar geta flutt eða selt notendagögn til. Oft er þetta skrifað í notendasamninginn, en ekki alltaf.

Þriðji aðilinn eru ríkisstofnanir, tölvuþrjótar eða fyrirtæki sem kaupa gögn í viðskiptalegum tilgangi. Hinir fyrrnefndu geta fengið gögn með ákvörðun dómstóls eða æðra stjórnvalds. Tölvuþrjótar nota auðvitað engar heimildir - þeir hakka einfaldlega gagnagrunna sem eru geymdir á netþjónunum. Fyrirtæki (lögum samkvæmt) hafa aðeins aðgang að gögnum ef þú hefur sjálfur leyft þau – með því að haka í reitinn undir samningnum. Annars er það ólöglegt.

Af hverju nota fyrirtæki Big Data?

Stór gögn á viðskiptasviði hafa verið notuð í áratugi, þau voru bara ekki eins mikil og þau eru núna. Þetta eru til dæmis skrár úr eftirlitsmyndavélum, gögn frá GPS-leiðsögumönnum eða netgreiðslur. Nú, með þróun samfélagsneta, netþjónustu og forrita, er hægt að tengja þetta allt saman og fá sem fullkomnustu mynd: hvar hugsanlegir viðskiptavinir búa, hvað þeim finnst gaman að horfa á, hvert þeir fara í frí og hvaða bíltegund þeir eiga.

Af dæmunum hér að ofan er ljóst að með hjálp stórra gagna vilja fyrirtæki fyrst og fremst miða á auglýsingar. Það er að segja að bjóða vörur, þjónustu eða einstaka valkosti aðeins fyrir réttan markhóp og jafnvel sérsníða vöruna fyrir tiltekinn notanda. Auk þess verða auglýsingar á Facebook og öðrum stórum kerfum sífellt dýrari og að sýna öllum í röð er alls ekki arðbært.

Upplýsingar um hugsanlega viðskiptavini frá opnum aðilum eru virkir notaðar af tryggingafélögum, einkareknum heilsugæslustöðvum og vinnuveitendum. Þeir fyrrnefndu geta til dæmis breytt tryggingaskilmálum ef þeir sjá að þú ert oft að leita að upplýsingum um ákveðna sjúkdóma eða lyf og vinnuveitendur geta metið hvort þú ert viðkvæm fyrir árekstrum og andfélagslegri hegðun.

En það er annað mikilvægt verkefni sem hefur verið í erfiðleikum á undanförnum árum: að komast nálægt leysingahópnum. Þetta er ekki svo auðvelt að gera, þó að verkefnið sé verulega auðveldað með greiðsluþjónustu og rafrænum ávísunum í gegnum einn OFD (fiscal data operator). Til að komast sem næst reyna fyrirtæki jafnvel að hafa uppi á og „hlúa“ að hugsanlegum viðskiptavinum frá barnæsku.: í gegnum netleiki, gagnvirk leikföng og fræðsluþjónustu.

Hvernig virkar það?

Stærstu tækifærin til gagnasöfnunar eru frá alþjóðlegum fyrirtækjum sem eiga nokkrar þjónustur í einu. Facebook hefur nú meira en 2,5 milljarða virka notendur. Á sama tíma á fyrirtækið einnig aðra þjónustu: Instagram - meira en 1 milljarð, WhatsApp - meira en 2 milljarða og aðrar.

En Google hefur enn meiri áhrif: Gmail er notað af 1,5 milljörðum manna í heiminum, aðra 2,5 milljarða af Android farsímastýrikerfinu, meira en 2 milljörðum af YouTube. Og það er ekki talið með Google leit og Google Maps forritunum, Google Play versluninni og Chrome vafranum. Það er eftir að festa netbankann þinn - og Google mun geta vitað bókstaflega allt um þig. Við the vegur, Yandex er nú þegar skrefi á undan í þessum efnum, en það nær aðeins til rússneskumælandi áhorfenda.



???? Í fyrsta lagi hafa fyrirtæki áhuga á því sem við birtum og líkar við á samfélagsmiðlum. Til dæmis, ef bankinn sér að þú ert giftur og ert virkur hrifinn af stelpum á Instagram eða Tinder, þá er líklegra að þú samþykkir neytendalán. Og veð á fjölskyldunni er farið.

Það skiptir líka máli hvaða auglýsingar þú smellir á, hversu oft og með hvaða árangri.

(Þ.e.a.s. Næsta skref eru einkaskilaboð: þau innihalda miklu meiri upplýsingar. Skilaboðum var lekið á VKontakte, Facebook, WhatsApp og aðra spjallforrit. Samkvæmt þeim, við the vegur, er auðvelt að fylgjast með landfræðilegri staðsetningu á þeim tíma sem skilaboðin eru send. Þú hefur örugglega tekið eftir því: þegar þú ræðir um að kaupa eitthvað eða bara panta pizzu með einhverjum, birtast viðeigandi auglýsingar strax í straumnum.

🚕 Stór gögn eru notuð á virkan hátt og „lekið“ af sendingar- og leigubílaþjónustum. Þeir vita hvar þú býrð og vinnur, hvað þú elskar, hverjar áætlaðar tekjur þínar eru. Uber, til dæmis, sýnir verðið hærra ef þú ert að keyra heim af barnum og augljóslega ofgert. Og þegar þú ert með fullt af öðrum safntækjum í símanum þínum, þvert á móti, munu þeir bjóða upp á ódýrari.

(Þ.e.a.s. Það eru þjónustur sem nota myndir og myndbönd til að safna eins miklum upplýsingum og mögulegt er. Til dæmis tölvusjónasöfn – Google er með eitt. Þeir skanna þig og umhverfi þitt til að sjá hvaða stærð eða hæð þú ert, hvaða vörumerki þú notar, hvaða bíl þú keyrir, hvort þú ert með börn eða gæludýr.

(Þ.e.a.s. Þeir sem gefa banka SMS-gátt fyrir póstsendingar geta fylgst með kaupum þínum á kortinu – að vita síðustu 4 tölustafina og símanúmerið – og selja síðan þessi gögn til einhvers annars. Þess vegna allt þetta ruslpóst með afslætti og pizzu að gjöf.

🤷️️ Að lokum lekum við sjálf gögnum okkar til vinstri þjónustu og forrita. Mundu að þessi hype í kringum Getcontact, þegar allir voru ánægðir með að fylla út símanúmerið sitt til að komast að því hvernig það var skrifað af öðrum. Og finndu nú samkomulagið þeirra og lestu hvað það segir um flutning gagna þinna (spilla: eigendur geta flutt þau til þriðja aðila að eigin geðþótta):

Hver safnar stórum gögnum og hvers vegna?

Fyrirtæki geta með góðum árangri safnað og jafnvel selt notendagögn í mörg ár, þar til það kemur til máls – eins og gerðist með sama Facebook. Og svo var afgerandi hlutverkið gegnt með broti fyrirtækisins á GDPR – lögum í ESB sem takmarkar notkun gagna mun strangari en þau bandarísku. Annað nýlegt dæmi er Avast vírusvarnarhneykslið: ein af dótturfyrirtækjum fyrirtækisins safnaði og seldi gögnum frá 100 til 400 milljón notendum.

En hefur allt þetta einhverja kosti fyrir okkur?

Hversu stór gögn hjálpa okkur öllum?

Já, það er líka björt hlið.

Stór gögn hjálpa til við að ná glæpamönnum og koma í veg fyrir hryðjuverkaárásir, finna týnd börn og vernda þau gegn hættu.

Með þeirra hjálp, við við fáum flott tilboð frá bönkum og persónuafslætti. Þökk sé þeim við við borgum ekki fyrir margar þjónustur og samfélagsnet sem græða aðeins á auglýsingum. Annars myndi Instagram eitt og sér kosta okkur nokkur þúsund dollara á mánuði.

Facebook eitt og sér hefur 2,4 milljarða virka notendur. Á sama tíma nam hagnaður þeirra fyrir árið 2019 18,5 milljörðum dala. Það kemur í ljós að fyrirtækið þénar allt að $7,7 á ári frá hverjum notanda með auglýsingum.

Að lokum, stundum er það bara þægilegt: þegar þjónustan veit hvar þú ert og hvað þú vilt og þú þarft ekki að leita að upplýsingum sem þú þarft sjálfur.

Annað efnilegt svið fyrir beitingu Big Data er menntun.

Í einum af bandarísku háskólunum í Virginíu var gerð rannsókn til að safna gögnum um nemendur í áhættuhópnum svokallaða. Þetta eru þeir sem læra illa, missa af kennslu og eru við það að hætta. Staðreyndin er sú að í fylkjunum er árlega dregið frá um 400 manns. Þetta er slæmt bæði fyrir háskólana, sem fá lækkuð einkunnir og skorið niður, og námsmennina sjálfa: Margir taka lán til menntunar, sem eftir frádrátt á að endurgreiða. Svo ekki sé minnst á tapaðan tíma og starfsmöguleika. Með hjálp stórra gagna er hægt að bera kennsl á þá sem eru eftirbátar í tíma og bjóða þeim upp á kennara, aukatíma og aðra markvissa aðstoð.

Þetta, við the vegur, hentar líka fyrir skóla: þá mun kerfið láta kennara og foreldra vita - þeir segja, barnið á í vandræðum, hjálpum því saman. Big Data mun einnig hjálpa þér að skilja hvaða kennslubækur virka betur og hvaða kennarar útskýra efnið auðveldara.

Annað jákvætt dæmi er starfsferill.: Þetta er þegar unglingum er hjálpað að ákveða framtíðarstarf sitt. Hér gerir stór gögn þér kleift að safna upplýsingum sem ekki er hægt að fá með hefðbundnum prófum: hvernig notandinn hagar sér, hverju hann veitir athygli, hvernig hann hefur samskipti við efnið.

Í sömu Bandaríkjunum er starfsleiðsögn – SC ACCELERATE. Það notar meðal annars CareerChoice GPS tækni: þeir greina gögn um eðli nemenda, tilhneigingu þeirra til viðfangsefna, styrkleika og veikleika. Gögnin eru síðan notuð til að hjálpa unglingum að velja rétta framhaldsskólana fyrir þá.


Gerast áskrifandi og fylgist með okkur á Yandex.Zen — tækni, nýsköpun, hagfræði, menntun og miðlun á einni rás.

Skildu eftir skilaboð