Samþykkja eins og gögn: hvernig fyrirtæki læra að hagnast á stórum gögnum

Með því að greina stór gögn læra fyrirtæki að afhjúpa falin mynstur og bæta afkomu sína. Stefnan er í tísku, en ekki allir geta notið góðs af stórum gögnum vegna skorts á menningu að vinna með þeim

„Því algengara sem nafn einstaklings er, því líklegra er að hann borgi á réttum tíma. Því fleiri hæðir sem húsið þitt hefur, því tölfræðilega ertu betri lántakandi. Stjörnumerkið hefur nánast engin áhrif á líkurnar á endurgreiðslu, en sálfræðin gerir það verulega,“ segir Stanislav Duzhinsky, sérfræðingur hjá Home Credit Bank, um óvænt mynstur í hegðun lántakenda. Hann skuldbindur sig ekki til að útskýra mörg af þessum mynstrum - þau voru opinberuð af gervigreind, sem vann þúsundir viðskiptavinaprófíla.

Þetta er kraftur stórra gagnagreininga: með því að greina mikið magn af óskipulögðum gögnum getur forritið uppgötvað margar fylgnir sem vitrasti mannlegur sérfræðingur veit ekki einu sinni um. Sérhvert fyrirtæki hefur mikið magn af óskipulögðum gögnum (stór gögn) – um starfsmenn, viðskiptavini, samstarfsaðila, keppinauta, sem hægt er að nota í viðskiptahagsmunum: bæta áhrif kynningar, ná söluvexti, draga úr starfsmannaveltu o.s.frv.

Fyrstir til að vinna með stór gögn voru stór tækni- og fjarskiptafyrirtæki, fjármálastofnanir og smásölufyrirtæki, segir Rafail Miftakhov, forstjóri Deloitte Technology Integration Group, CIS. Nú er áhugi fyrir slíkum lausnum í mörgum atvinnugreinum. Hverju hafa fyrirtæki áorkað? Og leiðir stór gagnagreining alltaf til verðmætra ályktana?

Ekki auðvelt álag

Bankar nota reiknirit stórra gagna fyrst og fremst til að bæta upplifun viðskiptavina og hámarka kostnað, sem og til að stjórna áhættu og berjast gegn svikum. „Á undanförnum árum hefur raunveruleg bylting átt sér stað á sviði stórra gagnagreininga,“ segir Duzhinsky. „Notkun vélanáms gerir okkur kleift að spá mun nákvæmari fyrir um líkurnar á vanskilum lána – vanskil í bankanum okkar eru aðeins 3,9%. Til samanburðar má nefna að frá og með 1. janúar 2019 var hlutfall lána með vanskilum yfir 90 daga af lánum til einstaklinga að sögn Seðlabankans 5%.

Jafnvel örfjármögnunarstofnanir eru undrandi yfir rannsóknum á stórum gögnum. „Að veita fjármálaþjónustu án þess að greina stór gögn í dag er eins og að gera stærðfræði án tölur,“ segir Andrey Ponomarev, forstjóri Webbanka, netlánavettvangs. „Við gefum út peninga á netinu án þess að sjá hvorki viðskiptavininn né vegabréfið hans, og ólíkt hefðbundnum lánveitingum, verðum við ekki aðeins að meta greiðslugetu einstaklings heldur einnig að bera kennsl á persónuleika hans.

Nú geymir gagnagrunnur fyrirtækisins upplýsingar um meira en 500 þúsund viðskiptavini. Hvert nýtt forrit er greint með þessum gögnum í um 800 breytum. Forritið tekur ekki aðeins tillit til kyns, aldurs, hjúskaparstöðu og lánstrausts, heldur einnig tækisins sem einstaklingur fór inn á vettvang, hvernig hann hagaði sér á síðunni. Það getur til dæmis verið skelfilegt að hugsanlegur lántaki hafi ekki notað lánareiknivél eða spurt ekki um skilmála lána. „Að undanskildum nokkrum stöðvunarþáttum – segjum við gefum ekki út lán til einstaklinga yngri en 19 ára – engin af þessum breytum í sjálfu sér er ástæða til að neita eða samþykkja að gefa út lán,“ útskýrir Ponomarev. Það er samsetning þátta sem skiptir máli. Í 95% tilvika er ákvörðun tekin sjálfkrafa, án aðkomu sérfræðinga frá sölutryggingadeild.

Að veita fjármálaþjónustu án þess að greina stór gögn í dag er eins og að gera stærðfræði án tölur.

Stór gagnagreining gerir okkur kleift að draga fram áhugaverð mynstur, segir Ponomarev. Til dæmis reyndust iPhone notendur vera agaðri lántakendur en eigendur Android tækja – þeir fyrrnefndu fá samþykki umsókna 1,7 sinnum oftar. „Sú staðreynd að hermenn greiða ekki niður lán næstum fjórðungi sjaldnar en meðallántaki kom ekki á óvart,“ segir Ponomarev. „En venjulega er ekki gert ráð fyrir að námsmenn séu skyldugir, en á meðan eru vanskil á lánsfé 10% sjaldgæfari en meðaltal grunnsins.

Rannsóknin á stórum gögnum gerir einnig kleift að skora fyrir vátryggjendur. IDX var stofnað árið 2016 og stundar fjarkennslu og sannprófun á skjölum á netinu. Þessi þjónusta er eftirsótt meðal vörutryggingafélaga sem hafa áhuga á að tapa vöru sem minnst. Áður en vátryggjandinn tryggir vöruflutninga, kannar vátryggjandinn, með samþykki ökumanns, hvort áreiðanleiki sé áreiðanlegur, útskýrir Jan Sloka, viðskiptastjóri IDX. Ásamt samstarfsaðila – St. Petersburg fyrirtækinu „Risk Control“ – hefur IDX þróað þjónustu sem gerir þér kleift að athuga auðkenni ökumanns, vegabréfagögn og réttindi, þátttöku í atvikum sem tengjast farmmissi o.s.frv. Eftir greiningu gagnagrunni ökumanna greindi fyrirtækið „áhættuhóp“: oftast tapast farmur meðal ökumanna á aldrinum 30–40 ára með langa akstursreynslu, sem hafa oft skipt um starf að undanförnu. Þá kom í ljós að farminum er oftast stolið af ökumönnum bifreiða, en endingartími þeirra er lengri en átta ár.

Í leit að

Söluaðilar hafa annað verkefni - að bera kennsl á viðskiptavini sem eru tilbúnir til að kaupa og ákvarða árangursríkustu leiðirnar til að koma þeim á síðuna eða verslunina. Í því skyni greina forritin prófíl viðskiptavina, gögn af persónulegum reikningi þeirra, innkaupasögu, leitarfyrirspurnir og notkun bónuspunkta, innihald rafrænna körfa sem þeir byrjuðu að fylla út og yfirgáfu. Gagnagreining gerir þér kleift að greina allan gagnagrunninn og bera kennsl á hópa hugsanlegra kaupenda sem gætu haft áhuga á tilteknu tilboði, segir Kirill Ivanov, forstöðumaður gagnaskrifstofu M.Video-Eldorado hópsins.

Til dæmis auðkennir forritið hópa viðskiptavina, sem hver um sig líkar við mismunandi markaðsverkfæri - vaxtalaust lán, endurgreiðslu eða afsláttarkóða. Þessir kaupendur fá fréttabréf í tölvupósti með tilheyrandi kynningu. Líkurnar á því að maður, sem hefur opnað bréfið, fari á heimasíðu fyrirtækisins, í þessu tilfelli eykst verulega, segir Ivanov.

Gagnagreining gerir þér einnig kleift að auka sölu á tengdum vörum og fylgihlutum. Kerfið, sem hefur unnið úr pöntunarsögu annarra viðskiptavina, gefur kaupanda ráðleggingar um hvað á að kaupa ásamt völdu vörunni. Prófanir á þessari vinnuaðferð, samkvæmt Ivanov, sýndu aukningu í fjölda pantana með aukahlutum um 12% og aukningu í veltu aukahluta um 15%.

Söluaðilar eru ekki þeir einu sem leitast við að bæta gæði þjónustunnar og auka sölu. Síðasta sumar setti MegaFon á markað „snjöll“ tilboðsþjónustu sem byggir á vinnslu gagna frá milljónum áskrifenda. Eftir að hafa rannsakað hegðun þeirra hefur gervigreind lært að mynda persónuleg tilboð fyrir hvern viðskiptavin innan gjaldskrár. Til dæmis, ef forritið tekur fram að einstaklingur sé virkur að horfa á myndband í tækinu sínu, mun þjónustan bjóða honum að auka magn farsímaumferðar. Að teknu tilliti til óska ​​notenda veitir fyrirtækið áskrifendum ótakmarkaða umferð fyrir uppáhalds tegundir af internetafþreyingu - til dæmis með því að nota spjallforrit eða hlusta á tónlist á streymisþjónustum, spjalla á samfélagsnetum eða horfa á sjónvarpsþætti.

„Við greinum hegðun áskrifenda og skiljum hvernig hagsmunir þeirra eru að breytast,“ útskýrir Vitaly Shcherbakov, forstöðumaður stórgagnagreiningar hjá MegaFon. „Til dæmis, á þessu ári hefur umferð AliExpress vaxið 1,5 sinnum miðað við síðasta ár og almennt er fjöldi heimsókna í fataverslanir á netinu að aukast: 1,2–2 sinnum, allt eftir tilteknu úrræði.

Annað dæmi um vinnu rekstraraðila með stór gögn er MegaFon Poisk vettvangurinn til að leita að týndum börnum og fullorðnum. Kerfið greinir hvaða fólk gæti verið í grennd við þann sem saknað er og sendir þeim upplýsingar með mynd og skiltum um þann sem saknað er. Rekstraraðilinn þróaði og prófaði kerfið ásamt innanríkisráðuneytinu og Lisa Alert samtökunum: Innan tveggja mínútna frá kynningu á týnda aðilann fá meira en 2 þúsund áskrifendur, sem eykur verulega líkurnar á árangursríkri leitarniðurstöðu.

Ekki fara á PUB

Stór gagnagreining hefur einnig fundið notkun í iðnaði. Hér gerir það þér kleift að spá fyrir um eftirspurn og skipuleggja sölu. Svo, í Cherkizovo fyrirtækjahópnum, fyrir þremur árum, var lausn byggð á SAP BW innleidd, sem gerir þér kleift að geyma og vinna allar söluupplýsingar: verð, úrval, vörumagn, kynningar, dreifingarleiðir, segir Vladislav Belyaev, CIO. af hópnum "Cherkizovo. Greining á uppsöfnuðum 2 TB upplýsinga gerði það ekki aðeins mögulegt að mynda úrvalið á áhrifaríkan hátt og hámarka vöruúrvalið, heldur auðveldaði einnig vinnu starfsmanna. Til dæmis, að útbúa daglega söluskýrslu myndi krefjast dags vinnu margra greinenda – tveir fyrir hvern vöruflokk. Nú er þessi skýrsla unnin af vélmenni og eyðir aðeins 30 mínútum í alla hluti.

„Í iðnaði virka stór gögn á áhrifaríkan hátt í tengslum við Internet hlutanna,“ segir Stanislav Meshkov, forstjóri Umbrella IT. „Á grundvelli greiningar á gögnum frá skynjurum sem búnaðurinn er búinn er hægt að greina frávik í rekstri hans og koma í veg fyrir bilanir og spá fyrir um frammistöðu.“

Í Severstal, með hjálp stórra gagna, eru þeir einnig að reyna að leysa frekar óléttvæg verkefni - til dæmis til að draga úr meiðslum. Árið 2019 úthlutaði fyrirtækið um 1,1 milljarði RUB til aðgerða til að bæta vinnuöryggi. Severstal gerir ráð fyrir að lækka tjónatíðni um 2025% um 50 (miðað við 2017). „Ef línustjóri – verkstjóri, verkstjóri, verkstjóri, verslunarstjóri – tók eftir því að starfsmaður framkvæmir ákveðnar aðgerðir á óöruggan hátt (heldur ekki í handrið þegar gengið er upp stiga á iðnaðarsvæðinu eða notar ekki allar persónuhlífar) skrifar hann það. sérstaka athugasemd til hans – PAB (af „behavioral security audit“),“ segir Boris Voskresensky, yfirmaður gagnagreiningardeildar fyrirtækisins.

Eftir að hafa greint gögn um fjölda PAB í einu af sviðunum komust sérfræðingar fyrirtækisins að því að öryggisreglur voru oftast brotnar af þeim sem höfðu þegar fengið nokkrar athugasemdir áður, svo og af þeim sem voru í veikindaleyfi eða í fríi skömmu áður. atvikið. Brot fyrstu vikuna eftir heimkomu úr orlofi eða veikindaleyfi voru tvöfalt fleiri en á því tímabili þar á eftir: 1 á móti 0,55%. En vinna á næturvakt, eins og það kom í ljós, hefur ekki áhrif á tölfræði PAB.

Úr sambandi við raunveruleikann

Að búa til reiknirit fyrir vinnslu stórra gagna er ekki erfiðasti hluti vinnunnar, segja forsvarsmenn fyrirtækja. Það er miklu erfiðara að skilja hvernig hægt er að beita þessari tækni í samhengi við hvert tiltekið fyrirtæki. Þar liggur akkillesarhæll sérfræðinga fyrirtækja og jafnvel utanaðkomandi veitenda, sem að því er virðist hafa safnað sér sérfræðiþekkingu á sviði stórgagna.

„Ég hitti oft stóra gagnasérfræðinga sem voru frábærir stærðfræðingar, en höfðu ekki nauðsynlegan skilning á viðskiptaferlum,“ segir Sergey Kotik, forstöðumaður þróunar hjá GoodsForecast. Hann rifjar upp hvernig fyrir tveimur árum síðan fyrirtæki hans fékk tækifæri til að taka þátt í samkeppni um eftirspurnarspá fyrir alríkisverslunarkeðju. Valið var tilraunasvæði fyrir allar vörur og verslanir sem þátttakendur gerðu spár um. Spárnar voru síðan bornar saman við raunverulega sölu. Fyrsta sætið tók einn af rússnesku netrisunum, þekktur fyrir sérfræðiþekkingu sína í vélanámi og gagnagreiningu: í spám sínum sýndi það lágmarks frávik frá raunverulegri sölu.

En þegar netið fór að rannsaka spár hans nánar kom í ljós að frá viðskiptalegu sjónarmiði eru þær algjörlega óviðunandi. Fyrirtækið kynnti líkan sem framleiddi söluáætlanir með kerfisbundnu vanmati. Forritið fann út hvernig á að lágmarka líkurnar á villum í spám: það er öruggara að vanmeta sölu, þar sem hámarksskekkja getur verið 100% (það er engin neikvæð sala), en í átt að ofspá getur hún verið geðþótta stór, Kotik útskýrir. Fyrirtækið kynnti með öðrum orðum tilvalið stærðfræðilíkan sem við raunverulegar aðstæður myndi leiða til hálftómra verslana og mikils taps af undirsölu. Fyrir vikið vann annað fyrirtæki keppnina og hægt var að koma útreikningum hennar í framkvæmd.

„Kannski“ í stað stórra gagna

Stórgagnatækni er viðeigandi fyrir margar atvinnugreinar, en virk innleiðing þeirra á sér ekki stað alls staðar, segir Meshkov. Til dæmis, í heilsugæslu er vandamál með gagnageymslu: mikið af upplýsingum hefur safnast saman og þær eru uppfærðar reglulega, en að mestu leyti hafa þessi gögn ekki enn verið stafræn. Það er líka mikið af gögnum hjá ríkisstofnunum en þau eru ekki sameinuð í sameiginlegan klasa. Þróun á sameinuðum upplýsingavettvangi National Data Management System (NCMS) miðar að því að leysa þetta vandamál, segir sérfræðingurinn.

Hins vegar er landið okkar langt frá því að vera eina landið þar sem í flestum stofnunum eru mikilvægar ákvarðanir teknar á grundvelli innsæis, en ekki greiningar á stórum gögnum. Í apríl á síðasta ári gerði Deloitte könnun meðal meira en þúsund leiðtoga bandarískra stórfyrirtækja (með 500 starfsmenn eða fleiri) og komst að því að 63% aðspurðra þekkja stórgagnatækni en hafa ekki allt sem þarf. innviði til að nota þá. Á sama tíma, meðal 37% fyrirtækja með háan greiningarþroska, hefur næstum helmingur farið verulega yfir viðskiptamarkmið undanfarna 12 mánuði.

Rannsóknin leiddi í ljós að auk erfiðleika við að innleiða nýjar tæknilegar lausnir er mikilvægt vandamál í fyrirtækjum skortur á menningu að vinna með gögn. Þú ættir ekki að búast við góðum árangri ef ábyrgð á ákvörðunum sem teknar eru á grundvelli stórra gagna er eingöngu falin greinendum fyrirtækisins, en ekki öllu fyrirtækinu. „Nú eru fyrirtæki að leita að áhugaverðum notkunartilfellum fyrir stór gögn,“ segir Miftakhov. "Á sama tíma krefst innleiðing sumra sviðsmynda fjárfestinga í kerfum til að safna, vinna og gæðaeftirlit með viðbótargögnum sem ekki hafa verið greind áður." Því miður, "greining er ekki enn hópíþrótt," viðurkenna höfundar rannsóknarinnar.

Skildu eftir skilaboð