Programmering

Den virkelige historie om, hvordan big data-analyse hjalp Obama med at vinde

Du har måske hørt, hvordan den statistiske troldmand Nate Silver forudsagde valgstemmerne for hver stat i præsidentvalget i 2012, hvilket viser, at rådataknusning af afstemninger er meget mere pålidelig end traditionel punditry. Det, du sandsynligvis ikke har hørt, er, hvordan Obama-kampagnen opbyggede et 100-stærk analytikemedarbejderstab, der kunne gennemgå snesevis af terabyte data med en kombination af HP Vertica MPP (massiv parallelbehandling) analytisk database og forudsigelige modeller med R og Stata til få en konkurrencemæssig fordel.

Kredit for big data-tilgangen kommer til Obama-kampagnechef Jim Messina, der besluttede at dykke først i en analytisk drevet kampagne. Messina kommenterede, "Vi skulle kræve data om alt, vi skulle måle alt ... vi ville sætte et analytikerteam inde i os for at studere os hele tiden for at sikre, at vi var kloge over ting." For at sikre, at alt blev målt, blev personalet evalueret, om de indtastede data. Mantraet blev: "Hvis du ikke indtastede dataene, gjorde du ikke arbejdet."

[Download Big Data Analytics Deep Dive giver et omfattende, praktisk overblik over dette blomstrende felt. | Udnyt kraften i Hadoop med de 7 bedste værktøjer til at tæmme big data. ]

Støvler på jorden

Af de 100 analysemedarbejdere arbejdede 50 i en dedikeret analyseafdeling, 20 analytikere var spredt over kampagnens forskellige hovedkvarter, og yderligere 30 var i marken og fortolkede dataene.

Chris Wegrzyn, direktør for dataarkitektur for Den Demokratiske Nationale Komité, beskrev udfordringerne, mulighederne og vejen til at opbygge den analysedrevne kampagne. Wegrzyn bemærkede, at nøglemålingerne var centreret om selve dataene, modellering og eksperimentering. Kernedataene indeholdt fakta om vælgerne og kampagnedriften. Modellering blev brugt til at forstå vælgerne på det enkelte vælgerniveau. Endelig hjalp evaluering af resultaterne af eksperimenter kampagnen med at lære, hvordan dens handlinger faktisk påvirkede mennesker.

Naturligvis var nøgleindikatoren for kampagnen det antal, der planlagde at stemme på Obama divideret med dem, der planlagde at stemme samlet. Kampagnen forstod, at der var tre løftestænger for at maksimere antallet: registrering, overtalelse og valgdeltagelse. De var nødt til at tilskynde deres målgruppe af vælgere til at registrere sig, overtale de ubeslutte til at stemme på Obama og derefter gøre alt, hvad de kunne for at sikre, at Obama-vælgerne ville dukke op for at stemme på valgdagen.

Marshalering af tropperne

Tidligere havde alle disse afdelinger brugt sofistikerede analytiske teknologier - men havde implementeret deres individuelle analytiske tilgange uafhængigt. Kampagnen i 2012 ændrede alt dette.

De rigtige mennesker og mandater var vigtige for at gøre et samlet analysemiljø til virkelighed. Executive buy-in fra kampagnelederen Messina var afgørende; uden denne myndighed er ethvert ambitiøst initiativ måske blevet overgået eller helt droppet. Derudover havde kerneteamet stærk analytisk erfaring fra tidligere kampagner - og meget talentfulde analytiske medarbejdere ansat til langt under markedsraten.

Copyright verticalshadows.com 2021