Inför Oscarsgalan

Uppdatering 2013-02-25: Helt ok utfall för statistikerna, men inte mer än så. De hade alla ett par missar som att Christoffer Waltz vann bästa manliga biroll och att Ang Lee vann regipriset. Till deras försvar skrev Nate Silver att manliga biroll var en väldigt jämn kategori och regipriset var svårt att förutse då de som borde vara favoriter (Beff Affleck och Kathryn Bigelow) inte var nominerade.

Efter höstens amerikanska presidentval, då statistiknördar som Nate Silver och Simon Jackman lyckades väl med att förutspå resultatet, är det inte konstigt att det finns ett intresse för att även förutspå vem som kommer att få de olika Oscarsstatyetterna i kvällens gala. En ytterligare bidragande orsak är att årets gala sägs vara ovanligt oviss. Det är dock svårt att predicera hur äran kommer att fördelas och många verkar göra prognoser mer som en kul grej, även om vissa tar det på större allvar. Hur priserna fördelas bestäms av röster från 5 850 medlemmar av Academy of Motion Picture Arts and Sciences. Tyvärr vet man inte hur de enskilda rösterna har fallit tidigare, vilket försvårar analysen och prognosmakandet.

Så vad säger de statistiska analyserna? Crimson Hexagon, ett företag som analyserar sociala medier och som har den kände statsvetaren Gary King som grundare, har noterat att Argo och Zero Dark Thirty är de filmer som har genererat mest inlägg, och den senare av de filmerna har gett upphov till båda kraftigt negativa och kraftigt positiva omdömen. Ovan nämnda Nate Silver har även prognostiserat sannolikheterna för olika utfall och hans modell säger att Argo kommer att vinna följt av just Zero Dark Thirty. David Rothschild, Microsoft Research, har också Argo som en klar favorit i sin prediktion. Där landar även Farsite Group i sin prognos. Så Argo verkar med andra ord vara budet för bästa film (för olika prognoser i olika kategorier, se länkarna nedan).

Alla ovan nämnda prognosmakare har Steven Spielberg som favorit till priset till bästa regissör. Intressant nog påpekar Nate Silver att Ben Affleck troligen hade haft bäst sannolikhet i hans modell om det inte vore för det enkla faktum att han inte är nominerad. Den största utmanaren förefaller vara Ang Lee.

När det gäller skådespelare förefaller alla vara eniga om att Daniel Day-Lewis ska vinna. Hugh Jackman är främste utmanare hos de flesta, dock inte Nate Silver som har Bradley Cooper där. Men å andra sidan är Daniel Day-Lewis stor favorit, så det kanske är av underordnad betydelse. Betydligt jämnare är det när det gäller kvinnlig huvudroll, även om enigheten är stor i prognoserna även där: Jennifer Lawrence är budet.

När det gäller bästa birollsinnehavare är det än mer jämnt i den manliga kategorin, men Tommy Lee Jones favorit hos statistikerna. I den kvinnliga kategorin är dock osäkerheten obefintlig: Nate Silver går så långt att han säger att han ska sluta försöka förutspå Oscarsgalan om inte Ann Hathaway vinner.

Men Searching for Sugar Man då? Tja, jag gillar filmen, men för oss som upptäckte honom via David Holmes för tio år sedan framstår historien som väl tillrättalagd. Eller ni menar sannolikheten för att den vinner? Tyvärr verkar de flesta prognosmakare vara lite ointresserade av dokumentärfilmsgenren, men PredictWise har den som solklar favorit – 98,4 procents sannolikhet enligt deras modell.

Länkar:
The Numbers Guy om Oscarsgalan
Visualiseringar av Oscarsgalan från Visual.ly
Interaktiv grafik från The Guardian
Nate Silvers prognoser
PredictWise – David Rothschild
Farsite Groups prognoser

Tips för Stata

Jag har fått en hel del frågor kring vilket statistikprogram man bör välja och jag har tänkt utveckla min syn i ett senare inlägg. Fast här och nu blir det bara några nya tips för er som använder er av statistikprogrammet Stata.

Stata har själva startat en blogg sedan en tid tillbaka, innehåller en hel del matnyttigt. De har även en egen kanal på youtube där de har en hel del instruktionsvideor. Tyvärr visar de där allt genom att klicka i menyer, vilket är ett sätt analysera som jag starkt avråder ifrån. Å andra sidan genererar Stata kod då du klickar i menyer, så du kan använda den koden för att skapa program (och till skillnad från t.ex. SPSS genererar inte Stata en massa onödig skräp i sådana fall).

För den som vill skapa grafer i Stata är deras egen guide till hjälp. Den här bedrövligt designade sidan har också en rad intressanta exempel. Även UCLA har en del bra exempel.

Slutligen vill jag tipsa om att Världsbankens Statamodul är uppdaterad. Den är en enkel väg till spännande analyser av deras data. För mer information se här, eller installera via -ssc install wbopendata-.