Databaser kring välfärdsstatistik

Ikväll kollade jag lite på doktorandkursen The Politics of the Welfare State in an Era of Reform: Voters, Interest Groups, and Political Responsiveness som ges i sommar vid Universitetet i Oslo. I beskrivningen av kursen fanns en intressant sammanställning av databaser relevanta för välfärdsstatistik, vilken jag återger nedan. Kursen, med Jane Gingrich som föreläsare, verkar också intressant.

 

Policy Structures

http://www.lisdatacenter.org/resources/other-databases/
See: Social Citizenship Indicators Data (see Esping-Andersen), Child Benefits Database, SAMIP,  Comparative Welfare state database

CWED 2 –- measures of welfare generosity
http://cwed2.org

EU MISSOC
http://ec.europa.eu/social/main.jsp?catId=815&langId=en

Social Security Around the World
https://www.ssa.gov/policy/docs/progdesc/ssptw/

OECD – Taxes and Benefits
http://www.oecd.org/els/soc/benefitsandwagestax-benefitcalculator.htm

Comparative Family Policy Database
http://www.demogr.mpg.de/cgi-bin/databases/fampoldb/index.plx

MIPEX migration data (some on entitlement to benefits)
http://www.mipex.eu

Expenditure

OECD – Social Expenditures Database  (see also OECD health and education datasets)
http://www.oecd.org/social/expenditure.htm

Income Inequality, Poverty and Living Conditions

Luxembourg Income Study
http://www.lisdatacenter.org

World Top incomes database
http://topincomes.parisschoolofeconomics.eu

Standardized World Income Inequality Database
http://myweb.uiowa.edu/fsolt/swiid/swiid.html

Our world in data (historical and world inequality data)
http://ourworldindata.org

EU-SILC
http://ec.europa.eu/eurostat/web/income-and-living-conditions/overview
Political Institutions, Government Control and Parties

Comparative Political Datasets
http://www.cpds-data.org/index.php

Quality of Government Datasets
http://qog.pol.gu.se/data/datadownloads

Political Parties

Chapel Hill Expert Survey (party positioning as ranked by experts)
http://chesdata.eu

Comparative Manifesto Data (party positioning/salience by manifestos)
https://manifestoproject.wzb.eu

Labour Market and Wage Bargaining

ICTWSS – Wage Bargaining institutions
http://www.uva-aias.net/208

OECD – Employment Protection Legislation
http://www.oecd.org/employment/emp/oecdindicatorsofemploymentprotection.htm

EU – Labor Force Survey
http://ec.europa.eu/eurostat/web/microdata/european-union-labour-force-survey

Public Attitudes – Cross-National Surveys

European Social Survey
http://www.europeansocialsurvey.org

International Social Survey Programme (ISSP)
http://www.gesis.org/en/issp/home/

European Values Survey
http://www.europeanvaluesstudy.eu

World Values Survey
http://www.worldvaluessurvey.org/wvs.jsp

Comparative Study of Electoral Systems
http://www.cses.org

Nytt år och dags att höja takten

Då är det hög tid att summera 2015 och blicka framåt. Tyvärr blev det inte så mycket bloggat under 2015, inget inlägg alls här och färre än jag hade tänkt på Politologerna. Men i december skrev jag i alla fall om statistiska experiment och om man ska hälla mjölken först i kaffet och om sänkt rösträttsålder. Det senare har blivit aktuellt då det framkommit att den pågående demokratiutredningen kommer att föreslå det.

Det slutgiltiga betänkandet kommer den 18  januari, så det finns anledning till att återkomma till förslaget då argumentationen bakom finns presenterad.  En del verkar förvånade över att de föreslår att rösträttsåldern ska sänkas på försök i kommunala val först, men det är inte så konstigt. Rösträttsåldern i riksdagsval regleras i regeringsformen, vilken inte är lika enkel att ändra som kommunallagen, där rösträttsålder i kommunala val preciseras. Det kan även vara klokt att utvärdera ett försök innan en förändring görs. Det är dock lite oroväckande att utredningen verkar föreslå att kommunerna själva ska få ansöka om att få genomföra ett sådant försök. Det vore att föredra om försökskommunerna valdes ut slumpmässigt, helst bland alla kommuner men åtminstone bland de kommuner som anmält intresse. En sådan design skulle göra möjligt att göra en bättre utvärdering av försöket.

Nåväl, 2016 är här och än finns hopp om att hålla mina nyårslöften. Bland dem finns löftet om att arbeta mer strukturerat. Om det faller väl ut ska jag försöka dela med mig av tips här på bloggen. Jag tänker även försöka vara lite flitigare här framöver, men det är dock inte något löfte.

Lär dig R i R!

För den som vill lära sig statistikprogrammet R finns många vägar att vandra, bland annat finns många gratis nätkurser via Coursera som lär ut R. Nu finns dock en ytterligare en väg: genom R!

I R kan man installera så kallade paket som tillför funktionalitet till programmet. Ett sådant paket är Swirl. Om man installerar det och sedan laddar det kan man genom R lära sig använda R. Läs mer om hur du går till väga här.

Piketty och PikettieR

Hypen kring Thomas Piketty och hans bok Kapitalet i det 21:a århundradet kan inte ha undgått många. Tyvärr missade jag hans framträdandet i Almedalen. Men för oss som gjorde det finns ett antal sätt att ta del av hans tankar (förutom att läsa boken), exempelvis finns på YouTube hans föreläsning för London School of Economics i juni i år.

Det har varit en hel del diskussioner kring de analyser som han har gjort. Piketty har själv lagt ut underlag till analyserna på sin webbplats, vilket är föredömligt. Fast av någon outgrundlig anledning har han analyserat sina datamaterial i Excel. Det är lite stökigt att få ordning på data för att kunna analysera dem på ett vettigt sätt. Fast nu har Jeff Leek och de andra bakom den utmärkta bloggen Simply Statistics dragit igång ett projekt för att flytta materialet till R.

De vill dock ha hjälp för att slutföra det arbetet (läs mer här om hur du kan bidra). Det som hittills är bearbetat finns på GitHub. Förhoppningsvis kommer en del intressanta analyser från detta arbete. Själv förstår jag dock inte varför de inte valde att kalla projektet PikettieR.

QQ-plots med Pisa-resultat

Sommaren är en utmärkt tid för att experimentera lite med data, metoder och program. Bland allt har jag tänkt använda statistikprogrammet R lite mer än jag brukar (vanligtvis använder jag Stata eller SAS – se min översikt av statistikprogram här).

Den här bloggposten är en kombination av ovanstående. En intressant form av grafer är så kallade QQ-plots, eller quantile-quantile plots. De är ett alternativ till histogram om man vill studera fördelningar. Exempelvis kan de användas för att se om datamaterialet är normalfördelat (genom att jämföra en faktisk fördelning med en teoretisk). Eller som i det fall jag tänker titta på här, för att jämföra två olika fördelningar: hur väl pojkar och flickor presterar i Pisa-undersökningen 2012.

I nedanstående QQ-plots jämförs för ett antal länder hur bra flickor och pojkar presterade när det gäller läsförståelse och matematik i Pisa 2012. För respektive kön har eleverna delats in i likstora 100 grupper efter hur väl de presterade, från de sämsta till de sämsta. I diagrammet är flickornas resultat på y-axeln och pojkarnas på x-axeln. Den första punkten i diagrammet (nere till vänster) är alltså resultaten för den percentil som presterade sämst (de sämsta 1 procenten).

Som framgår av diagrammen är flickor bättre på läsförståelse i alla länderna som presenteras här. Skillnaden är rätt stor i Sverige och framför allt i Finland. När det gäller matematik är skillnaderna mindre. I Sverige är de sämsta tjejerna bättre än de sämsta killarna, men de bästa killarna är bättre än de bästa tjejerna. I övriga länder är könsskillnaderna lite större.

Exemplet och koden är hämtad från bloggen SmarterPoland, det är bara att kopiera och ändra för den som vill ta fram andra resultat. Om ni vill lära er mer om QQ-plots rekommenderas klassikern Visualizing Data av William S. Cleveland från 1993.

Introduktioner till SPSS och Stata i videoformat

Det finns mängder av introduktioner till statistikprogram på nätet, både i form av dokument och videor. Jag  har inte själv kollat igenom alla avsnitt, men jag tycker att det verkar som om de introduktioner som metodavdelningen vid London School of Economics and Political Science har lagt ut täcker in det mest grundläggande.

Du hittar videor för Stata här och för SPSS här.

Det är lite intressant att även om båda programmen har möjligheter att göra analyser genom att välja i menyer (s.k. point-and-click) och att skriva kod, så utgår introduktionerna för SPSS från menyer och introduktionerna för Stata från skriven kod.

Min starka rekommendation är att den som vill ägna tid åt dataanalys bör lära sig att skriva kod, även om de första stapplande stegen kan tas med stöd av menyer. I både Stata och SPSS kan man få ut kod som motsvarar de kommandon som man väljer via menyer. Tyvärr får man en massa onödig kod i SPSS (även default-värden specificeras etc.), men det kan ändå vara ett sätt att lära sig programmera.

Nya webbkurser i statistik och dataanalys

Jag har tidigare tipsat om olika webbkurser, eller MOOCs om vi använda oss av buzzwords, och tänkte göra det igen. Visserligen har jag inte själv kollat på dem så noga, men vid första anblick verkar följande tre kurser från Udacity intressanta:

Statistics: The science of decisions. En grundläggande kurs i statistik. Gratis!

Introduction to data science. Dataanalys och programmering i Python. Det är en kostnad för att få del av hela kursen, men det mesta verkar ligga ute gratis.

Exploratory data analysis. Dataanalys och programmering i R. Även här är det en kostnad för att få del av hela kursen, men det mesta verkar ligga ute gratis.

Än fler spännande kurser från Udacity går att hitta här.

Ny blogg: 312

Jag har börjat blogga på Svenska Dagbladet genom den nya bloggen 312. Namnet syftar på att vi i år har 312 olika val: i 290 kommuner, 20 landsting/regioner, 1 riksdag och 1 Europaparlament.

Så om du är intresserad av inlägg om val och demokrati rekommenderar jag att du följer bloggen. Länk: http://blog.svd.se/trehundratolv/

Jag kommer att försöka hinna med att även fortsättningsvis blogga här. Det kommer nog framför allt att bli inlägg som rör statistik, statistikprogram och visualisering av data, alltså lite spetsigare och lite nördigare.

Guider till SPSS

I veckan fick jag förmånen att undervisa studenter i en datasalsövning. Eftersom Linköpings universitet använder SPSS gjorde även jag det, trots att det inte är det statistikprogram jag vanligen använder. Och då tiden var knapp använde vi oss av menyer för att göra enkla beräkningar, även om jag rekommenderar alla att skriva kod om man vill göra analyser som går utöver de allra enklaste. Livet är fullt av kompromisser.

Jag satte ihop några bilder för att göra väldigt enkla steg i SPSS. Om de kan vara till hjälp för någon kan de laddas ned här. I efterhand hittade jag den här guiden till SPSS sammansatt av Rickard Andersson och Michael Wahman, statsvetenskapliga institutionen vid Lunds universitet. Deras guide är betydligt mer genomarbetad och kan säkert vara till hjälp för många. Sedan finns även SPSS-akuten, som grundats av statsvetaren Anders Sundell och som hjälpt många studenter genom att pedagogiskt förklara hur man löser olika moment i SPSS. En ytterligare guide är Programming and Data Management for IBM SPSS Statistics 20 av Raynald Levesque, Raynald (2011). Än fler guider finns att tillgå för den som söker lite på nätet. Och som jag tagit upp i tidigare inlägg, det finns andra statistikprogram att välja bland, till med sådana som är gratis.