Val av referenshanteringssystem: Zotero

Om man skriver en vetenskaplig artikel, en akademisk eller populärvetenskaplig bok eller något liknande blir det snabbt många referenser att hålla koll på. Ofta kan dessa referenser även finnas tillgängliga elektroniskt, till exempel i form av pdf-filer eller mobi-filer för en Kindle, och då kan det även vara bra att lagra dessa filer på ett strukturerat sätt för att kunna enkelt hitta dessa filer och de anteckningar som man har gjort när man läst dem. Allt detta kan ett referenshanteringssystem hjälpa till med. I och med att det går att integrera med ordbehandlingsprogram blir underlättas skrivandet markant.

När man ska välja referenshanteringssystem finns dock ett antal olika program att välja bland. Förr var EndNote ett naturligt val för många forskare. Om man arbetar vid ett universitet eller motsvarande som redan har en allmän licens är det möjligt att det är ett bra alternativ, i synnerhet om man redan har investerat tid i att lära sig programmet. Det finns även en enklare online variant (EndNote Basic) som är gratis. För min del är det dock inte något alternativ då det finns andra bra  program som är helt kostnadsfria.

Då det finns många program att välja mellan har jag  valt mellan de två som förefaller mest flitigt rekommenderade: Mendeley och Zotero. Och i det valet har jag fastnat för det senare alternativet. Det bygger inte på någon väldigt grundlig research,  men av vad jag har läst ska Zotero vara bättre på att extrahera korrekta referenser från webbsidor, medan en del framhåller Mendeleys gränssnitt och sociala funktioner. Framför allt har dock Zotero öppen källkod och utvecklingen drivs vid George Mason University med stöd av en livaktig grupp utvecklare på olika håll i världen. Ibland kan program med öppen källkod stanna av i utvecklingen, men i det här fallet verkar inte det vara någon risk. Mendeley ägs av förlaget Elsevier, så även om det är gratis idag finns det oro för att det kommer att kosta pengar framöver, eller att det kommer att finans premiumvarianter till ett högre pris (läs här om reaktionerna när Elsevier köpte Mendeley).

Om man skriver i LaTex istället för i Word eller LibreOffice, kan JabRef vara ett annat alternativ. Men det går även att kombinera Zotero med någon editor för LaTex. I vilket fall,  jag har landat i att välja Zotero som referenshanteringssystem,  men det är möjligt att andra program kan vara bättre val för andra.

Det är rätt enkelt att komma igång med Zotero, men några saker kan ta lite tid att sätta sig in i. Då jag ändå har lagt ned den tiden kommer jag att skriva några inlägg där jag ger en del råd. Det handlar om hur man kommer igång, ordnar lagring av filer i kombination med Dropbox, hur man kan använda en läsplatta för att göra anteckningar i pdf:er som går att nå via Zotero och hur man kombinerar Zotero med Evernote. Dessa och andra blogginlägg kring hur man får ett bra arbetsflöde kommer jag att ge etiketten ”Workflow” så att de lätt kan hittas via bloggen.

Flytande, mer produktivt arbete

De senaste veckorna har jag ägnat en del tid åt att fundera på olika sätt som jag skulle kunna effektivisera mitt arbete. Förhoppningen  är att den investeringen i tid ska visa sig vara klok. Även om jag nu har arbetat länge med att analysera datamaterial, läsa forskningsresultat och skriva, och lärt mig en hel del under den tiden, så tror jag att det finns utrymme för att använda tiden mer effektivt – att nå ett bättre flyt.

Jag tänker skriva ett antal bloggposter för att teckna ned en del tips och lösningar som har visat sig fungera väl för mig. Men även några nymodigheter som ännu är under utvärdering. Förhoppningsvis har någon annan nytta av dessa inlägg och kanske undviker en del återvändsgränder jag har besökt.

I skrivande stund har jag inte riktigt bestämt vad jag ska ta upp, men jag tänker mig skriva en del om val av program för  referenshantering, tidshantering, system för anteckningar och struktur för mappar och filer. De kommer dock inte att komma i någon genomtänkt ordning, men jag kommer att lägga alla inlägg under kategorin ‘workflow’, så efter en tid kommer det att bli möjligt att läsa dem i valfri ordning.

Databaser kring välfärdsstatistik

Ikväll kollade jag lite på doktorandkursen The Politics of the Welfare State in an Era of Reform: Voters, Interest Groups, and Political Responsiveness som ges i sommar vid Universitetet i Oslo. I beskrivningen av kursen fanns en intressant sammanställning av databaser relevanta för välfärdsstatistik, vilken jag återger nedan. Kursen, med Jane Gingrich som föreläsare, verkar också intressant.

 

Policy Structures

http://www.lisdatacenter.org/resources/other-databases/
See: Social Citizenship Indicators Data (see Esping-Andersen), Child Benefits Database, SAMIP,  Comparative Welfare state database

CWED 2 –- measures of welfare generosity
http://cwed2.org

EU MISSOC
http://ec.europa.eu/social/main.jsp?catId=815&langId=en

Social Security Around the World
https://www.ssa.gov/policy/docs/progdesc/ssptw/

OECD – Taxes and Benefits
http://www.oecd.org/els/soc/benefitsandwagestax-benefitcalculator.htm

Comparative Family Policy Database
http://www.demogr.mpg.de/cgi-bin/databases/fampoldb/index.plx

MIPEX migration data (some on entitlement to benefits)
http://www.mipex.eu

Expenditure

OECD – Social Expenditures Database  (see also OECD health and education datasets)
http://www.oecd.org/social/expenditure.htm

Income Inequality, Poverty and Living Conditions

Luxembourg Income Study
http://www.lisdatacenter.org

World Top incomes database
http://topincomes.parisschoolofeconomics.eu

Standardized World Income Inequality Database
http://myweb.uiowa.edu/fsolt/swiid/swiid.html

Our world in data (historical and world inequality data)
http://ourworldindata.org

EU-SILC
http://ec.europa.eu/eurostat/web/income-and-living-conditions/overview
Political Institutions, Government Control and Parties

Comparative Political Datasets
http://www.cpds-data.org/index.php

Quality of Government Datasets
http://qog.pol.gu.se/data/datadownloads

Political Parties

Chapel Hill Expert Survey (party positioning as ranked by experts)
http://chesdata.eu

Comparative Manifesto Data (party positioning/salience by manifestos)
https://manifestoproject.wzb.eu

Labour Market and Wage Bargaining

ICTWSS – Wage Bargaining institutions
http://www.uva-aias.net/208

OECD – Employment Protection Legislation
http://www.oecd.org/employment/emp/oecdindicatorsofemploymentprotection.htm

EU – Labor Force Survey
http://ec.europa.eu/eurostat/web/microdata/european-union-labour-force-survey

Public Attitudes – Cross-National Surveys

European Social Survey
http://www.europeansocialsurvey.org

International Social Survey Programme (ISSP)
http://www.gesis.org/en/issp/home/

European Values Survey
http://www.europeanvaluesstudy.eu

World Values Survey
http://www.worldvaluessurvey.org/wvs.jsp

Comparative Study of Electoral Systems
http://www.cses.org

Nytt år och dags att höja takten

Då är det hög tid att summera 2015 och blicka framåt. Tyvärr blev det inte så mycket bloggat under 2015, inget inlägg alls här och färre än jag hade tänkt på Politologerna. Men i december skrev jag i alla fall om statistiska experiment och om man ska hälla mjölken först i kaffet och om sänkt rösträttsålder. Det senare har blivit aktuellt då det framkommit att den pågående demokratiutredningen kommer att föreslå det.

Det slutgiltiga betänkandet kommer den 18  januari, så det finns anledning till att återkomma till förslaget då argumentationen bakom finns presenterad.  En del verkar förvånade över att de föreslår att rösträttsåldern ska sänkas på försök i kommunala val först, men det är inte så konstigt. Rösträttsåldern i riksdagsval regleras i regeringsformen, vilken inte är lika enkel att ändra som kommunallagen, där rösträttsålder i kommunala val preciseras. Det kan även vara klokt att utvärdera ett försök innan en förändring görs. Det är dock lite oroväckande att utredningen verkar föreslå att kommunerna själva ska få ansöka om att få genomföra ett sådant försök. Det vore att föredra om försökskommunerna valdes ut slumpmässigt, helst bland alla kommuner men åtminstone bland de kommuner som anmält intresse. En sådan design skulle göra möjligt att göra en bättre utvärdering av försöket.

Nåväl, 2016 är här och än finns hopp om att hålla mina nyårslöften. Bland dem finns löftet om att arbeta mer strukturerat. Om det faller väl ut ska jag försöka dela med mig av tips här på bloggen. Jag tänker även försöka vara lite flitigare här framöver, men det är dock inte något löfte.

Lär dig R i R!

För den som vill lära sig statistikprogrammet R finns många vägar att vandra, bland annat finns många gratis nätkurser via Coursera som lär ut R. Nu finns dock en ytterligare en väg: genom R!

I R kan man installera så kallade paket som tillför funktionalitet till programmet. Ett sådant paket är Swirl. Om man installerar det och sedan laddar det kan man genom R lära sig använda R. Läs mer om hur du går till väga här.

Piketty och PikettieR

Hypen kring Thomas Piketty och hans bok Kapitalet i det 21:a århundradet kan inte ha undgått många. Tyvärr missade jag hans framträdandet i Almedalen. Men för oss som gjorde det finns ett antal sätt att ta del av hans tankar (förutom att läsa boken), exempelvis finns på YouTube hans föreläsning för London School of Economics i juni i år.

Det har varit en hel del diskussioner kring de analyser som han har gjort. Piketty har själv lagt ut underlag till analyserna på sin webbplats, vilket är föredömligt. Fast av någon outgrundlig anledning har han analyserat sina datamaterial i Excel. Det är lite stökigt att få ordning på data för att kunna analysera dem på ett vettigt sätt. Fast nu har Jeff Leek och de andra bakom den utmärkta bloggen Simply Statistics dragit igång ett projekt för att flytta materialet till R.

De vill dock ha hjälp för att slutföra det arbetet (läs mer här om hur du kan bidra). Det som hittills är bearbetat finns på GitHub. Förhoppningsvis kommer en del intressanta analyser från detta arbete. Själv förstår jag dock inte varför de inte valde att kalla projektet PikettieR.

QQ-plots med Pisa-resultat

Sommaren är en utmärkt tid för att experimentera lite med data, metoder och program. Bland allt har jag tänkt använda statistikprogrammet R lite mer än jag brukar (vanligtvis använder jag Stata eller SAS – se min översikt av statistikprogram här).

Den här bloggposten är en kombination av ovanstående. En intressant form av grafer är så kallade QQ-plots, eller quantile-quantile plots. De är ett alternativ till histogram om man vill studera fördelningar. Exempelvis kan de användas för att se om datamaterialet är normalfördelat (genom att jämföra en faktisk fördelning med en teoretisk). Eller som i det fall jag tänker titta på här, för att jämföra två olika fördelningar: hur väl pojkar och flickor presterar i Pisa-undersökningen 2012.

I nedanstående QQ-plots jämförs för ett antal länder hur bra flickor och pojkar presterade när det gäller läsförståelse och matematik i Pisa 2012. För respektive kön har eleverna delats in i likstora 100 grupper efter hur väl de presterade, från de sämsta till de sämsta. I diagrammet är flickornas resultat på y-axeln och pojkarnas på x-axeln. Den första punkten i diagrammet (nere till vänster) är alltså resultaten för den percentil som presterade sämst (de sämsta 1 procenten).

Som framgår av diagrammen är flickor bättre på läsförståelse i alla länderna som presenteras här. Skillnaden är rätt stor i Sverige och framför allt i Finland. När det gäller matematik är skillnaderna mindre. I Sverige är de sämsta tjejerna bättre än de sämsta killarna, men de bästa killarna är bättre än de bästa tjejerna. I övriga länder är könsskillnaderna lite större.

Exemplet och koden är hämtad från bloggen SmarterPoland, det är bara att kopiera och ändra för den som vill ta fram andra resultat. Om ni vill lära er mer om QQ-plots rekommenderas klassikern Visualizing Data av William S. Cleveland från 1993.

Introduktioner till SPSS och Stata i videoformat

Det finns mängder av introduktioner till statistikprogram på nätet, både i form av dokument och videor. Jag  har inte själv kollat igenom alla avsnitt, men jag tycker att det verkar som om de introduktioner som metodavdelningen vid London School of Economics and Political Science har lagt ut täcker in det mest grundläggande.

Du hittar videor för Stata här och för SPSS här.

Det är lite intressant att även om båda programmen har möjligheter att göra analyser genom att välja i menyer (s.k. point-and-click) och att skriva kod, så utgår introduktionerna för SPSS från menyer och introduktionerna för Stata från skriven kod.

Min starka rekommendation är att den som vill ägna tid åt dataanalys bör lära sig att skriva kod, även om de första stapplande stegen kan tas med stöd av menyer. I både Stata och SPSS kan man få ut kod som motsvarar de kommandon som man väljer via menyer. Tyvärr får man en massa onödig kod i SPSS (även default-värden specificeras etc.), men det kan ändå vara ett sätt att lära sig programmera.

Nya webbkurser i statistik och dataanalys

Jag har tidigare tipsat om olika webbkurser, eller MOOCs om vi använda oss av buzzwords, och tänkte göra det igen. Visserligen har jag inte själv kollat på dem så noga, men vid första anblick verkar följande tre kurser från Udacity intressanta:

Statistics: The science of decisions. En grundläggande kurs i statistik. Gratis!

Introduction to data science. Dataanalys och programmering i Python. Det är en kostnad för att få del av hela kursen, men det mesta verkar ligga ute gratis.

Exploratory data analysis. Dataanalys och programmering i R. Även här är det en kostnad för att få del av hela kursen, men det mesta verkar ligga ute gratis.

Än fler spännande kurser från Udacity går att hitta här.