Fler kartnotiser

Ja, jag ska skriva något mer substantiellt snart, men först några ytterligare kartnotiser:

Sajten Woodcut Maps säljer kartor i trä. Du kan själv välja ett valfritt område från Google Maps och trämaterial så fixar de resten. Jag är dock lite osäker på om de levererar till Sverige, men om man pratar med dem går det säkert att ordna.

Då man befinner sig i Norrbotten, som jag gör för tillfället, förundras man över Golfströmmens inverkan på klimatet. Om man vill se snygg visualisering av olika strömmar har NASA tagit fram just det för perioden juni 2005 till december 2007. Riktigt snyggt, kolla här!

För en överblick över världens IT-mässiga infrastruktur rekommenderas Greg’s Cable Map (bara namnet är fantastiskt).

Kartnotiser

Några intressanta saker jag hittat på kartfronten:

Stamen, som gör väldigt många coola saker, har lanserat nya, sökbara kartor där man kan se kartorna i olika utseenden: vattenfärg, bläck och miljö. Kolla själva på deras webbsida.

Nathan Yau har en guide till hur man enkelt kan göra koropletkartor med programvaror som är gratis. Ett annat sätt är att använda statistikprogramvaran R, som är både gratis och kraftfullt, och paketet ggplots2, se t.ex. den här guiden.

För den som är lite mer datorkunnig vill jag tipsa om projektet Kartograph av Gregor Aisch, otroligt intressant, läs mer här. Eller föresten, även om ni inte är datorkunniga är det av intresse då Gregor tar upp viktiga poänger kring kartprojicering.

 

Venn och Euler

Med det ökande intresset för visualiseringar av data har Euler- och framför allt Venndiagrammen fått en renässans. Det har på senare tid skrivits en del bra om dessa diagram på olika håll, så jag passar på att skriva ned några rader och ge ett par länkar (se längst ned).

Venndiagram är diagram som visar alla logiskt möjliga kombinationer mellan mängder (klasser). De används flitigt i mängdlära. Vanligen tar de formen av två eller tre överlappande cirklar. I bilden nedan ses ett Venndiagram med cirkel A och B.

Allt som befinner sig inom cirkel A tillhör en viss kategori (eller mängd) och allt som befinner sig utanför cirkeln tillhör inte den kategorin. Samma gäller för cirkel B. Exempelvis kan vi tänka oss att cirkel A representerar hundar och cirkel B skådespelare. Den del av diagrammet faller inom både cirkel A och B brukar kallas snittet av A och B och avser dem som tillhör både kategori A och B, vilket i det här exemplet blir skådespelande hundar, såsom Rin Tin Tin, Lassie och Uggie. Den del av diagrammet som är inom antingen A eller B (tillhör minst en av kategorierna) brukar kallas unionen av A och B. Eftersom Venndiagram ska innehålla alla logiskt möjliga kombinationer av de kategorier som redovisas blir det komplext om antalet kategorier är många, så vanligen innehåller diagrammen två eller tre kategorier (ofta i form av cirklar).

Bilden ovan är hämtad från The World Reduced to Infographics av Patrick Casey och Worm Miller.

Venndiagram kan ses som en underkategori till Eulerdiagram. Eulerdiagram behöver inte ha restriktionen att diagrammet ska innefatta alla möjliga kombinationer av de olika klasser som redovisas. De innefattar därmed fler typer av diagram än Venndiagram. Eulerdiagram brukar bland annat användas för att beskriva statistiska urvalsundersökningar, som i bilden nedan. Där har vi hela populationen, t.ex. svenska medborgare 18 år och äldre, ur vilken vi drar ett urval (sample). De som ingår i urvalet kontaktas sedan på något sätt, men tyvärr vill inte alla vara med i undersökningen, så de svarande blir en delmängd av dem i urvalet. Ofta komplicerar man bilden ytterligare genom att skilja på den population vi avser att undersöka och den population som ingår i den urvalram (den lista från vilken vi drar urvalet) vi har att tillgå när vi gör undersökningen.

Det är förhållandevis enkelt att skapa ett Venn- eller Eulerdiagram i en mängd programvaror. Vanligen är inte kategorierna redovisade i storlekar som är proportionella mot deras faktiska storlekar. Om man ändå vill ha mer kontroll över proportionerna och även vill koppla dem till befintliga data är alternativen färre. I statistikprogrammet Stata finns det användarskrivna kommandot -pvenn-, som kan installeras via -ssc install pvenn- och som kan ta fram Venndiagram. Tyvärr blir det inte riktigt så snyggt som man skulle önska (diagrammet med cirkel A och B ovan är skapat i Stata). I statistikprogrammet R (fantastiskt gratisprogram) finns däremot funktionen venneuler() som kan hantera både Venn- och Eulerdiagram och dessutom resulterar i ett riktigt snyggt resultat.

Venndiagram kan ofta användas för att illustrera roliga samband, som i diagrammet av Stehpen Wildish nedan (se fler Venndiagram av Stephen Wildish här).

Läs bra inlägg om Euler- och Venndiagram hos visual.ly och EagerEyes. Även Wikipedia har matnyttig information om Venndiagram och Eulerdiagram. För den som blir riktigt biten rekommenderas den tredje internationella workshopen kring Eulerdiagram.

Statistikens Indiana Jones

För ett antal år sedan jobbade jag i ett internationellt projekt kring att mäta demokrati, mänskliga rättigheter och vad som i brist på bättre ord även på svenska kallas governance. I projektet jobbade även en forskare vid namn Patrick Ball. En väldigt rolig och fascinerande person. Han är förmodligen den mest äventyrliga statistiker världen skådat, statistikens Indiana Jones. Foreign Policy har nyligen skrivit en artikel om honom. I artikeln tar de bland annat upp att han har vittnat i rättegången mot Milosevic och då blev korsförhörd av Milosevic själv. Han har för mig berättat att det var en skrämmande upplevelse. Läs artikeln för att inse hur spännande statistik kan vara.

För snart sju år sedan översatte jag en artikel av Patrick och hans kollega Romesh Silva till SCB:s tidskrift Välfärd. Den ger också lite inblick i hur de jobbar för att få fram svårtillgänglig statistik över brott mot mänskliga rättigheter och den är också värd att läsas (tyvärr gjordes dock misstag vad gäller ordvalet i rubriken – det skulle inte stå ”folkmord”).