<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Richard Öhrvall</title>
	<atom:link href="http://richardohrvall.com/feed/" rel="self" type="application/rss+xml" />
	<link>http://richardohrvall.com</link>
	<description></description>
	<lastBuildDate>Wed, 04 Apr 2012 15:19:23 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.3.2</generator>
		<item>
		<title>Anscombes kvartett</title>
		<link>http://richardohrvall.com/2012/04/anscombes-kvartett/?utm_source=rss&#038;utm_medium=rss&#038;utm_campaign=anscombes-kvartett</link>
		<comments>http://richardohrvall.com/2012/04/anscombes-kvartett/#comments</comments>
		<pubDate>Wed, 04 Apr 2012 11:33:06 +0000</pubDate>
		<dc:creator>Richard Öhrvall</dc:creator>
				<category><![CDATA[statistik]]></category>
		<category><![CDATA[Visualisering av data]]></category>

		<guid isPermaLink="false">http://richardohrvall.com/?p=845</guid>
		<description><![CDATA[Att grafiskt åskådliggöra sina data är inte bara en möjlighet att underlätta för läsaren att förstå och tolka en undersöknings resultat. Det är inte konstigt att många inflytelserika forskare inom samhällsvetenskaperna, som Gary King och Andrew Gelman, på senare tid &#8230; <a href="http://richardohrvall.com/2012/04/anscombes-kvartett/">Continue reading <span class="meta-nav">&#8594;</span></a>]]></description>
			<content:encoded><![CDATA[<p>Att grafiskt åskådliggöra sina data är inte bara en möjlighet att underlätta för läsaren att förstå och tolka en undersöknings resultat. Det är inte konstigt att många inflytelserika forskare inom samhällsvetenskaperna, som Gary King och Andrew Gelman, på senare tid lyft fram vilket fantastiskt verktyg visualisering av data kan vara i dessa sammanhang (även om genomslaget än så länge varit ganska litet, i alla fall i Sverige). Grafiken kan även vara till stor hjälp vid analys av data. Vi har mycket lättare att snabbt ta till oss ett datamaterial som illustrerats grafiskt, och framför allt har vi en förmåga att urskilja mönster i grafer som går oss förbi ifall samma data skulle presenteras i tabellform.</p>
<p>Grafikens möjligheter i dessa sammanhang illustreras mycket tydligt genom <em>Anscombes kvartett</em>. Det är en kvartett dataset som blev kända genom Francis J Anscombes artikel <a href="http://www.jstor.org/stable/2682899" target="_blank">&#8221;Graphs in Statistical Analysis&#8221;</a> i <em>The American Statistician,</em> 1973. Artikeln är mycket läsvärd och den utgör en kraftfull argumentation för användandet av grafer i analys av datamaterial (frågan är om man i dag skulle komma undan med ett sådant språk i en vetenskaplig artikel). I artikeln presenterar Anscombe fyra dataset med värden för två variabler: x och y.</p>
<table width="512" border="0" cellspacing="0" cellpadding="0">
<colgroup>
<col span="8" width="64" /> </colgroup>
<tbody>
<tr>
<td width="64" height="20"><strong>1 </strong></td>
<td align="right" width="64"></td>
<td width="64"><strong>2 </strong></td>
<td align="right" width="64"></td>
<td width="64"><strong>3 </strong></td>
<td align="right" width="64"></td>
<td width="64"><strong> 4</strong></td>
<td align="right" width="64"></td>
</tr>
<tr>
<td height="20"><strong>x</strong></td>
<td><strong>y</strong></td>
<td><strong>x</strong></td>
<td><strong>y</strong></td>
<td><strong>x</strong></td>
<td><strong>y</strong></td>
<td><strong>x</strong></td>
<td><strong>y</strong></td>
</tr>
<tr>
<td align="right" height="20">10</td>
<td align="right">8,04</td>
<td align="right">10</td>
<td align="right">9,14</td>
<td align="right">10</td>
<td align="right">7,46</td>
<td align="right">8</td>
<td align="right">6,58</td>
</tr>
<tr>
<td align="right" height="20">8</td>
<td align="right">6,95</td>
<td align="right">8</td>
<td align="right">8,14</td>
<td align="right">8</td>
<td align="right">6,77</td>
<td align="right">8</td>
<td align="right">5,76</td>
</tr>
<tr>
<td align="right" height="20">13</td>
<td align="right">7,58</td>
<td align="right">13</td>
<td align="right">8,74</td>
<td align="right">13</td>
<td align="right">12,74</td>
<td align="right">8</td>
<td align="right">7,71</td>
</tr>
<tr>
<td align="right" height="20">9</td>
<td align="right">8,81</td>
<td align="right">9</td>
<td align="right">8,77</td>
<td align="right">9</td>
<td align="right">7,11</td>
<td align="right">8</td>
<td align="right">8,84</td>
</tr>
<tr>
<td align="right" height="20">11</td>
<td align="right">8,33</td>
<td align="right">11</td>
<td align="right">9,26</td>
<td align="right">11</td>
<td align="right">7,81</td>
<td align="right">8</td>
<td align="right">8,47</td>
</tr>
<tr>
<td align="right" height="20">14</td>
<td align="right">9,96</td>
<td align="right">14</td>
<td align="right">8,1</td>
<td align="right">14</td>
<td align="right">8,84</td>
<td align="right">8</td>
<td align="right">7,04</td>
</tr>
<tr>
<td align="right" height="20">6</td>
<td align="right">7,24</td>
<td align="right">6</td>
<td align="right">6,13</td>
<td align="right">6</td>
<td align="right">6,08</td>
<td align="right">8</td>
<td align="right">5,25</td>
</tr>
<tr>
<td align="right" height="20">4</td>
<td align="right">4,26</td>
<td align="right">4</td>
<td align="right">3,1</td>
<td align="right">4</td>
<td align="right">5,39</td>
<td align="right">19</td>
<td align="right">12,5</td>
</tr>
<tr>
<td align="right" height="20">12</td>
<td align="right">10,84</td>
<td align="right">12</td>
<td align="right">9,13</td>
<td align="right">12</td>
<td align="right">8,15</td>
<td align="right">8</td>
<td align="right">5,56</td>
</tr>
<tr>
<td align="right" height="20">7</td>
<td align="right">4,82</td>
<td align="right">7</td>
<td align="right">7,26</td>
<td align="right">7</td>
<td align="right">6,42</td>
<td align="right">8</td>
<td align="right">7,91</td>
</tr>
<tr>
<td align="right" height="20">5</td>
<td align="right">5,68</td>
<td align="right">5</td>
<td align="right">4,74</td>
<td align="right">5</td>
<td align="right">5,73</td>
<td align="right">8</td>
<td align="right">6,89</td>
</tr>
</tbody>
</table>
<p>Som ni ser av tabellen har x samma värden i dataset 1 till 3, medan y varierar mellan samtliga dataset. Även i så här små dataset är det svårt att urskilja tydliga mönster och då man analyserar datamaterial med tusentals observationer eller fler, ja, då blir det en omöjlighet. Vanligtvis tar man därför fram ett antal mått för de variabler man är intresserad av, såsom medelvärden och mått på variation. Om vi ser till dataset 1 kan vi exempelvis ta fram följande värden:</p>
<p>Antal observationer (n)=11</p>
<p>Medelvärde för x=9</p>
<p>Medelvärde för y=7,5</p>
<p>Standardavvikelse för x=3,32</p>
<p>Standardavvikelse för y=2,03</p>
<p>Och en enkel regressionsmodell (OLS) ger y=3+0,5x med ett p-värde för koefficienten för x på 0,03 och ett R2 som uppgår till 0,67.</p>
<p>Det intressanta är att exakt samma värden även gäller för dataset 2, 3 och 4. Så om vi bara använder dessa standardmått kan vi lätt frestas att dra slutsatsen att sambandet mellan x och y ser ut på samma sätt i de fyra datamaterialen. Stämmer då inte det? Nej, om vi grafiskt illustrerar sambandet mellan x och y i dataseten med hjälp av punktdiagram och en regressionlinje ser vi att det är stora skillnader mellan dem.</p>
<p><a href="http://richardohrvall.com/wp-content/uploads/anscombe.png"><img class="aligncenter size-full wp-image-852" title="anscombes kvartett" src="http://richardohrvall.com/wp-content/uploads/anscombe.png" alt="" width="1600" height="1200" /></a></p>
<p>I dataset 1 verkar sambandet mellan x och y vara linjärt och regressionsmodellen förefaller därmed vara lämplig. Punkterna ligger jämnt spridda kring regressionslinjen. Som framgår av graf 2 är den linjära regressionsmodellen däremot inte lämplig för dataset 2. Där verkar istället sambandet mellan x och y vara kurvlinjärt och en modell med en andragradspolynom hade antagligen varit mer lämplig. I dataset 3 verkar visserligen sambandet mellan x och y vara linjärt, men en observation verkar vara en så kallad uteliggare (outlier) och den observationen gör att regressionslinjen blir brantare än den annars skulle vara. Här bör den observationen kontrolleras för att se att det inte är något fel i datamaterialet. Även om datapunkten visar sig vara korrekt kan det finnas anledning att fundera på att utesluta den från modellen (det beror på sammanhanget) eller berätta om dess effekt i presentationen av analysen. I dataset 4 beror sambandet på endast en datapunkt. Om den utesluts finns inte längre något linjärt samband. Även här finns det anledning att studera datamaterialet närmare för att se om ett linjärt samband verkligen finns.</p>
<p>Även om dessa dataset är illustrerar extremfall är det inte ovanligt att motsvarande situationer kan uppstå, om än vanligtvis i lindrigare former. Så slutsatsen är glasklar: visualisera dina data!</p>
]]></content:encoded>
			<wfw:commentRss>http://richardohrvall.com/2012/04/anscombes-kvartett/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Fler kartnotiser</title>
		<link>http://richardohrvall.com/2012/03/fler-kartnotiser/?utm_source=rss&#038;utm_medium=rss&#038;utm_campaign=fler-kartnotiser</link>
		<comments>http://richardohrvall.com/2012/03/fler-kartnotiser/#comments</comments>
		<pubDate>Tue, 27 Mar 2012 07:14:59 +0000</pubDate>
		<dc:creator>Richard Öhrvall</dc:creator>
				<category><![CDATA[kartor]]></category>

		<guid isPermaLink="false">http://richardohrvall.com/?p=843</guid>
		<description><![CDATA[Ja, jag ska skriva något mer substantiellt snart, men först några ytterligare kartnotiser: Sajten Woodcut Maps säljer kartor i trä. Du kan själv välja ett valfritt område från Google Maps och trämaterial så fixar de resten. Jag är dock lite osäker på &#8230; <a href="http://richardohrvall.com/2012/03/fler-kartnotiser/">Continue reading <span class="meta-nav">&#8594;</span></a>]]></description>
			<content:encoded><![CDATA[<p>Ja, jag ska skriva något mer substantiellt snart, men först några ytterligare kartnotiser:</p>
<p>Sajten <a href="http://woodcutmaps.com/" target="_blank">Woodcut Maps</a> säljer kartor i trä. Du kan själv välja ett valfritt område från Google Maps och trämaterial så fixar de resten. Jag är dock lite osäker på om de levererar till Sverige, men om man pratar med dem går det säkert att ordna.</p>
<p>Då man befinner sig i Norrbotten, som jag gör för tillfället, förundras man över Golfströmmens inverkan på klimatet. Om man vill se snygg visualisering av olika strömmar har NASA tagit fram just det för perioden juni 2005 till december 2007. Riktigt snyggt, kolla <a href="http://www.flickr.com/photos/gsfc/7009056027/" target="_blank">här</a>!</p>
<p>För en överblick över världens IT-mässiga infrastruktur rekommenderas<a href="http://www.cablemap.info/" target="_blank"> Greg&#8217;s Cable Map</a> (bara namnet är fantastiskt).</p>
]]></content:encoded>
			<wfw:commentRss>http://richardohrvall.com/2012/03/fler-kartnotiser/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Kartnotiser</title>
		<link>http://richardohrvall.com/2012/03/kartnotiser/?utm_source=rss&#038;utm_medium=rss&#038;utm_campaign=kartnotiser</link>
		<comments>http://richardohrvall.com/2012/03/kartnotiser/#comments</comments>
		<pubDate>Thu, 22 Mar 2012 13:02:42 +0000</pubDate>
		<dc:creator>Richard Öhrvall</dc:creator>
				<category><![CDATA[kartor]]></category>

		<guid isPermaLink="false">http://richardohrvall.com/?p=837</guid>
		<description><![CDATA[Några intressanta saker jag hittat på kartfronten: Stamen, som gör väldigt många coola saker, har lanserat nya, sökbara kartor där man kan se kartorna i olika utseenden: vattenfärg, bläck och miljö. Kolla själva på deras webbsida. Nathan Yau har en &#8230; <a href="http://richardohrvall.com/2012/03/kartnotiser/">Continue reading <span class="meta-nav">&#8594;</span></a>]]></description>
			<content:encoded><![CDATA[<p>Några intressanta saker jag hittat på kartfronten:</p>
<p>Stamen, som gör väldigt många coola saker, har lanserat nya, sökbara kartor där man kan se kartorna i olika utseenden: vattenfärg, bläck och miljö. Kolla själva <a href="http://maps.stamen.com/watercolor/#8/59.489/18.726" target="_blank">på deras webbsida</a>.</p>
<p>Nathan Yau har <a href="http://flowingdata.com/2009/11/12/how-to-make-a-us-county-thematic-map-using-free-tools/" target="_blank">en guide</a> till hur man enkelt kan göra koropletkartor med programvaror som är gratis. Ett annat sätt är att använda statistikprogramvaran R, som är både gratis och kraftfullt, och paketet ggplots2, se t.ex. <a href="http://www.r-bloggers.com/maps-with-ggplot2/" target="_blank">den här guiden</a>.</p>
<p>För den som är lite mer datorkunnig vill jag tipsa om projektet Kartograph av Gregor Aisch, otroligt intressant, läs mer <a href="http://vis4.net/blog/posts/introducing-kartograph/" target="_blank">här</a>. Eller föresten, även om ni inte är datorkunniga är det av intresse då Gregor tar upp viktiga poänger kring kartprojicering.</p>
<p>&nbsp;</p>
]]></content:encoded>
			<wfw:commentRss>http://richardohrvall.com/2012/03/kartnotiser/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Venn och Euler</title>
		<link>http://richardohrvall.com/2012/03/venn-och-euler/?utm_source=rss&#038;utm_medium=rss&#038;utm_campaign=venn-och-euler</link>
		<comments>http://richardohrvall.com/2012/03/venn-och-euler/#comments</comments>
		<pubDate>Thu, 08 Mar 2012 09:09:58 +0000</pubDate>
		<dc:creator>Richard Öhrvall</dc:creator>
				<category><![CDATA[Visualisering av data]]></category>

		<guid isPermaLink="false">http://richardohrvall.com/?p=785</guid>
		<description><![CDATA[Med det ökande intresset för visualiseringar av data har Euler- och framför allt Venndiagrammen fått en renässans. Det har på senare tid skrivits en del bra om dessa diagram på olika håll, så jag passar på att skriva ned några &#8230; <a href="http://richardohrvall.com/2012/03/venn-och-euler/">Continue reading <span class="meta-nav">&#8594;</span></a>]]></description>
			<content:encoded><![CDATA[<p>Med det ökande intresset för visualiseringar av data har Euler- och framför allt Venndiagrammen fått en renässans. Det har på senare tid skrivits en del bra om dessa diagram på olika håll, så jag passar på att skriva ned några rader och ge ett par länkar (se längst ned).</p>
<p>Venndiagram är diagram som visar <em>alla</em> logiskt möjliga kombinationer mellan mängder (klasser). De används flitigt i mängdlära. Vanligen tar de formen av två eller tre överlappande cirklar. I bilden nedan ses ett Venndiagram med cirkel A och B.</p>
<p><a href="http://richardohrvall.com/wp-content/uploads/venn_a_b.png"><img class="aligncenter size-full wp-image-810" title="venn_a_b" src="http://richardohrvall.com/wp-content/uploads/venn_a_b.png" alt="" width="607" height="442" /></a></p>
<p>Allt som befinner sig inom cirkel A tillhör en viss kategori (eller mängd) och allt som befinner sig utanför cirkeln tillhör inte den kategorin. Samma gäller för cirkel B. Exempelvis kan vi tänka oss att cirkel A representerar hundar och cirkel B skådespelare. Den del av diagrammet faller inom både cirkel A och B brukar kallas snittet av A och B och avser dem som tillhör både kategori A och B, vilket i det här exemplet blir skådespelande hundar, såsom Rin Tin Tin, Lassie och Uggie. Den del av diagrammet som är inom antingen A eller B (tillhör minst en av kategorierna) brukar kallas unionen av A och B. Eftersom Venndiagram ska innehålla alla logiskt möjliga kombinationer av de kategorier som redovisas blir det komplext om antalet kategorier är många, så vanligen innehåller diagrammen två eller tre kategorier (ofta i form av cirklar).</p>
<p><img src="http://blog.visual.ly/wp-content/uploads/2012/01/625x628xWorld_Reduced_to_Infographics_pg_33-1.png,q547b7b.pagespeed.ic.hdZ3CaEhqa.png" alt="" /></p>
<p><em>Bilden ovan är hämtad från <a href="http://www.amazon.com/World-Reduced-Infographics-Hollywoods-Sociopathic/dp/1569759898" target="_blank">The World Reduced to Infographics</a> av Patrick Casey och Worm Miller.</em></p>
<p>Venndiagram kan ses som en underkategori till Eulerdiagram. Eulerdiagram behöver inte ha restriktionen att diagrammet ska innefatta alla möjliga kombinationer av de olika klasser som redovisas. De innefattar därmed fler typer av diagram än Venndiagram. Eulerdiagram brukar bland annat användas för att beskriva statistiska urvalsundersökningar, som i bilden nedan. Där har vi hela populationen, t.ex. svenska medborgare 18 år och äldre, ur vilken vi drar ett urval (sample). De som ingår i urvalet kontaktas sedan på något sätt, men tyvärr vill inte alla vara med i undersökningen, så de svarande blir en delmängd av dem i urvalet. Ofta komplicerar man bilden ytterligare genom att skilja på den population vi avser att undersöka och den population som ingår i den urvalram (den lista från vilken vi drar urvalet) vi har att tillgå när vi gör undersökningen.</p>
<p><a href="http://richardohrvall.com/wp-content/uploads/Urval.png"><img class="aligncenter size-full wp-image-827" title="Urval" src="http://richardohrvall.com/wp-content/uploads/Urval.png" alt="" width="819" height="460" /></a></p>
<p>Det är förhållandevis enkelt att skapa ett Venn- eller Eulerdiagram i en mängd programvaror. Vanligen är inte kategorierna redovisade i storlekar som är proportionella mot deras faktiska storlekar. Om man ändå vill ha mer kontroll över proportionerna och även vill koppla dem till befintliga data är alternativen färre. I statistikprogrammet Stata finns det användarskrivna kommandot -pvenn-, som kan installeras via -ssc install pvenn- och som kan ta fram Venndiagram. Tyvärr blir det inte riktigt så snyggt som man skulle önska (diagrammet med cirkel A och B ovan är skapat i Stata). I statistikprogrammet R (fantastiskt gratisprogram) finns däremot funktionen <a href="http://www.cs.uic.edu/~wilkinson/Publications/venneuler.pdf" target="_blank">venneuler()</a> som kan hantera både Venn- och Eulerdiagram och dessutom resulterar i ett riktigt snyggt resultat.</p>
<p>Venndiagram kan ofta användas för att illustrera roliga samband, som i diagrammet av Stehpen Wildish nedan (se fler Venndiagram av Stephen Wildish <a href="http://www.buzzfeed.com/burnred/clever-venn-diagrams-by-stephen-wildish-281t" target="_blank">här</a>).</p>
<p><img src="http://s3-ec.buzzfed.com/static/enhanced/web05/2012/3/4/8/enhanced-buzz-22604-1330869081-6.jpg" alt="" /></p>
<p><em>Läs bra inlägg om Euler- och Venndiagram hos <a href="http://blog.visual.ly/euler-and-venn-diagrams/" target="_blank">visual.ly</a> och <a href="http://eagereyes.org/techniques/venn-diagrams">EagerEyes</a>. Även Wikipedia har matnyttig information om <a href="http://en.wikipedia.org/wiki/Venn_diagram" target="_blank">Venndiagram </a>och <a href="http://en.wikipedia.org/wiki/Euler_diagram" target="_blank">Eulerdiagram</a>. För den som blir riktigt biten rekommenderas <a href="http://www.diagrams-conference.org/2012/content/3rd-international-workshop-euler-diagrams" target="_blank">den tredje internationella workshopen kring Eulerdiagram</a>.</em></p>
]]></content:encoded>
			<wfw:commentRss>http://richardohrvall.com/2012/03/venn-och-euler/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Mer visualisering: Jer Thorp</title>
		<link>http://richardohrvall.com/2012/03/mer-visualisering-jer-thorp/?utm_source=rss&#038;utm_medium=rss&#038;utm_campaign=mer-visualisering-jer-thorp</link>
		<comments>http://richardohrvall.com/2012/03/mer-visualisering-jer-thorp/#comments</comments>
		<pubDate>Mon, 05 Mar 2012 19:43:43 +0000</pubDate>
		<dc:creator>Richard Öhrvall</dc:creator>
				<category><![CDATA[data]]></category>
		<category><![CDATA[Visualisering av data]]></category>

		<guid isPermaLink="false">http://richardohrvall.com/?p=822</guid>
		<description><![CDATA[Nyligen lades en presentation som Jer Thorp gjort för TEDx ut på nätet, se nedan. Jer ligger bakom olika coola projekt som Cascade och OpenPaths. Dessa projekt och videon nedan är riktigt intressanta om man gillar visualisering av data. Kolla &#8230; <a href="http://richardohrvall.com/2012/03/mer-visualisering-jer-thorp/">Continue reading <span class="meta-nav">&#8594;</span></a>]]></description>
			<content:encoded><![CDATA[<p>Nyligen lades en presentation som Jer Thorp gjort för TEDx ut på nätet, se nedan. Jer ligger bakom olika coola projekt som <a href="http://nytlabs.com/projects/cascade.html">Cascade </a>och <a href="https://openpaths.cc/">OpenPaths</a>. Dessa projekt och videon nedan är riktigt intressanta om man gillar visualisering av data. Kolla även in <a href="http://blog.blprnt.com/">Jers blogg</a>.</p>
<div class="mceItemEmbedly" style="max-width: 600px;max-width:600px;" data-ajax="{'url':'http://www.youtube.com/watch?feature=player_embedded&amp;v=Q9wcvFkWpsM','width':null,'words':null,'height':null,'embed':'&lt;div class=\&quot;embedly\&quot; style=\&quot;max-width:nullpx;max-height:nullpx\&quot;&gt;&lt;iframe width=\&quot;640\&quot; height=\&quot;360\&quot; src=\&quot;http://www.youtube.com/embed/Q9wcvFkWpsM?fs=1&amp;feature=oembed\&quot; frameborder=\&quot;0\&quot; allowfullscreen&gt;&lt;/iframe&gt;&lt;div class=\&quot;embedly-clear\&quot;&gt;&lt;/div&gt;&lt;span class=\&quot;embedly-powered\&quot; style=\&quot;float:right;display:block\&quot;&gt;&lt;a target=\&quot;_blank\&quot; href=\&quot;http://embed.ly?src=anywhere\&quot; title=\&quot;Powered by Embedly\&quot;&gt;&lt;img src=\&quot;//static.embed.ly/images/logos/embedly-powered-small-light.png\&quot; alt=\&quot;Embedly Powered\&quot; /&gt;&lt;/a&gt;&lt;/span&gt;&lt;div class=\&quot;media-attribution\&quot;&gt;&lt;span&gt;via &lt;/span&gt;&lt;a href=\&quot;http://www.youtube.com/\&quot; class=\&quot;media-attribution-link\&quot; target=\&quot;_blank\&quot;&gt;YouTube&lt;/a&gt;&lt;/span&gt;&lt;/div&gt;&lt;div class=\&quot;embedly-clear\&quot;&gt;&lt;/div&gt;&lt;/div&gt;'}">
<div class="embedly" style="max-width:nullpx;max-height:nullpx"><iframe width="640" height="360" src="http://www.youtube.com/embed/Q9wcvFkWpsM?fs=1&#038;feature=oembed" frameborder="0" allowfullscreen></iframe></p>
<div class="embedly-clear"></div>
<p><span class="embedly-powered" style="float:right;display:block"><a target="_blank" href="http://embed.ly?src=anywhere" title="Powered by Embedly"><img src="//static.embed.ly/images/logos/embedly-powered-small-light.png" alt="Embedly Powered" /></a></span></p>
<div class="media-attribution"><span>via </span><a href="http://www.youtube.com/" class="media-attribution-link" target="_blank">YouTube</a></span></div>
<div class="embedly-clear"></div>
</div>
</div>
]]></content:encoded>
			<wfw:commentRss>http://richardohrvall.com/2012/03/mer-visualisering-jer-thorp/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Statistikens Indiana Jones</title>
		<link>http://richardohrvall.com/2012/03/statistikens-indiana-jones/?utm_source=rss&#038;utm_medium=rss&#038;utm_campaign=statistikens-indiana-jones</link>
		<comments>http://richardohrvall.com/2012/03/statistikens-indiana-jones/#comments</comments>
		<pubDate>Sun, 04 Mar 2012 00:19:58 +0000</pubDate>
		<dc:creator>Richard Öhrvall</dc:creator>
				<category><![CDATA[mänskliga rättigheter]]></category>
		<category><![CDATA[statistik]]></category>

		<guid isPermaLink="false">http://richardohrvall.com/?p=814</guid>
		<description><![CDATA[För ett antal år sedan jobbade jag i ett internationellt projekt kring att mäta demokrati, mänskliga rättigheter och vad som i brist på bättre ord även på svenska kallas governance. I projektet jobbade även en forskare vid namn Patrick Ball. &#8230; <a href="http://richardohrvall.com/2012/03/statistikens-indiana-jones/">Continue reading <span class="meta-nav">&#8594;</span></a>]]></description>
			<content:encoded><![CDATA[<p>För ett antal år sedan jobbade jag i ett internationellt projekt kring att mäta demokrati, mänskliga rättigheter och vad som i brist på bättre ord även på svenska kallas governance. I projektet jobbade även en forskare vid namn Patrick Ball. En väldigt rolig och fascinerande person. Han är förmodligen den mest äventyrliga statistiker världen skådat, statistikens Indiana Jones. Foreign Policy har nyligen skrivit <a href="http://www.foreignpolicy.com/articles/2012/02/27/the_body_counter?page=full" target="_blank">en artikel om honom</a>. I artikeln tar de bland annat upp att han har vittnat i rättegången mot Milosevic och då blev korsförhörd av Milosevic själv. Han har för mig berättat att det var en skrämmande upplevelse. Läs artikeln för att inse hur spännande statistik kan vara.</p>
<p>För snart sju år sedan översatte jag <a href="http://www.scb.se/Grupp/valfard/BE0801_2005K04_TI_12_A05ST0504.pdf" target="_blank">en artikel av Patrick och hans kollega Romesh Silva till SCB:s tidskrift Välfärd</a>. Den ger också lite inblick i hur de jobbar för att få fram svårtillgänglig statistik över brott mot mänskliga rättigheter och den är också värd att läsas (tyvärr gjordes dock misstag vad gäller ordvalet i rubriken &#8211; det skulle inte stå &#8221;folkmord&#8221;).</p>
]]></content:encoded>
			<wfw:commentRss>http://richardohrvall.com/2012/03/statistikens-indiana-jones/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>En kvittrande opinion</title>
		<link>http://richardohrvall.com/2012/02/en-kvittrande-opinion/?utm_source=rss&#038;utm_medium=rss&#038;utm_campaign=en-kvittrande-opinion</link>
		<comments>http://richardohrvall.com/2012/02/en-kvittrande-opinion/#comments</comments>
		<pubDate>Fri, 24 Feb 2012 12:27:53 +0000</pubDate>
		<dc:creator>Richard Öhrvall</dc:creator>
				<category><![CDATA[data]]></category>
		<category><![CDATA[opinionsmätningar]]></category>

		<guid isPermaLink="false">http://richardohrvall.com/?p=795</guid>
		<description><![CDATA[Opinionsmätare har problem: det är allt svårare att få tag på urvalspersoner och de personer som man får tag på vägrar i allt högre grad att medverka vid intervju. Följden är ett allt större bortfall. Nu redovisas sällan bortfall och &#8230; <a href="http://richardohrvall.com/2012/02/en-kvittrande-opinion/">Continue reading <span class="meta-nav">&#8594;</span></a>]]></description>
			<content:encoded><![CDATA[<p>Opinionsmätare har problem: det är allt svårare att få tag på urvalspersoner och de personer som man får tag på vägrar i allt högre grad att medverka vid intervju. Följden är ett allt större bortfall. Nu redovisas sällan bortfall och ingen som kommenterar opinionsmätningar verkar bekymra sig kring vilka personer det egentligen är som uttrycker den opinion som man drar långtgående slutsatser ifrån (får anledning att återkomma kring detta och det vilseledande begreppet &#8221;representativt urval&#8221;).</p>
<p>Fast det är ändå kostsamt och tidsödande att samla in data kring den allmänna opinionen, i synnerhet när folk är motvilliga att ställa upp. Denna motvillighet är en aning paradoxal: samtidigt som det finns en tilltagande motvilja kring att medverka i opinionsmätningar delar allt fler fritt med sig av sina åsikter via olika social medier.  Det är inte konstigt att några har slagit ihop ett och ett och fått ihop mer eller mindre seriösa affärsidéer, ibland beväpnade med en hel arsenal floskler. Men det finns undantag, som<a href="http://www.crimsonhexagon.com/" target="_blank"> Crimson Hexagon</a>, ett företag som bland andra har statsvetarprofessorn <a href="http://gking.harvard.edu/" target="_blank">Gary King</a> som grundare. I <a href="http://online.wsj.com/article/SB10001424052970203646004577213242703490740.html" target="_blank">en intressant artikel i ämnet i Wall Street Journal</a> säger King att de vill fånga åsikterna hos de personer som uttrycker åsikter. Det är dock inte så enkelt som det kan låta. Det gäller att med automatiserad, datormässig behandling att fånga och förstå ironi, sarkasm och nya ord och förkortningar. Men om man lyckas är belöningen stor: man kan kan då till en billig penning mycket snabbt fånga åsikter. Frågan är bara vad det är för åsikter man fångar. Vissa, som företaget <a href="http://www.generalsentiment.com/" target="_blank">General Sentiment</a>, har enligt samma artikel ambitionen att förutspå utfallet i både Republikanernas primärval och det kommande presidentvalet. King är mer tveksam till om sociala medier är lämpliga för det.</p>
<p>Helt klart har på senare år nya möjligheter för såväl opinionsmätning som forskning öppnats. Det gäller både tillgång till öppna data, men även, som i det här fallet, data som genereras av användare och som finns fritt tillgänglig att samla in och analysera. Eftersom Facebook är ett slutet system är möjligheterna att använda data där mindre, om man inte lyckas samarbeta med företaget, men data från Twitter kan enkelt samlas in. Självklart kommer det här att komma till Sverige inom en inte alltför avlägsen framtid (om det inte redan finns?). Det öppnas spännande möjligheter, tyvärr kommer vi nog att få se avigsidorna också: skulle inte förvåna mig om Aftonbladet en vacker dag har opinionsmätningar baserade på twitter-kommentarer, men med en betryggande formulering om att de baseras på &#8221;ett riksrepresentativt urval&#8221;.</p>
<p><em>Läs även The Numbers Guy <a href="http://blogs.wsj.com/numbersguy/mining-tweets-for-public-opinion-1118/" target="_blank">bloggpost i ämnet</a>. Och följ mina kvittrande åsikter: <a href="http://twitter.com/richardohrvall" target="_blank">http://twitter.com/richardohrvall</a></em></p>
]]></content:encoded>
			<wfw:commentRss>http://richardohrvall.com/2012/02/en-kvittrande-opinion/feed/</wfw:commentRss>
		<slash:comments>2</slash:comments>
		</item>
		<item>
		<title>Kartor och drakar</title>
		<link>http://richardohrvall.com/2012/02/kartor-och-drakar/?utm_source=rss&#038;utm_medium=rss&#038;utm_campaign=kartor-och-drakar</link>
		<comments>http://richardohrvall.com/2012/02/kartor-och-drakar/#comments</comments>
		<pubDate>Sun, 05 Feb 2012 18:55:44 +0000</pubDate>
		<dc:creator>Richard Öhrvall</dc:creator>
				<category><![CDATA[kartor]]></category>
		<category><![CDATA[valstatistik]]></category>

		<guid isPermaLink="false">http://richardohrvall.com/?p=774</guid>
		<description><![CDATA[Det har varit lite tyst här på bloggen. Det betyder dock inte att jag har varit inaktiv, utan tvärtom har en hel del hänt och förhoppningsvis har jag möjlighet att berätta mer snart. Det har blivit drakens år och som &#8230; <a href="http://richardohrvall.com/2012/02/kartor-och-drakar/">Continue reading <span class="meta-nav">&#8594;</span></a>]]></description>
			<content:encoded><![CDATA[<p>Det har varit lite tyst här på bloggen. Det betyder dock inte att jag har varit inaktiv, utan tvärtom har en hel del hänt och förhoppningsvis har jag möjlighet att berätta mer snart. Det har blivit drakens år och som ett nyårslöfte har jag tänkt prioritera hårdare, ge färre löften, fokusera mer på vissa saker och säga nej till andra. I linje med det kan jag inte lova att det blir mer bloggande, men det är i alla fall ambitionen.</p>
<p>Det är snart fyra veckor sedan DN publicerade <a href="http://www.dn.se/nyheter/politik/geografin-fargar-sveriges-politiska-landskap" target="_blank">en artikel</a> om de politiska kartor som jag redan tidigare hade lagt ut här på bloggen. Jag har fått väldigt många kommentarer kring artikeln. De flesta har varit positiva &#8211; tack för det! Det är roligt att så många verkar uppskatta kartor som ett sätt att illustrera statistik. Några har dock framfört kritik.</p>
<p>En del har ifrågasatt valet av färger för de olika partierna (på Flashback finns en hel tråd med konspirationsteorier kring detta). Det är dock DN som har valt färger för partierna i deras artikel och jag vet inte hur de har resonerat. Här på bloggen har jag valt färger som ligger i linje med vad partierna själva använder. När det gäller Sverigedemokraterna är det dock lite svårare att välja färg: de använder själva blått och gult, men det finns redan två partier som använder blått och gult är en svår färg att använda i de här sammanhangen. Jag valde därför att använda orange istället (och gult blir därmed ett skalsteg).</p>
<p>Vissa kommentarer har att göra med att kartorna avser partiernas <em>relativa</em> stöd, det vill säga att även i ett valdistrikt där Kristdemokraterna är jämförelsevis starka och Socialdemokraterna jämförelsevis svaga kan Socialdemokraterna fortfarande vara det starkare av de två partierna. Detta då Socialdemokraterna totalt sett är mycket större än Kristdemokraterna. Att visa det relativa stödet är själva poängen med kartorna, men det är mycket möjligt att det kunde framgå än tydligare av artikeln. De flesta verkar dock ha förstått upplägget, och  här i bloggen tycker jag att tillvägagångssättet är utförligt förklarat.</p>
<p>Det som ingen, såvitt jag sett, ifrågasatt är valet av klassindelning. Andra indelningar skulle ge en delvis annan bild, men jag tycker att den valda indelningen har tydliga förtjänster. Jag har dock en ny uppsättning kartor på gång och de har av olika skäl en annan indelning.</p>
<p>Om ni själva vill kolla kartor över partiernas stöd i olika valdistrikt kan jag rekommendera att kolla in <a href="http://www.scb.se/Pages/List____296469.aspx" target="_blank">SCB:s interaktiva kartor över valen 2010</a>. SCB anordnar även <a href="http://www.scb.se/Pages/Form____326828.aspx" target="_blank">ett seminarium kring dessa kartor den 8 mars i Stockholm</a>.</p>
]]></content:encoded>
			<wfw:commentRss>http://richardohrvall.com/2012/02/kartor-och-drakar/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Politiska kartor</title>
		<link>http://richardohrvall.com/2012/01/politiska-kartor/?utm_source=rss&#038;utm_medium=rss&#038;utm_campaign=politiska-kartor</link>
		<comments>http://richardohrvall.com/2012/01/politiska-kartor/#comments</comments>
		<pubDate>Mon, 09 Jan 2012 06:40:04 +0000</pubDate>
		<dc:creator>Richard Öhrvall</dc:creator>
				<category><![CDATA[kartor]]></category>
		<category><![CDATA[Val]]></category>
		<category><![CDATA[valstatistik]]></category>

		<guid isPermaLink="false">http://richardohrvall.com/?p=725</guid>
		<description><![CDATA[I dagens DN finns en artikel om de politiska kartor som jag tidigare har presenterat här på bloggen. Den som vill se dem i lite större format kan leta sig bakåt i bloggen eller följa någon av följande länkar till &#8230; <a href="http://richardohrvall.com/2012/01/politiska-kartor/">Continue reading <span class="meta-nav">&#8594;</span></a>]]></description>
			<content:encoded><![CDATA[<p>I dagens DN finns <a href="http://www.dn.se/nyheter/politik/geografin-fargar-sveriges-politiska-landskap" target="_blank">en artikel</a> om de politiska kartor som jag tidigare har presenterat här på bloggen. Den som vill se dem i lite större format kan leta sig bakåt i bloggen eller följa någon av följande länkar till kartorna: <a href="http://richardohrvall.com/2011/10/kartmarathon-c/">Centerpartiet</a>, <a href="http://richardohrvall.com/2011/10/kartmarathon-fp/">Folkpartiet</a>, <a href="http://richardohrvall.com/2011/10/kartmarathon-kd/">Kristdemokraterna</a>, <a href="http://richardohrvall.com/2011/10/kartmarathon-m/">Moderaterna</a>, <a href="http://richardohrvall.com/2011/10/kartmarathon-mp/">Miljöpartiet</a>, <a href="http://richardohrvall.com/2011/10/kartmarathon-s/">Socialdemokraterna</a>, <a href="http://richardohrvall.com/2011/10/kartmarathon-v/">Vänsterpartiet </a>och <a href="http://richardohrvall.com/2011/10/kartmarathon-sd/">Sverigedemokraterna</a> (se även den här <a href="http://richardohrvall.com/2011/11/sds-framvaxt/">kartan över Sverigedemokraternas framväxt</a>).</p>
<p>Jag har tidigare även lagt ut en <a href="http://richardohrvall.com/2011/11/det-politiskt-delade-sverige/">karta över de två blockens stöd i 2010 års val</a>. Mer kartor och inlägg om statistik och visualisering av data kommer att dyka upp här på bloggen framöver, så titta gärna förbi igen. Om ni själva vill kolla kartor över partiernas stöd i olika valdistrikt kan jag rekommendera att kolla in <a href="http://www.scb.se/Pages/List____296469.aspx" target="_blank">SCB:s interaktiva kartor över valen 2010</a>.</p>
<p>&nbsp;</p>
]]></content:encoded>
			<wfw:commentRss>http://richardohrvall.com/2012/01/politiska-kartor/feed/</wfw:commentRss>
		<slash:comments>8</slash:comments>
		</item>
		<item>
		<title>Kartor och färger</title>
		<link>http://richardohrvall.com/2011/12/kartor-och-farger/?utm_source=rss&#038;utm_medium=rss&#038;utm_campaign=kartor-och-farger</link>
		<comments>http://richardohrvall.com/2011/12/kartor-och-farger/#comments</comments>
		<pubDate>Sat, 17 Dec 2011 15:52:27 +0000</pubDate>
		<dc:creator>Richard Öhrvall</dc:creator>
				<category><![CDATA[kartor]]></category>
		<category><![CDATA[Visualisering av data]]></category>

		<guid isPermaLink="false">http://richardohrvall.com/?p=710</guid>
		<description><![CDATA[En vanlig form av kartor är så kallade koropletkartor. Det är en form av tematiska kartor där områden får en viss färg (eller ett visst mönster) baserat på värdet för den statistiska variabel man vill illustrera, t.ex. kan man illustrera &#8230; <a href="http://richardohrvall.com/2011/12/kartor-och-farger/">Continue reading <span class="meta-nav">&#8594;</span></a>]]></description>
			<content:encoded><![CDATA[<p>En vanlig form av kartor är så kallade <a href="http://en.wikipedia.org/wiki/Choropleth_map">koropletkartor</a>. Det är en form av tematiska kartor där områden får en viss färg (eller ett visst mönster) baserat på värdet för den statistiska variabel man vill illustrera, t.ex. kan man illustrera stödet för Socialdemokraterna efter kommun genom att ge kommunerna en röd färg som är mörkare ju starkare stöd partiet har i kommunen. Oftast delar man in områdena i klasser och ger alla områden i en viss klass samma färg, t.ex.genom alla kommuner där S har över 60 procents stöd får den mörkaste rödfärgen osv. Då måste man välja hur många klasser man vill ha och var gränserna mellan dessa klasser ska gå (man kan i och för sig även välja att ha en kontinuerlig skala). Beroende på dessa två val kan kartan förmedla olika intryck. Det visas på ett tydligt sätt på<a href="http://gabrielflor.it/counties"> den här sidan</a>. Det är även illustrerat på den utmärkta<a href="http://vis4.net/blog/posts/choropleth-maps/"> bloggen Vis4.net</a> där följande bild är hämtad från:</p>
<p><img src="http://vis4.net/blog/wp-content/uploads/2011/12/choropleth-classes.gif" alt="" /></p>
<p>Kartan avser andel fattiga i USA och att diskussionen har kommit upp beror på ett inlägg på Guardians datablogg som kan läsas <a href="http://www.guardian.co.uk/news/datablog/interactive/2011/sep/15/us-poverty-mapped">här</a>. Märk väl att det är samma data som illustreras i den animerade bilden ovan, det enda som varierar är antalet klasser som används. Hur dessa data bäst illustreras diskuteras vidare <a href="http://www.excelcharts.com/blog/the-same-data-the-same-map-different-stories/">här</a>.</p>
<p>Ett ytterligare val är vilka färger som ska väljas för respektive klass. Det gäller att välja färger som uppfattas vara på samma avstånd från varandra som de klasser de ska illustrera. Här kan man få hjälp genom att använda tjänsten <a href="http://colorbrewer2.org/">Colorbrewer2</a>. Det viktiga här är att färger som ifråga om ljusstyrka befinner sig på samma avstånd från varandra kan uppfattas på annat sätt, och det är hur färgerna uppfattas som är det centrala. Den som vill nörda ner sig rejält kring färgval kan läsa vidare <a href="http://vis4.net/blog/posts/avoid-equidistant-hsv-colors/">här</a>. Ett besläktat tema gäller färgskalor som går från rött till grönt, vilka bör undvikas om man bryr sig om de färgblinda, läs mer <a href="http://vis4.net/blog/posts/goodbye-redgreen-scales/">här</a>.</p>
<p>Finns med andra ord en hel del att tänka på när det gäller statistik redovisad i kartform. Och en lärdom är att det intryck som en karta ger kan bero på beslut fattade av den den som gjort kartan.</p>
]]></content:encoded>
			<wfw:commentRss>http://richardohrvall.com/2011/12/kartor-och-farger/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>

