Öppna data, kunskap och #sverigeligger

Trogna läsare, i den mån min blogg har sådant, har nog lagt märke till att jag tittat lite närmare på Aftonbladet och United minds undersökning om svenskarnas sexvanor och kom till lite andra slutsatser om förhållandet mellan sex och partisympatier. Men oavsett det så finns det två saker jag vill passa på att påpeka lite starkare:

1. Jag är åter igen inte en av dem som tycker att en stor undersökning om sex är onödig, fånig, ointressant eller vad gnällspikarna nu säger. Tvärtom! Sex är intressant, sex är viktigt och det finns inget annat sätt att få veta när folk har sex, hur de har sex och vad de känner inför det än att fråga dem. Och det finns inget annat sätt att bringa ordning i stora mängder data än statistisk analys. Jag instämmer helt när Aftonbladets skribenter frågar efter en vetenskaplig undersökning. Jag har på mitt bord den tidigare undersökningen från 1997 (Bo Lewin (red). ”Sex i Sverige. Om sexuallivet i Sverige 1996”,  Uppsala) och jag tänkte citera en passage från följebrevet som gavs till dem som deltog, som jag tycker fint illustrerar värdet av sådana undersökningar:

Några resultat av undersökningen 1967

Detta trodde forskare och myndigheter före undersökningen

1. Ungdomars första sexuella erfarenhet sker ofta efter en danstillställning där man druckit sprit och knutit tillfälliga intima bekantskaper. (…)

2. Mycket få ungdomar använder preventivmedel vid sitt första samlag. (…)

3. Jordbrukare har stor kunskap om sex och har också en friare inställning. (…)

Detta tyckte man var helt rimliga antaganden, ja rent av självklara, som stämde med sunt förnuft och med vad lärda män sa. En sak hade de gemensamt: De var alla felaktiga!

2. Det är värt att upprepa hur coolt det är att Aftonbladet och United minds släppt data från undersökningen! Den här skärmbilden visar min favoritgrej med undersökningen (min inringning):

ladda_ner_undersokning

Hur häftigt är inte det? Fritt tillgängliga öppna data är en stor grej både inom vetenskap och offentliga organisationer, och jag är väldigt glad att Aftonbladet och United minds inte bara släpper sina data — de lägger dessutom en länk till datafilen på kampanjsidan, som om det vore den självklaraste sak i världen. Att de gör det möjliggör oberoende analys (som mina små diagram). Föredömligt!

Annonser

Mer om Aftonbladets sexundersökning

Igår kväll var jag dryg på Twitter men ikväll känner jag ett behov att komma med något lite mer konstruktivt (fast bara lite), det vill säga rita några fler diagram och säga ett par sensmoraler.

dryg_tweet

Aftonbladet och United minds har alltså gjort en enkät om sex som tidningen försöker krama fram det mesta ur. Jag läste först om den när det började handla om skillnader i sexvanor mellan folk som röstar på olika partier, men Aftonbladet har tidigare påstått att den visar någon sorts ”bottenrekord” i sexuell aktivitet. I gårdagens post visade jag ett diagram över de som i undersökningen svarat på vilket parti de skulle rösta på om det var val idag och hur många gånger de uppgav att de haft sex de senaste 30 dagarna. Det är en ganska rörig bild, men den gör i alla fall tydligt att Aftonbladets rubrik, ”Kristdemokrater har mest sex” är snömos. Underrubriken, ”stora skillnader mellan partiväljarna” är inte heller sann. Vad som är sant är att medelvärdet i antalet ligg är högst bland de som kryssat kristdemokraterna. Här är diagrammet igen:

Rplot02

På den horisontala axeln ser vi alltså vilket parti de svarade och på den vertikala antalet gånger de haft sex de senaste 30 dagarna. (Någon undrade hur det kommer sig att punkter kan hamna strax under noll? För att alla punkter inte ska hamna ovanpå varandra har vi lagt på ett lite slumpvis brus.) Allra längst upp vid femtio (fler än femtio var det största alternativet) finns två punkter: två deltagare i undersökningen som svarat att de haft sex fler än femtio gånger senaste månaden och skulle rösta på KD. Dessa två extrempunkter drar upp medelvärdet för KD-gruppen, som är jämförelsevis liten och får den att verka extremare än den egentligen är. Så — första sensmoralen: Rita diagram och se efter om de numeriska resultaten verkar rimliga!

Men undersökningen innehåller massor av andra frågor. En av dem föranledde Ivar Arpi, ledarskribent på Svenska dagbladet, att också vara dryg på Twitter.

dryg_tweet_2

Ligger det något i det då? Aftonbladets graf visar, åter igen, i medeltal mer onani för de som kryssat SD och V. Men medelvärdet är som sagt känsligt för extrema värden. Och, som det här diagrammet visar, precis som sex med andra så har onanifrekvensen en väldigt ojämn fördelning. Det är många som uppger att de onanerar lite och några få som onanerar mycket. Här kommer samma typ av prickdiagram men med onanifrekvensen på den vertikala axeln (och punkter som är färgade efter kön, för här är en variabel där det faktiskt verkar finnas en märkbar könsskillnad):

onani1

Det är en ganska rörig bild, som sagt. Men den visar i alla fall ett liknande mönster som ovan. Här ser SD och V inte särskilt speciella ut, eller hur? Men Aftonbladet visar inte alla data, utan bara medelvärden. Medelvärden är som sagt känsliga för extrema värden. Det mittersta värdet, medianen, är ett annat lägesmått som inte är lika känsligt. Låt oss titta på medianer och medelvärden:

onani_prickdiagram

Så, medelvärdet (den röda pricken) är hela tiden högre än medianen (den turkosa) — det tyder på att fördelningen är sned och att de flesta observationerna har låga värden. Inget nytt. Om vi tittar på medianerna verkar inte V och SD lika extrema. SD får median på två gånger per månad, precis som nästan alla partier. V och MP har medianen tre. Inte ens om vi tar medelvärdena för vad de är så blir det någon vidare imponerande skillnad. Medelvärdet för onani bland de som kryssat V och SD är ungefär sju. Medelvärdet för M är ungefär 5.5. Att onanera en och en halv gång mer eller mindre i månaden, är det en skillnad att twittra om? Andra sensmoralen: Titta på siffrorna och fundera på om skillnaden är stor (eller liten) nog för att vara meningsfull.

Tyvärr är det ganska lätt att lura sig själv med dataanalys och se saker som inte finns där. Aftonbladets artiklar innehåller flera pinsamma citat av forskare, politiker med flera som resonerar om varför folk nuförtiden eller folk som röstar si eller så har sex på olika sätt. De kan tjäna som exempel på hur lätt det alltid är att hitta på en rimlig historia sådär i efterhand som förklarar de siffror som råkade trilla ut ur analysen. Till sist: jag tillhör inte de som tycker att undersökningens ämne är fånigt och onödigt i sig. En undersökning av sex i Sverige kan definitivt vara nyttig och intressant. Så tack Aftonbladet och United minds för att ni gjort era data fritt tillgängliga! På den fronten är ni verkligen ett föredöme. Men inga tack för att ni sprider dåliga tolkningar utan vidare stöd i ert data.

Fotnot

Tanja Suhinina har också bloggat förtjänstfullt om undersökningen (och länkat till mitt lilla diagram! woho!) och kritiserar inte bara delen om politiska sympatier utan också själva huvudnyheten om ”bottenrekordet”. Det resultatet verkar också sådär lagom pålitligt.

Så kristdemokrater har mest sex, säger ni?

Nja. Två som röstar på kristdemokraterna har mycket sex.

Rplot02

Aftonbladet har köpt någon sorts undersökning om svenskarnas sexvanor. Hoppas det var en god investering; jag tror i alla fall den har genererat löpsedlar ett par dagar. Nu har turen kommit till politiska sympatier och sex. Data finns på United minds hemsida. Kristdemokraterna har alltså minst stickprovsstorlek, men hela två som uppgivit att de haft sex fler än femtio gånger de sista 30 dagarna. Sådana extrema värden kan dra iväg medelvärdet ganska ordentligt, som till exempel i Aftonbladets diagram, vilket därför är rätt missvisande.