There is grandeur in this view of life

martins bioblogg

@sweden recap

leave a comment »

So, a couple of weeks ago I tweeted from the @sweden account. This is a short recap of some things that were said, and a few links that I promised people. Overall I think it went pretty well. I didn’t tweet as much as some other curators, but much much more than I usually do. This also meant I did spend my lunch and coffee breaks looking at my phone. My tweets are collected here, if for some reason you’d care to read them.

Of course, tweeting from a rotating curation account is very different from the way I normally use Twitter. First, I read much more than I write. One of the main purposes of Twitter, for me, is to get a steady stream of links to read. That doesn’t really work on an account that follows much more and entirely different people. A lot of what I wrote was prepared monologue, but I don’t think that’s necessarily a bad thing. I follow a lot of people on Twitter for their monologues. Also, thankfully, a lot of people asked me questions! Another thing that struck me is that so few people were unpleasant. There were a few extreme right folks who wanted me to retweet their racist tweets, but only a few. Then, a few felt the need to tell me that I’m utterly boring, which is fine. Someone lamented the fact that all curators are uneducated about the proper use of Twitter (it’s probably to build your personal brand or something). Also, a certain Swedish celebrity got put on ignore so I wouldn’t have to see him tagging each tweet with ”@sweden”. But that was pretty much all.

I talked quite a bit about my research. I spent more or less a full day on the chicken comb as a sexual ornament and genetics of comb mass. We discussed domestication as an evolutionary process, tonic immobility, and how to measure gene expression for eQTL mapping. I also wrote about Kauai feral chickens … And what I actually do in a day nowadays, that is: writing R code.

I got a question about what to say to your creationist friend. I think this depends on what the creationist friend believes and what their objections to evolution are. Unfortunately, I don’t think there is a simple knock-down argument against all forms of creationism, except that evolution works really well and has a lot of evidence going for it. I certainly don’t think it will do to rely on methodological naturalism and say that ”creation would be a supernatural event and outside the scope of science”. First, because I don’t think that is how science works. Say if unicorns, miraculous healing, and species popping into existence without relation to other species were actually part of the world, wouldn’t we want to study that? Second, that will never convince anyone, except of the irrelevance of science to their worldview.

But I think there are a handful of things that creationists often take issue with. First, some don’t believe in sequence variants creating new functions. This is often described with slogans about information, and how it cannot be created by random mutation. I don’t think ”sequence information” is a particularly useful concept, and would much prefer to talk about function and adaptation. That is what is important, after all, organisms acquiring new adaptations. It turns out, new functions arising can be observed, particularly in microorganisms. Some really fun and well-studied example occur in the Long Term Evolution Experiment; see Richard Lenski’s blog which has explanatory posts and links to papers.

Second, the formation of species come up a lot in these discussions. This is a bit tricky, because it’s not always clear what constitutes different species. The definition most people have heard is probably that individuals belong to different species if they cannot have fertile offspring. But just think of asexually reproducing organisms. There, individuals belong to different species if they’re sufficiently different. So we already have what is needed to understand the formation of species in the evolution of new functions. When it comes to sexually reproducing organisms, there are examples of the evolution of reproductive isolation — cases where it seems to be ongoing or to have happened recently. (See for instance this paper on hybrid incompatibility in Mimulus guttatus; I have blogged about it, but only in Swedish)

Third, there is the question of relatedness between species. In particular, some creationists really hate the idea that humans are apes. I think it is important to emphasize a couple of things that evolution does not say about humans and other apes. By the way, this isn’t just confusing for creationists, but for everyone. Evolution does not mean that humans descend from extant apes. Look at this phylogenetic tree from Perelman & al 2011. This is just like a family tree, but of populations: we see how chimps and humans have a recent common ancestor population. This is different than claiming that we would descend from extant chimps. Of course, chimps have also changed since the common ancestor, although not in the same ways as humans. (Again, I’ve written about this before in Swedish.)


Speaking of unicorns, I of course celebrated unicorn Friday:

Someone asked whether you can keep fruit flies for amateur genetics at home. That should be quite possible, and I don’t see any real problems with it either. The fruit fly community has really strong culture of classical genetics with crosses and stocks. I don’t know if stock centres would deliver to private customers, but I don’t see why they wouldn’t — except for transgenic flies. It turned out, however, that transgenic flies was actually what the person asking was after. And of course, I can’t recommend that. I must say, I have mixed feelings about do-it-yourself biotechnology. On the one hand, some home molecular biology should be possible and rewarding. On the other hand, a lot of things routinely used in molecular labs are actually really dangerous if misused, and not just for the user. For example, when making any type of construct in transgenic bacteria, antibiotics and antibiotic resistance genes are the standard screening markers. They are used to pick out the bacteria that have incorporated the piece of DNA you care about. This is not the kind of stuff you want to use without proper containment. So, in the fly example, you would not only have to handle the flies, but also transgenic antibiotic resistant bacteria safely and legally. Then again, a lot of the genetics I care about does not involve any of that, and could very well be done in a basement.

The @sweden account caught me under a teaching week; otherwise, all of my photos would’ve been my computer, my pen and my coffee mug. Now I got to walk the followers through agarose gel electrophoresis and a little transformation of bacteria:

And, finally, Swedish spring:

Written by mrtnj

4 maj, 2015 at 19:45

På dna-dagen: Gener, orsak och verkan

leave a comment »

”DNA, livets molekyl” … Visst, DNA är en viktig och snygg biomolekyl. Men varför skulle inte en komplex kolhydrat, ett protein eller en membranlipid förtjäna det namnet?

Det finns två perspektiv på genetik som jag brukar tjata om. Å ena sidan: genetik som handlar om vad molekylära gener gör och vad de har för funktion. Å andra sidan: genetik som är studiet av ärftliga skillnader mellan individer, och i förlängningen populationer och arter. Genetik beskrivs ibland som en vetenskap som handlar om ”koder” och ”information”. Det ligger något i det, men jag tror det är bra att vara lite försiktig med metaforerna. Jag misstänker att koder och information inte är något vi bara hittar liggande ute i naturen, så att säga, utan mänskliga tolkningar.

Ja, vissa DNA-sekvenser skrivs av till mRNA som kodar för proteiner. Här betyder ”kodar för” att sekvensen har tripletter av baser som är komplementära mot tRNA-molekyler som bär aminosyror. Andra sekvenser motsvarar RNA-molekyler som har någon annan funktion. Men de orsakande faktorerna till att ett visst RNA uttrycks vid en viss tid finns inte i DNA, utan någon annan stans. DNA är en del av mekanismen, men det är också RNA-polymeraset som skriver av det, spliceosomen som sätter ihop aktivt mRNA, de system av enzymer som tillverkar nukleotiderna och så vidare, och så vidare. Processen aktiveras av vad som händer i organismens miljö, interna processer som omfattar många delar av cellen eller helt olika delar av kroppen osv. På så sätt är kärnan med sitt DNA en organell vilken som helst.

Men! Det finns ett sammanhang där det är befogat att prata om genetiska orsaker, nämligen ärftliga skillnader mellan individer. Det går att hitta (och faktiskt konstruera) exempel på individer där dramatiska skillnader i egenskaper som utseende och beteende beror på en skillnad i DNA-sekvens — en genetisk variant eller ”gen” i den klassiska bemärkelsen. Det förstås, det kan finnas andra typer av ärftlighet som inte beror på DNA, och i så fall borde de också räknas med här. Men de flesta saker som inuti celler kan göra skillnad i en organisms egenskaper — proteiner, membranlipider, kolhydrater, små organiska molekyler osv — nollställs mellan generationerna, när könsceller bildas och utvecklingen så att säga börjar om varje generation. Men DNA går i arv — med sin ”information”, om en så vill.

(Den 25 april 1953 publicerades artiklarna som presenterade DNA-molekylens struktur. Därav DNA-dagen. Min DNA-dagspost från förra året: På dna-dagen)

Written by mrtnj

26 april, 2015 at 00:01

Publicerat i genetik, molekylärgenetik

Tagged with , , ,

Morning coffee: @sweden

leave a comment »

This week, I’m tweeting from the @sweden account. It is a rotating account with a new Swede every week. I honestly have no idea who could have nominated me, but I’m flattered and happy. So far I think it’s going well. As I wrote on

I’m unlikely to present any great insights about the nature and meaning of Swedishness, but I hope I may be able to give you a new appreciation for the chicken comb.

I think I could probably just keep the week going by answering questions and comments, because there have been many good ones! We’ve been talking about domestication (of course), programming languages for data analysis, the bright but possibly distant future when quantitative genetics and systems biology come together, common misconceptions about genetics, what to say to your creationist friend etc.

Written by mrtnj

15 april, 2015 at 07:05

Paper: ”Mixed ancestry and admixture in Kauai’s feral chickens: invasion of domestic genes into ancient Red Junglefowl reservoirs”

with one comment

We have a new paper almost out (now in early view) in Molecular Ecology about the chickens on the Pacific island Kauai. These chickens are pretty famous for being everywhere on the island. Where do they come from? If you use your favourite search engine you’ll find an explanation with two possible origins: ancient wild birds brought over by the Polynesians and escaped domestic chickens. This post on Kauaiblog is great:

Hawaii’s official State bird is the Hawaiian Goose, or Nene, but on Kauai, everyone jokes that the “official” birds of the Garden Island are feral chickens, especially the wild roosters.

Wikepedia says the “mua” or red jungle fowl were brought to Kauai by the Polynesians as a source of food, thriving on an island where they have no real predators. /…/
Most locals agree that wild chickens proliferated after Hurricane Iniki ripped across Kauai in 1992, destroying chicken coops and releasing domesticated hens, and well as roosters being bred for cockfighting. Now these brilliantly feathered fowl inhabit every part of this tropical paradise, crowing at all hours of the day and night to the delight or dismay of tourists and locals alike.

In this paper, we look at phenotypes and genetics and find that this dual origin explanation is probably true.


(Chickens on Kauai. This is not from our paper, but by Jeff Trimble (cc:by-sa-nc) published on Flickr. There are so many pretty chicken pictures there!)

Dom, Eben, and Pamela went to Kauai to photograph, record to and collect DNA from the chickens. (I stayed at home and did sequence bioinformatics.) The Kauai chickens look and sound like mixture of wild and domestic chickens. Some of them have the typical Junglefowl plumage, and other have flecks of white. Their crows vary in the length of the characteristic fourth syllable. Also, some of them have yellow legs, a trait that domestic chickens seem to have gotten not from the Red but from the Grey Junglefowl.

We looked at DNA sequences by massively parallel (SOLiD) sequencing of 23 individuals. We find mitochondrial sequences that fall in two haplogroups: E and D. The presence of the D haplogroup, which is the dominating one in ancient DNA sequences from the Pacific, means that there is a Pacific component to their ancestry. The E group, on the other hand, occurs in domestic chickens. It also shows up in some ancient DNA samples from the Pacific, but not from Kauai (and there is a scientific debate about these sequences). The nuclear genome analysis is pretty inconclusive. I think what we would need is some samples of possible domestic source populations (Where did the escapee  chickens came from? Are there other traditional domestic sources?) and a better sampling of Red Junglefowl to make better sense of it.

When we take the plumage, vocalisation and mitochondrial DNA together, it looks like this is a feral admixed population of either Red Junglefowl or traditional Pacific chickens mixed with domestics. A very interesting population indeed.

Kenneth Chang wrote about the paper in New York Times; includes quotes from Eben and Dom.

E Gering, M Johnsson, P Willis, T Getty, D Wright (2015) Mixed ancestry and admixture in Kauai’s feral chickens: invasion of domestic genes into ancient Red Junglefowl reservoirs. Molecular ecology

Written by mrtnj

8 april, 2015 at 20:46

Morning coffee: cost per genome

leave a comment »

I recently heard this thing referred to as ”the most overused slide in genomics” (David Klevebring). It might be: what it shows is some estimate of the cost of sequencing a human genome over time, and how it plummets around 2008. Before that, the curve is Sanger sequencing, and then the costs show second generation sequencing (454, Illumina and SOLiD).


The source is the US National Human Genome Research Institute, and they’ve put some thought into how to estimate costs so that machines, reagents, analysis and people to do the work are included and that the different platforms are somewhat comparable. One must first point out that downstream analysis to make any sense of the data (assembly and variant calling) isn’t included. But the most important thing that this graph hides, even if the estimates of the cost would be perfect, is that to ”sequence a genome” means something completely different in 2001 and 2015. (Well, with third generation sequencers that give long reads coming up, the old meaning might come back.)

For data since January 2008 (representing data generated using ‘second-generation’ sequencing platforms), the ”Cost per Genome” graph reflects projects involving the ‘re-sequencing’ of the human genome, where an available reference human genome sequence is available to serve as a backbone for downstream data analyses.

The human genome project was of course about sequencing and assembling the genome into high quality sequences. Very few of the millions of human genomes resequenced since are anywhere close. As people in the sequencing loop know, resequencing with short reads doesn’t give you a genome sequence (and neither does trying to assemble a messy eukaryote genome with short reads only). It gives you a list of variants compared to the reference sequence. The usual short read business has no way of detect anything but single nucleotide variants and small indels. (And the latter depends … Also, you can detect copy number variants, but large scale structural variants are mostly off the table.) Of course, you can use these edits to reconstruct a consensus sequence from the reference, but it would be a total lie.

Again, none of this is news for people who deal with sequencing, and I’m not knocking second-generation sequencing. It’s very useful and has made a lot of new things possible. It’s just something I think about every time I see that slide.

Written by mrtnj

2 april, 2015 at 07:15

R in genomics @ SciLifeLab, Solna

leave a comment »

Dear diary,

I went to the Stockholm R useR group meetup on R in genomics at the Stockholm node of SciLifeLab. It was nice. If I had worked a bit closer I would attend meetups all the time. I even got to be pretentious with my notebook while waiting for the train.


The speakers were:

Jakub Orzechowski Westholm on R and genomics in general. He demonstrated genome browser-style tracks with Gviz, some GenomicRanges, and a couple of common plots of gene expression data. I have been on the fence about what package I should use for drawing genes and variants along the genome. I should play with Gviz.

Daniel Klevebring on clinical sequencing and how he uses R (not that much) in sequencing pipelines aimed at targeting the right therapy to patients based on the mutations in their cancer cells. He mentioned some getopt snippets for getting R to play nicely on the command line, which is something I should definitely try more!

Finally, Arvind Singh Mer on predictive modelling for clinical genomics (like the abovementioned ClinSeq data). He showed the caret package for machine learning, with an elastic net regression.

I don’t know the rest of the audience, so maybe the choice to gear talks towards the non-bio* person was spot on, but that made things a bit less interesting for me. For instance, in Jakub’s talk about gene expression, I would’ve preferred more about the messy stuff: how to make that nice gene-by-sample matrix in the first place, and if R can be of any help in that process; also, in the other end, what models one would use after that first pass of visualisation. But this isn’t a criticism of the presenters — time and complexity constraints apply. (If I was asked to present how I use R any demos would be toy analyses of clean datasets. That is the way these things go.)

We also heard repeated praise for and recommendations of the hadleyverse and data.table. I’m not a data.tabler myself, but I probably should be. And I completely agree about the value of dplyr — there’s this one analysis where a couple of lines with dplyr changed it from ”argh, do I have to rewrite this in C?” to being workable. I think we also saw all the three plotting systems: base graphics, ggplot2 and lattice in action.

Written by mrtnj

24 mars, 2015 at 17:40

Gruppselektion fungerar, men är det viktigt?

leave a comment »

Det här kommer bara vara roligt för dem som redan bryr sig om gruppselektion, men de är förvånansvärt många. Av någon anledning är gruppselektion väldigt provocerande. Ordet ”selektion” är en omskrivning för naturligt urval. Naturligt urval händer när vissa individer i en population har egenskaper som gör dem bättre på att överleva och fortplanta sig än andra. Om egenskaperna ifråga är ärftliga gör det att populationens egenskaper ändras över generationerna. Detta är evolution genom naturligt urval. De genetiska varianter som får individer att klara sig bättre ökar i frekvens. Men tänk om populationen består av grupper av individer som lever särskilt nära varandra. Kan det finnas egenskaper hos en grupp som gör den framgångsrik och som inte kan förklaras av selektion på individer? Ja, det fullt möjligt. Frågan är hur viktigt det är i naturen.

Organismer gör vanligtvis inte saker för populationens, artens eller gruppens skull. De gör saker för sig själva och sin avkomma. Men det finns många situationer där det är lönsamt, alltså förknippat med större reproduktiv framgång, att samarbeta, hjälpa andra och bete sig altruistiskt. Det är ganska tydligt varför det kan vara fördelaktigt för en individ att hjälpa sina ungar. De bär ju på hälften av ens genetiska material! Vi tänker oss en art där ungarna behöver omvårdnad medan de är små. Där kan en genetisk variant som ökar föräldrabeteendet sprida sig, eftersom den ger bäraren fler överlevande ungar, där i medeltal hälften i av dem kommer bära på samma variant. Samma resonemang fungerar för mer avlägsna släktingar, bara i mindre grad, eftersom sannolikheten att vi delar genetiska varianter blir mindre ju längre från varandra i släktträdet vi befinner oss. Detta kallas släktskapsselektion (engelska: kin selection), att förbättra sin reproduktiva förmåga indirekt genom släktingar. Tyvärr är det ett ganska uselt namn, eftersom det är ett namn på en typ av strategier, inte en egen form av selektion. Ett annat namn för samma sak är inclusive fitness, men det är typ omöjligt att översätta till något vettigt.

Det finns en lång lista med möjliga sätt som altruism kan löna sig i längden (se t.ex. West, Griffin & Gardner 2006). Det kan handla om att hjälpa sina släktingar, som ovan, eller att byta tjänster och gentjänster, eller min favorit: grönt skägg-altruism. Det är en situation där vi tänker oss en genetisk variant som har två olika effekter. Å ena sidan får den individen att bete sig altruistiskt mot individer som har ett visst kännetecken, hypotesens ”gröna skägg”. Dessutom får den individen själv att odla ett grönt skägg, alltså uttrycka samma signal. På så sätt kan den sprida sig genom att bärarna känner igen och hjälper varandra.

Så sociala interaktioner och altruism är inga stora mysterier som helt saknar förklaringar. Men att det inte verkar finnas ett skriande teoretiskt behov av gruppselektion betyder inte att effekter på gruppnivå inte finns. Låt oss därför ta ett exempel där selektion på gruppnivå utan tvivel fungerar och påverkar egenskaper. Naturligtvis kommer exemplet från artificiell selektion, inte naturligt urval, och det handlar om höns. En första version av experimentet ifråga beskrivs av William Muir (1996). Höns är inte riktigt anpassade för ett liv i industriell uppfödning. Ett vanligt problematiskt beteende är att hönsen hackar varandra, i värsta fall till döds. Det här experimentet gick ut på att försöka avla dem för att klara sig bättre i gruppburar med flera höns — utan att klippa i deras näbbar, vilket knappast löser problemet för hönsen men hindrar symptomen … Näbbtrimning är förbjudet bland annat i Sverige. Muir avlade höns på överlevnad i gruppburar, där invånarna i en bur valdes eller valdes bort tillsammans som en grupp. I generation 2 var dödligheten 70%. Jag upprepar: på ett år dog 70% av hönsen. I generation 6 var dödligheten 9% procent, vilket är samma dödlighet som kontrolldjur som hölls ensamma.

En stor del av dödligheten förklaras av hur mycket individen blir hackad. Det kan såklart finnas genetiska varianter som skyddar offer mot fjäderhackning, men det viktigaste för individens överlevnad är inte hur mycket den själv hackar utan hur mycket de andra hackar. Det här fenomenet, när en individs egenskaper påverkas av vilka genetiska varianter som finns hos dem hen interagerar med, kan beskrivas med indirekta genetiska effekter. Indirekta genetiska effekter är en mekanism för hur gruppselektion kan fungera. Okej, men vad hade hänt med vanlig avel på individuell nivå? I ett liknande experiment, med höns i gruppburar, tittade författarna (Bijma & co 2007) på direkta och indirekta genetiska effekter på överlevnad. Jag har skrivit om heritabilitet förut, ett mått på hur stor del av variationen i en egenskap som beror på genetisk variation. Den kan skattas med en statistisk modell (se t.ex. Kruuk 2004) där en lägger samman mätningar och släktträd från ett antal individer och uppskattar hur stor del av egenskapen som går i släkten. Bijma & co använde en utökad version av samma modell som också tar hänsyn till effekten av andra gruppmedlemmar och deras släktträd. Det ger dels en vanlig direkt genetisk varianskomponent, den som används till heritabilitet, och en total varians som räknar med påverkan från de andra gruppmedlemmarna. I det här fallet var den totala genetiska variansen för överlevnad ungefär tre gånger så stor som den direkta genetiska variansen. Det intressanta med genetisk varians i avelssammanhang är att den visar hur snabbt en population kommer påverkas av selektion. I den här populationen bör alltså gruppselektion vara betydligt effektivare än individuell selektion i att minska dödligheten. I princip är det möjligt att ha en direkt och indirekt genetisk effekt i motsatt riktning, där selektion på individ och grupp skulle ge motsatta resultat.

Så långt hönshuset. Kan något liknande hända i naturen? Nyligen kom det en artikel (Pruitt & Goodnight 2014) som hävdar att de sett lokal anpassning på gruppnivå hos spindlar av arten Anelosimus studiosus. Spindlarna lever i kolonier där individerna kan klassificeras i två olika beteendetyper: lugna och aggressiva spindlar. Beroende på hur mycket resurser det finns i omgivningarna har naturliga kolonier olika sammansättning. Så författarna samlade in spindlar från olika ställen, födde upp dem i laboratoriet, testade deras beteende och satte ut dem igen i konstruerade kolonier med olika gruppsammansättning. Sedan kom de tillbaka med jämna mellanrum för att se hur bra experimentkolonierna klarade sig. Kort och gott löpte kolonierna större risk att dö ut om deras sammansättning inte matchade sammansättningen hos naturliga kolonier på den platsen. Det verkar som att på vissa platser är det bra att ha många aggressiva spindlar i en koloni, på andra färre, och om en koloni har för många eller för få kommer den klara sig sämre. I rika omgivningar med mycket att äta verkar det fungera bättre att ha många aggressiva individer. I fattigare omgivningar är det bättre med många lugna.


(A. studiosus av Joe Lapp, på Flickr. cc:by 2.0)

Beteendetyperna, ”lugn” och ”aggressiv” verkar i det här fallet vara till största del bestämda av genetiska varianter. Så frågan är: Vilka interaktioner mellan individer inom kolonin är det som gör att en koloni får en viss sammansättning? Någonting verkar det vara i alla fall, för författarna prövade också att flytta kolonier mellan rik och fattig miljö. Och det ser ut som att kolonier behåller sin karaktäristiska sammansättning över generationerna. Spindlar som kommer från en fattig miljö fortsätter hålla en låg andel aggressiva individer i sina kolonier, även om det vore bättre för dem att ha fler. De verkar vara lokalt anpassade till en resursfattig miljö, där en låg andel aggressiva spindlar hade fungerat bättre.

Oftast det såklart så att de en lever närmast ofta också är de en är närmast släkt med. Så om släktskapsselektion och gruppselektion händer samtidigt kommer det vara svårt eller omöjligt att skilja dem åt. Att jag har svårt att komma på hur en alternativ förklaring med släktsskapsselektion skulle se ut i fallet spindlarna kan bara vara min bristande fantasi. Det är populärt att påstå något i stil med ”gruppselektion och släktskapsselektion är samma sak” av matematiska skäl. Men bevisen för att de bara är beskrivningar av samma process verkar inte vara entydiga. van Veelen m.fl. (2012) ger ett motexempel på en modell där de inte ger samma resultat. Jag kan inte påstå att jag förstår den teoretiska litteraturen på det här området, men att modeller av gruppselektion och av släktskapsselektion är bevisat matematiskt ekvivalenta verkar vara för mycket sagt.


West, S. A., Griffin, A. S., & Gardner, A. (2007). Social semantics: altruism, cooperation, mutualism, strong reciprocity and group selection. Journal of evolutionary biology, 20(2), 415-432.
Bijma, P., Muir, W. M., Ellen, E. D., Wolf, J. B., Van Arendonk, J. A. (2007). Multilevel selection 2: estimating the genetic parameters determining inheritance and response to selection. Genetics, 175(1), 289-299.
Kruuk, L. E. (2004). Estimating genetic parameters in natural populations using the ‘animal model’. Philosophical Transactions of the Royal Society of London. Series B: Biological Sciences, 359(1446), 873-890.

Få meddelanden om nya inlägg via e-post.

Gör sällskap med 1 366 andra följare