Heb je je ooit al eens afgevraagd hoe onderzoekers nu precies zijn te weten gekomen dat de hippocampus, een deel van de temporale hersenen, een belangrijke rol speelt in ons geheugen? Of dat het voorste deel van de hersenen, de frontale cortex, een belangrijke rol speelt bij het uitvoeren van complexe taken? Nog meer specifiek, hoe is men ooit tot de ontdekking gekomen dat er in de hersenen gebieden zijn zoals de Parahippocampal Place Area, dat enkel en alleen reageert op huizen, en de Fusiform Face Area, dat enkel en alleen reageert op, je had het al geraden, gezichten?
Stel je voor dat je zelf een onderzoeker bent en je wil weten welk deel van de hersenen actief is tijdens het verwerken van emotionele informatie. Je besluit om enkele proefpersonen emotionele foto’s te laten bekijken terwijl ze in een functionele MRI scanner liggen. Deze scan levert je een gigantische hoeveelheid data op die aangeven in welke mate alle delen van de hersenen actief waren tijdens het uitvoeren van deze taak. Hieruit concluderen waar emotionele informatie verwerkt wordt zou echter te eenvoudig zijn. Tijdens het bekijken van foto’s gebruiken proefpersonen hun ogen, en deze visuele informatie zal voor een grote activatie zorgen in de zogenaamde occipitale kwab, daar waar de hersenen visuele informatie verwerken. Om te verhinderen dat je verkeerdelijk besluit dat emotie in de occipitale kwab verwerkt wordt, laat je de proefpersonen ook een reeks neutrale foto’s zien, die je als controle gebruikt in het experiment. Aangezien deze controlefoto’s volledig identiek zijn aan de emotionele foto’s waarin je geïnteresseerd bent, op het emotionele karakter van de foto na, besluit je dat het verschil tussen beide foto’s je een goede indicatie kan geven van de hersendelen die actief zijn bij het verwerken van emotionele informatie. Aangezien beide foto’s activatie in de occipitale kwab veroorzaken zal het verschil tussen beide deze activatie uitmiddelen. Vervolgens kan je voor elk deel in de hersenen kijken of er een verschil in activatie zit tussen de neutrale en de emotionele foto’s. Als dit zo is, dan heb je prijs! Daar, in die hersendelen waar een verschil zit, daar worden emoties verwerkt! Laat de persen maar al warmdraaien.
Alvorens overhaaste conclusies te maken toch even een kleine opmerking. Om voor elk hersengebied te kijken of de activatie daar verschillend is gebruiken we statistiek. We kijken of er een statistisch significant verschil is. Dat wil zeggen, of het verschil in activatie tussen beide soorten zinnen groter is dan kan verwacht worden puur op basis van kans. Wat betekent dat, groter dan kans? Stel dat je dezelfde test 100 keer opnieuw zou doen en je zou meer dan 95 keer hetzelfde uitkomen, dan zeggen we dat deze bevinding significant verschillend is van wat we op basis van toeval zouden verwachten. Dit betekent echter ook dat je in vijf van die testen puur op basis van toeval niets zal uitkomen. Deze benadering heeft grote gevolgen voor dit soort onderzoek, want de omgekeerde redenering klopt ook. Als er geen verschil is tussen 100 hersengebieden zullen we toch, op basis van kans, bij 5 daarvan een statistisch significant verschil vinden dat eigenlijk volledig aan toeval te wijten is. Je kan je wel inbeelden dat deze valse positieven (we vinden een effect dat eigenlijk ‘vals’ is) grote gevolgen kunnen hebben voor je conclusies.
Beeld je nu opnieuw in dat je wil weten welke hersengebieden instaan voor het verwerken van emoties. Deze keer ben je echter niet geïnteresseerd in hoe mensen dit doen, maar hoe zalmen emotionele informatie verwerken. Meer bepaald, dode zalmen. Dit was precies wat Craig Bennett en zijn collega’s deden. Ze voerden precies dezelfde taak uit als jij hierboven, deden precies dezelfde analyses als jij hierboven, en kwamen net als jij tot de bevinding dat bepaalde hersengebieden statistisch significant méér actief waren tijdens het observeren van emotionele zinnen in vergelijking met neutrale zinnen. Wat was het belangrijkste verschil tussen hun studie en die van jou? De enige deelnemer aan het experiment was een dode Atlantische zalm. Opsturen naar de meest gerenommeerde tijdschriften zou je denken? Zelfs dode zalmen kunnen emotionele informatie verwerken? Wereldschokkend nieuws?
Wat Bennett en collega’s met dit experiment wilden aantonen is exact wat ik hierboven heb uitgelegd. Tijdens een functionele MRI scan worden de hersenen onderverdeeld in 130.000 kleine voxels (een soort driedimensionale pixels). Vervolgens wordt in de analyse voor elke voxel apart gekeken of die verschillend actief is bij neutrale of emotionele foto’s. Dit werpt meteen een heel ander licht op de resultaten. 130.000 voxels, waarvan we per honderd tests vijf valse positieven verwachten, dat zou 6500 valse positieven moeten opleveren. Dit is uiteraard een veel betere verklaring voor de vreemde resultaten van deze studie. Volgens de auteurs is het ongeoorloofd om data van functionele MRI scans op deze manier te analyseren. Elke kleine toevalligheid in de data (bijvoorbeeld, met oudere scanners krijg je vaak kleine ruispatronen), kan op deze manier foutief als een cruciaal hersendeel voor deze taak beschouwd worden.
De uiteindelijke conclusie is minder spannend, maar des te belangrijker dan het verhaal zelf. Bij het uitvoeren van dit soort testen moeten we zorgen dat de kans op valse positieven 5 op 100 is voor alle testen die we uitvoeren samen, en niet voor elke test apart. Hoe dat precies moet gedaan worden, daar bestaan verschillende manieren voor, maar een correctie voor dit probleem is noodzakelijk! Indien onderzoekers zich hier niet aan houden en toch analyseren zonder de nodige correcties, dan weet jij alvast hoeveel geloof je moet hechten aan de opmerkelijke krantenkop ‘goudvis leest gedachten zonder fysiek aanwezig te zijn’.
Referenties
- Bennett, C. M., Baird, A. A., Miller, M. B., & George, L. (2004). Neural Correlates of Interspecies Perspective Taking in the Post-Mortem Atlantic Salmon: An Argument For Proper Multiple Comparisons Correction. Journal of Serendipitous and Unexpected Results, 1(1), 1–5.