Gezondheidsraad

J.P. Vandenbroucke

Gezondheidsraadlezing

30 september 1999

Dames en heren,

In 1714 schreef het Britse parlement een prijsvraag uit. De prijsvraag betrof het oplossen van het lengtegraadprobleem. In die tijd konden zeilschepen op het midden van de oceaan wel hun breedtegraad bepalen, maar niet hun lengtegraad. Dat leidde tot zeilen in totaal verkeerde richting, te pletter slaan op rotsen: grote verliezen aan kapitaal en manschappen. Er waren twee richtingen om het probleem aan te pakken. De eerste werd voorgestaan door serieuze astronomen: uit de hoek waaronder iemand de manen van Jupiter ziet kan men afleiden op welke lengtegraad hij zich bevindt. Een schitterende exacte oplossing. Ze vergt het aan boord hebben van goede l8de eeuwse telescopen, enkele dikke boekwerken voor de coördinaatbepaling, een niet schommelend zeilschip en een volstrekt heldere hemel bij nacht. De rivaliserende oplossing was wel wat minder exact, maar was van grote eenvoud. Als je midden op de oceaan was, dan bepaalde je wanneer de zon op haar hoogste punt stond. Op dat ogenblik was het op die plaats precies 12 uur. Dat vergeleek je met een klok die je had meegenomen bij vertrek, een klok die nog steeds de tijd aangaf van je thuishaven. Met enkele simpele berekeningen uit het tijdsverschil kreeg je dan de lengtegraad.

Het probleem was de klok: die moest bestand zijn tegen een zeereis uit die tijd: bestand tegen alle mogelijke slingeringen, maar ook tegen grote hitte en koude, die materialen doen uitzetten en inkrimpen, en tegen vochtigheid. Geen geringe opgave voor een louter mechanische klok.

Een klokkenmaker zette zich aan het werk. Na vele jaren vervaardigde hij een klok die uitgetest werd op een zeereis. Op drie maanden zeilen onder moeilijke omstandigheden was de klok slechts enkele seconden verkeerd gaan lopen. De kapitein was laaiend enthousiast: eindelijk wist hij met grote precisie waar hij was. De klokkenmaker meende dus de prijs voor het oplossen van het navigatieprobleem in ontvangst te mogen nemen.

Hij had buiten de waard gerekend. In de jury zetelde ook de Britse koninklijke astronoom, hoofd van de sterrenwacht uit Greenwich, die het bewijs onvoldoende vond, en vroeg om de klok opnieuw te mogen testen. De astronoom nam de klok mee naar zijn sterrenwacht en gaf zijn bedienden de opdracht om de klok enkele malen per dag flink te schudden, er vervolgens een vuurtje onder te stoken en daarna ijs op te leggen. Reeds na enkele dagen liep de klok vrijwel een half uur achter. De prijs werd niet toegekend omdat er nu experimenteel bewijs was dat de klok niet deugde.

Feiten en meningen

Dames en heren, het is goed gekomen met de klokkenmaker: de klok heeft het gehaald en zeevarend Engeland op voorsprong gebracht, mede dank zij de interventie van de toenmalige Engelse koning, die een klokkenfanaat was. Maar; waarom vertel ik U dit verhaal? Het onderliggende thema van mijn uiteenzetting over "hoe medische kennis gemaakt wordt" is de verhouding, en de wederzijdse beïnvloeding tussen meningen en feiten, tussen theorie en waarneming, empirie en dogma.

In een eerste deel zal ik met U enkele voorbeelden bespreken van de onderlinge verhouding tussen feiten en meningen in de moderne geneeskunde. Dat zal ik achtereenvolgens doen aan de hand van voorbeelden uit epidemiologisch onderzoek naar bijwerkingen, daarna voorbeelden over medische experimenten, randomized trials, en uiteindelijk ook met voorbeelden uit basiswetenschappelijk onderzoek. We zullen zien dat de verhouding tussen theorie en feiten ook in de moderne geneeskunde heel wat subtieler ligt dan we veelal denken: even zal het erop lijken of we in een moeras van totale subjectiviteit terecht komen. In een tweede gedeelte van mijn uiteenzetting zal ik mij afvragen of er oplossingen zijn. Dat is geen louter theoretische exercitie, maar ook een hele praktische voor een Gezondheidsraad. Die moet immers uitspraken doen over de huidige stand van de wetenschap. Zo'n uitspraak moet uiteraard niet slechts een mening zijn, ook al is het een mening van deskundigen, maar onderbouwd met feiten.

Bijwerkingen

Hoe is de verhouding tussen feiten en meningen in de moderne geneeskunde? Ik begin met "bijwerkingen van geneesmiddelen". Controverses over bijwerkingen zijn fraaie voorbeelden omdat het probleem daar zo duidelijk ligt.

Als typevoorbeeld neem ik een controverse die erg bekend is in Nederland: over de derdegeneratie anticonceptiepil . Probleem: is het zo dat de meest moderne laag gedoseerde anticonceptiepil, de derdegeneratie pil, toch meer veneuze trombose veroorzaakt, in vergelijking met de net iets oudere tweede-generatie pil, die andere progestagene hormonen bevat?

Het volgende plaatje is een overzicht van de onderzoeksresultaten tot nog toe.

Figuur 1. Relatief risico voor veneuze trombose bij gebruik van derde generatie anticonceptiepil ten opzichte van tweede generatie anticonceptiepil afhankelijk van sponsoring.

Op de verticale as ziet U het relatieve risico: hoeveel vaker geeft een derdegeneratie pil trombose in vergelijking met de tweede-generatie pil. Elk stipje is het resultaat van één onderzoek. Op de horizontale as heb ik aangegeven of het onderzoek al dan niet gesponsord werd door een pilproducerende industrie. U ziet dat op één onderzoek na, een Italiaans onderzoek gepubliceerd in een kleiner tijdschrift, alle resultaten van de niet-gesponsorde onderzoekingen hoger liggen dan die van de gesponsorde. Globaal is de conclusie uit het niet-gesponsorde onderzoek dat de derdegeneratie pil zeker een tweevoudige verhoging geeft van het risico van veneuze trombose, bovenop het basisrisico dat elke pil al heeft. De gesponsorde auteurs daarentegen komen tot de conclusie dat er niets aan de hand is: het relatieve risico wijkt niet af van de 1: dat wil zeggen een gelijk risico voor beiden soorten pil.

Dit zijn de oorspronkelijke bevindingen. Met dezelfde gegevens is een macht van heranalyses en commentaren geschreven. Meest interessant voor onze uiteenzetting is dat één van de niet-gesponsorde onderzoekingen, een onderzoek dat oorspronkelijk een relatief risico van ongeveer twee vond, gebaseerd was op een groot gegevensbestand dat tegen betaling verkrijgbaar is. Deze gegevens zijn onlangs verworven door één van de auteurs van de gesponsorde onderzoekingen, die de gegevens ging heranalyseren, met iets andere criteria en indelingen, en zie: hij vindt nu met hetzelfde gegevensbestand een relatief risico dat niet noemenswaardig afwijkt van een: niets aan de hand dus.

Wat is nu nog het verschil tussen onze moderne epidemiologie en het klokkenexperiment uit de 18de eeuw? Eén en dezelfde klok, in andere handen, geeft verschillende tijden. Eén en hetzelfde gegevensbestand, in verschillende handen, leidt tot volstrekt tegengestelde gevolgtrekkingen.

Dames en heren, dit voorbeeld is niet uniek. De grootste bijwerkingencontroverse in deze eeuw is die over sigaretten roken en longkanker. Een halve eeuw geleden is al aangetoond dat longkanker een neveneffect is van tabak. Tot de dag van vandaag zijn we er niet in geslaagd om dit product afdoende te reguleren, mede omdat er voortdurend wetenschappelijke stokken in de wielen worden gestoken. De huidige gevechten rondom het reguleren van sigaretten woeden rond het "passief roken". Daarover zijn een beperkt aantal studies verschenen, maar nog een veel groter aantal meta-analyses en commentaren. Vorig jaar verscheen een meta-analyse van de meta-analyses, waaruit bleek dat de conclusies van de afzonderlijke commentaren vrijwel volstrekt voorspelbaar waren op basis van de financiering van de auteurs. Auteurs die geregeld deelnamen aan bijeenkomsten van de tabaksindustrie of daar ooit door gesponsord waren, vonden geen nadelig effect van passief roken. Op basis van dezelfde literatuur vonden anderen dat wel.

In de afgelopen decennia hebben we vaak meegemaakt dat de bron van financiering en de opinie van de auteurs sterk samenlopen: bij de controverse over de calcium-antagonisten, over de beta-agonisten bij astma, over salicylaten en het syndroom van Reye, en vele andere.

Ja, hoor ik U bijna denken, dat gaat over literatuuroverzichten, vooral gebaseerd op observationeel epidemiologisch onderzoek. En we weten toch dat dit soort onderzoek bij uitstek onderhevig is aan alle mogelijke vertekening. Als je nu maar een echt gerandomiseerd experiment had, of echte harde basiswetenschap, dan zou je al die problemen toch niet hebben.

Het gerandomiseerde experiment

Laten we daarom onze aandacht nu verleggen naar de randomized controlled trial, het medische experiment. We beginnen met een wat buitenissig voorbeeld: gerandomiseerd onderzoek naar het effect van homeopathie, vooraleer we overgaan tot onze vertrouwde allopathische geneeskunde. Over homeopathie bestaat het misverstand dat we er misschien het voordeel van de twijfel aan moeten geven, omdat we het werkingsmechanisme niet begrijpen. Tenslotte zijn ook wilgenbast en vingerhoedskruid in de geneeskunde ingevoerd, vanuit de volkse folklore, zonder dat we begrepen waarom ze werkten. En ik ben er niet geheel van overtuigd dat we heden ten dage al wel weten waarom salicylaten en digitalis werken. Bij homeopathie is de situatie verschillend: er is sprake van een oneindige verdunning die elke chemische activiteit onmogelijk maakt.

Stelt u zich even voor hoe een randomized trial naar homeopathie verloopt: je wil een vergelijking maken tussen een groep proefpersonen die uitsluitend een flesje met oplosmiddel krijgen, en een andere groep die oplosmiddel krijgt met bijkomend agens, in oneindige verdunning. Dat is hetzelfde als twee keer het oplosmiddel geven. Zo'n randomized trial is eigenlijk een kansspelletje tussen twee placebo's. Wat zou daar uit moeten komen? Geen verschil uiteraard, tenzij op basis van toevalsvariatie die in een onderzoek altijd aanwezig is, Dat wil zeggen, dat je van een verzameling van verschillende onderzoekingen naar homeopathie verwacht dat ze zich groeperen in een fraaie funnel plot, zoals op het volgende plaatje.

figuur 2. Computersimulatie van randomized trials van homeopathie ten opzichte van placebo.

Op de X-as, de horizontale, ziet U alle mogelijke resultaten van het gerandomiseerde onderzoek. In het midden ziet u "geen effect", nul verschil dus. Op de Y-as, de verticale as, ziet U de grootte van het onderzoek. Kleinere onderzoekingen onderaan, en grotere bovenaan. Elk punt of elk getal stelt één of meer onderzoekingen voor: elk onderzoek geeft één resultaat; een relatief risico of een risicoverschil, en elk onderzoek heeft een bepaalde grootte. Wat we verwachten is dat de kleinere onderzoekingen door toeval nogal wat spreiding rondom het werkelijke "geen effect" vertonen, maar hoe groter het onderzoek, hoe dichter bij de waarheid. Dat is de funnel die we verwachten. Deze, op dit plaatje, is uiteraard een fraaie computersimulatie.

De werkelijkheid was anders. Zowat 2 jaar geleden verscheen een meta-analyse van randomized trials naar homeopathie, en de auteurs publiceerden de volgende grafiek.

Figuur3. Funnel homeopathie

Om te beginnen, opnieuw de X-as met het relatieve risico, deze keer Op logaritmische schaal. Op de Y-as de inverse van de variantie, wat goed overeenkomt met de grootte van het onderzoek. "Geen effect" is hier een log relatief risico van nul. Daar zien we niet veel onderzoeksresultaten. Slechts enkele grotere, maar het grootste aantal onderzoekingen centreert zich rond een logaritme van 1, ongeveer overeenkomend met een relatief risico van 2, wat wil zeggen dat homeopathische verdunningen ongeveer twee keer zoveel werkzaamheid hebben als het oplosmiddel. U ziet ook een groepje extreme waarnemingen, "uitbijters". Aha, zegden sommigen, wellicht is de gehele literatuur vertekend. Wellicht zijn sommige kleinere trials aan de negatieve kant, de kant van de onwerkzaamheid, niet gepubliceerd. Want je verwacht toch dat een funnel plot symmetrisch is, en als er uitbijters aan de ene kant zijn dan moeten die er ook aan de andere kant zijn. Er moeten dus negatieve publicaties achtergehouden zijn. "Erg onwaarschijnlijk", zo stellen de auteurs van de meta-analyse. Ze berekenden dat er meer dan 4000 goed uitgevoerde middelgrote onderzoekingen bewust achtergehouden zouden moeten worden om deze resultaten uitsluitend door "publicatie bias" te verklaren.

U en ik geven het niet op - tenminste, ik hoop dat ik u nog aan mijn zijde heb. Wellicht was de kwaliteit van het onderzoek erg slecht. Wederom hebben de auteurs van de meta-analyse hun antwoord klaar: als ze uitsluitend kijken naar het onderzoek van hoge methodologische kwaliteit, gepubliceerd in hoog genoteerde tijdschriften, blijft de werkzaamheid van homeopathie, ook in de hoogste verdunningen, nog altijd bestaan.

Laten we op dit punt samen een gevaarlijk gedachten experiment uitvoeren. Stel dat dit plaatje niet ging over homeopathie, maar over een medicatie waarin we rotsvast geloven. Elk van ons neemt even een medicatie in gedachten waarvan we zeker zijn dat ze werkt. Maar, stelt u zich vervolgens voor dat de funnel plot van de gepubliceerde onderzoekingen er uit zou zien zoals deze. Wat zouden we zeggen? We zouden naar deze grafiek kijken, en we zouden zeggen: "Ja natuurlijk is de literatuur altijd een tikje optimistisch, maar ook als je de uitbijters weg laat, dan blijft er een duidelijk effect. En die enkele grote onderzoekingen die geen effect vinden: die zijn natuurlijk uitgevoerd door dat slag onderzoekers dat altijd van die grote maar heel slordige mega-trials uitvoert: ze gebruikten niet de juiste dosis, niet het juiste tijdstip van toediening, en ze hebben de patiënten met de contra-indicaties onvoldoende uit het onderzoek verwijderd. En die uitbijters, nu we er aan denken, die zijn eigenlijk ook te verklaren: dat is een subgroep van patiënten met ernstiger ziekte. Daarom liggen ze apart: de medicatie is bij hen veel effectiever. Je ziet het, zij hebben hun eigen kleine funnel.

Ik waarschuwde U over dit gedachten experiment: het lijkt alsof we alles hebben omgedraaid. Zonet dachten we nog dat we ons door echte waarnemingen, echte feiten moesten laten leiden, om te zien of een theorie juist is. Nu lijkt het erop dat we de waarnemingen, de onderzoeksresultaten al dan niet geloven, afhankelijk van onze theoretische inzichten.

Waarom vertonen gerandomiseerde onderzoekingen over homeopathie dit effect? Enkele jaren geleden verscheen een overzicht over een groot aantal gepubliceerde randomized trials, waaruit bleek dat de interventiegroep, de groep die het actieve product kreeg, gemiddeld kleiner was dan de placebogroep. Klaarblijkelijk worden patiënten vaker uit een interventiegroep dan uit een placebogroep verwijderd, ondanks het feit dat er in "materiaal en methoden" geschreven staat dat de analyse "intention-to-treat" was en het hele onderzoek "dubbel blind". Het is ook aangetoond dat randomized trials met externe sponsoring vaker significant positieve resultaten vertonen dan trials zonder sponsoring.

De zucht om te behagen?

Op de een of andere wijze is het zo dat het gerandomiseerde experiment, net zoals observationeel epidemiologisch onderzoek, een neiging vertoont om te behagen: om te behagen aan de onderzoekers die het onderzoek hebben opgezet. Dat is uiteraard lang niet altijd het geval. Er zijn perfecte voorbeelden van gerandomiseerd onderzoek dat helemaal anders uitkwam dan de onderzoekers hadden gedacht. Maar; als je er in zijn algemeenheid naar kijkt, dan is er toch een element van "behagen" dat duidelijker wordt naarmate je gerichter kijkt. Dat is helemaal niets om beschaamd over te zijn. De geschiedenis van de wetenschap leert ons dat hetzelfde gebeurt in de fysica en in de scheikunde, en het was ook zo in het klokkenexperiment. Ik vermoed dat een opeenstapeling van kleine vertekeningen, kleine foutjes, exclusies, subgroepanalyses, enz. de verklaring is voor zovele positieve onderzoekingen over homeopathie. Maar; als dat zo is, dan moet dat ook gebeuren in onze reguliere allopathische geneeskunde. Bij definitie zal dat moeilijker te zien zijn, wellicht zelfs onmogelijk, omdat we in de allopathische geneeskunde nooit weten wanneer we onszelf zand in de ogen strooien. Dat wordt pas duidelijk als eerst de theorie verandert.

Laag-moleculairgewicht heparine

Toen de laag-moleculairegewicht heparine voor het eerst op de markt kwam, was er de hoop dat deze medicatie beter zou zijn dan de klassieke heparine voor de preventie van diep veneuze trombose in hoog-risico situaties, zoals chirurgie, omdat het werkingsmechanisme van deze producten anders was. Deze nieuwe producten zouden aan de ene kant betere preventieve anti-stolling geven, en aan de andere kant minder bloeding. Enkele jaren geleden werkten Leidse en Amsterdamse onderzoekers samen aan een meta-analyse van gerandomiseerd onderzoek van klassieke en nieuwe heparine. En we vonden deze effecten: betere preventie, en minder of ten hoogste evenveel bloedingen. Omdat sommigen onder ons onverbeterlijke sceptici zijn, deelden we de onderzoekingen in twee groepen in: die met een "hogere" en die met een wat "lagere" kwaliteitscore.

Het beeld dat naar voren kwam uit het onderzoek met een wat hogere kwaliteitscore, vaak ook gepubliceerd in wat hoger genoteerde tijdschriften, was toch een tikje minder rooskleurig: het preventieve effect was er; maar was kleiner; en er was nu een duidelijke tendens tot meer bloeden. In tegenstelling daarmee vertoonde het onderzoek met de wat lagere kwaliteitscore een fors preventief effect en ook minder bloedingen. Het onderzoek met wat mindere kwaliteit toonde het verwachte effect veel duidelijker.

Er is sedertdien nog meer onderzoek gepubliceerd, en nog veel meer meta-analyses, en in hun algemeenheid zijn de conclusies voorzichtiger geworden. De laagmoleculaire heparines worden gezien als een grote therapeutische aanwinst, vooral omdat ze makkelijker toe te dienen zijn, en geen opname in het ziekenhuis vergen, maar hun therapeutisch en bijwerkingenprofiel wordt steeds vaker als vergelijkbaar met de klassieke heparine beschreven. Om deze omslag te begrijpen is het hoogst interessant om te weten dat ondertussen duidelijk is geworden dat het werkingsmechanisme van de nieuwere heparines hij nader onderzoek toch heel wat vergelijkbaarder bleek met de klassieke heparines, zodat een hele forse therapeutische winst steeds minder verwacht werd. Klaarblijkelijk werden de eerdere en kwalitatief wat zwakkere onderzoekingen meer geleid door de oorspronkelijke biochemische inzichten dan het sterkere en het wat latere onderzoek.

Feiten en verklaringen

Een straaltje hoop komt plots te voorschijn uit dit laatste verhaal: zou het zo zijn dat wanneer gegevens uit de basiswetenschappen op één lijn liggen met gegevens uit het klinische onderzoek, dat we dan veilig zitten?

Laten we de overeenkomst tussen feiten en verklaringen nog wat nader bekijken.
En daarvoor teruggaan naar de discussie rond sigarettenroken en longkanker. De waarnemingen uit de observationele epidemiologie zijn overweldigend. Al meer dan een halve eeuw geloven wij al dat sigaretten longkanker veroorzaken, vrijwel uitsluitend op basis van de epidemiologie. De dierproeven die ooit gebeurden, waren altijd een tikkeltje kunstmatig, zowel voor de gebruikte blootstelling als voor de waargenomen effecten. Wat we nog niet hebben is een biologisch mechanisme. Het is dan ook niet te verwonderen dat enkele jaren geleden een triomfantelijk hoera-geroep opsteeg uit de bladzijden van Science: in DNA van longepitheel vonden onderzoekers dat een component van tabaksrook, benzopyrenen, zich bond aan plaatsen op het p53 oncogen waar vaak mutaties voorkomen.

Eindelijk een verklaring! Als je die publicatie leest, zie je wel dat het ook nogal een associatieve verklaring is: we lezen dat p53 vaak gemuteerd is in sommige longkankers, maar niet in alle, en dat mogelijke mutagenen uit tabaksrook vaak binden aan die favoriete mutatieplaats, maar ook niet altijd. En dat gebeurt niet uitsluitend in longepitheel, maar ook in andere onderzochte cellen.

Laten we ons, gedurende 30 seconden, even voorstellen dat we leefden in een wereld waarin helemaal geen epidemiologische gegevens zouden bestaan over longkanker en roken. Wat zouden we met deze moleculaire waarnemingen doen? In de eerste plaats zouden ze waarschijnlijk nooit verricht zijn: niemand zou het ooit de moeite waard hebben gevonden om daar ooit onderzoek naar te doen. En zelfs als de een of andere gekke wetenschapper dat toch gedaan zou hebben, dan zou dit bericht zeker Science nooit gehaald hebben. Waarschijnlijk zou het nooit gepubliceerd zijn geweest, want er zou geen enkele reden geweest zijn om te veronderstellen dat tabak longkanker doet ontstaan. Deze waarnemingen zouden afgedaan zijn als mogelijk een lab-fout, of als iets heel aspecifiek dat in alle mogelijke cellen optreedt en nog niet verklaard is.

Dit gedachte-experiment is onlangs werkelijkheid geworden, in de controverse rond de derdegeneratie pil. Begin 1997 publiceerden stollingsonderzoekers uit Maastricht een nieuwe stoltest voor wat zij "verworven APC-resistentie" noemen. De theorie is dat hoe hoger de APC-resistentie, hoe vaker veneuze trombose. Bij vrouwen die de derdegeneratie pil gebruikten, vonden deze onderzoekers veel hogere waarden. Dat zou dus het begin van een verklaring kunnen zijn. Sommigen onder ons riepen wederom hoera: nu hebben we niet alleen de epidemiologie, maar ook het begin van een basiswetenschappelijke verklaring. We hadden buiten de waard gerekend. Ondanks recente bevestigingen, stellen de onderzoekers die niets mis vonden met de derde-generatie pil (die van het relatieve risico rond de één), samen met andere stollingsdeskundigen, dat deze afwijking onbegrepen is, en dus waarschijnlijk volstrekt onschuldig. De afwijking kan niets verklaren, zo menen zij. Er is immers niets aan de hand.

Een moeras van subjectiviteit?

In het begin van mijn betoog dachten we nog even dat alleen de observationele epidemiologie een zwakke wetenschap was, waarin subjectiviteit hoogtij viert, en je geen recht van krom kan onderscheiden. Nu blijkt dat het basale stollingsonderzoek daar op geen enkele wijze voor onder doet.

Dames en heren, met veel enthousiasme zijn we begonnen aan onze deconstructie van feiten en meningen in de geneeskunde. Maar nu blijven we toch wat ontgoocheld achter: alle conclusies lijken altijd mogelijk. Elke zekerheid glipt ons uit handen. U begrijpt dat dit niet een louter theoretische bespiegeling is: de vraag rijst of het in principe nog mogelijk is om tot een advies te komen, via bijvoorbeeld een vergadering van experts, dan wel of alle meningen en alle conclusies altijd even goed zijn. Dat kan toch niet zo zijn, zelfs niet als het, en ik noem maar twee dwarsstraten, gaat over screening voor hypercholesterolemie of voor osteoporose. Daar moet toch een onderscheid te maken zijn over wat wetenschappelijk acceptabel is en wat niet.

Hedendaagse wetenschapsfilosofie

Hoe geraken we uit dit moeras van subjectiviteit? Zoals het een generalist betaamt, heb ik mij gewend tot de specialist, tot de moderne wetenschapsfilosoof in een persoonlijk consult en vervolgens via de literatuur.

Nadat ik aan de hoogleraar Gerard de Vries, wetenschapsfilosoof te Amsterdam, uitgebreid had verteld over de homeopathie, over de bijwerkingencontroverses, en hoe we daar dus niet meer uit komen, was zijn antwoord dat dit soort redeneerproblemen hem deden denken aan het "Japanse elektronargument". Stel dat een experiment in de fysica wordt uitgevoerd in de VS en hetzelfde experiment in Japan. Stel ook dat de uitslagen van de experimenten verschillend zijn. Dan kan een onderzoeker daar uiteraard proberen uit te geraken met de stelling: "Wellicht zijn elektronen in Japan wel verschillend van elektronen in de VS". Dat lijkt op het eerste gezicht licht lachwekkend, tenminste voor ons medici die spontaan geloven dat er één objectieve realiteit bestaat buiten ons om, en die vooral weinig weten over elektronen, maar het is toch moeilijker dan U denkt. De onderzoeker die stelt dat elektronen in Japan en de VS verschillen, zal immers zeggen dat de uitkomsten van de experimenten dat juist aantonen. Onze spontane neiging om te stellen dat er een uniforme werkelijkheid bestaat, is voor deze onderzoeker dus experimenteel weerlegd. Wie toch wil blijven geloven dat elektronen overal hetzelfde zijn, die verlaat de echte wetenschap, zo stelt deze onderzoeken. Wat valt daar tegen in te brengen?

Het enige wat je kan zeggen, aldus collega De Vries, is dat je het een "zwak argument" vindt. De onderzoeker maakt het zichzelf te gemakkelijk door een verschil aan te nemen. Als wij daarentegen blijven eisen dat een theorie over elektronen op onze aardbol resultaten moet opleveren die overal geldig zijn, omdat we willen uitgaan van eenheid in natuurwetenschappelijke verklaringen op atomair niveau, dan leggen wij de methodologische lat wat hoger. Het dwingt ons precies te kijken naar de experimenten die de tegenstrijdige resultaten hebben opgeleverd. Dus, dan zoek je toch maar naar verklaringen in onderzoeksopzet of analyse. Die moeten uitmaken welk van beide experimentele resultaten het meest geloofwaardig is. Let wel: onze stelling dat elektronen overal hetzelfde zijn is geen "feit uit de natuur" dat we kunnen vaststellen. Het is zelfs onmogelijk om vast te stellen omdat het onmogelijk is om te besluiten dat twee dingen op geen enkel punt verschillen. Het is een argument waaraan we willen vasthouden omdat we willen vasthouden aan de eenheid van verklaring, tegen de al te gemakkelijke uitweg van de onderzoeker. Uiteindelijk gaat het dus om geloofwaardigheid van argumenten.

Let ook, dat in een medische context, het idee dat Japanners bijvoorbeeld anders zouden reageren op een medicatie dan Kaukasiërs, niet onmiddellijk te verwerpen is. Integendeel, het vereist nader bevestigend of ontkennend onderzoek om het argument al dan niet uit te sluiten. Argumenten zijn slechts geldig in een bepaalde context.

In diezelfde geest las ik het werk van de Amerikaanse wetenschapsfilosofe Susan Haack. Zij gelooft al lang niet meer in het eenvoudige schema van Karl Popper, in de zin van: je maakt een hypothese, je toetst de hypothese en als de toets negatief uitvalt dan verwerp je de hypothese. Vooraanstaande wetenschappers hebben vaak doorbraken bewerkstelligd door zich niets aan te trekken, zelfs niet van hun eigen experimentele waarnemingen als die tegen hun hypothese waren. Ze bleven nadenken over hoe ze hun experimenten konden verbeteren, tot deze de triomferende theorie bevestigden.

Dit wil tegelijkertijd niet zeggen dat we mogen vervallen in volledig subjectivisme: "alle meningen zijn even goed". Susan Haack stelt als oplossing de kruiswoordraadsel-analogie. Bij het oplossen van een kruiswoordraadsel hebben we op een bepaald ogenblik een aantal lange horizontale en verticale woorden. Die lange woorden zijn ons houvast: onze theoretische vooronderstellingen. Van de overblijvende korte woorden, twee en drie letters, kennen we de omschrijving, dat zijn onze experimenten, die we interpreteren zodat ze bij de lange woorden passen. Het is uitsluitend als er na lang puzzelen helemaal niets blijkt te passen, dat we beginnen te twijfelen over de juistheid van de lange woorden. Dan gaan we twijfelen aan onze theorie, en plots zien we dan hoe we het lange woord kunnen aanpassen zodat de korte er in passen. Dan wijzigen we onze theorie. Behalve als de theorie te sterk is, of het experimentele resultaat onaannemelijk, zoals bij de Japanse elektronen.

Het samenspel

Ook in de geneeskunde vinden we een samenspel tussen feiten en theorie. In een gesprek met professor Henrik Wulff uit Denemarken vertelde deze mij dat in zijn visie volledig empirische kennis onmogelijk kan bestaan: dat zou een verzameling losse feiten zijn, zoals een hoopje zandkorrels, zonder structuur, zonder doel. We hebben de theorie nodig om structuur en doel aan te brengen.

Uiteraard zal de theorie veranderen over de tijd. Als je 50 jaar geleden aan een arts vroeg waarom hij salicylaten gebruikte bij koorts, dan zou hij geantwoord hebben: "omdat het een antipyretisch effect heeft", wat hetzelfde is als zeggen dat het koorts verlaagt, maar dan in het Latijn en Grieks, een strategie waarin artsen heel sterk zijn. Als je het mij zou gevraagd hebben, tijdens mijn opleiding, nu al meer dan 25 jaar geleden, dan zou ik geantwoord hebben dat salicylaten de lichaamsklok voor de temperatuurregulatie bijstellen in de hypothalamus. En als je het aan de huidige studentengeneratie vraagt, dan zullen zij een verhaal vertellen over "endorfines, prostaglandines en vooral cytokines". De theorie verandert dus, en wordt meer en meer gedetailleerd. Dat is voor onze uiteenzetting niet zo belangruk. Belangrijk is dat we een geheel van verklaringen nodig hebben om orde aan te brengen in de feiten.

Artsen die kritisch nadachten over de geneeskunde, hebben altijd volgehouden dat we beide - theorie en empirie - nodig hebben. In een inleiding tot de geneeskunde op het einde van de l8de eeuw, schreef Cullen te Edinburgh:

"... for two thousand years past there have heen two plans proposed..., the dogmatic and the empiric

...it is extremely necessary to know that both have their imperfections,... and that in the present state of science, either of them is by itself insufficient"

[Cullen, Practice of Physic, Edinhurgh 1768-89]

Vrij vertaald: we discussiëren al 2000 jaar; of de geneeskunde empirisch of dogmatisch is. Maar beide wijzen van aanpak hebben hun onvolkomenheden, en bij de huidige stand der wetenschap zijn beiden onvoldoende.

Het is zeer fascinerend om ons te realiseren dat vrijwel niets van hetgeen Cullen doceerde, noch de theorie, noch de feiten, enige genade zou kennen in onze moderne ogen. Toch begreep hij het verschil, en hij begreep ook de wisselwerking: dat de ene soort kennis voortdurend nodig is om de andere bij te stellen.

Feiten en theorieën zijn onlosmakelijk verbonden. Ze zijn verbonden op twee niveaus. Vooreerst kunnen feiten niet bestaan zonder theorie, zelfs als die theorie een min of meer tautologische omschrijving is, zoals het benoemen van salicylaten als "antipyretisch". Maar; op een nog dieper niveau, licht onrustbarend, en aanleiding tot de scherpte in veel controversen: ook het tot stand komen van feiten, de productie van feiten, is beladen met theorie, met meningen, of zo U wil met vooroordelen, afhankelijk van uw standpunt. Deze tweevoudige band maakt dat we op het front van de wetenschappelijke vooruitgang op geen enkele wijze kunnen ontsnappen aan subjectiviteit, omdat ieder van ons op een bepaald ogenblik in de tijd verschillende keuzes maakt uit feiten en theorieën, en we daarom tot verschillende opvattingen komen. Het blijft steeds weer de toekomst die moet leren wie gelijk had.

John Snow en cholera

Het is altijd al zo geweest. Een van de beroemdste onderzoekingen uit de epidemiologie is dat van John Snow over drinkwater en cholera in Londen rond 1850. U weet dat daarover vaak verhaald wordt dat Snow in de verschillende wijken van Londen een verschillend voorkomen van cholera waarnam, en vervolgens besloot dat het aan het drinkwater moest liggen. Elders heb ik al uiteengezet dat het omgekeerd gegaan is: Snow had eerst zijn drinkwatertheorie, en vervolgens ging hij in achtereenvolgende epidemieën kijken of de feiten in overeenstemming waren. Maar nog sterker dan dat: ook zijn weergave van de feiten heeft hij aangepast aan zijn theorie.

E en groot aantal tabellen in zijn boek over de verspreiding van cholera handelen uitsluitend over de eerste weken van de epidemieën die hij bestudeerde. Hij geeft zelf heel duidelijk aan waarom. In die eerste weken waren de verschillen tussen de watermaatschappijen het sterkst. In de tweede helft van de epidemie ging de verspreiding van cholera verder via contact van persoon-tot-persoon, en dus vervaagde het verschil tussen de drinkwatermaatschappijen. Die vervaging wilde hij met in zijn gegevens hebben, dus presenteerde hij vooral de eerste weken. Niet alleen zijn waarnemingen, maar ook zijn analyses, zijn dus volstrekt gedicteerd door zijn theorie.

Ook over de implementatie van wetenschap had Snow al duidelijke ideeën. Er is een ander apocrief verhaal dat hij ter gelegenheid van een laatste epidemie, rond een stadwaterpomp, eigenhandig op een nacht de hendel van die pomp verwijderd zou hebben. Ook dat is niet echt zo gegaan. Na zijn door theorie gekleurde waarnemingen, vroeg Snow belet bij de parochieraad waartoe de pomp behoorde. Hij vertelde zijn bevindingen aan de parochie-oudsten. En die hebben toen het besluit genomen om de hendel onverwijld te verwijderen.

Hoe ontsnappen?

Wat wordt dan het voorzichtige recept om onszelf enigszins uit het moeras van de oeverloze subjectiviteit omhoog te lichten? Kernelement is dat we vooral "de feiten" niet slaafs moeten volgen, maar wel de helderheid van de argumentatie rondom de feiten.

Je kan niet simpelweg stellen: "er is een RCT, er is type A evidence, dus moeten we die volgen". Want dat leidt regelrecht tot de acceptatie van homeopathie. Aanvaarden dat een oneindige verdunning werkzaam is leidt tot het verwerpen van een heel bouwwerk van chemisch en fysisch inzicht waarop meer berust dan alleen geneeskunde. Die prijs is gewoon te hoog. Aan dat dogma blijven we dus vasthouden, en we stellen ons dan liever kritisch op tegenover de zogenaamde feiten. Omgekeerd, moet je niet eender welk argument accepteren. Wanneer de belangen groot zijn, heeft een industrie zoals de tabaksindustrie er een handje van weg om ons te bedelven onder een stortvloed van argumenten en publicaties, waardoor we door de bomen het bos niet meer zien. In een uitgelekt intern memo van de tabaksindustrie stond dan ook "Doubt is our product", vrij vertaald "wij verkopen twijfel". Jammer genoeg zijn er soms ook farmaceutische industrieën die menen dat zij dezelfde tactiek moeten toepassen, wanneer een belangrijk product in de gevarenzone komt. Alle mogelijke bronnen van twijfel worden op speciale symposia en in betaalde bijlagen zo breed mogelijk ten toon gespreid. Totdat de arme voorschrijvende arts besluit dat "de deskundigen het ook niet meer weten" en dat er dus wel niets aan de hand zal zijn. Als je dan gaat puzzelen en de argumenten één voor één op merites onderzoekt, blijkt er al snel een groot aantal af te vallen, omdat ze onlogisch zijn, al beantwoord zijn, niet stroken met andere resultaten enz. Toch blijft men deze eindeloos herhalen in een public relations circuit. Dat valt buiten elke wetenschappelijke gedachtewisseling.

Maar ook na alle gepuzzel, met de beste intenties, blijft er een subjectief moment, vooral waar kennis nog in wording is, en waar nog onvoldoende gegevens zijn. Een fraai voorbeeld werd onlangs gegeven door Wiersma in het Nederlands Tijdscbrift voor Geneeskunde, in een vergelijking van de "standaard osteoporose" van het Nederlands Huisartsen Genootschap en het "rapport osteoporose" van de Gezondheidsraad. Ogenschijnlijk leken die zeer tegengesteld: voor en tegen case-finding, voor en tegen bepaalde farmacologische interventie. Wiersma stelt dat het meest essentiële verschil tussen beide rapporten eigenlijk ligt in de houding die ze aannemen tegenover een recent op de markt gebrachte medicatie waarover nog niet zoveel gegevens zijn als men wenselijk zou achten. En eigenlijk zit het verschil niet eens in de beschrijving van onze kennis over deze medicatie. Beide rapporten geven aan dat er nog veel onzekerheid is. Maar op basis van eenzelfde onzekerheid, is de houding van het ene rapport "toch maar doen", en die van het andere een Hippocratisch "in dubio abstine", bij twijfel onthouden we ons. Er is hier dus niet zozeer een verschil in mening over onze wetenschappelijke kennis, maar wel over wat men er nu al mee kan doen.

De basis van dit verschil moet welhaast te vinden zijn in de psychologie van de leden van de verschillende commissies die de rapporten schreven. De ene commissie bestaat meer uit medisch specialisten en onderzoekers op het terrein van osteoporose. Daar zal men gemakkelijker geneigd zijn om het "technologische imperatief" te volgen: men gelooft in de mogelijkheden van de technologische vooruitgang en in het eigen onderzoek. De andere commissie is veel afwachtender. Wellicht dat het ook te wijten is aan het beeld van de patiënt die men voor ogen heeft. De endocrinologische specialist, ook als hij aan case-finding doet, ziet toch een wat andere patiënt dan de huisarts, en maakt dus een wat andere inschatting van de kosten en baten van het uitproberen van een medicatie waarover nog geen volledige zekerheid bestaat. Dit voorbeeld bevestigt dat op het grensvlak van de vooruitgang, de uiteindelijke sprong van feiten en theorie naar handelen een subjectieve, en welhaast een ideologische is. Dat hoeft uiteraard niet zo te blijven, zeker niet als er meer onderzoeksresultaten beschikbaar komen, want dan heeft men meer feiten en daar omheen meer argumenten.

Besluit

Blijft dat op het grensvlak van vooruitgang, daar waar wetenschap in de maak is, subjectiviteit onontkoombaar is. Een commissie die een advies geeft over de stand van wetenschap zal bepaalde feiten minder belangrijk achten, en andere feiten op de voorgrond plaatsen. In controversiële situaties kan dat niet anders, en welke situatie waarover advies wordt gevraagd heeft niet enig element van controverse in zich? Wat we wel mogen verwachten is dat de commissie aantoont hoe de stukken van de puzzel passen, niet alleen op basis van haar eigen interne logica, maar ook op basis van algemeen geaccepteerde vooronderstellingen. Zolang een commissie dat doet met absolute openheid en helderheid van argumentatie over het waarom van de keuzes is daar niet alleen niets mis mee, maar het is zelfs onvermijdelijk. Daarna is het aan de parochieoudsten in het parlement om te besluiten wat daarmee te doen.

Met dank aan prof. dr. G. de Vries, Amsterdam, voor kritisch commentaar en aanvulling. De tekst van deze lezing is mede gebaseerd op een eerdere lezing ter gelegenheid van het 175-jarig bestaan van The Lancet. Figuren 2 en 3 zijn overgenomen met toestemming van The Lancet en Harvard University Press.

Terug