Op 25 oktober 1999 verscheen er in een medisch tijdschrift een artikel (1) dat aangetoond zou hebben dat bidden voor zieken helpt. Het trok de aandacht van New Scientist (2) en vervolgens van het Nederlandse dagblad Trouw (3). Ook De Morgen (4) en Het Laatste Nieuws (5), lieten zich niet onbetuigd. Beide kranten waren kennelijk geïnspireerd door een bericht in het februarinummer van Test-Gezondheid (nr. 35, pagina 4) van de consumentenorganisatie Test-Aankoop. De studie ziet er op het eerste gezicht gedegen uit. Ze was superdubbelblind opgezet. De patiënten werden verloot en behandeld zonder dat ze dat wisten, en de behandelende artsen wisten zelfs niet eens dat er een studie aan de gang was.
William Harris, van het het Saint Luke's Hospital in Kansas City, Missouri, had het onderzoek georganiseerd. Hij had gezorgd dat de voornamen van de patiënten werden doorgegeven aan teams van telkens vijf bidders. Het ging om ongeveer de helft van de patiënten die in een tijdsbestek van een jaar bij de intensive care van de hartafdeling (de Cardiac Care Unit, CCU) binnenkwamen.
De feitelijke organisatie ging zo dat de secretaresse van de ziekenhuisaalmoezenier de voornamen van de 484 patiënten met even patiëntnummers aan een bidteamleider doorgaf, die dan weer de andere teamleden op de hoogte stelde. De bidteamleden kenden elkaar niet, maar hadden beloofd 28 dagen lang dagelijks voor de betrokkenen te bidden. De bidders waren meest oudere vrouwen (gemiddelde leeftijd 56 jaar) van verschillende gezindtes, die wekelijks naar de kerk gingen en al gewend waren dagelijks te bidden. Op grond van de aantallen zullen de bidders gemiddeld 2 tot 3 doelen tegelijk onder hun hoede hebben gehad: Here God maak alstublieft Joe van 18 maart en Bill van 3 april vlug beter zonder complicaties, en Ann van 8 april ook. Amen. Op de een af andere manier kreeg de organisatie voor elkaar dat het eerste gebed werd opgezegd vrijwel exact (namelijk met een spreiding van een uur) 29 uur nadat de patiënt de CCU was binnengekomen.
De 529 patiënten met oneven nummers dienden als controle. Die moesten het uitsluitend stellen met de gebeden van familie en vrienden. Hier spreekt natuurlijk een curieuze opvatting uit over de werking van gebed. Vrijwel alle Amerikanen zijn gelovig. Bij opiniepeilingen wordt regelmatig 80 tot 90 percent in de een of andere zin als gelovig geteld. Nog in 1991 bleek 94% in God te geloven, was 93% lid van een kerkgenootschap en zei 92% ten minste eenmaal per jaar te bidden. (6) Voor regelmatig kerkbezoek zijn de percentages vanzelfsprekend lager, en in een ander onderzoek uit 1990 kwam Geloof in een persoonlijke God in de VS niet hoger dan 69%, overigens nog steeds het hoogste ter wereld (zie Skepter, december 1998). Harris gaat niet verder dan de mededeling dat ten minste 50% van de patiënten van Saint Luke's beweert een religieuze voorkeur te hebben. Zou Kansas City in de VS een broeinest van ongelovigheid zijn?
Bij een eerdere proef van Byrd (7) was wel aan de patiënten gevraagd wat ze ervan vonden dat er voor ze gebeden zou worden, en toen had ongeveer 1 op 8 geweigerd, wat aardig klopt met bovengenoemde 10% ongelovige Amerikanen. Men mag aannemen dat voor grote aantallen zieken in een CCU in de binnenlanden van de VS iemand toch wel eens een diepgemeend gebed tot een Hogere Macht richt. Het bidden door vrijwilligers zou dan alleen verschil maken voor personen met godloochenende en nimmer-biddende (of geen) familie en vrienden, tenzij men denkt dat er voor gebed ook een soort van dosis-responsrelatie geldt. Het organiseren van vijf bidders in plaats van één wijst ook al op die gedachte.
In totaal zijn er 15 teams actief geweest. Deze teams kregen niets te horen over hoe het met hun biddoel ging. De termijn van 4 weken was zo gekozen dat binnen die termijn zo'n 95% van de patiënten het ziekenhuis dood of levend verlaten zouden hebben. De lezer heeft zich misschien al afgevraagd of de verloting wel helemaal correct is gebeurd. Er waren minder patiënten in de bidgroep dan in de controlegroep. Dat kan gebeuren, en narekenen leert dat je een kans van 16,7% (dus 1 op 6) hebt dat de getallen zo scheef liggen. Daar zeuren we dus niet meer over, behalve dat de auteurs een rekenfoutje maken en de kans op 18% berekenen.
Ernstiger is dat er in de bidgroep veel meer mensen uitvielen. Officieel waren er twee uitsluitingsgronden. Mensen die ter voorbereiding op een harttransplantatie in de CCU kwamen werden niet meegeteld (zes in totaal), en als de patiënt de CCU weer verliet binnen 24 uur na binnenkomst, dan werd deze ook niet meegeteld. Als reden geven de auteurs dat het organiseren van het bidteam vaak een dag kostte. Het is niet duidelijk of er nu wel of niet voor deze vroege uitvallers werd gebeden. In de bidgroep verdwenen er zo 18. Uiteindelijk werd er dus maar aan 484 - 18 = 466 zieken gerekend. Op grond van dezelfde 24-uursregel vielen er 5 uit de controlegroep, die dus 529 - 5 = 524 patiënten telde.
Volgens onze berekening is de kans op een dergelijk scheve verdeling, gegeven de groepsgroottes en gegeven een totaal van 23 uitvallers slechts 1 op 200 (Harris rept met geen woord over deze kleine kans). Dit duidt op z'n minst op een onzorgvuldigheid in de onderzoeksopzet. Misschien is het coderingssysteem voor patiëntnummers niet helemaal random, en misschien hebben de onderzoekers (of de secretaresse van de aalmoezenier) beter opgelet bij de even nummers van de bidgroep. Deze vorm van vertekening (minder patiënten en/of meer uitval in verumgroep) komt vaker voor in zogenaamd dubbelblinde gerandomiseerde studies.
Eveneens zorgelijk is dat de auteurs onder het kopje Statistical analysis schrijven dat de analyses uitgevoerd werden op een intention-to-treat basis. Dat betekent dat elke verlote patiënt wordt meegenomen in de berekening, ook als die patiënt om wat voor reden uitvalt. Dat klopt niet met het afvoeren van degenen die minder dan een etmaal in het ziekenhuis verbleven. Intention to treat is een manier die in zwang gekomen is, juist om gesjoemel met uitvallers te vermijden.
De auteurs beweren dat de behandelende artsen niet op de hoogte van de studie waren. Er worden geen nadere mededelingen hierover gedaan. Toch zijn de hoofdauteur Harris en nog 5 coauteurs cardiologen aan het ziekenhuis waar de studie gedaan is. Harris werkt bij het Lipid Research Laboratory van het Mid American Heart Institute. Dat lijkt weinig te maken te hebben de dagelijkse gang van zaken op de CCU. We moeten echter aannemen dat niemand die de patiënten zag wist dat er een onderzoek aan de gang was en dat het om de patiënten met even nummers ging.
Een zonde die medische onderzoekers vaak begaan is die van multiple outcome: op meerdere manieren naar de resultaten kijken, en dan vervolgens eruit pikken wat in je straatje past. Als een onderzoeker dat doet is het bovendien maar de vraag of hij of zij wel al het geknutsel met en gevis in de gegevens wel gerapporteerd heeft. Harris keek in essentie naar drie uitkomsten, zoals we aanstonds zullen bespreken. Als je de zogeheten significantiegrens bij 5% legt, dan hoor je voor elke afzonderlijke uitkomst de lat bij 1,7% te leggen.
Harris en de zijnen keken per patiënt naar wel 34 parameters van de meest uiteenlopende soort: complicaties, symptomen, gebruikte medicaties, alles ontleend aan een speciaal voor dit onderzoek opgestelde lijst, die ze MAHI-CCU-lijst noemden (MAHI staat voor Mid American Heart Institute). De complicaties enzovoorts werden pas meegeteld als ze zich langer dan 24 na binnenkomst in de CCU voordeden. Wat er op in de Emergency Room of vlak na binnnenkomst in de CCU gebeurde werd niet meegeteld.
Elke mogelijke parameter werd volgens een tamelijk willekeurig systeem in punten omgezet. Doodgaan telde voor 6 punten, een pacemaker krijgen was ook heel erg (4 punten). Toediening van antibiotica telde voor 1 punt, maar een plaspil voor 2 punten. Het geheel maakt een nogal willekeurige indruk, maar de auteurs beweren dat de keuze van de MAHI-CCU-lijst en de puntentelling van tevoren bedacht was.
Niet dat het wat uitmaakte. In de bidgroep was de score 11% lager dan in de controlegroep, als je de items op de MAHI-CCU-lijst ongelijk scoorde, en 10% lager als je ze gelijk scoorde. Dat is niet verwonderlijk, want wie gemiddeld 10 procent minder items bij de supermarkt inslaat, hoeft over het algemeen ook ongeveer 10 procent minder bij de kassa af te dragen, ongeacht hoe de prijzen voor de afzonderlijke items zijn. Harris keek ook nog naar verblijfsduur in het ziekenhuis (en op de CCU) en naar een speciale schaal die in de eerdere studie van Byrd was gebruikt. Hoewel het bidden expliciet voor spoedig herstel was geweest, was er voor verblijfsduur geen verschil. Het minieme succesje van Byrd met diens scoresysteem bleek niet gereproduceerd te kunnen worden.
Tien procent mag heel wat lijken, maar de zogeheten p-waarde was met 4% maar net onder de magische vijfprocentsgrens. Als de 466 patiënten waarvoor gebeden werd samen een dozijn MAHI-CCU-items meer hadden gehad (of 21 punten extra hadden opgelopen), dan hadden Harris et al. geen significant resultaat kunnen melden.
De lezer wordt nu wel erg nieuwsgierig naar de exacte toedracht bij het laten vallen van de even patiëntnummers. Weliswaar waren de behandelende artsen en de bidders geblindeerd, maar hoe zat het met de secretaresse die de namen aan de bidders moest doorgeven? Dat wordt niet uitgelegd. Gezien het tijdstip waarop met bidden begonnen werd, lijkt het alsof de organisatie van meet af aan met die 24-uursmarge had rekening gehouden. Goed beschouwd is de gedachte achter de 24-uursmarge wat merkwaardig, want ze veronderstelt dat het effect van bidden strict causaal is en dat er van terugwerkende kracht van gebed uiteraard geen sprake kan zijn. Maar een eventueel effect van bidden is dermate ongeloofwaardig, dat voorzorgen om de schijn van een terugwerkende kracht uit te sluiten nogal overdreven lijken. Het enige echt opvallende verschil tussen beide groepen was dat de oneven nummers behoorlijk wat vaker een Swan-Ganzcatheter kregen ingebracht. Zou bidden dus soms gezorgd hebben dat een volgens vele deskundigen nutteloze en gevaarlijke ingreep achterwege werd gelaten?
Het resultaat van de studie is dus een drietal uitkomsten, waarvan er twee luidkeels NEE! roepen en eentje heel zachtjes "ja" fluistert. De kans dat van drie uitkomsten er puur toevallig eentje p = 0,04 oplevert is ruim 12 procent, en dat is iets wat we meestal niet-significant noemen, dat wil zeggen: niet eens de moeite waard om op de een of andere manier uit te zoeken wat er nou aan de hand is. Al met al een uiterst zwak resultaat, zeker gezien de onaannemelijkheid van de getoetste hypothese. Immers, de traditie om significantie bij vijf procent te laten beginnen komt voort uit situaties waarin wat getoetst wordt niet al te verbazingwekkend is. Harris et al. geven ook schoorvoetend toe dat de uitkomst een toevalligheid zou kunnen zijn.
De auteurs willen daar duidelijk niet aan, en proberen zelfs te verklaren waarom zij Byrds resultaat niet konden reproduceren. Bij Byrd waren de dertien procent patiënten die bidden? - nee bedankt! hadden gezegd weggelaten, dus Byrd had te maken met patiënten die ontvankelijker waren voor gebedskracht. En de bidders van Byrd waren gemotiveerder, want die hadden meer gegevens gekregen over hun klanten. Deze redeneringen openen interessante kijkjes op de denkwereld van de onderzoekers. Ze organiseren een jaar lang vrijwel anoniem gebed, en gebruiken dan achteraf die anonimiteit als smoes om te verklaren waarom het eigenlijk niet zo leuk uitkomt!
Van theologische zijde is dan ook bezwaar aangetekend. Dominee G. Messie schreef in Trouw (8) dat Harris van God een verhoorcomputer maakt, en dat het proberen af te dwingen van wonderen indruist tegen letter en geest van de bijbel. Volgens Messie worden trouwens "alle gebeden verhoord, alleen vrijwel nooit op de manier die we ons wensen..."
Professor Vermeersch was dezelfde mening toegedaan. "Zelfs als God bestaat (...) zou Hij toch zeer onnozel moeten zijn om mensen op commando beter te maken, fulmineerde de filosoof tegen de interviewer van Het Laatste Nieuws, en hij zette zijn woorden kracht bij met: "Je reinste waanzin, sorry dat ik me hier zo zit op te winden, maar dit is ronduit idioot." Vermeersch voegde eraan toe dat je met dit soort berichten valse hoop geeft. Bidden helpt wel volgens hem, namelijk voor de bidder zelf, omdat je er er rustiger van wordt. Maar dit soort berichten is duidelijk ongezond voor ongelovigen - tenzij ze er hard om kunnen lachen natuurlijk.
Wie niet lacht is Paul Kurtz, de voorzitter van de Amerikaanse zuster van SKEPP en Skepsis. Volgens New Scientist (2) vindt hij dat er nu maar eens een replicatie moet worden georganiseerd in samenwerking met zijn club, het Committee for the Scientific Investigation of Claims of the Paranormal (CSICOP). Zij zijn er klaar voor, maar dan moet er wel een zeer, zeer strak protocol komen, zei hij vroom.
Iedereen moet voor zichzelf maar bedenken of we te maken hebben met een toevalstreffer die misschien door naar het antwoord toe te rekenen wat is opgepoetst of met de afspiegeling van een echt verschijnsel dat lijnrecht indruist tegen de resultaten van twintig of meer eeuwen theologie, ten minste twee eeuwen wetenschap, en de enige eerdere studie over het effect van bidden op hartpatiënten van twaalf jaar geleden. Voor personen met lak aan wetenschap en primitieve geloofsopvattingen is de keus duidelijk, en voor vrijwel iedereen anders ook, lijkt ons.
De studie van Harris et al. stimuleert ongewenste ontwikkelingen. Ze houdt het gevaar in dat artsen druk gaan uitoefenen op zieken om hun mening over religie te beïnvloeden. Of ze gaan schuldgevoelens aankweken (u bent ziek omdat u of de uwen niet genoeg bidden). Een van de onaangename kanten van New-Agespiritualiteit is dat die primitieve verbanden legt tussen gedrag en levensstijl van de patiënt en de ziekte, maar de studie van Harris et al. bevordert dezelfde denktrant in een klassiek-religieuze context.
Uit enquêtes in de VS blijkt dat veel (de helft tot tweederde) patiënten zouden willen dat hun arts met hen zou bidden. Spijtig genoeg doet maar 1% van de artsen dat. Blijkbaar is er in de VS nu een soort beweging op gang gekomen om artsen onder druk te zetten om met hun patiënten te bidden.
Brian Haynes protesteert hiertegen (9). Hij is hoogleraar Klinische Epidemiologie in McMaster University, en redacteur van APC Journal Club, het blad van het American College of Physicians en de American Society of Internal Medicine. Hij vindt dat men artsen niet mag gaan voorschrijven wat ze moeten doen, gewoon omdat een groep mensen dat wil. Het eind is dan zoek. Andere critici, Richard Sloan en Emilia Bagiella, merkten op dat getrouwd zijn en geld hebben ook statistisch samenhangen met een betere gezondheid. Moeten artsen dus huwelijksadviezen verstrekken of raadgeven bij sparen en beleggen?
Haynes pleit er voor dat artsen zich beperken tot interventies die evidence based zijn. Wij zijn het met hem eens. De arts is verplicht betrouwbare geneeskunde af te leveren. Bidden hoort daar niet bij. Degenen die vrijwillig de taak op zich hebben genomen om voor anderen te bidden zijn doorgaans geen artsen. De samenleving is het best ermee gediend, als iedereen doet waartoe hij zich geroepen voelt en waarvoor hij is opgeleid.
Voetnoten
- William Harris et al., A randomised, controlled clinical trial of the effects of remote, intercessory prayer on outcomes in patients admitted to the coronary care unit. Archives of internal medicine, vol. 159, nr. 19 (October 25, 1999), p.2273-2278.
- Nell Boyce, God on their side. New Scientist, 13 november 1999 (nr. 2212), p. 24
- Wetenschappelijk bewijs: bidden voor zieken helpt. Trouw 20 november 1999.
- Amerikanen vinden wetenschappelijk bewijs dat bidden helpt. De Morgen, 25 januari 2000.
- Bidden om genezing? Waanzin! Het Laatste Nieuws, 27 januari 2000. 6. International Social Survey Programme, 1991, geciteerd in: Sociaal en Cultureel Planbureau, Secularisatie in Nederland, 1966-1991. Rijswijk, 1994. 7. R.C. Byrd, Positive therapeutic effects of intercessory prayer in a coronary care unit population. South. Med. J. (1988), vol. 81, p.826-829. 8. G. Messie, Bidden helpt- maar hoe? Trouw, 27 november 1999. 9. geciteerd door Linda Gunnersen, Faith and Healing. Annals of Internal Medicine, 8 januari 2000.
Wim Betz († 2019) was hoogleraar huisartsengeneeskunde aan de VUB.
Jan Willem Nienhuys is redacteur van Skepter.