8
UvA-DARE is a service provided by the library of the University of Amsterdam (http://dare.uva.nl) UvA-DARE (Digital Academic Repository) Tubal subfertility and ectopic pregnancy. Evaluating the effectiveness of diagnostic tests Mol, B.W.J. Link to publication Citation for published version (APA): Mol, B. W. J. (1999). Tubal subfertility and ectopic pregnancy. Evaluating the effectiveness of diagnostic tests. General rights It is not permitted to download or to forward/distribute the text or part of it without the consent of the author(s) and/or copyright holder(s), other than for strictly personal, individual use, unless the work is under an open content license (like Creative Commons). Disclaimer/Complaints regulations If you believe that digital publication of certain material infringes any of your rights or (privacy) interests, please let the Library know, stating your reasons. In case of a legitimate complaint, the Library will make the material inaccessible and/or remove it from the website. Please Ask the Library: https://uba.uva.nl/en/contact, or a letter to: Library of the University of Amsterdam, Secretariat, Singel 425, 1012 WP Amsterdam, The Netherlands. You will be contacted as soon as possible. Download date: 08 Apr 2020

UvA-DARE (Digital Academic Repository) Tubal subfertility ... · staan bij het opsporen vatuba-pathologien de Chlamydia; antistof(CAT titer) bepaling, het hysterosalpingogram (HSG)

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: UvA-DARE (Digital Academic Repository) Tubal subfertility ... · staan bij het opsporen vatuba-pathologien de Chlamydia; antistof(CAT titer) bepaling, het hysterosalpingogram (HSG)

UvA-DARE is a service provided by the library of the University of Amsterdam (http://dare.uva.nl)

UvA-DARE (Digital Academic Repository)

Tubal subfertility and ectopic pregnancy. Evaluating the effectiveness of diagnostic tests

Mol, B.W.J.

Link to publication

Citation for published version (APA):Mol, B. W. J. (1999). Tubal subfertility and ectopic pregnancy. Evaluating the effectiveness of diagnostic tests.

General rightsIt is not permitted to download or to forward/distribute the text or part of it without the consent of the author(s) and/or copyright holder(s),other than for strictly personal, individual use, unless the work is under an open content license (like Creative Commons).

Disclaimer/Complaints regulationsIf you believe that digital publication of certain material infringes any of your rights or (privacy) interests, please let the Library know, statingyour reasons. In case of a legitimate complaint, the Library will make the material inaccessible and/or remove it from the website. Please Askthe Library: https://uba.uva.nl/en/contact, or a letter to: Library of the University of Amsterdam, Secretariat, Singel 425, 1012 WP Amsterdam,The Netherlands. You will be contacted as soon as possible.

Download date: 08 Apr 2020

Page 2: UvA-DARE (Digital Academic Repository) Tubal subfertility ... · staan bij het opsporen vatuba-pathologien de Chlamydia; antistof(CAT titer) bepaling, het hysterosalpingogram (HSG)

Samenvatting

19. Samenvatting

Dit proefschrift houdt zich bezig met de evaluatie van de effectiviteit van diagnostische tests. Het gebruik van sensitiviteit, specificiteit, likelihood ratios (LR) (of aannemelijkheidsverhoudingen) en Receiver Operating Characteristic (ROC) curves is inmiddels algemeen gangbaar geworden bij het weergeven van het onderscheidend vermogen van diagnostische tests. De vraag of patiënten echter daadwerkelijk 'beter' worden van het ondergaan van een diagnostische test (i.e., of de test effectief is) wordt echter niet alleen bepaald door dit onderscheidend vermogen van een test (de mate waarin door de test patiënten met de ziekte onderscheiden kunnen worden van patiënten zonder de ziekte), maar ook of en hoe de informatie verkregen door de test gebruikt wordt. Deze kwestie staat centraal in dit proefschrift.

In de hoofdstukken 1 tot en met 8 wordt het onderscheidend vermogen van verschillende tests in het opsporen van tubapathologie in vrouwen met verminderde vruchtbaarheid bestudeerd, alsmede de bijdrage die zulke tests kunnen leveren aan het bepalen van de prognose van verminderd vruchtbare paren.

In hoofdstuk 1 wordt beschreven dat aan de arts drie belangrijke tests ter beschikking staan bij het opsporen van tuba-pathologie; de Chlamydia antistof titer (CAT) bepaling, het hysterosalpingogram (HSG) en de diagnostische laparoscopic Met een CAT-bepaling kunnen in het serum van de patiënt antistoffen worden aangetoond die wijzen op een ontsteking van de tubae veroorzaakt door Chlamydia Trachomatis, die de patiënt eerder heeft doorgemaakt. Deze ontsteking is de belangrijkste oorzaak van afwijkingen van de tubae bij verminderd vruchtbare vrouwen. Bij een HSG wordt olie- of waterhoudend contrastmiddel via de cervix in het cavum uteri en de tubae gebracht. Hierdoor kunnen afwijkingen aan het cavum uteri worden opgespoord, en kan de doorgankelijkheid van de tubae beoordeeld worden, alsmede de aanwezigheid van adhesies in de buikholte. Bij de laparoscopic is het mogelijk om via een camera de uterus en de tubae direct te beoordelen. De doorgankelijkheid van de tubae kan getest worden met methyleenblauw. Ook is het mogelijk de buik te inspecteren op aanwezigheid van adhesies of endometriose.

In hoofdstuk 2 wordt de reproduceerbaarheid van de interpretatie van het HSG bestudeerd in relatie tot de bevindingen bij laparoscopic De reproduceerbaarheid van de diagnose proximale tuba-afsluiting bleek vrijwel perfect te zijn. De reproduceerbaarheid van de diagnose distale tuba-afsluiting en hydrosalpinx, daarentegen, was slechts substantieel, terwijl de reproduceerbaarheid van de diagnose adhesies middelmatig bleek. Het HSG kan daardoor geen waarde hebben in de diagnostiek van adhesies.

In hoofdstuk 3 worden de resultaten gepresenteerd van een systematisch literatuur onderzoek, waarin de gegevens van 20 studies die rapporteerden over de bevindingen bij HSG en laparoscopic samengevat te zijn. De sensitiviteit van het HSG in de diagnostiek van tuba-pathologie bleek 65% te zijn, terwijl de specificiteit 83% was. Omdat een groot deel van de tubae die afgesloten leken bij laparoscopic, bij het HSG doorgankelijk waren, is ook laparoscopic geen perfecte test is voor de evaluatie van tuba-pathologie. De meta-

207

Page 3: UvA-DARE (Digital Academic Repository) Tubal subfertility ... · staan bij het opsporen vatuba-pathologien de Chlamydia; antistof(CAT titer) bepaling, het hysterosalpingogram (HSG)

Samenvatting

analyse bevestigde dat de accuraatheid van het HSG in de diagnostiek van peritubaire adhesies slecht is.

Vervolgens worden in hoofdstuk 4 de resultaten gepresenteerd van een systematisch literatuur onderzoek naar de relatie tussen de CAT bepaling en de bevindingen bij laparoscopic Het onderscheidend vermogen van CAT bleek afhankelijk te zijn van het type assay dat was gebruikt: de samenvattende ROC-curves die geconstrueerd werden voor studies die enzyme immunoassay (ELISA) of (micro)-immunofluorescence (MIF/IF) gebruikten waren beter dan de samenvattende ROC-curve van studies die immunoperoxidase assay (IPA) gebruikten. Het onderscheidend vermogen van CAT in de diagnostiek van tuba-pathologie bleek vergelijkbaar te zijn met het onderscheidend vermogen van HSG in de diagnostiek van tuba-afsluiting.

Het is maar de vraag of de men zich bij de evaluatie van tuba-pathologie moet richten op het opsporen van de morfologische afwijkingen aan de tubae, als men zich realiseert welke verschuiving heeft plaatsgevonden in de behandeling van verminderde vruchtbaarheid ten gevolge van tuba-pathologie in de laatste 20 jaar. In-vitro fertilisatie en embyo-transfer (IVF-ET), ook wel bekend als reageerbuisbevruchting, heeft geleidelijk aan de plaats ingenomen van tuba-chirugie. Hierdoor is het opsporen van morfologische afwijkingen aan de tubae minder belangrijk geworden, terwijl het veel belangrijker is betrouwbare informatie te verkrijgen over de kans op een 'spontane' zwangerschap, zowel met als zonder behandeling. In hoofdstuk 5 en 6 wordt daarom het vermogen van HSG en laparoscopic om het optreden van spontane zwangerschap te voorspellen, onderzocht.

In hoofdstuk 5 worden bevindingen op het HSG gerelateerd aan de kans op een spontane zwangerschap. Een één-zijdige afwijking aan de tuba, waargenomen op het HSG, verminderde de spontane zwangerschapskansen van een patiënte slechts in geringe mate in vergelijking tot de zwangerschapskansen van een patiënte met een normaal HSG (ratio van de fecunditeitsratios (FRR) 0.81). Een twee-zijdige afwijking aan de tuba, daarentegen, verminderde de kansen op een spontane zwangerschap aanzienlijk (FRR 0.30).

In hoofdstuk 6 word het prognostisch vermogen van het HSG vergeleken met dat van de laparoscopic aan de hand van gegevens van 794 patiënten die beide testen ondergingen. De gegevens waren verzameld in het kader van de Canadian Infertility Treatment Evaluation Study (CITES). Een multivariabele analyse van de resultaten toonde dat een één-zijdige afwijking van de tubae gezien op het HSG een geringe verslechtering van de zwangerschapskansen betekende (FRR 0.80), terwijl een twee-zijdige afwijking van de tubae gezien op het HSG een aanzienlijke verslechtering van de fertiliteitskansen betekende (FRR 0.49). Voor laparoscopic waren deze FRRs respectievelijk 0.51 en 0.15. Bij patiënten met een normaal HSG of een HSG met een één-zijdige afwijking aan de tubae was de kans op een twee-zijdige afwijking aan de tubae bij laparoscopic slechts 5%, en de kans op een spontane zwangerschap bij deze patiënten bleek zeer gering. Als een twee-zijdige afsluiting van de tubae gezien werd op een HSG, terwijl laparoscopic geen afwijkingen toonde, was de kans op een spontane zwangerschap nauwelijks verminderd. De kans op een spontane zwangerschap was daarentegen sterk verslechterd indien na een

208

Page 4: UvA-DARE (Digital Academic Repository) Tubal subfertility ... · staan bij het opsporen vatuba-pathologien de Chlamydia; antistof(CAT titer) bepaling, het hysterosalpingogram (HSG)

Samenvatting

twee-zijdige afsluiting op het HSG ook bij laparoscopic een één-zijdige of twee-zijdige afwijking werd gezien (FRR respectievelijk 0.38 en 0.19). Alhoewel het prognostisch vermogen van laparoscopic beter was dan dat van het HSG, kan de laparoscopic toch niet beschouwd worden als de perfecte test in de diagnostiek van tubapathologie, omdat bij sommige patiënten met een twee-zijdige afsluiting op de laparosopie toch een spontane zwangerschap optrad.

In hoofdstuk 7 worden 13 strategieën voor het handelen bij verdenking op tuba-padiologie geëvalueerd. Strategieën die begonnen met een CAT-bepaling of een HSG, en waarin laparoscopic onmiddellijk werd uitgevoerd indien de kans op tubapathologie groter was dan 15%, terwijl laparoscopic pas na 1 jaar werd uitgevoerd indien de kans op tubapadiologie kleiner was dan 15%, bleken de meest kosten-effectieve strategieën te zijn. Voor paren bij wie de cumulatieve kans op succesvolle zwangerschap na 3 jaar groter was dan 14%, bleek de strategie die begon met CAT naar verwachting iets kosten-effectiever dan een strategie die begon met HSG. In paren bij wie die kans kleiner was dan 14%, bleek de strategie die begon met HSG naar verwachting iets kosten-effectiever te zijn. Het uitvoeren van een CA-125 bepaling bleek naar verwachting alleen kosten-effectief te zijn bij patiënten bij wie de cumulatieve kans op zwangerschap binnen 3 jaar kleiner was dan 5%. Geconcludeerd werd dat de 'work-up' voor tuba-pathologie zou moeten beginnen met CAT bij patiënten met een relatief goede fertiliteitsprognose (3-jaar cumulatieve zwangerschapskans groter dan 15%), terwijl bij patiënten met een relatief slechte fertiliteitsprognose (3-jaar cumulatieve zwangerschapskans kleiner dan 15%) gestart zou moeten worden met een HSG.

De hoofdstukken 9 tot en met 17 hielden zich bezig met het onderscheidend vermogen van transvaginale echoscopie en serum humaan chorion gonadotrophine (hCG) meting bij de diagnostiek van de extra-uteriene graviditeit, en met de vraag bij welke patiënten deze technieken kunnen worden toegepast.

In hoofdstuk 10 wordt aangetoond dat het onderscheidend vermogen van de serum hCG bepaling beter was bij patiënten bij wie op echoscopie een ectopische massa of vrij vocht was gezien dan bij patiënten bij wie op echoscopie geen afwijking werd gezien. Bij het interpreteren van de serum hCG concentratie bij patiënten die verdacht worden voor het hebben van een extra-uteriene graviditeit moet daarom niet alleen rekening gehouden worden met intra-uteriene echoscopische bevindingen, maar ook met extra-uteriene echoscopische bevindingen. Dit is des te meer van belang als men zich realiseert dat de prevalentie van de extra-uteriene graviditeit sterk verschilt tussen deze twee groepen patiënten: bij patiënten bij wie bij echoscopie een ectopische massa of vrij vocht was gezien bleek 72% een extra-uteriene graviditeit te hebben, terwijl dit bij patiënten bij wie bij echoscopie geen afwijking werd gezien slechts 24% was.

In hoofdstuk 11 wordt getoond dat het beloop van de serum hCG concentratie, hetzij uitgedrukt als absoluut verschil, hetzij als procentueel verschil, een beter onderscheidend vermogen had in de diagnostiek van de intra-uteriene en extra-uteriene graviditeit dan de absolute serum hCG concentratie gemeten bij een herhaalde bepaling. Een stijging van de serum hCG concentratie kleiner dan 50% had een LR van 3.4. Bij een stijging van de

209

Page 5: UvA-DARE (Digital Academic Repository) Tubal subfertility ... · staan bij het opsporen vatuba-pathologien de Chlamydia; antistof(CAT titer) bepaling, het hysterosalpingogram (HSG)

Samenvatting

serum hCG concentratie met meer dan 50% bleek de LR 3.2 te zijn. Bij alle vitale ïntra-utenene zwangerschappen steeg het serum hCG met meer dan 50%. Vier dagen na de eerste serum hCG meting waren alle intra-uteriene zwangerschappen op één na detecteerbaar met transvaginale echoscopie. Bij een stijging van het serum hCG na 4 dagen waarbij echoscopisch geen intra-uteriene graviditeit werd gezien, nam de kans op een extra-uteriene graviditeit sterk toe (LR > 10).

In hoofdstuk 12 is een flexibel diagnostisch algoritme beschreven waarbij een probabilistische beshsregel gebruikt is bij de evaluatie van vrouwen verdacht voor het hebben van een extra-uteriene graviditeit. Dit algoritme werd vergeleken met een eerder door ons ontwikkeld algoritme dat vaste afkapwaardes gebruikte. In het flexibele algoritme werd de diagnose extra-uteriene graviditeit gesteld indien de kans op deze aandoening groter dan 95% was, terwijl de diagnose verworpen wordt indien de kans op een extra-uteriene graviditeit kleiner dan 1% was. Het algoritme met vaste afkapwaardes had een sensitiviteit van 93% en een specificiteit van 97%, terwijl de sensitiviteit en specificiteit bij het flexibele algoritme afhing van de vooraf kans op een extra-uteriene graviditeit. Als gevolg hiervan varieerden de voorspellende waardes in het algoritme met vaste afkapwaarden sterk, terwijl deze veel constanter waren bij gebruik van het flexibele algoritme. Voor vrijwel iedere waardering van fout-positieve en fout-negatieve uitkomsten bleek het flexibele algoritme beter te voldoen dan het algoritme met vaste afkapwaarden. Hieruit kan geconcludeerd worden dat probabilistische beslisregels moeten worden gebruikt bij het interpreteren van echoscopische bevindingen en serum hCG concentraties bij vrouwen verdacht voor het hebben van een extra-uteriene graviditeit.

In hoofdstuk 13 wordt geëvalueerd of het mogelijk was om op niet-invasieve wijze te voorspellen welke patiënten met een tubaire graviditeit een tuba-ruptuur of een intra-abdominale bloeding hebben. Van 288 opeenvolgende patiënten verdacht voor het hebben van een tubaire graviditeit, was bij 65 (23%) sprake van een tuba-ruptuur of een intra-abdominale bloeding. Aanwezigheid van buikpijn, peritoneale prikkeling bij onderzoek van de buik, vocht in het cavum Douglasi bij transvaginale echoscopie, en een laag serum hemoglobine gehalte waren onafhankelijke voorspellers voor de aanwezigheid van tubaruptuur en/of een actieve bloeding. Aanwezigheid van foetale kenmerken of een ectopische massa bij transvaginale echoscopie reduceerden de kans op een tuba-ruptuur en/of een actieve bloeding. Buikpijn was de meest sensitieve voorspeller met een sensitiviteit van 95%, alhoewel de specificiteit slechts 37% was. Omdat buikpijn aanwezig was bij 70% van de patiënten met een tubaire graviditeit, en omdat methotrexaat alleen gebruikt kan worden in de behandeling van een extra-uteriene graviditeit in afwezigheid van een tuba-ruptuur, kan de behandeling met methotrexaat zonder voorafgaande laparoscopic slechts veilig toegepast worden bij een beperkt aantal patiënten.

In de hoofdstukken 14, 15 en 16 wordt ingegaan op de vraag of screening op een extra-uteriene graviditeit bij vrouwen met een verhoogd risico op deze ziekte zinvol is. Screening op een extra-uteriene graviditeit bestaat uit het uitnodigen van vrouwen met een verhoogd risico zodra deze weten dat ze zwanger zijn, nog voordat er klachten zijn opgetreden.

210

Page 6: UvA-DARE (Digital Academic Repository) Tubal subfertility ... · staan bij het opsporen vatuba-pathologien de Chlamydia; antistof(CAT titer) bepaling, het hysterosalpingogram (HSG)

Samenvatting

In hoofdstuk 14 worden de resultaten gepresenteerd van een systematisch literatuur onderzoek naar risico-indicatoren voor het hebben van of krijgen van een extra-uteriene graviditeit. De resultaten van 30 case-control studies en 10 cohort studies werden geanalyseerd. Een eerdere extra-uteriene graviditeit, eerdere tuba-chirurgie, tuba-pathologie vastgesteld op HSG of laparoscopic, en DES-dochterschap bleken sterke risico-indicatoren. Vrouwen zwanger geworden na een sterilisatie of ondanks het gebruik van een spiraaltje hadden ook een verhoogd risico op het hebben van een extra-uteriene graviditeit.

In hoofdstuk 15 worden de resultaten beschreven van een prospectieve studie over 143 opeenvolgende vrouwen zonder klachten, maar met een verhoogd risico op het hebben van een extra-uteriene graviditeit. Alle vrouwen ondergingen transvaginale echoscopie en serum hCG meting om een extra-uteriene graviditeit op te sporen voor het begin van symptomen. Acht vrouwen bleken een extra-uteriene graviditeit te hebben, 129 vrouwen hadden een intra-uteriene graviditeit, en zes vrouwen waren zwanger zonder dat ooit echoscopisch een zwangerschap werd gezien. De prevalentie van een extra-uteriene graviditeit in de gescreende populatie was 5.6% (95% betrouwbaarheidsinterval 2.5% tot 10.7%), opvallend anders dan de prevalentie van 24% die eerder in een gelijksoortige studie in Finland werd gerapporteerd. De meest waarschijnlijke oorzaak van dit verschil is dat in de Finse studie niet alle vrouwen met een verhoogd risico op een EUG systematisch werden geïncludeerd.

In hoofdstuk 16 wordt een besliskundige analyse verricht waarin screemngsprogramma's met transvaginale echoscopie, serum hCG meting en serum Progesteron meting vergeleken zijn met een expectatief beleid. De strategieën zijn vergeleken met betrekking tot het verwachte aantal tuba-rupturen, het verwachte aantal fout-positieve diagnoses en de verwachte kosten. Zowel het aantal fout-positieve diagnoses als de kosten gemaakt om één tuba-ruptuur te voorkomen bleken sterk afhankelijk te zijn van de prevalentie van de extra-uteriene graviditeit. Bij een prevalentie van 6% zou screening met transvaginale echoscopie en serum hCG meting het aantal patiënten met een geruptureerde extra-uteriene graviditeit naar verwachting reduceren van 2.1 naar 0.61 per 100 gescreende vrouwen, terwijl screening met transvaginale echoscopie, serum hCG meting en serum Progesteron meting dit aantal naar verwachting zou reduceren tot 1.2 per 100 gescreende vrouwen. Naar verwachting zou screening met transvaginale echoscopie en serum hCG meting US$ 1.200 kosten om één tuba-ruptuur te voorkomen, terwijl dit bij screening met transvaginale echoscopie, serum hCG meting en serum Progesteron US$ 2.100 zou zijn. Screening met transvaginale echoscopie en serum hCG meting alleen zou 0.64 fout-positieve diagnoses per 100 gescreende vrouwen genereren, terwijl dit voor screening met transvaginale echoscopie, serum hCG meting en serum Progesteron meting 0.84 per 100 gescreende vrouwen zou zijn. Screening reduceerde de kosten in vergelijking met een afwachtend beleid bij prevalenties van 7.9% en 8.8% voor de strategieën zonder, respectievelijk met serum Progesteron meting.

Alhoewel vanuit dit perspectief screening op extra-uteriene graviditeiten niet aantrekkelijk lijkt, moet ook in ogenschouw genomen worden dat vrouwen met

211

Page 7: UvA-DARE (Digital Academic Repository) Tubal subfertility ... · staan bij het opsporen vatuba-pathologien de Chlamydia; antistof(CAT titer) bepaling, het hysterosalpingogram (HSG)

Samenvatting

fertiliteitsproblemen snel geïnformeerd willen worden over het verloop van een nieuwe zwangerschap. Als gevolg hiervan lijkt echoscopie gerechtvaardigd op psychologische gronden. De analyse in hoofdstuk 16 toonde echter aan dat men voorzichtig moet zijn met het verrichten van een laparoscopic of het instellen van een behandeling na het stellen van de diagnose extra-uteriene graviditeit bij klachtenvrije zwangeren.

In hoofdstuk 18 worden methoden van de evaluatie van diagnostische tests behandeld, en wordt ingegaan op de vraag hoe de waarde van diagnostische tests kan worden bepaald. In § 18.2 wordt het traditionele concept van evaluatie van diagnostische tests behandeld. De parameters sensitivititeit, specificiteit, LRs en ROC-curves worden gedefinieerd. Al deze parameters drukken het onderscheidend vermogen van een test uit. In theorie zijn deze parameters onafhankelijk van de prevalentie van de ziekte die men wil opsporen. Indien de prevalentie van de op te sporen ziekte bekend is in de populatie die de test ondergaat, kunnen met behulp van sensitiviteit, specificiteit, LRs of ROC-curves de positief en negatief voorspellende waardes van een testuitslag berekend worden. Deze laatste parameters zijn van belang voor de interpretatie van het de uitslag van een test in de klinische praktijk.

In Jf 18.2.1 wordt vervolgens gedemonstreerd dat verschillen in de prevalentie van ziekte, die het gepaard gaan met verschillen in patiënt-karakteristieken, invloed kunnen hebben op de sensitiviteit en /of de specificiteit van een test. Dit is van belang, omdat het impliceert dat sensitiviteit en specificiteit van een test kunnen verschillen in verschillende populaties.

In § 18.2.2 wordt getoond dat het onderscheidend vermogen van een test zowel bepaald kan worden in 'case-control'-studies als in cohort studies. Cohort studies bestuderen een reeks patiënten verdacht voor het hebben van een ziekte, waarbij zowel de onderzochte test als de referentie-test zijn uitgevoerd. Case-control studies daarentegen bestuderen patiënten die de ziekte die opgespoord moet worden zeker hebben (cases), en patiënten die ziekte zeker niet hebben (controles). Het onderscheid tussen cohort studies en case-control studies is van belang, omdat in case-control studies het onderscheidend vermogen van een test overschat kan worden in vergelijking met cohort studies.

In ƒ 18.2.3 worden verschillende vormen van 'bias' behandeld, die een rol kunnen spelen bij studies over diagnostische tests.

In § 18.2.4 wordt ingegaan op de relatie tussen reproduceerbaarheid van een test en het onderscheidend vermogen van die test. Indien de reproduceerbaarheid van een test gering blijkt te zijn, kan het onderscheidend vermogen nooit goed zijn, waardoor de waarde van de test in de klinische praktijk beperkt is.

§ 18.2.5 houdt zich bezig met meta-analyse van diagnostische tests. Heterogeniteit in studies die rapporteren over het onderscheidend vermogen van diagnostische tests is mogelijk het gevolg van verschillen in afkapwaarden, zoals die gehanteerd zijn in verschillende studies. Als dit het geval zou zijn, zou een toename van de sensitiviteit gepaard moeten gaan met een afname van de specificiteit, en vice versa. Het onderscheidend vermogen van de test die bestudeerd wordt in een meta-analyse kan dan geschat worden in een samenvattende ROC-curve.

212

Page 8: UvA-DARE (Digital Academic Repository) Tubal subfertility ... · staan bij het opsporen vatuba-pathologien de Chlamydia; antistof(CAT titer) bepaling, het hysterosalpingogram (HSG)

Samenvatting

§ 18.3 behandelt verschillen tussen screening en diagnostiek. Screening is gedefinieerd als het met behulp van een relatief eenvoudige test systematisch opsporen van ziekte nog voordat symptomen zijn opgetreden. Het essentiële verschil tussen screening en diagnostiek is dat in geval van diagnostiek het de patiënt is die contact zoekt met de zorgverlener, terwijl in het geval van screening de zorgverlener contact zoekt met de persoon die mogelijk de ziekte (of een voorstadium van de ziekte) heeft.

In § 18.4 wordt ingegaan op het bepalen van de waarde van diagnostische tests. Bij de evaluatie van diagnostische tests is het essentieel zich te realiseren dat het doel van de test is om juist die patiënten op te sporen die een ziekte hebben die door behandeling kan verbeteren. Naast het onderscheidend vermogen van een test, uitgedrukt als sensitiviteit, specificiteit, LRs of ROC-curves, is de waarde van een test afhankelijk van de prevalentie van de ziekte, en van de effectiviteit, bijwerkingen en kosten van mogelijke behandelingen. Indien de prevalentie van een ziekte ofwel relatief hoog ofwel relatief laag is, lijkt het onwaarschijnlijk dat uitvoeren van de test zinvol is. De waarde van een test zal ook beperkt zijn, als er voor de op te sporen ziekte geen goede behandeling voorhanden is.

In Jf 18.4.1 wordt aangetoond dat de klinische waarde van een test geëvalueerd kan worden met besliskundige technieken. In zo'n benadering wordt het onderscheidend vermogen van een test in een model gecombineerd met een aansluitende behandeling. Vervolgens kan de verwachte waarde van een test voor verschillende prevalenties berekend worden. In zulke modellen kan ook rekening worden gehouden met kosten en bijwerkingen van zowel test als behandeling.

In § 18.4.2 wordt getoond dat gerandomiseerde studies een alternatief zijn voor het gebruik van besliskundige modellen bij de evaluatie van diagnostische tests. Gerandomiseerde studies kunnen met name nuttig zijn, indien kennis over de effectiviteit van relevante behandelingen ontbreekt. Er zijn echter een aantal gevaren bij het gebruik van gerandomiseerde studies voor de evaluatie van diagnostische tests. Op de eerste plaats moet de beslissing van de arts om een behandeling in te stellen overeenstemmen met het resultaat van de test: een test-resultaat duidend op ziekte moet gevolgd worden door het adviseren van een behandeling, terwijl bij een test-resultaat duidend op afwezigheid van ziekte behandeling afgeraden moet worden. De patiënt moet vervolgens akkoord gaan met het behandelvoorstel van de arts. Op de tweede plaats moet de behandeling die ingesteld wordt effectief zijn. Enkele voorbeelden van diagnostische tests geëvalueerd in gerandomiseerd onderzoek worden behandeld.

Tenslotte wordt in § 18.5 een schema gegeven, dat gebruikt kan worden voor het ontwerpen en beoordelen van studies over diagnostische tests. Centraal in dit schema staat de beschikbaarheid van voldoende informatie over de effectiviteit van de behandeling die ingesteld moet worden bij een positief test-resultaat. In aanwezigheid van zulke informatie is het voldoende om te evalueren hoe precies de bestudeerde test de relevante ziekte kan opsporen. De waarde van een test kan vervolgens bepaald worden in een besliskundig model. In afwezigheid van voldoende informatie over de effectiviteit van een behandeling is het essentieel dat ook de effectiviteit van de behandeling geëvalueerd wordt, bij voorkeur in gerandomiseerd onderzoek.

213