Kritiek op intermediaire eindpunten in de oncologie

Het klinisch voordeel van heel wat beschikbare antitumorale geneesmiddelen is onzeker. Eén van de redenen hiervan is het soms ongepast gebruik van intermediaire eindpunten in studies. Commentatoren roepen op om intermediaire eindpunten rationeler te gebruiken en om de drempel voor de goedkeuring van deze geneesmiddelen te verhogen. In dit artikel worden frequent gebruikte intermediaire eindpunten in de oncologie besproken met aandacht voor een aantal problemen zoals zwakke correlaties met de eindpunten die er werkelijk toe doen: overleving en levenskwaliteit.

Inleiding

Sinds een aantal jaren vormen de antitumorale geneesmiddelen de grootste categorie van nieuwe geneesmiddelen die goedgekeurd worden door het Europees Geneesmiddelenagentschap EMA. Een aantal publicaties wijzen erop dat het klinisch voordeel van een belangrijk deel van deze geneesmiddelen onzeker is. In dit artikel bespreken we een belangrijke methodologische beperking in de uitgevoerde studies, namelijk het soms ongepast gebruik van intermediaire eindpunten.

Intermediaire eindpunten gebruikt men in studies als vervanger voor klinisch relevante (of harde) eindpunten. Intermediaire eindpunten laten toe de grootte, de duur en dus de kosten van de studies beperkt te houden. Wanneer er een sterke correlatie bestaat tussen beiden typen uitkomstmaten, kunnen studies met intermediaire eindpunten betrouwbare resultaten opleveren. Vaak ontbreekt echter deze sterke associatie en moet men studies die een intermediair eindpunt als primair eindpunt hebben, voorzichtig interpreteren.

In de oncologie zijn totale overleving en levenskwaliteit de belangrijkste klinische eindpunten, m.a.w. dit zijn de harde eindpunten. Voor vaste tumoren hanteert men meestal intermediaire eindpunten op basis van tumormetingen via medische beeldvorming. Van bij de start van de studie wordt op deze manier nagegaan of de tumor groeit of krimpt tijdens de behandeling. Nieuwe antitumorale geneesmiddelen worden vaak geregistreerd op basis van studies met alleen data van intermediaire eindpunten, dus zonder informatie over overleving of levenskwaliteit. Het lijkt logisch dat het krimpen van een tumor zal resulteren in een langere en/of kwaliteitsvollere overleving, maar zo rechtlijnig is het niet, wat de oorzaak van de discussie is. Kan een afname van tumorvolume gezien worden als een goed surrogaat voor totale overleving en/of levenskwaliteit?

Gebruikte intermediaire eindpunten in de oncologie

Dit artikel bespreekt 3 intermediaire eindpunten die vaak in de oncologie worden gebruikt, namelijk “objective response rate” (ORR), “progression-free survival” (PFS), en “disease-free survival” (DFS). De keuze van een eindpunt bij de design van een studie hangt af van factoren zoals de prognose van de ziekte en de fase van de behandeling (bv. vóór of na heelkunde, als onderhoudsbehandeling, palliatief).
Alle mogelijke (intermediaire) eindpunten hebben voordelen en nadelen¹. Ook de “gouden standaard” totale overleving heeft nadelen. Dit eindpunt wordt beïnvloed door het beleid (bv. bijkomende behandelingen) na het stoppen van de studiebehandeling waardoor het effect van het onderzochte geneesmiddel voor overleving nog moeilijk bepaald kan worden. Een gelijkaardig probleem heb je met studies waar crossover is toegelaten. Bij crossover krijgen de patiënten uit de controle-arm bij falen van de behandeling (vaak standaardbehandeling + placebo) de optie om over te schakelen naar de experimentele arm (zie verder).

Om intermediaire eindpunten in studies met vaste tumoren te begrijpen, is eerst een begrip nodig over tumorrespons. Intermediaire eindpunten in deze studies evalueert men vaak aan de hand van
CT-metingen waarbij tumorletsels gemeten en gevolgd worden volgens gestandaardiseerde criteria (zie “meer info”). Men kan de respons van de tumor op de behandeling globaal en vereenvoudigd indelen in:

Partiële respons (PR): een reductie van >30% van de tumorletsels
Progressieve ziekte (PD): een groei van >20% van de tumorletsels
Stabiele ziekte (SD): geen PD of PR
Complete respons (CR): geen bewijs van ziekte meer aantoonbaar

Voor de verschillende beeldvormingstechnieken bestaan er gestandaardiseerde criteria om tumoren te meten in studies². De keuze van de beeldvormingstechniek hangt o.a. af van het tumortype; zo worden bijvoorbeeld hersentumoren gewoonlijk opgevolgd met MRI. Maar over het algemeen worden meestal CT-scans gebruikt en gaat het om metingen op CT-beelden volgens de RECIST (Response Evaluation Criteria In Solid Tumours) criteria. De RECIST criteria werden oorspronkelijk opgesteld voor chemotherapie. Ondertussen zijn er nieuwe vormen van behandeling beschikbaar. Bij immuuntherapie gebruikt men een variant van de RECIST criteria om rekening te houden met fenomenen waarbij in het begin van de behandeling eerst ziekteprogressie kan optreden gevolgd door een respons (pseudoprogressie).

Een bron van kritiek op intermediaire eindpunten heeft te maken met de CT-metingen. Er bestaat een belangrijke intra- en interobserver variabiliteit bij de responsevaluatie. Om dit probleem te beperken dient een respons steeds bevestigd te worden door een tweede CT-scan. Alle beelden worden bij voorkeur ook beoordeeld door een onafhankelijke reviewer die geblindeerd is voor de behandeling. Daarnaast zijn de afkapwaarden, die gebruikt worden om een partiële respons (30% tumorregressie) of progressieve ziekte (20% tumorgroei) te definiëren, arbitrair. In die zin dat een tumor die groeit met 19% versus 21% waarschijnlijk geen verschil zal geven qua symptomen, nochtans is 20% de afkapwaarde voor ziekteprogressie in studies. Ook zal bij een patiënt waarbij de tumor krimpt met 29% of groeit met 19%, de tumorrespons gecategoriseerd worden als stabiele ziekte (SD), terwijl men tussen beide situaties een verschillende klinische uitkomst zou kunnen verwachten.

Response rate

De “objective response rate” (ORR) is het totale percentage patiënten in een studie met een partiële respons (PR) en complete respons (CR).

De “objective response rate (ORR)” wordt in veel studies als eindpunt gebruikt om de werkzaamheid van antitumorale geneesmiddelen te evalueren. De ORR is het totale percentage patiënten in een studie met een partiële respons (PR) en complete respons (CR). Dit eindpunt wordt ook vaak gebruikt in fase II studies, soms zonder controle-arm wanneer er geen andere therapeutische opties zijn, om versnelde goedkeuring (zie Folia september 2018) te bekomen. Enerzijds mag men niet uit het oog verliezen dat het krimpen van een tumor op zich niet noodzakelijk overeenkomt met een klinisch voordeel voor de patiënt. M.a.w. dit eindpunt zegt alleen wat de behandeling doet met de tumor en niet wat het voordeel is voor de patiënt. Welk voordeel heeft bijvoorbeeld een patiënt met dyspneu aan een radiologische afname in het volume van longmetastasen als hij afhankelijk blijft van zuurstoftherapie? Daarnaast kan een tumor bijvoorbeeld wel krimpen, maar zou deze op termijn resistent kunnen worden voor de studiebehandeling en een meer agressieve en moeilijker behandelbare vorm aannemen, waardoor er netto geen of zelfs een nadelig effect is op de overleving. Anderzijds hebben sommige behandelingen eerder een stabiliserend effect (SD) dan dat het de tumor doet krimpen, wat niet gecapteerd wordt in de parameter ORR. Er zijn andere eindpunten die hier wel rekening mee houden, maar deze worden hier niet besproken.
Vaak evalueert men ook de duration of response (DOR), de tijd tussen een respons (PR of CR) en progressieve ziekte (PD). Deze parameter is waarschijnlijk belangrijker dan het percentage waarmee de tumor krimpt.

Progressievrije overleving

Progressievrije overleving (PFS, progression-free survival) kan gedefinieerd worden als de tijd van randomisatie tot progressieve ziekte (PD) op beeldvorming of overlijden ongeacht de oorzaak.

Progressievrije overleving (PFS, progression-free survival) is de laatste jaren waarschijnlijk het meest gebruikte eindpunt in de oncologie bij patiënten met kanker in een gevorderd stadium. Nieuwe antitumorale geneesmiddelen worden vaak eerst in dit stadium van de ziekte onderzocht. PFS wordt in RCT’s (randomized controlled trials) steeds meer gebruikt als primair eindpunt in plaats van totale overleving. Dit samengestelde eindpunt kan gedefinieerd worden als de tijd van randomisatie tot progressieve ziekte (PD) op beeldvorming of overlijden ongeacht de oorzaak. In tegenstelling tot het eindpunt totale overleving, wordt het eindpunt PFS niet beïnvloed door verschillende behandelregimes na falen van het onderzochte geneesmiddel of door crossover omdat het eindpunt bereikt wordt bij het eerste bewijs van ziekteprogressie (PD). Omdat PFS (meer bepaald ziekteprogressie) eerder bereikt wordt dan overlijden, hebben studies met PFS als primair eindpunt een kortere studieduur dan studies met totale overleving als primair eindpunt. Hierdoor zouden innovatieve geneesmiddelen vlugger beschikbaar kunnen komen voor de patiënt. Deze voordelen verklaren het frequent gebruik van PFS als primair eindpunt.

Er bestaat echter ook kritiek op het gebruik van PFS. Het toenemend gebruik van het intermediaire eindpunt PFS wordt niet verklaard door sterke correlaties met totale overleving of levenskwaliteit (zie verder). Een winst in PFS vertaalt zich in studies later niet altijd in een overlevingswinst. Mogelijke bias door problemen met tumormetingen werden hoger al besproken. Bij het uitblijven van een overlevingswinst ondanks een winst in PFS wordt er soms als verklaring, al dan niet terecht, gewezen op verschillen in behandeling na ziekteprogressie tussen de interventie-groep en de controle-groep. Zie “meer info” voor uitleg over crossover in dit verband.

Crossover wordt tegenwoordig frequent toegepast in studies in de oncologie. Crossover kan in verschillende omstandigheden toegepast worden en afhankelijk van de exacte onderzoeksvraag bestaan er statistische methoden die hiervoor proberen te corrigeren bij een overlevingsanalyse. Een volledige bespreking van crossover valt buiten het bestek van dit artikel. Hier geven we alleen een voorbeeld om dit concept beter te begrijpen³.

Stel dat geneesmiddel “X” met bewezen werkzaamheid de standaardbehandeling is na falen van een eerdere behandelregime (X = tweedelijnsbehandeling) bij patiënten met een bepaalde gemetastaseerde kanker. We willen onderzoeken of X een overlevingswinst geeft indien het vroeger, nl. als eerste behandelregime (eerstelijnsbehandeling), wordt gegeven. In een dergelijke studie is het wenselijk en correct dat patiënten in de controle arm overschakelen naar X bij ziekteprogressie. Indien crossover geen optie is, zou dit problematisch zijn omdat patiënten in de controle arm dan een minderwaardige behandeling zouden hebben ontvangen vergeleken met de standaardpraktijk. Omgekeerd zijn er voorbeelden van studies waar crossover problematisch is, en dit desondanks werd toegepast³.

Een ander aangehaald punt van kritiek op het gebruik van PFS i.p.v. totale overleving, heeft te maken met de tijdswinst die men zou maken bij het bekomen van een vergunning voor een nieuw geneesmiddel. Gezien PFS gebruikt wordt in studies bij patiënten met gevorderde kanker, is deze tijdswinst namelijk niet altijd zo groot. Een Amerikaanse analyse (het gaat dus over goedkeuringen door de FDA) schatte op basis van gegevens tussen 2006-2018 dat het zou gaan om een tijdswinst in studieduur van gemiddeld 11 maanden (95% BI: 5-17 maanden)⁴. Hou hierbij rekening dat de tijd tussen de eerste klinische studies en de goedkeuring van een antitumoraal geneesmiddel in een andere Amerikaanse studie geschat werd op gemiddeld 7,3 jaar (range: 5,8 tot 15,2 jaar)⁵. De beperkte tijdwinst door het gebruik van PFS i.p.v. totale overleving moet dan afgewogen worden met de hogere onzekerheid over de werkzaamheid van het geneesmiddel.
Bij de interpretatie van de vermelde Amerikaanse cijfers moet de kanttekening gemaakt worden, dat een recente analyse erop wijst dat nieuwe antitumorale geneesmiddelen significant vlugger goedgekeurd worden door de FDA vergeleken met de EMA in Europa⁶. Voor Europa kan men dus stellen dat het gebruik van PFS i.p.v. totale overleving in dit verband nog minder een voordeel geeft.

Ziektevrije overleving

Ziektevrije overleving (DFS, disease-free survival) wordt bereikt bij herval van de kanker of overlijden ongeacht de oorzaak.

Ziektevrije overleving (DFS, disease-free survival) is vergelijkbaar met het eindpunt progressievrije overleving maar wordt gebruikt in studies bij patiënten die nog met een curatieve opzet behandeld worden. Meer bepaald in studies die een nabehandeling volgend op heelkunde of radiotherapie onderzoeken of m.a.w. in de adjuvante setting. Dit samengesteld eindpunt wordt bereikt bij herval van de kanker of overlijden ongeacht de oorzaak. Over het algemeen is ziektevrije overleving beter voorspellend voor totale overleving dan progressievrije overleving. Een herval van kanker is dan ook meer objectief te bepalen vergeleken met een respons (PD of PR) bij een bestaande tumor. Een duidelijk bewezen meerwaarde van geneesmiddelen in de adjuvante setting is extra belangrijk gezien hier patiënten zonder bewijs van kanker blootgesteld worden aan geneesmiddelen met potentiël ernstige ongewenste effecten.

Beperkingen in voorspellend vermogen en validiteit

Het voorspellend vermogen van een intermediair eindpunt voor totale overleving evalueert men door de correlatie tussen beide te bepalen⁷. Dergelijke validatie studies dienen telkens opnieuw uitgevoerd te worden voor elke indicatie en interventie. Vaak worden deze studies echter niet uitgevoerd en wanneer dit wel het geval is, zijn de correlaties meestal zwak of matig (zie “meer info”).

Een systematische review zocht naar meta-analyses van RCT’s die de correlatie onderzocht tussen een intermediair eindpunt en totale overleving in de oncologie⁸. Het ging om verschillende intermediaire eindpunten waaronder ORR, PFS en DFS. Er waren geen restricties qua tumortype of setting van de behandeling (bv. in een vroeg stadium van een kanker of bij gemetastaseerde ziekte).

In totaal voldeden 78 artikels aan de inclusiecriteria en deze rapporteerden correlaties in 89 settings: 12% had een hoge (r ≥ 8,5) correlatie, 10% had een matige (r > 0,7 tot r < 0,85) correlatie, 38% had een lage (r ≤ 7) correlatie. Bij 39% varieerde de sterkte van de correlatie afhankelijk van het intermediair eindpunt en de methode die gebruikt werd om de correlatie te bepalen.

Zelfs met een zwakke associatie tussen PFS en totale overleving, zou men bij een winst in PFS nog een verbeterde levenskwaliteit kunnen verwachten gezien de ziekteprogressie (op beeldvorming) uitgesteld wordt. Maar ook hier vinden studies vaak lage correlaties tussen intermediaire eindpunten en het eindpunt levenskwaliteit^9,10. Indien men levenskwaliteit in studies wil evalueren (wat nog te weinig gedaan wordt), is het beter om gewoon de levenskwaliteit direct te beoordelen tijdens de studie.

Ondanks dat intermediaire eindpunten vaak niet goed in staat zijn om klinische eindpunten te voorspellen in de oncologie, worden nieuwe geneesmiddelen (voorwaardelijk) goedgekeurd op basis hiervan⁷. Dit zou minder problematisch zijn indien postregistratie studies duidelijke voordelen zouden aantonen voor klinisch relevante eindpunten, maar dit is meestal niet het geval. In een aantal gevallen werden geneesmiddelen zelfs niet teruggetrokken van de markt nadat een overlevingswinst niet kon aangetoond worden^7,10. Commentatoren roepen op om intermediaire eindpunten in studies rationeler te gebruiken en om de drempel voor de goedkeuring van deze geneesmiddelen te verhogen^11-14.

Voorwaardelijke vergunningen, intermediaire eindpunten en transparantie

In Folia september 2018 bespraken we de voorwaardelijke vergunningen (“conditional market authorisation”) die sinds 2006 het mogelijk maken vlugger markttoegang te bekomen van innovatieve geneesmiddelen op basis van minder gegevens voor indicaties met een “unmet medical need”. Vaak, maar niet altijd, zijn deze gebaseerd op studies met intermediaire eindpunten. De firma moet dan na het bekomen van de voorwaardelijke vergunning bijkomende data leveren die een klinisch voordeel moeten bevestigen. Een terugkerende kritiek in de literatuur gaat over deze bevestigende studies die niet, veel later of ook met intermediaire eindpunten als primair eindpunt worden uitgevoerd. Daarnaast wordt het criterium “unmet medical need” voor deze versnelde procedure soms in vraag gesteld, zo gaat het vaak niet over “first-in-class” geneesmiddelen waarvan men kan verwachten dat deze geen belangrijke verschillen zullen geven vergeleken met andere reeds goedgekeurde geneesmiddelen uit dezelfde klasse of zijn er andere geneesmiddelen beschikbaar met een ander werkingsmechanisme.

Wanneer de EMA een geneesmiddel goedkeurt, publiceert ze gedetailleerde informatie over het geneesmiddel in een EPAR (European Public Assessment Report). Een studie toonde aan dat in deze rapporten van geneesmiddelen goedgekeurd tussen 2011-2018, niet systematisch werd aangegeven of de gebruikte intermediaire eindpunten al dan niet gevalideerd waren of m.a.w. of ze voorspellend waren voor klinisch relevante eindpunten¹⁵. Dit was ook niet het geval in de bijsluiters en de Samenvattingen van de Kenmerken van het Product (SKP’s). De EPAR rapporten bevatten ook de maatregelen of verplichtingen waaraan de firma’s na het ontvangen van de voorwaardelijke vergunning moeten voldoen. Daar was het ook niet altijd duidelijk of deze later zouden leiden tot een bevestiging van een klinisch voordeel. Er werd dan ook niet systematisch aangegeven welk eindpunt moest gebruikt worden in de bevestigende studies. De auteurs van deze studie concluderen dat al deze informatie consequent en beter moet gedocumenteerd worden in de EPAR, bijsluiters en SKP’s zodat de arts en de patiënt hier een beter zicht op hebben¹⁵. Dit moet ervoor zorgen dat de werkzaamheid van antitumorale geneesmiddelen niet wordt overschat en dat de ongewenste effecten niet worden onderschat. De EMA dient naar firma’s toe duidelijkere en afdwingbare criteria op te geven voordat de voorwaardelijke vergunning wordt afgeleverd, zodat de vergunning zo nodig later wordt ingetrokken als niet voldaan is aan de criteria^14-16.

Conclusie en commentaar

Meer en meer worden antitumorale geneesmiddelen goedgekeurd door geneesmiddelenautoriteiten op basis van studies met intermediaire eindpunten die vaak niet goed in staat zijn om klinisch relevante eindpunten te voorspellen. Commentatoren roepen op om intermediaire eindpunten in studies rationeler te gebruiken en om de drempel voor de goedkeuring van deze geneesmiddelen te verhogen.
De discussie rond de onzekerheid van de werkzaamheid van vele antitumorale geneesmiddelen gaat verder dan het soms ongepast gebruik van intermediaire eindpunten in studies. Ook andere methodologische beperkingen^14-17, de marginale overlevingswinst in sommige studies en de onhoudbare prijzen en het gebrek aan transparantie daar rond zijn o.a. grote discussiepunten. In een rapport (klik hier) dat vorig jaar werd gepubliceerd door het Federaal Kenniscentrum voor de Gezondheidszorg (KCE) wordt hier dieper op ingegaan¹⁶. Het rapport eindigt (vanaf pagina 40) met 19 aanbevelingen die er voor moeten zorgen dat de arts en de patiënt in de toekomst de meerwaarde van deze geneesmiddelen beter kan inschatten. Het BCFI steunt deze aanbevelingen en noteert hierbij dat het beperken van de markttoegang van (innovatieve) geneesmiddelen zonder bewezen meerwaarde niet hetzelfde is als het beperken van innovatie.

Bronnen

1 Wilson MK, Karakasis K, Oza AM. Outcomes and endpoints in trials of cancer treatment: the past, present, and future. Lancet Oncol. 2015 Jan;16(1):e32-42.
2 https://imaging.cancer.gov/clinical_trials/imaging_response_criteria.htm
3 Haslam A, Prasad V. When is crossover desirable in cancer drug trials and when is it problematic?. Ann Oncol. 2018;29(5):1079-1081.
4 Chen EY, Joshi SK, Tran A, et al. Estimation of Study Time Reduction Using Surrogate End Points Rather Than Overall Survival in Oncology Clinical Trials. JAMA Intern Med. 2019 May 1;179(5):642-647.
5 Prasad V, Mailankody S. Research and Development Spending to Bring a Single Cancer Drug to Market and Revenues After Approval. JAMA Intern Med. 2017 Nov 1;177(11):1569-1575.
6 Lythgoe MP, Desai A, Gyawali B, et al. Cancer Therapy Approval Timings, Review Speed, and Publication of Pivotal Registration Trials in the US and Europe, 2010-2019. JAMA Netw Open. 2022;5(6):e2216183.
7 Kemp R, Prasad V. Surrogate endpoints in oncology: when are they acceptable for regulatory and clinical decisions, and are they currently overused? BMC Med. 2017 Jul 21;15(1):134.
8 Haslam A, Hey SP, Gill J, Prasad V. A systematic review of trial-level meta-analyses measuring the strength of association between surrogate end-points and overall survival in oncology. Eur J Cancer. 2019 Jan;106:196-211.
9 Kovic B, Jin X, Kennedy SA, Hylands M, et al. Evaluating Progression-Free Survival as a Surrogate Outcome for Health-Related Quality of Life in Oncology: A Systematic Review and Quantitative Analysis. JAMA Intern Med. 2018 Dec 1;178(12):1586-1596.
10 Gyawali B, Rome B N, Kesselheim A S. Regulatory and clinical consequences of negative confirmatory trials of accelerated approval cancer drugs: retrospective observational study BMJ 2021; 374 :n1959
11 Booth CM, Eisenhauer EA. Progression-free survival: meaningful or simply measurable? J Clin Oncol. 2012 Apr 1;30(10):1030-3.
12 Mintzes B, Vitry A. Flawed evidence underpins approval of new cancer drugs BMJ 2019; 366 :l5399
13 Dawoud D, Naci H, Ciani O, Bujkiewicz S. Raising the bar for using surrogate endpoints in drug regulation and health technology assessment BMJ 2021; Sep 15;374:n2191.
14 Schnog, JJ.B., Samson, M.J., Gans, R.O.B. et al. An urgent call to raise the bar in oncology. Br J Cancer 125, 1477–1485 (2021).
15 Schuster Bruce C, Brhlikova P, Heath J, et al. The use of validated and nonvalidated surrogate endpoints in two European Medicines Agency expedited approval pathways: A cross-sectional study of products authorised 2011-2018. PLoS Med. 2019 Sep 10;16(9):e1002873.
16 Neyt M, Devos C, Thiry N, et al. Benefits and costs of innovative oncology drugs in Belgium (2004-2017). Health Technology Assessment (HTA) Brussels: Belgian Health Care Knowledge Centre (KCE). 2021. KCE Reports 343. D/2021/10.273/23
17 Naci H, Davis C, Savović J, et al. Design characteristics, risk of bias, and reporting of randomised controlled trials supporting approvals of cancer drugs by European Medicines Agency, 2014-16: cross sectional analysis. BMJ. 2019 Sep 18;366:l5221.