Tratamiento multimodal del cáncer de recto, visión del oncólogo
Soledad Iseas
Hospital de Gastroenterología Carlos Bonorino Udaondo, Ciudad Autónoma de Buenos Aires
Instituto Urológico y Coloproctológico de Buenos Aires (IUBA), Ciudad Autónoma de Buenos Aires
Soledad Iseas
soledad.iseas@gmail.com
Recibido: mayo de 2020
Aceptado: junio de 2020
Desde las recomendaciones del NCI, en 1990,1 que introdujeron la quimioradioterapia (QTRT) postoperatoria en el manejo interdisciplinario de los pacientes con cáncer de recto, se han consolidado enormes avances en las diferentes disciplinas involucradas en el diagnóstico y el tratamiento de esta enfermedad. Existe hoy un convencimiento imperioso en el desarrollo de modalidades de trabajo más integrativas y transversales para el beneficio de estos pacientes. Estos progresos han logrado mejorar sustancialmente el control local de la enfermedad. Sin embargo, en tres décadas, el impacto en el aumento de la sobrevida global de los pacientes con cáncer de recto localmente avanzado (CRLA), con la mejor versión de todas las disciplinas, ha sido casi nulo. Es así, como con el tratamiento estándar, que con QTRT seguida de escisión total mesorrectal (ETM) se mantiene invariable el riesgo de desarrollar metástasis a distancia en el 20-30 % de los casos.2 Probablemente, este bajo impacto en la evolución a largo plazo sea consecuencia de estrategias que han sido, y siguen siendo, profundamente empíricas en el diseño de los tratamientos y que se han limitado únicamente a cambiar de lugar las piezas o “las disciplinas”. Aún en el 2020, no podemos precisar cuál es la mejor secuencia para una estrategia más satisfactoria. En lo que sí hay congruencia, a través de las diferentes alternativas de un enfoque “símil tetris”, es que ante una estrategia de tratamiento neoadyuvante total (TNT), el lugar de la cirugía, o la decisión de omitirla, constituirían el último eslabón de la secuencia terapéutica.
Con el objetivo de lograr un impacto en la recurrencia a distancia, el primer modelo, aún vigente, de TNT con QT inicial o “de inducción”, con esquemas con oxaliplatino, seguida por QTRT de curso largo y ETM, (designado TNT1) demostró que: 1) un mayor intervalo desde el diagnóstico a la cirugía era factible, 2) la toxicidad era aceptable, 3) las tasas de resección R0 eran satisfactorias (>90 %), 4) se obtenían respuestas objetivas con regresión tumoral de entre 88 % y 97 %, 5) se lograba un rápido control sintomático y una mayor adherencia al tratamiento y 6) el porcentaje recibido de la dosis planeada de QT era mayor cuando se la administraba en forma preoperatoria que cuando era dada como adyuvancia, sin comprometer pero, lamentablemente, sin aumentar ni la sobrevida libre de enfermedad (SLE) ni la sobrevida global (SG).3-7 Este modelo permitió identificar también a los subgrupos de pacientes respondedores a la QT de inducción que podrían ir a cirugía omitiendo la radioterapia y gatilló la posibilidad de testear esta hipótesis en forma prospectiva. 8,9 Otra ventaja adicional, quizás de mayor interés para los pacientes, es la posibilidad de un cierre de la ostomía, generada en la ETM, más temprano que con el tratamiento estándar. Además, al aumentar el grado de regresión tumoral, este modelo ha consagrado el interés en el logro de: a) una respuesta completa clínica (RCc) como un alentador “endpoint” para la preservación esfinteriana, y/o b) una mayor tasa de respuesta completa patológica (RCp) en los ensayos en CRLA, como subrogante de una mejor sobrevida global. 5 En los Estados Unidos, cuatro meses de FOLFOX durante la inducción seguido de QTRT ya es una opción preoperatoria recomendada para pacientes considerados de alto riesgo.10 Finalmente, cabe destacar que el TNT1 ha sido adoptado en el contexto de la investigación traslacional prospectiva como un modelo para lograr una mejor comprensión molecular del efecto de la QT y de la RT.11 Debe tenerse en cuenta que los resultados mencionados se obtuvieron a través de ensayos clínicos fase 2, de los cuales solo uno ha sido aleatorizado con el tratamiento estándar; y de series retrospectivas de gran volumen, pero con los sesgos habituales en la selección de los pacientes, con una incompleta estadificación clínica por resonancia magnética de alta resolución (RM-AR) y sin considerar la invasión vascular extramural como un factor de riesgo en ninguna de las series. En ASCO 2020 se presentó el primer ensayo prospectivo basado en quimioterapia de inducción con el esquema FOLFIRINOX seguido de un curso largo de radioterapia concurrente con fluoropirimidinas con un intervalo a la cirugía de ocho semanas comparado con una rama de tratamiento standard de curso largo cirugía. En ambas ramas fue mandatorio el tratamiento adyuvante. El PRODIGE 23 cumplió su objetivo primario, demostrando un mayor beneficio en la sobrevida libre de enfermedad y sobrevida libre de metástasis a distancia en la rama experimental (HR:0,69; p=0,034 y HR:0,64;p=0,017 respectivamente). Además, no estuvo asociado a mayores complicaciones postoperatorias y no hubo diferencias en la evaluación de calidad de vida entre ambas ramas. La tasa de respuestas completas patológicas fue del 27 % comparado con 12 % del tratamiento estándar. Es el primer ensayo que en forma prospectiva demostró mayor control sistémico de la enfermedad, probablemente a expensas de un tratamiento de inducción de mayor intensidad que ensayos previos. Por otro lado, no se mencionó la tasa de respuesta del tumor primario con el efecto de la quimioterapia antes de la radioterapia, que sería de interés para tener en cuenta en tumores de recto medio o alto sin criterios de radioterapia y con riesgo sistémico. De todas maneras, este triplete de quimioterapia se está evaluando, en dicho escenario, en el estudio FOBEAR, pero también, en un contexto diferente, en el GRECCAR 12 para evaluar la efectividad en pacientes de recto inferior con el objetivo de preservación del órgano.12
Al entender mejor el efecto del intervalo de tiempo postQTRT en la respuesta, al dejar de lado la dicotomía entre buenos y malos respondedores y al agregar una tercera categoría, los “respondedores lentos”, se propuso llenar con QT el mayor intervalo entre QTRT y cirugía, moviendo las piezas de lugar. Así, se generó un segundo enfoque de TNT, la TNT2: QTRT de curso largo, inicialmente, seguida por QT y, finalmente, ETM. Este otro modelo de neoadyuvancia extendida, llenado el intervalo a la respuesta con QT inicialmente con capecitabina,13 seguido del agregado de oxaliplatino como quimioterapia de “consolidación”, siempre postRTQT, logró mayores tasas de RCc y de RCp y una mayor compliance a la QT, como se mencionó previamente.13 En TNT2, la QT de consolidación, al prolongar el intervalo entre la RTQT y la evaluación de respuesta, permitió posponer la decisión quirúrgica según la evolución de la respuesta conseguida e impulsó la inclusión de la estrategia de la omisión de la cirugía no solo dentro de la práctica clínica sino como opción experimental dentro de ensayos clínicos.14 Si se deja de lado la exaltación que produce el logro de un endpoint primario, como es la obtención de mayores porcentajes de RCc y/o de RCp, todavía la TNT2 no ha demostrado mejorar los resultados oncológicos a largo plazo. Parecería existir, con esta estrategia, una mayor SLE, pero este beneficio fue obtenido en un ensayo prospectivo no aleatorizado. Corresponde ser cauteloso con sus resultados ya que este estudio podría tener una subestadificación clínica inicial, debido a que solo un bajo porcentaje de casos contaba con RM-AR,14 a pesar del indiscutible rol de la RM-AR para documentar el compromiso tumoral más allá del mesorrecto.
Ante cualquiera de los dos abordajes mencionados, los oponentes al TNT basan su rechazo en un posible riesgo de sobretratamiento. Sostienen que, a medida que la experiencia crece, la familiaridad y la factibilidad han bajado el umbral para ofrecer TNT que, habiendo sido inicialmente pensada para los pacientes con CRLA, podría indicarse ahora a pacientes con estadios más tempranos o de menor riesgo.15 Por otro lado, se mantiene aún candente la controversia sobre una eventual mayor morbilidad quirúrgica por el desarrollo de fibrosis, potencialmente creciente a medida que nos alejamos de la finalización de la RT.16 También existen datos de que el TNT2 estaría asociado a una menor toxicidad, a una mayor compliance durante la RT y a una mayor tasa de RCp que el TNT1.17 Si bien este ensayo fase 2 (AIO-12) logró su endpoint primario, la demostración de una mayor tasa de RCp con TNT2, el intervalo a la cirugía fue de 6 semanas en aquellos aleatorizados a TNT1 versus 12 semanas en los de TNT2. Este disbalance, por el efecto del tiempo postQTRT, podría explicar las diferencias en la regresión tumoral de cada rama. Quizás, con otro diseño similar que comparara también inducción versus consolidación en pacientes tratados con QTRT, pero con SLE como endpoint, se podría contestar si existen diferencias no sesgadas entre ambas estrategias.14 El ensayo clínico OPRA también comparó la efectividad de las dos modalidades de TNT pero específicamente en el contexto de cáncer de recto inferior con el objetivo de demostrar diferencias en la efectividad en lograr respuestas completas clínicas y por ende mayor porcentaje de pacientes candidatos a una estrategia no operatoria. Sin embargo, el objetivo primario fue demostrar mejor SLE. Este objetivo no fue alcanzado sin diferencia entre las dos ramas de TNT. Lo que sí demostró fue que la estrategia de iniciar el tratamiento neoadyuvante con QTRT de curso largo seguido de quimioterapia durante el intervalo a la respuesta (FOLFOX/CAPOX) fue superior en el porcentaje de pacientes en la sobrevida libre de TME, comparada con la estrategia de inducción con el mismo esquema de quimioterapia (p=0,007). El porcentaje de pacientes asignados a la estrategia de preservación de órgano fue 58 % en la rama de consolidación versus 43 % en la rama de inducción (p=0,01). Más allá de estos resultados robustos para seleccionar en forma intencional los pacientes candidatos a watch and wait, la rama de TNT2 recibió una dosis más alta de radioterapia y desde ya el intervalo a la evaluación de la respuesta fue mayor.18 Los resultados de este trabajo están alineados con el AIO12 donde observándose en ambos ensayos prospectivos que esperar más asociado a quimioterapia de consolidación esta asociado a mayor grado de regresión tumoral.
Finalmente, una adaptación de TNT2, con RT de curso corto seguida de QT (extrapolada del beneficio que se obtiene con RT corta en pacientes metastásicos),19 ha llevado al desarrollo de diferentes ensayos aleatorizados. Lamentablemente, tienen diferentes endpoints primarios y duración que los esquemas de QT. El uso de QT de consolidación, postRT de curso corto, comparado con la QTRT estándar de curso largo, no aumentó las resecciones R0, en el estudio RAPIDO, que era su objetivo primario. Pero sí se asoció a menor toxicidad. Por otro lado, el mayor intervalo a la cirugía no impactó en la morbimortalidad quirúrgica. En coincidencia con las estrategias previas, no tuvo mayor beneficio en la SLE ni en la sobrevida global.20 Los resultados de efectividad y seguridad de RT corta seguida de Xelox más bevacizumab en pacientes con cáncer de recto metastásico del estudio DUTCH M121 impulsaron también el desarrollo del estudio RAPIDO, pensado para Adenocarcinoma de recto con uno o más factores de peor pronóstico, seleccionados por RMAR en todos los casos: mrT4a/v, EMVI+, N2, compromiso de la fascia mesorrectal y/o ganglios laterales. Un ensayo que incluyó más de 900 pacientes con dichas características, multicéntrico, prioritariamente en centros europeos. Fue el primer ensayo randomizado donde los pacientes recibieron la mayor duración de tratamiento sistémico antes de la cirugía: 6 cursos de CAPOX o 9 de FOLFOX. Por un lado, dicha duración implicaría un mayor control sistémico; pero, por otro lado, un mayor intervalo a la cirugía, que fue 24 semanas después de terminada la radioterapia. La rama control fue tratamiento standard de curso largo seguido de cirugía a las 8-10 semanas y en esta rama 40% de los pacientes no recibieron en forma adyuvante tratamiento con oxaliplatino, lo cual quizás fue uno de los sesgos más relevantes. El objetivo primario fue falla de tratamiento relacionada con la enfermedad, un endpoint que combinaba recaída local, metástasis a distancia, muerte relacionada con el tratamiento, etc. La falla del tratamiento relacionada con la enfermedad fue un 7 % superior en la rama control (HR:0,75, p=0,019). Probablemente, a expensas del mayor porcentaje de pacientes que desarrolló metástasis a distancia, también mayor en la rama control (27 % vs. 20 %, HR:0,69, p=0,005). No se observaron diferencias entre el tratamiento estándar comparado con el curso corto seguido de quimioterapia de consolidación durante 4-5 meses en sobrevida global ni en recurrencia local. También demostró que una espera más larga a la cirugía no está asociada a mayores complicaciones postoperatorias y, nuevamente, el efecto de un intervalo mayor y quimioterapia de consolidación demostró en forma significativa mayor grado de regresión tumoral, 28 % vs. 14 % a favor de la rama experimental (p=0,001).22
Para aumentar la complejidad del análisis de la evidencia, hay que resaltar que, en todos los modelos de TNT mencionados, hay discrepancias en los esquemas de tratamiento QT, ya sea CAPOX o FOLFOX, y en su duración. En los estudios que investigaron la duración ideal de la QT adyuvante en cáncer de colon, la QT con FOLFOX durante 6 meses demostró un beneficio en SLE equivalente a 6 meses de QT con CAPOX. Sin embargo, cuando se investigó QT durante 3 meses solo se objetivó beneficio con el esquema CAPOX y solo para estadios III de bajo riesgo.23 Entonces, considerando estos datos, en los ensayos específicamente en CRLA, la duración de la QT, de inducción o de consolidación, podría haber sido insuficiente, ya que no ha sido mayor de 3 meses, aún con esquemas basados en FOLFOX. Por otro lado, en estos ensayos en CRLA la decisión de completar la QT adyuvante postoperatoria no ha sido mandatoria y ha quedado a criterio de los investigadores. Esta decisión es habitualmente compleja en la práctica clínica. Es que las herramientas para evaluar el pronóstico de los pacientes y para predecir el beneficio de QT adyuvante en el contexto de TNT generan controversias. Por un lado, en la séptima edición del TNM (AJCC v7) se introdujo un score de regresión tumoral patológica (CAP) que ha demostrado ser superior a los sistemas utilizados anteriormente.24-26 Los pacientes con RCp (CAP:0) tienen excelentes resultados a largo plazo, con un riesgo muy bajo de recurrencia local o a distancia.27 Por el contrario, aquellos con respuesta moderada, mínima o sin respuesta (CAPG2-G3) tienen un riesgo significativamente mayor de recurrencia28,29. pero este score no considera, para establecer el pronóstico, el estado de los ganglios, ni aun si están comprometidos en la pieza quirúrgica, ni otros factores de riesgo sistémico que están generalmente contemplados en el informe patológico. Otra herramienta con intención pronóstica, el score de NAR30 que se ha incorporado como punto final en algunos ensayos clínicos modernos 11 Esta fórmula contempla la estadificación clínica inicial del tumor y no sólo el informe patológico, pero tiene un cierto grado de ambivalencia. La puntuación NAR sigue la suposición de que el pronóstico mejora con una mayor regresión tumoral. Sin embargo, en algunos análisis, cuando hay RCp el score da como resultado puntuaciones más altas (asociadas a peor pronóstico) en tumores estadificados clínicamente en etapas tempranas. Se produce una contradicción: las RCp de tumores inicialmente pequeños tienen peor pronóstico que las RCp de tumores inicialmente más avanzados.31 El NAR tampoco incluye la estadificación ganglionar inicial (sujeta a una sensibilidad imperfecta en la RM-AR). Así, la respuesta al tratamiento no tiene ninguna evaluación clínica, morfológica o patológica suficiente para constatar correctamente el éxito de la neoadyuvancia.
Son las características biológicas del tumor las que pueden ser relevantes para predecir el éxito terapéutico, permitir una estratificación del riesgo molecular y facilitar una mejor toma de decisiones clínicas. En la última década se han publicado diferentes enfoques para identificar un santo grial o biomarcadores moleculares como posibles candidatos para la predicción de la respuesta, aún sin resultados consistentes.32-35 Esa inconsistencia está relacionada, al menos en parte, con las diferencias en la selección de pacientes, con el tamaño de la muestra, con los diferentes tratamientos indicados y, lo más importante, con las definiciones utilizadas para clasificar la respuesta tumoral. La heterogeneidad tumoral y la ausencia de un análisis integrador que incluya el papel del microambiente bajo el tratamiento con QTRT también son motivo de estas inconsistencias. Se necesita una comprensión integral de los factores biológicos que generan una determinada respuesta a la neoadyuvancia. Debe hacerse una evaluación rigurosa de la respuesta para señalar biomarcadores predictivos efectivos y sensibles que nos permitan redefinir y dirigir las estrategias neoadyuvantes. Así, se podrá identificar a quienes se perjudicarían por exponerse a un tratamiento que es cada vez más extenso y puede estar asociado a complicaciones, algunas de ellas irreversibles, que afectan en diferentes aspectos la calidad de vida de los pacientes.
REFERENCIAS