johamsc.uta@gmail.com

Correo Electrónico: johamsc.uta@gmail.com

J. health med. sci.,
5(4):229-243, 2019.

Diseño de Sistema Automatizado para Detección de Anomalías en Imágenes Digitales de Mama

Eduardo Daniel Suárez Aday; Marlén Pérez Díaz & Rubén Orozco Morales

Universidad Central “Marta Abreu” de las Villas, Santa Clara, Cuba.

Dirección para correspondencia:
Jessica Salvo
Programa Doctorado en Ciencias
Morfológicas Facultad de Medicina
Universidad de La Frontera
Temuco
CHILE
Email: j.salvo03@ufromail.cl

SÚAREZ, A. E. D; PÉREZ, D. M. & OROZCO, M. R. Diseño de sistema automatizado para detección de anomalías en imágenes digitales de mama. J. health med. sci., 5(4):229-243, 2019.

 

RESUMEN: La mamografía por rayos X es el examen diagnóstico por excelencia para la detección temprana del cáncer de mama. Sin embargo, las lesiones no son fáciles de detectar, debido a las pequeñas diferencias de contraste de imagen con el tejido circundante. Los sistemas de detección asistidos por computadora (CAD), son una herramienta de ayuda al diagnóstico para los radiólogos. Se propone un sistema CAD, que mejora la calidad de la imagen, segmenta la glándula mamaria y detecta micro-calcificaciones y masas. Se implementan métodos tales como: la segmentación median- te Laplaciano, apertura de áreas binarias, determinación de componentes conexas binarias, umbral global basado en entropía, filtrado morfológico, métodos iterativos para el mejoramiento del contraste de imagen y segmentación mediante un método de contornos activos. El sistema fue probado con la base de datos (BD) anotada MIAS, en vistas laterales oblicuas, que contenía imágenes de mamas glandulares, glandulares-densas y predominantemente adiposas, todas con lesiones o sanas. El sistema fue evaluado en cuanto a su desempeño con respecto a la anotación de la BD, para una muestra de 115 imágenes. Se obtuvo una sensibilidad del 93,2 %, una especificidad del 85,3 %, una exactitud del 90,4 % y una precisión del 92 %.

 

PALABRAS CLAVE: mamografía, microcalcificación, masa, sistema de detección asistido por computadora, procesamiento digital de imágenes.

INTRODUCCIÓN

El cáncer de mama es el tipo de lesión cancerígena de mayor ocurrencia entre mujeres y la segunda causa de muerte después del cáncer de pulmón. Re- presenta el 16 % de todos los cánceres femeninos. Además, las proyecciones indican que el número de mujeres diagnosticadas en América aumentará en un 46 % en el 2030. Las edades más avanzadas, de 50 a 64 años, son las de mayor riesgo. Aproximadamente, un 80 % de las mujeres con diagnóstico de tumor en etapa I, tienen un promedio de supervivencia superior a 5 años, mientras que solo el 25 % de las mujeres con diagnóstico de tumores en etapa II-IV, muestran expectativas de vida superiores a los 5 años (OPS, 2014).

 

La mamografía ha demostrado ser el método más eficaz para la detección temprana del cáncer de mama. La dificultad radica en que la diferencia de con- traste imagen de las zonas con lesiones respecto a las zonas sanas de la mama es muy pequeña debido a la necesidad de utilizar baja dosis de radiación por el efecto ionizante que esta posee sobre los tejidos biológicos. Es por ello que las lesiones pudieran pasar desapercibidas cuando están en etapas iniciales de la enfermedad.

 

El cáncer de mama se manifiesta básicamente por algunos tipos de lesiones características como son: masas, micro-calcificaciones y conductos galactóforos con infiltraciones anómalas. La no detección de una lesión no solo depende del tamaño de esta o del contraste imagen existente, sino de la eficacia de detección, así como del grado de pericia del radiólogo y de las condiciones bajo las cuales las visualiza (Pérez- Díaz, 2014).

 

A partir de la tecnología digital se revolucionó la radiografía en general. Con esto se han desarrollado también muchos sistemas de diagnóstico asistidos por ordenador (CAD) y las técnicas relacionadas han sido objeto de estudio para muchos investigadores. La mayoría de estos sistemas constan de cuatro etapas: pre-procesamiento de imágenes, segmentación de la lesión, extracción de características, y clasificación (Cheng et al., 2003; Maitra et al., 2011; Arnau et al., 2012; Tzikopoulos et al., 2012; Burcin et al., 2014 Guo et al., 2016; Abdulkaer & Abiyev, 2016; Abdel-Nasser et al., 2016; Anitha et al., 2017; de Oliveira Silva et al., 2017; Mehdi et al., 2017). Bajo este enfoque se desarrolla el presente trabajo.


En imágenes digitales de mamografía, como la diferencia entre tejido normal y maligno es apenas distinguible, existe la necesidad de recurrir a técnicas de realce de contraste que garanticen una posterior segmentación exitosa. Además de los métodos clásicos para realce de contraste, tales como la ecualización del histograma, los basados en transformada, o los basados en descomposición de la imagen, se han aplicado otras estrategias novedosas con relativa eficacia, basados en programación evolutiva para la optimización del histograma (Babu & Rajamani, 2016). No obstante, estos métodos, si bien logran una deter- minada eficacia, generalmente son costosos computacionalmente. Algunos ejemplos son: Papadopoulos et al., 2008; Sundarama et al., 2011; Mustra & Grgic, 2013; Sheeba et al., 2016.


Otro de los inconvenientes en el procesamiento digital de imágenes digitales de mamografía es la le necesidad de la exclusión del músculo pectoral. Ello se debe a que los niveles de intensidad que este músculo presenta, influyen en la exactitud de la segmentación de los tejidos de interés. Además, el tejido graso puede causar una sobreestimación de la densidad de la mama y algunas de las áreas glandulares densas adyacentes a este músculo, pueden ser subestimadas. La exclusión del músculo pectoral ha sido un tema muy abordado en la literatura, recurriéndose para ello a métodos elementales como los basados en las transformadas de Hough o Radon, pero que frecuentemente tienen el inconveniente de considerar que el contorno de este músculo es una línea recta. No obstante, se han propuesto métodos que se sobreponen a dicha limitación, como es la utilización de la Gabor- wavelet (Ferrari et al., 2004), la utilización de filtrado de Kalman (Yenfeng et al., 2013), o la utilización de la textura, (Bora et al., 2016). En estudios realizados por Ganesan et al., (2013) y Mustra et al. (2016), se realizan profundas revisiones del tema. Simultáneamente, Wei et al. (2016), recurren al umbralizado, tras dividir la mama en varias regiones, aplicando posteriormen te transformada de Hough. Con posterioridad Syed et al. (2017), introducen la utilización de la corrección gamma adaptativa, pero solo logran un índice Jaccar del 92,79 %. Al mismo tiempo, Rampun et al. (2017) apelan al clásico detector de bordes de Canny, luego de un pre-procesamiento, que remueve los bordes ruidosos. Recientemente Shen et al. (2018) han pro- puesto un método que combina algoritmos genéticos (GA) y algoritmos de selección morfológica (MSA) ob- teniendo una tasa promedio de falsos positivos y falsos negativos de 2,03 % y 6,9 %, respectivamente. En general, debido al posible sobre-segmentado que pueden producir muchos de los métodos publicados, aún la exactitud alcanzada por los mismos deja espacio para nuevas propuestas.


Uno de los aspectos que influyen en la temprana prevención del cáncer es la detección y clasificación de micro-calcificaciones. Debido a su pequeño tamaño, y a que en ocasiones son comparables a los artefactos presentes en las imágenes, resultan difíciles de ser detectadas. Cheng et al. analizan estas causas y exponen los diversos motivos que dificultan su detección. Entre las propuestas de soluciones puede mencionarse el trabajo (Papadopoulos et al.) que analiza el desempeño de cinco algoritmos de realce de imágenes, entre los que se destacan: Local Range Modification (LRM), con una efectividad del 93,2 % y Redundant Discrete Wavelet (RDW) con una efectividad del 92,6 %. Otra relevante solución fue propuesta por Anau et al., utilizando un sistema basado en cono- cimiento, a partir de rasgos locales extraídos utilizando un banco de filtros. Anitha et al. introducen la utilización de la transformada de contorno (contourlet transform) y redes neuronales de acoplamiento de pulsos simplificados (PCNN) para lograr una sensibilidad de 96,3 % y una especificidad de 94,7 %. Por su parte, Mehdi et al. hacen una revisión y proponen un método basado en un procesamiento dual espacial/ espectral, logrando una razón de verdaderos positivos de 97,14 % con un área bajo la curva ROC de 0,92 y una razón de falsos negativos de 0,48. En la última década, por ejemplo, se han comenzado a emplear métodos que incluyen la inteligencia artificial (López et al., 2008).


La identificación de masas es otro importante aspecto para el diagnóstico del cáncer de mama. No obstante, su identificación por sistemas CAD puede ser muy compleja cuando la masa es muy pequeña, dado que no produce un pico apreciable en el histograma de la imagen, o cuando el tejido de la mama es muy denso, como sucede principalmente en mujeres jóvenes (Abdel-Nasser et al.). Diversos métodos han sido propuestos para la identificación o segmentación de masas; entre ellos, puede mencionarse es estudio de Maitra et al., donde se introduce un esquema en dos partes que primeramente forma bloques homogéneos y posteriormente utiliza una cuantificación de las intensidades en la imagen para reducirlas a solo ocho niveles; así como el trabajo realizado por Burcin et al., quienes utilizan una combinación de la entropía de Havrda-Charvat con el método de umbralizado de Otsu, para obtener una sensibilidad del 93 %. Recientemente de Oliveira Silva et al. abordan el tema utilizando análisis de componentes principales (PCA). Así mismo, Anitha et al. proponen un umbral adaptativo de dos etapas que utiliza histograma global, basado en Histogram Peak Analysis (HPA), y umbralizado de enventanado local; obteniendo una sensibilidad promedio de 93,5 %.


En este trabajo se investigó la eficacia de una alternativa eficiente para el realce del contraste en imágenes digitales de mamografía, la cual se basa en las operaciones morfológicas en escala de grises conocidas como sombrero de copa negro y sombrero de copa blanco (Papadopoulos et al.). Estos métodos, del estado del arte, han probado su eficacia en otros con- textos. Se indagó además por la eficacia de un método de exclusión del músculo pectoral, basado en una formulación variacional geométrica del método de con- tornos activos, capaz de identificar el contorno no recto que presenta este músculo. Hasta el momento de realizar este trabajo no se había reportado la utilización de esta formulación para la segmentación del músculo pectoral, aunque sí la opción clásica de Chan- Vese para la detección del contorno de la mama (Syed et al.). Se examinó el desempeño de varios métodos de segmentación de masas basados en umbral aplicando diversos criterios de entropía, como la de Tsallis bidimensional, y varias implementaciones de la entropía de Shannon (Kapur & Sahoo, 1985; Mehmet & Sankur, 2004; Portes de Alburquerque et al., 2004; Chang et al., 2006; Prasanna & Gurdial, 2006; Chen- Chung et al., 2012; Yan et al., 2014; Naidu & Rajesh, 2017; Yu & Fan, 2017), por primera vez en el contexto de la mamografía.


MATERIAL Y MÉTODO


La Figura 1 muestra el esquema del sistema diseñado que ha incluido una etapa de evaluación de desempeño.

El sistema CAD comienza con un pre-procesamiento de la imagen que ayuda a eliminar ruido, mejorar el contraste y realzar las regiones de mayor interés. A continuación, en la fase de segmentación, se separa de la imagen la región que no corresponde al objeto de estudio. La misma es una primera aproximación para aislar las regiones sospechosas de lo que corresponde a tejido normal. En la siguiente fase, se extraen y seleccionan las características de las regiones de interés. Finalmente, se aplican técnicas para evaluar los resultados obtenidos. A continuación, se explica cada una de estas fases.

 

La finalidad del pre-procesamiento es aumentar las diferencias entre las anomalías y el tejido sano, así como eliminar de la imagen todos aquellos objetos que no sean de interés para el estudio de la mama. En este trabajo se realizó realce de bordes y eliminación de artefactos con el empleo de un filtro de convolución. Diversos kernel fueron implementados sobre cada imagen (Tzikopoulos et al.). Los kernel seleccionados, atendiendo a las recomendaciones bibliográficas, simplicidad y bajo costo computacional son los siguientes:

H1 es un kernel que resalta el brillo de los bordes de los objetos en la dirección del eje principal de la matriz H1. El kernel H2 incrementa el valor del contenido de alta frecuencia, lo cual tiene efecto sobre el realce de los bordes. H3 determina en cada píxel la segunda derivada en su entorno 3 x 3 de modo que también produce un realce de bordes y H4 es una matriz que resalta el contenido de cada píxel respecto a su entorno.

 

 

Para la implementación de la eliminación de artefactos, la imagen se considera compuesta por varios objetos: fondo oscuro, mama, etiquetas, franjas blancas, letras y números (estos cuatro últimos aparecen fundamentalmente en imágenes escaneadas). La Figura 2 muestra este problema. Se procede a identificar estos objetos; se separan unos de otros cuando hay varios solapados y se eliminan aquellos que no son de interés. En muchas ocasiones las franjas y/o etiquetas están adheridas a la imagen de la mama por líneas finas de píxeles claros (aquellos de intensidad mayor a la del fondo oscuro). Para separar estos objetos, se aplicó a la imagen un procedimiento de apertura morfológica, utilizando el mismo elemento de estructura para ambas operaciones (dilatación y erosión). En este trabajo se utilizaron dos tipos de elemento estructural morfológico. Uno de ellos es una línea de 10 pixeles de largo por un píxel de ancho con 0° de inclinación, utilizado para eliminar las líneas horizontales y el otro de igual longitud y ancho, pero con 90° de inclinación; para eliminar las líneas verticales.

En el caso de las etiquetas, cuando estas se superponen a regiones de la mama, deben ser retira- das sin afectar el objeto de estudio. Para cumplir este requisito se convirtió la imagen a binaria, escogiendo para ello, tras probar algunos métodos, el umbralizado basado en Laplaciano (Mehmet & Sankur). Para identificar y separar las etiquetas, se utilizó un procedi- miento de apertura de áreas binarias sobre las com- ponentes conexas. Con estos procedimientos se identificó el objeto de interés (mama) que es el de mayor número de pixeles en área.


Para segmentar la glándula se utilizaron diversos métodos de segmentación mediante umbralizado de simple nivel (bi-clase) basados en la entropía, admitiendo que el histograma de toda la imagen, una vez normalizado con respecto a la cantidad de pixeles que esta posee, es una distribución de probabilidad de cada una de las intensidades que posee la ima- gen. De esta forma, una vez binarizada la imagen, la suma de las entropías del primer plano (objetos) y el fondo, es igual a la entropía en toda la imagen. Los métodos de umbralizado basados en entropía utilizados en este trabajo fueron:


· La implementación del concepto de la máxima entropía (ME), a partir de la definición clásica de entropía enunciada por Shannon (Kapur & Sahoo).

· La versión mejorada del método de ME propuesto por Kapur, (Yan et al.). Esta emplea un proceso de optimización en dos pasos en el cual, el primero de ellos estima un umbral inicial, siendo reajustado en el segundo paso, mediante la maximización de la expectación.

· La implementación bidimensional, en el umbralado de imágenes, introducida por Sahoo y Arora en 2006 (Prasanna & Gurdial) a partir de la entropía de Tsallis. Esta definición de entropía es una generalización de la de Shannon, a sistemas físicos no extensivos, es decir, a aquellos cuya entropía total no cumple con el principio de la aditividad, siendo dependiente de un parámetro de control. Al ser implementada la entropía de Tsallis de forma bidimensional por medio de un histograma en dos dimensiones, una de las cuales es la distribución de probabilidades de las intensidades de los píxeles en la imagen y la otra las variaciones locales de la intensidad promedio alrededor de cada píxel de la imagen, se logra un umbral que tiene en cuenta tanto los aspectos globales como locales en la imagen.


Para determinar los umbrales óptimos se consultó la opinión de una radióloga, con más de 10 años de experiencia. Es decir, una vez realizada la segmentación de la glándula por cualquiera de los métodos de entropía descritos, se le realizó un ajuste fino, a partir del criterio médico. El ajuste consistió en modificar el umbral, multiplicándolo por un factor k, con va- lores entre 0,8 y 1,05, que garantizara que la glándula segmentada tuviese una apariencia verdaderamente ajustada al criterio médico. Luego se realizó un re- ajuste de la imagen, donde se extendieron los pixeles a toda la escala de gris, mediante un ensanchamiento del histograma, para obtener un mayor contraste y realzar aún más los objetos de interés.


Se utilizó el filtrado morfológico en escala de grises para el realce de microcalcificaciones, teniendo en cuenta distinguir entre estructuras relevantes e irrelevantes. Se escogió el filtrado morfológico, ya que como cualidad tiene la de distinguir en las imágenes las estructuras de acuerdo con su morfología y tamaño. En este caso, los rasgos geométricos en la ima- gen que sean similares en forma y tamaño al elemento estructural morfológico seleccionado se realzan, mientras que los otros se preservan. En las imágenes utilizadas, una mama con microcalcificaciones presenta diminutas agrupaciones de pixeles brillantes, con forma de diamante o disco de aproximadamente 3 ó 4 pixeles de radio. Se parte entonces de localizar en la imagen ya reajustada, de la glándula y tejido graso, todos aquellos objetos con características similares en forma y tamaño a dichas microcalcificaciones. Para ello, se aplica una dilatación en escala de grises, ya que la imagen es de fondo negro con objetos claros. Se escoge un elemento estructural morfológico de geometría circular con tres pixeles de radio y cima plana para aumentar el tamaño de estos objetos y hacerlos más brillantes. El tamaño del elemento estructural morfológico dependió de la resolución de la imagen, que en el presente caso son de 1024 x 1024 pixeles. Sea A[x,y] la imagen y e[u,v] el strel, los operadores morfológicas en escala de grises correspondientes a la erosión, representada mediante θ, así como la dilatación, representada mediante ⊕, están definidos por las ecuaciones (1) y (2), respectivamente:

El operador de erosión se utilizó para reducir el tamaño de los objetos claros, incrementar el tamaño de los puntos o regiones oscuras y eliminar los pequeños detalles claros. De esta forma, los objetos brillantes menores que el elemento estructural fueron eliminados, luciendo la imagen resultante más oscura que la original. El operador de dilatación es el dual de la erosión, incrementando el tamaño de las regiones claras y disminuyendo el tamaño de los objetos y las regiones oscuras en la imagen.

 

El operador de apertura morfológica, representado mediante Ο, se define como el resultado de la aplicación de una erosión seguido de una dilatación con el mismo elemento estructural morfológico, mien- tras el operador cierre morfológico, representado mediante , actúa en orden inverso de las operaciones. Las expresiones para la apertura y el cierre morfológicos son las dadas en (3) y (4), respectivamente:

De esta manera, la apertura morfológica en escala de grises eliminó las conexiones débiles entre los objetos y los pequeños detalles que podían considerarse artefactos dentro de las imágenes, mientras que el cierre morfológico en escala de grises eliminó las pequeñas regiones oscuras y realzó los canales finos correspondientes, en este caso, a los conductos en las mamas.

 

 

Para realzar en la imagen el contraste entre los objetos identificados, primeramente se utilizaron las transformaciones morfológicas en escala de grises denominadas: sombrero de copa blanco (white top-hat) dada en la ecuación (5) y sombrero de copa negro (black top-hat) dada en la ecuación (6).

Las operaciones anteriores pueden combinar- se para lograr un incremento del contraste entre las zonas claras y las oscuras de una imagen, en lo que se conoce en literatura en lengua inglesa como Morphological Contrast Enhancement (MCE). El MCE sobre la imagen A[x,y] está dado por la expresión (7):

Para el realce de masas, sin embargo, fue imprescindible, además, determinar primero la forma y el tamaño del elemento estructural morfológico. En este trabajo se utilizó un elemento estructural en forma de disco con cima plana, debido a que es omnidireccional, produciendo un resultado que es independiente de la orientación de la masa. El tamaño de dicho elemento de estructura debe ser dependiente de los objetos sobre los que se desea actuar dentro de la imagen. Para ello se implementó un procedimiento iterativo basado en incrementar paulatinamente en un píxel el diámetro del elemento estructural en cada iteración, determinando en cada caso el valor de la relación de incremento de contraste (CIR por sus siglas en idioma inglés), hasta obtener un resultado óptimo. Se entiende como óptimo, el de mayor contraste (Burcin et al.).

 

En escala de grises, el contraste imagen está determinado por la diferencia en intensidad de pixeles del objeto de interés y sus alrededores. Para esto se utilizaron dos diferentes ventanas concéntricas deslizantes, centradas en cada píxel de la imagen, una de 3 x 3 pixeles, que determina el valor de p, que es el promedio de intensidad en la zona central limitada por esta ventana, y otra de 7 x 7 píxeles, que permite determinar el valor de q, que es la intensidad promedio en la región periférica limitada entre ambas ventanas. Con estas intensidades promedio se obtiene la imagen del contraste local C[x,y], dado por la expresión (8), el cual varía en el rango [0, 1]:

Finalmente, el CIR entre la imagen original y la realzada se calculó por la ecuación (9):

Donde R es la región de interés, mientras que C y Cˆ son los contrastes locales en la imagen original y realzada respectivamente.

 

 

El método implementado utilizó un elemento estructural morfológico inicial con forma de disco de ra- dio de 20 pixeles. En cada iteración se calculó el CIR correspondiente, que determina la calidad de imagen en términos de contraste. El proceso termina cuando el CIR de una iteración sea menor que el de la anterior, quedando determinado el elemento estructural morfológico óptimo para el incremento del contraste en la imagen de entrada.

 

 

El tejido pectoral brinda información valiosa para la interpretación del radiólogo, ya que en él pueden presenciarse otras patologías del paciente como ganglios dudosos. Sin embargo, el tejido pectoral in- fluye en la determinación del elemento estructural morfológico idóneo para el realce de contraste en el resto de la imagen, por lo que en el sistema CAD pro- puesto se requiere que sea retirado. Para ello se pro- cede a segmentar el mismo.

 

 

Para segmentar el tejido pectoral primeramente se requirió realzar esta región. En la mayoría de los casos la misma es más brillante que el resto de las regiones de la imagen, sobre todo en la parte superior y luego va descendiendo en intensidad hacia el centro de la mama. Para ejecutar este paso, se aplicó un re- alce utilizando la ecuación (8) de forma iterativa, con un elemento estructural con forma de diamante hasta encontrar que el óptimo fue de 150 pixeles de radio y cima plana para todas las imágenes de mama.

 

 

Una vez realzado el músculo pectoral, se realizó una segmentación preliminar del mismo. Para esto se aplicaron los métodos de umbralado basados en entropía descritos anteriormente, seleccionándose el método que produjo el mayor umbral de todos, que es el que permite segmentar la zona más clara. De esta forma, se obtiene una región triangular que se utiliza como contorno inicial para el siguiente paso. Este consiste en la aplicación de una segmentación basada en contornos activos. Partiendo del contorno inicial, se aplicó un proceso de erosión para eliminar de los alrededores del tejido pectoral resaltado y segmentado, los pequeños conglomerados de pixeles que obstaculizan el siguiente paso. Se utilizó en este caso un elemento estructural morfológico en forma de disco de 5 pixeles de radio. En el siguiente paso, se procedió a encerrar la región realzada, segmentada y sin obstáculos, en una subregión de imagen, con el objetivo de que solo contuviera tejido pectoral. Para esto se de- terminan dos puntos del borde superior del contorno y se trazó una recta, donde n es el intercepto con el borde superior de la imagen y m la pendiente, de forma tal que el tejido pectoral quede completamente encerrado.

 

El siguiente paso consistió en aplicar la formulación variacional geométrica del método de contornos activos (Chan & Vese, 2001), propuesta en (Li et al., 2005). Esta, en nuestro caso, tiene como finalidad encerrar la región pectoral que se encuentra dentro de la subregión seleccionada de la imagen, explicada en el párrafo anterior. Esta variante del método de Chan-Vese posee la ventaja de obligar a la función de ajuste de nivel a estar cerca de la función de signo de distancia, eliminando la necesidad del costoso proceso de reinicialización. Como resultado se obtiene el músculo pectoral completamente segmentado, como se apreciará en la sección de resultados.

 

Para probar el sistema CAD diseñado, se trabajó con 322 imágenes de la base de datos (BD) desarrollada por la Mammographic Image Analysis Society (MIAS), conocida como MiniMammographic obtenida libremente de internet. Las imágenes tienen una resolución de 1024 x 1024 pixeles cada una, en proyección medio lateral oblicua (MLO) derecha o izquierda. Se trata de una BD anotada con una descripción específica de lesiones presentes. Aunque es una base de datos de referencia, sus imágenes se obtuvieron escaneando radiografías, proceso que afecta el contraste (Mustra & Grgic; Bora et al.) introduce ruido (Tzikopoulos et al.) y pequeños artefactos (Maitra et al.), además del ruido original proveniente del grano del receptor fílmico y del introducido durante su revelado químico. El software utilizado para programar el sistema fue Matlab 2015 y su Toolbox de pro- cesamiento de imágenes.

 

Para evaluar subjetivamente el desempeño del sistema CAD se seleccionaron 115 imágenes, correspondientes a vistas laterales oblicuas de mamas derechas e izquierdas, de la BD original. Estas imágenes constituyen un abanico que contempla todas las anomalías que se desea identificar en este trabajo, mientras que evitan la fatiga visual del radiólogo utilizado para el análisis subjetivo, tarea que por demás es altamente consumidora de tiempo.

 

Entre las 115 imágenes seleccionadas, 30 pre- sentaban microcalcificaciones; de ellas 9 eran imágenes correspondientes a mamas glandulares, 15 glandulares-densas y 6 predominantemente adiposas. Otras 41 imágenes presentaban masas, 18 espiculadas y 23 circunscritas. De las espiculadas, había 6 imágenes de mamas glandulares, 7 glandulares-densas y 5 predominantemente adiposas. De las circunscritas, había 7 imágenes de mamas glandulares, 3 glandulares-densas y 13 predominantemente adiposas. Además, se incluyeron 44 imágenes nor- males, correspondientes a mamas sanas; de ellas, 15 eran glandulares, 16 eran glandulares-densas y 13 pre- dominantemente adiposas. En cada imagen se seleccionó una región normal o anormal, para realizar una tarea de observación forzada, aprovechando la anotación de la DB.

 

Las imágenes originales se mostraron de for- ma consecutiva sobre un visor (XnViewMP) y este sobre una computadora i3 con resolución 1600 x 900 pixeles. El ejercicio se realizó en una habitación con iluminación tenue (menos de 25 lux) con una visualización variable entre 20 cm y 40 cm de la pantalla, según el criterio de confort de la radióloga para cada imagen. La radióloga fue forzada a observar para cada imagen y sin información previa, la región selecciona- da de la BD, de la cual se conoce con exactitud si se corresponde con una región normal, una masa o zona de microcalcificaciones.

 

Una vez que la radióloga diagnostica la zona (en normal, microcalcificación o masa), se le muestra la misma imagen procesada por el sistema CAD pro- puesto, con los diversos resultados o salidas que este ofrece. La radióloga verifica si el sistema confirma su diagnóstico, si este puede ser mejorado cuando el sis- tema ofrece resultados que no se aprecian a simple vista, o cuando el sistema ofrece resultados que no son ciertos o que no se pueden verificar. En el futuro esta etapa, que ahora se utiliza para evaluar desempeño de forma subjetiva, se convierte en etapa de apoyo al diagnóstico a partir de las imágenes que el sistema procesa y mejora.

 

Para evaluar cuantitativamente el sistema diseñado se compararon los resultados subjetivos que la radióloga aprecia a partir de ver las imágenes procesadas con el sistema propuesto (o sea su segundo momento de visualización de las imágenes), contra la anotación de la BD. Se contabilizaron el número de verdaderos positivos (Vp), que son lesiones detecta- das sobre la imagen procesada de salida del sistema, ya sea masas o microcalcificaciones, y que la BD informa como positivas, verdaderos negativos (Vn), que son imágenes donde no hay lesiones apreciables en la imagen procesada y que se reportan también como imágenes normales en la BD, falsos positivos (Fp), que son imágenes donde la radióloga aprecia una o varias lesiones pero que la BD informa como normales, y falsos negativos (Fn), que son imágenes donde la radióloga no aprecia ninguna lesión cuando en la BD sí se declaran. A partir de estos elementos, se calcularon los siguientes indicadores objetivos de des- empeño del sistema CAD:

AUC significa área bajo la curva “Reciving Operating Characteristic” que representa reales positivos vs falsos positivos. 

 

RESULTADOS


Fueron implementados los kernel (H1, H2, H3, H4) que producen diferentes efectos sobre la imagen como son: realzar los pequeños detalles, los bordes y aumentar intensidad en la escala de gris, para generar una mejoría preliminar en el contraste imagen, sin afectar otros detalles importantes como la textura de la mama o generar ruido. Se observó que H4 ofreció los mejores resultados y fue el seleccionado para convolucionar con las imágenes. Esta decisión se toma a partir del criterio subjetivo de la radióloga experta, buscando no solo que existiera buen contraste, sino buena resolución espacial y no se incrementara sensiblemente el ruido en las imágenes. Los resultados se mantienen independientemente del tipo de mama (grado de glandularidad) y del tipo de lesión que incluyen. La Figura 3 muestra una imagen pre-procesada con el kernel H4. En la siguiente etapa se eliminaron de las imágenes los artefactos (Fig. 4).


Los tres métodos de umbralizado empleados, basados en entropía, ofrecieron diversos resultados, en unos se sobre-segmenta y en otros se deja pasar mucho tejido extra. Por tanto, estos métodos se promediaron, obteniéndose una segmentación que es una combinación de todos con buenos resultados (Fig. 5). Como se puede observar en esta figura, el histograma de la imagen no es bimodal, por lo que no hay una clara definición de lo que es primer plano y fondo en la imagen. Esta es la principal razón por la que se recurre a métodos basados en la entropía, ya que no dependen de la forma del histograma, como ocurre para los métodos clásicos. Además, obsérvese la poca dispersión entre los resultados de los tres métodos.

Posteriormente, se realizó el ajuste fino. Los valores del coeficiente de corrección para obtener la segmentación fina, basado en el criterio médico, es-tuvieron entre 0,8 – 1,05. Una vez segmentada la glándula, se reajusta (Fig. 6) para que la imagen ocupe todo el rango de niveles de gris (Fig. 7). Así, los pixeles de menor intensidad, que suponen parte de las regiones de menor interés, ocuparán el espacio de menor intensidad en la escala de grises, y los pixeles de mayor intensidad, que ocupan las regiones de más interés, mantienen su intensidad. Se genera así, un mayor contraste entre las regiones de interés y el tejido sano.


La Figura 8 nos muestra el resultado de la aplicación del filtrado morfológico para el realce de microcalcificaciones. Puede verse una mama glandular densa, donde, según la anotación de la BD, contiene microcalcificaciones. Sin embargo, se puede apreciar que estas no son fácilmente visibles en la imagen original para la observación médica. Cuando esto sucede en la práctica clínica, los radiólogos declaran la imagen no útil para diagnóstico, y recomiendan acudir a otras técnicas para hacer lo mismo. Sin embargo, se puede apreciar, cómo las micro-calcificaciones aparecen resaltadas (Fig. 8C), a partir de los resultados del sistema CAD propuesto. La dilatación morfológica, aumentó el tamaño de las micro-calcificaciones con el objetivo de enfocar la visualización y localización de estas anomalías por parte del personal médico; siendo este uno de los aspectos de mayor utilidad del sistema propuesto, ya que significa un apoyo al diagnóstico.

Seguidamente, el tejido pectoral fue eliminado conjugando filtros morfológicos, métodos de segmentación global por umbral y método de contornos activos. La Figura 9 muestra toda la secuencia de procesamiento de una imagen hasta este punto.

 

Para detectar masas se aplicaron transformaciones morfológicas para incrementar el contraste de las imágenes médicas. En la Figura 10 se muestra la imagen original de una mama glandular que contiene una masa circunscrita. El resto de las imágenes muestran el progreso del algoritmo, mostrándose el incremento de contraste, hasta llegar al resultado final.


Para la optimización del CIR se realizó el pro- ceso iterativo explicado. La Figura 11 muestra que este alcanza su punto máximo en 14 iteraciones, comenzando a descender a partir de ese punto.


Finalmente, en la Figura 12 se observa otra posibilidad que ofrece el sistema CAD propuesto, que es mostrar solo la segmentación de la lesión. Para esto se utilizó el método basado en la entropía de Tsallis (Naidu & Rajesh, 2017), multiplicado por un factor k = 1,02.


A continuación, se muestran los resultados de desempeño del sistema en la Tabla I, por comparación del diagnóstico dado por la radióloga a partir de observar las imágenes procesadas con el sistema CAD propuesto, con respecto a la anotación de la base de datos, a partir de 115 imágenes evaluadas.

DISCUSIÓN

 

Se debe resaltar que 41 de las 115 imágenes incluidas en este análisis, son correspondientes a mamas glandulares-densas, las cuales son de muy difícil diagnóstico y en la mayoría de los casos los radiólogos no pueden llegar a una conclusión a partir de la simple inspección de las imágenes mamográficas. Esto induce, a pensar que los resultados que ofrece el sistema contribuyen significativamente a mejorar el diagnóstico, por lo que pueden considerarse buenos.


Dentro de los falsos positivos detectados, dos se correspondieron con mamas glandulares densas. Cuando esto sucede en la práctica del diagnóstico, el radiólogo sospecha que la compresión de la mama generó un artefacto, que debe de verificar si se aprecia en la imagen cráneo caudal. Si no se aprecia lesión en esa imagen, entonces lo observado en la ima- gen lateral oblicua se considera un falso positivo, es decir, la lesión no existe. Sin embargo, en la evaluación realizada del sistema CAD propuesto, no se ha incluido aún esta posibilidad, porque la base de da- tos utilizada no incluye los dos tipos de imágenes. Esto nos induce a pensar, que si el sistema se evalúa con esta posibilidad, todos los indicadores podrían mejorar.


Por otra parte, 37 imágenes fueron correspondientes a mamas glandulares. Entre estas hubo un falso negativo, correspondiente a una micro-calcificación. Esto implica que el sistema pudiera ser ajustado en cuanto a los umbrales de los métodos de segmentación empleados para lograr detectar aún más micro- calcificaciones, o incluir otros métodos de segmentación. Además, hubo cuatro falsos positivos en mamas que, según la BD, eran normales. En este caso, para ajustar el sistema se requiere una BD con imágenes cráneo caudales que sirva para verificar si hay o no una lesión real. El sistema arrojó también dos falsos negativos en masas espiculadas.


En el caso de las imágenes con tejido predominantemente adiposo, el sistema arrojó un Fn. Además, hubo un Fn en masa circunscrita, que sugiere el refinamiento del método de segmentación empleado.


El AUC presentó un valor de 89,2 %. En la medida en que los falsos positivos bajan, aumenta la sensibilidad del sistema y el área bajo la curva. El valor obtenido en esta evaluación se considera bueno y con tendencia a mejorar, cuando se evalúe el sistema con una base de datos que incluya imágenes cráneo-caudales.


En los estudios de López et al. por ejemplo, utilizaron 100 casos de la misma BD usada en este artículo, pero bajo el paradigma de la inteligencia artificial; los autores obtuvieron 94 verdaderos positivos, cuatro falsos positivos y dos falsos negativos. Abdel- Nasser et al. utilizaron tres algoritmos diferentes, usan- do machine learning con 161 imágenes de la BD MIAS para clasificar lesiones de mama, empleando cinco valores distintos de tamaño de píxel y cinco métodos de análisis de texturas, obteniendo valores de AUC entre 40 y 78 %. Anitha et al. utilizaron el umbralado adaptativo y 170 imágenes de la BD MIAS y obtuvieron una sensibilidad del 93 % y una tasa de 0,62 falsos positivos (microcalcificaciones) por imagen. Mehdi et al. utilizaron segmentación de la glándula en las 322 imágenes de la BD MIAS por el método de Otsu, umbralizado con enfoque Wavelet y detección median- te Entropía de Tsallis unidimensional, obteniendo va- lores de AUC entre 87 y 92 %. Mehdi et al. utilizaron nuevamente las 322 imágenes de la BD MIAS para detectar masas, empleando un algoritmo de conglomerados de k-medias y análisis de componentes principales para clasificación; obtuvieron una exactitud del 92,7 % en mamas no densas y un 79,17 % en mamas densas, además, cinco falsos positivos y dos falsos negativos para cada tipo de mama. En este sentido, podemos afirmar que los resultados del sistema CAD propuesto se encuentran en el entorno de los reporta- dos por otros autores empleando otros métodos de segmentación-detección y/o clasificación, para la mis- ma BD.


Debemos añadir que, como trabajo en progre- so, se desarrolla en la actualidad una etapa de clasificación, a partir de los resultados que se reportan en este artículo, utilizando algoritmos de Deep learning, que mejorarán también la detección correcta en el sis- tema CAD propuesto.


El tiempo de cómputo por imagen depende principalmente de las etapas iterativas, que son el ajuste de contraste basado en sombrero de copa y la segmentación mediante contornos activos basada en Chan-Vese. No obstante, todos los cálculos estuvieron por debajo de los 30 segundos, en una computa- dora laptop común, con un procesador Intel P6, con 6 GB de RAM; por lo que el sistema CAD propuesto se considera eficiente y puede usarse en condiciones de rutina clínica para facilitar el diagnóstico.


CONCLUSIONES


Se creó un sistema CAD que permite auxiliar el diagnóstico de lesiones mamarias por el radiólogo. El mismo, permite preprocesarar las imágenes realzan- do sus estructuras con el empleo de un kernel de convolución H4, que aumenta la resolución espacial sin introducir exceso de ruido. El sistema CAD permite eliminar todos los arte- factos sobre la imagen a partir de la combinación de la segmentación por el método del Laplaciano, la apertura de áreas binarias y la determinación de componentes conexas binarias.


La glándula mamaria fue segmentada satisfactoriamente a partir del promedio de tres métodos de umbralización global, basados en criterios de entropía y reajuste de imagen.


Las microcalcificaciones fueron detectadas adecuadamente a partir de filtrado morfológico. Las masas fueron detectadas satisfactoriamente a partir de implementar un método iterativo para el mejoramiento del contraste de imagen, con la segmentación pre- via del tejido pectoral mediante un método de contornos activos.


El sistema CAD propuesto presentó indicadores de desempeño por encima del 90 %.


AGRADECIMIENTOS


Los autores agradecen el apoyo y experiencia en radiología de la Dra. Marila Martínez Fortún, del Hospital Universitario Arnaldo Milián de Santa Clara, Cuba.

SÚAREZ, A. E. D; PÉREZ, D. M. & OROZCO, M. R. Automated system design to detect anomalies in digital images of the breast. J. health med. sci., 5(4):229-243, 2019.

 

ABSTRACT: X-ray mammography is the diagnostic test preferred for early breast cancer detection. However, the lesions are not easy to detect, due to the small differences in image contrast with the surrounding tissue. Computer-aided detection (CAD) systems are a tool for helping radiologists in the diagnosis. A CAD system, is proposed, which improves image quality, segments the mammary gland and detects microcalcifications and masses. The following methods were implemented: Laplacian segmentation, opening of binary areas, determination of binary related components, global thresholding based on entropy, morphological filtering, iterative methods for the improvement of image contrast and segmentation using an active contour method. The system was tested with the MIAS annotated database (DB) inside oblique views, which contained images of glandular, glandu- lar-dense and predominantly adipose, all injured or healthy breasts. The system was evaluated in terms of its performance concerning the DB annotation, for a sample of 115 images. A sensitivity of 93.2 %, a specificity of 85.3 %, accuracy of 90.4 % and precision of 92 %, were obtained.


KEY WORDS: mammography, microcalcification, mass, computed aided detection systems, digital image processing.

REFERENCIAS BIBLIOGRAFICAS

  • Abdel-Nasser, M.; Melendez, J.; Moreno, A. & Puig, D. The impact of pixel resolution, integration scale, preprocessing, and feature normalization on texture analysis for mass classification in mammograms. Int. J. Opt., 2016, ID 1370259:1-12, 2016.
  • Abdulkader, H. & Abiyev, R. Shape and texture features for the identification of breast cancer. Proceedings of the World Congress on Engineering and Computer Science, 2016.
  • Anitha, J.; Dinesh, P. & Pandian, I. A dual stage adaptive thresholding (DuSAT) for automatic mass detection in mammograms. Comput. Methods Programs Biomed., 138:93-104, 2017.
  • Arnau, O.; Torrent, A.; Llado, X.; Tortajada, M.; Tortajada, L.; Sentis, M. Freixenet, J. & Zwiggelaar, R. Automatic microcalcification and cluster detection for digital and digitised mammograms. Knowl. based syst., 28(4):68-75, 2012.
  • Babu, P. & Rajamani, V. Evolutionary Algorithm Based Optimized Histogram Modification for Contrast Enhancement of Mammogram Images. J. med. imag. health in., 6(2):518-25, 2016.
  • Burcin, K.; Vasif, V. & Turhan, K. A novel automatic suspicious mass regions identification using Havrda & Charvat entropy and Otsu’s N thresholding, Comput. Methods Programs Biomed., 114(3):349-60, 2014.
  • Bora, V.; Kothari, A. & Keskar, A. Robust automatic pectoral muscle segmentation from mammograms using texture gradient and euclidean distance regression. J. Digit. Imaging, 29(1):115-25, 2016.
  • Chan, F. & Vese, L. Active Contours without Edges. IEEE Trans Image Process., 10(2):266-77, 2001.
  • Chang, C.; Du, Y.; Wang, J.; Guo, S. & Thouin, P. Survey and comparative analysis of entropy and relative entropy thresholding techniques. IEE p-vis. image sign., 153(6):837-50, 2006.
  • Cheng, H.; Xiaopeng C.; Xiaowei, C.; Liming, H. & Xueling, L. Computer-aided detection and classification of microcalcifications in mammograms: a survey. Pattern Recognit., 36(12):2967-91, 2003.
  • Chen-Chung, L.; Chung-Yen, T.; Jui, L.; Chun-Yuan, Y. & Shyr- Shen, Y. A pectoral muscle segmentation algorithm for digital mammograms using Otsu thresholding and multiple regression analysis. Comput. Math. Appl., 64(5):1100-7, 2012.
  • Li, C., Xu, C., Gui, C., & Fox, M.D. Level set evolution without re- initialization: A new variational formulation. Proceedings of the 2005 IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR’05), 430-6, 2005.
  • de Oliveira Silva, L.; Barros, A. & Lopes, M. Detecting masses in dense breast using independent component analysis. Artif. Intell. Med., 80(7):29-38, 2017.
  • Ferrari, R.; Rangayyan, R.; Desautels, J.; Borges, R. & Frère, A. Automatic identification of the pectoral muscle in mammograms. IEEE trans. med. Imaging, 23(2):232-45, 2004.
  • Ganesan, K.; Acharya, U.; Chua, K.; Min, L. & Abraham, K. Pectoral muscle segmentation: a review. Computer Methods Programs Biomed., 110(1):48-57, 2013.
  • Guo, Y.; Dong, M.; Yang, Z.; Gao, X.; Wang, K.; Luo, C.; Ma, Y. & Zhang, J. A new method of detecting micro-calcification clusters in mammograms using contourlet transform and non-linking simplified PCNN. Comput. Methods Programs Biomed.,130(7):31-45, 2016.
  • Kapur, J. & Sahoo, P. A new method for gray-level picture thresholding using the entropy of the histogram. Comput. vis. graph. image process., 29(3):273-85, 1985.
  • López, Y.; Novoa, A.; Guevara, M.; Quintana, N. & Silva, A. Computer aided diagnosis system to detect breast cancer pathological lesions. Proceeding CIARP ’08 Proceedings of the 13th Iberoamerican congress on Pattern Recognition: Progress in Pattern Recognition, Image Analysis and Applications. 453-60, 2008.
  • Maitra, I.; Sanjay, N. & Kumar, S. Identification of Abnormal Masses in Digital Mammography Images. Int. J. Comput. Graph., 2(1):17- 30, 2011.
  • Mehdi, M.; Gargouri, N.; Damak, A.; Sellami D. & Abid, R. An efficient microcalcifications detection based on dual spatial/spectral processing. Multimed. Tools Appl., 76(11):13047-65, 2017.
  • Mehmet, S. & Sankur, B. Survey over image thresholding techniques and quantitative performance evaluation. J. electron. imaging, 13(1):146-68, 2004.
  • Mustra, M. & Grgic, M. Robust automatic breast and pectoral muscle segmentation from scanned mammograms. Signal Process., 93(10):2817-27, 2013.
  • Mustra, M.; Grgic, M. & Rangayyan, R. Review of recent advances in segmentation of the breast boundary and the pectoral muscle in mammograms. Med. Biol. Eng. Comput., 54(7):1003-24, 2016.
  • Naidu, M. S. R. & Rajesh, P. K. Tsallis entropy based image thresholding for image segmentation. In: Behera H., Mohapatra D. (eds) Computational Intelligence in Data Mining. Advances in Intelligent Systems and Computing, Vol. 556. Springer, Singapore, 2017.
  • Organización Panamericana de la Salud (OPS). El cáncer de mama en las Américas. Organización Panamericana de la Salud. Nota informativa cáncer de mama, 2014. Disponible en https:// www.paho.org/hq/dmdocuments/2014/OPS-Nota-Informativa- Cancer-Mama-2014.pdf.
  • Papadopoulos, A.; Fotiadis, D. & Costaridou, L. Improvement of microcalcification cluster detection in mammography utilizing image enhancement techniques. Comput. Biol. Med. 38(10):1045-55, 2008.
  • Perez-Diaz, M. Techniques to evaluate the quality of medical images. AIP Conference Proceedings 1626:39-45, 2014.
  • Portes de Albuquerque, M.; Esquef, I. & Gesualdi, A. Image
    thresholding using Tsallis entropy. Pattern Recogn. Lett.,
    25(9):1059-65, 2004.
  • Prasanna, K. & Gurdial, A. Image thresholding using two-dimen-
    sional Tsallis–Havrda–Charvát entropy. Pattern Recogn. Lett.,
    27(6):520-8, 2006.
  • Rampun, A.; Morrow, P.; Scotney, B. & Winder, J. Fully automated
    breast boundary and pectoral muscle segmentation in
    mammograms. Artif. Intell. Med., 79:28-41, 2017.
  • Sheeba, J.; Parasuraman, S. & Kadirvelu, A. Contrast enhancement and brightness preserving of digitalmammograms using fuzzy clipped contrast-limited adaptive histogram equalization algorithm. Appl. Soft Comput.,
    42(5):167-77, 2016.
  • Shen, R.; Yan, K.; Xiao, F.; Chang, J.; Jiang, C. & Zhou, K.
    Automatic pectoral muscle region segmentation in mammograms using genetic algorithm and morphological selection. J. Digit. Imaging, 31(5):680-91, 2018.
  • Sundarama, M.; Ramar, K.; Arumugam, N. & Prabin, G. Histogram Modified Local Contrast Enhancement for Mammogram Images. Appl. Soft. Comput., 11(8):5809-16, 2011.
  • Syed, J.; Gardezi, F.; Ibrahima, F.; Nidal, K. & Eltoukhy, M. Segmentation of pectoral muscle using the adaptive gamma corrections. Multimed. Tools Appl., 1-22, 2017.
  • Tzikopoulos, S. D.; Mavroforakis, M. E.; Georgiou, H. V.; Dimitropoulos, N. & Theodoridis, S. A fully automated scheme for mammographic segmentation and classification based on breast density and asymmetry. Comput. Methods Programs Biomed., 102(1):47-63, 2012.
  • Yan, H.; Liu, J.; Yang, D. & Wang, P. An Improved Algorithm of the Maximum Entropy Image Segmentation. In: 2014 Fifth International Conference on Intelligent Systems Design and Engineering Applications, 157-60, 2014.
  • Yanfeng, L.; Houjin, C.; Yongyi, Y. & Yang, N. Pectoral muscle segmentation in mammograms based on homogenous texture and intensity deviation. Pattern Recognit., 46(3):681-91, 2013.
  • Yu, H. & Fan, J. A novel segmentation method for uneven lighting image with noise injection based on non-local spatial information and intuitionistic fuzzy entropy. EURASIP. J. Adv. Signal Process., 74, 2017.
  • Wei C.; Gwo, C. & Huang, P. Identification and segmentation of obscure pectoral muscle in mediolateral oblique mammograms, Br. J. Radiol., 89(1062):ID: 20150802, 2016.

Comunícate con nosotros

Sitios de interés