Este proyecto utiliza redes neuronales convolucionales (CNN) para clasificar imágenes de diferentes tipos de lesiones de piel. Con un enfoque en la detección temprana de condiciones graves como el melanoma, el modelo puede ayudar a los médicos a priorizar y clasificar lesiones sospechosas, agilizando el proceso de triaje y derivación.
- Kevin Camilo Gómez González
En 2022, se reportaron más de 1.5 millones de nuevos casos de cáncer de piel a nivel mundial, de los cuales 324,635 fueron melanoma maligno, resultando en 57,043 muertes. En Colombia, el Instituto Nacional de Cancerología reportó 1,062 nuevos casos de cáncer de piel, afectando especialmente a regiones como Bogotá, Cundinamarca, Boyacá, Tolima y Meta.
El objetivo principal del proyecto es desarrollar un modelo CNN que clasifique imágenes de lesiones de piel en 9 categorías dermatológicas mediante técnicas de augmentación de datos, balanceo de clases y transfer learning, mejorando la precisión en la clasificación de condiciones dermatológicas.
- Aplicar transfer learning en modelos preentrenados para la clasificación de imágenes dermatológicas.
- Implementar augmentación y balanceo de datos para mejorar la representatividad de cada clase.
- Evaluar el rendimiento del modelo en un conjunto de datos de prueba.
El dataset utilizado es el "Skin Cancer 9 Classes (ISIC)" de Kaggle:
- Descripción: Imágenes de lesiones cutáneas en 9 categorías dermatológicas.
- Cantidad de Imágenes: Aproximadamente 23,000 imágenes.
- Desafíos: Desbalance de clases y variabilidad en la calidad de las imágenes.
- División de los datos en conjuntos de entrenamiento, validación y prueba.
- Flujo de datos generado a partir de carpetas de imágenes.
- Modelo base: ResNet50 preentrenado, adaptado mediante transfer learning.
- Preprocesamiento de imágenes: redimensionado a 224x224 píxeles y augmentación de datos (rotación, zoom, volteo).
- Balanceo de clases mediante la creación de datos sintéticos usando la librería Augmentor.
- Entrenamiento con optimización Adam y función de pérdida de entropía cruzada categórica.
- Validación en cada época para monitorear rendimiento.
- Uso de dropout y augmentación adicional para reducir sobreajuste.
- Evaluación final en datos de prueba para medir precisión y pérdida.
Incluye gráficos de precisión y pérdida a lo largo de las épocas de entrenamiento y validación, así como un análisis de rendimiento del modelo en cada clase.
- American Cancer Society: Skin Cancer Risk Factors
- Kaggle - Skin Cancer ISIC Dataset
- Barrera-Valencia, C., & Perea-Flórez, E. X. (2024). Telemedicine and e-Health, 30(7), e2087-e2095. DOI
- Instituto Nacional de Cancerología (INC), Bogotá, D.C.: Anuario estadístico 2022.