Resumen de la tesis que presenta Juan Miguel Armenta Cano como requisito parcial para la obtención
del grado de Maestro en Ciencias en Ciencias de la Computación
Aplicación de técnicas de aprendizaje de máquina para la clasificación del uso y cubierta del terreno a partir de imágenes de satélite
Resumen aprobado por:
|
M. en C. José Luis Briseño Cervantes
Director de tesis
|
Resumen en español
El presente trabajo analiza el desempeño de diferentes algoritmos de Aprendizaje de Máquina aplicados a la clasificación del Uso y Cubierta del Terreno (LULC, por las siglas del término en inglés, Land Use and Land Cover) en la región de pruebas, Ensenada Baja California, utilizando imágenes satelitales Landsat 5 TM y Landsat 8 OLI correspondientes a los años 1985, 2005 y 2024. El objetivo principal fue evaluar la exactitud, eficiencia y capacidad de generalización de los clasificadores K-Vecinos Más Cercanos (KNN), Bosques Aleatorios (RFC), Máquinas de Vectores de Soporte (SVM), Perceptrón Multicapa (MLP) y CatBoost (CBC), aplicados a escenarios multiclase caracterizados por alta complejidad espectral y heterogeneidad espacial. Se implementó un flujo metodológico que incluyó calibración radiométrica, corrección atmosférica y generación de muestras de entrenamiento validadas mediante métricas estadísticas. El desempeño de los modelos se evaluó a través de la exactitud, precisión, sensibilidad, especificidad y F1-score, de igual forma la exactitud de los mapas se evaluó a través de la exactitud global, el coeficiente Kappa y las exactitudes del productor y del usuario, complementadas con el análisis de separabilidad espectral mediante la distancia Jeffries-Matusita. Los resultados obtenidos mostraron que los algoritmos basados en ensambles, particularmente RFC y CBC, ofrecieron buena estabilidad frente a las clases, mientras que SVM presentó una alta precisión en clases espectralmente separables. Los mapas temáticos generados evidenciaron cambios significativos en el uso del suelo a lo largo de las décadas analizadas, destacando la expansión urbana y la disminución de áreas de vegetación natural. Estos patrones fueron corroborados mediante la detección de cambio multitemporal, que permitió cuantificar las principales transiciones de cobertura. En conjunto, los resultados confirman la eficacia de los modelos de Aprendizaje de Máquina para la clasificación del LULC y su potencial para la generación de cartografía temática confiable, útil para la gestión ambiental, la planificación territorial y el monitoreo de la dinámica del paisaje.
Palabras clave: Clasificación multitemporal, Uso y Cubierta del Terreno, Landsat, Aprendizaje de Máquina, Ensenada.
Resumen en inglés
This research analyzes the performance of several Machine Learning algorithms applied to the classification of Land Use and Land Cover (LULC) in the Ensenada region, Baja California, using Landsat 5 TM and Landsat 8 OLI satellite imagery from 1985, 2005, and 2024. The main objective was to evaluate the accuracy, robustness, and generalization capacity of the K-Nearest Neighbors (KNN), Random Forest Classifier (RFC), Support Vector Machine (SVM), Multi-Layer Perceptron (MLP), and CatBoost Classifier (CBC) algorithms when applied to complex multiscale and multispectral classification scenarios. The methodological workflow included radiometric calibration, atmospheric correction, and the generation of training samples validated through statistical performance metrics. The performance of the models was evaluated using accuracy, precision, sensitivity, specificity, and F1-score. Likewise, the accuracy of thematic maps was assessed through overall accuracy, the Kappa coefficient, and the producer’s and user’s accuracies, complemented by spectral separability analysis using the Jeffries-Matusita distance. The results revealed that ensemble-based algorithms, particularly RFC and CBC, exhibited greater stability in the presence of imbalanced classes, while SVM achieved high precision in spectrally separable categories. The generated thematic maps highlighted significant land use changes over the analyzed decades, mainly urban expansion and the decline of natural vegetation areas. These spatial and temporal transitions were further validated through multitemporal change detection analysis, quantifying the most relevant land cover transformations. Overall, the findings confirm the effectiveness of Machine Learning algorithms for LULC classification and emphasize their potential to produce accurate and reliable thematic cartography that supports environmental management, territorial planning, and long-term monitoring of landscape dynamics.
Palabras clave: Multitemporal classification, Land Use and Land Cover, Landsat, Machine Learning, Ensenada.