Resumen
Desde 2018, el varamiento de Sargassum ha aumentado en las playas del mar Caribe. El monitoreo de Sargassum a través de plataformas satelitales ha permitido sondear su dinámica a escala regional (mesoescala). Sin embargo, estos métodos no siempre se utilizan para el seguimiento a nivel de playa (escala humana). Se necesita información a este nivel para que las autoridades encargadas de la gestión del Sargassum puedan diseñar estrategias adecuadas para hacer frente a los varamientos. Recientemente se han incorporado técnicas de Inteligencia Artificial como el Aprendizaje Automático (AM) para el análisis de datos a nivel de playa. Esto ha requerido la construcción de nuevos conjuntos de datos. Debido a la longitud de las playas, se utilizan diversas técnicas para la recogida de imágenes. Una de estas técnicas es el Crowdsourcing. Para utilizar únicamente imágenes que posean las características visuales y de encuadre útiles para el cálculo de la cobertura de Sargassum en una playa, las imágenes enviadas por los participantes deben clasificarse antes del análisis.El presente estudio propone un método de clasificación automática de imágenes con una perspectiva lineal en profundidad que permite construir conjuntos de datos adecuados para estudios sobre Sargassum acumulado que requieran destacar la presencia de esta macroalga a lo largo de las playas. La detección de Sargassum en las imágenes queda fuera del alcance de este estudio. Para ello, se implementó sobre tres redes neuronales de la literatura la técnica de Transfer Learning. ResNet50, MobileNetv2 y VGG16 se reentrenaron con un conjunto de datos de 5.000 muestras equilibradas de imágenes con y sin perspectiva lineal de la playa. Tras varios experimentos, se alcanzó una precisión del 80%, 90% y 91%, respectivamente. Para complementar la información proporcionada por las métricas Accuracy, Precision y F1 score, se realizó un análisis de remuestreo de la métrica F1-Score con la técnica Bootstrapping, concluyendo que VGG16 y MobileNetV2 obtuvieron resultados similares con un intervalo de confianza del 95% entre 0,88 y 0,92. Finalmente, considerando la complejidad espacial y temporal de ambas arquitecturas, MobileNetV2 se propone como la más adecuada para la clasificación de imágenes con y sin perspectiva lineal en profundidad. La clasificación de este tipo de imágenes, además de requerir nuevos conjuntos de datos, lleva la aplicación de ML a otro nivel, ya que además de la geometría o el color, el modelo tiene que discriminar la textura y la distribución espacial de los elementos en la imagen, para poder realizar con éxito la clasificación.
