TÉCNICAS MODERNAS EN EL APRENDIZAJE AUTOMÁTICO CON IMÁGENES
DOI:
https://doi.org/10.56238/sevened2026.019-048Palabras clave:
Visión por Computadora, Aprendizaje Automático, Detección y Clasificación, Video, Imágenes 3DResumen
Este capítulo presenta técnicas modernas de Aprendizaje Automático aplicadas a la visión por computadora, dividiéndose en dos frentes complementarios: el procesamiento de imágenes y videos 2D y la clasificación de datos tridimensionales (imágenes 3D). La primera tiene una fuerte aplicación en seguridad y en la venta de productos, mientras que la segunda es fundamental para, por ejemplo, la industria de piezas y el tratamiento de imágenes médicas. De este modo, la primera parte del capítulo explora el uso práctico del ecosistema YOLO (específicamente YOLO26) para la detección de objetos y la clasificación de escenas, abarcando la implementación de pipelines de inferencia, anotación de datos, fine-tuning y técnicas de aumento de datos para mitigar el sobreajuste durante el entrenamiento. En la segunda parte del capítulo, el enfoque se centra en los desafíos relacionados con el tratamiento de espacios 3D, detallando los procesos de representación geométrica (mallas, nubes de puntos y rejillas de vóxeles). También se presenta la construcción y el preprocesamiento de un clasificador volumétrico desde cero, utilizando la arquitectura ResNet3D-18 sobre el conjunto de datos ModelNet10, junto con un análisis crítico del desempeño del modelo.
Descargas
Publicado
Número
Sección
Licencia

Esta obra está bajo una licencia internacional Creative Commons Atribución-NoComercial 4.0.