MODERN TECHNIQUES IN MACHINE LEARNING WITH IMAGES

Bruno Seki Schenberg; Rafael Colen de Almeida; Rogério de Oliveira

doi:10.56238/sevened2026.019-048

Autores/as

Bruno Seki Schenberg
Rafael Colen de Almeida
Rogério de Oliveira

DOI:

https://doi.org/10.56238/sevened2026.019-048

Palabras clave:

Visión por Computadora, Aprendizaje Automático, Detección y Clasificación, Video, Imágenes 3D

Resumen

Este capítulo presenta técnicas modernas de Aprendizaje Automático aplicadas a la visión por computadora, dividiéndose en dos frentes complementarios: el procesamiento de imágenes y videos 2D y la clasificación de datos tridimensionales (imágenes 3D). La primera tiene una fuerte aplicación en seguridad y en la venta de productos, mientras que la segunda es fundamental para, por ejemplo, la industria de piezas y el tratamiento de imágenes médicas. De este modo, la primera parte del capítulo explora el uso práctico del ecosistema YOLO (específicamente YOLO26) para la detección de objetos y la clasificación de escenas, abarcando la implementación de pipelines de inferencia, anotación de datos, fine-tuning y técnicas de aumento de datos para mitigar el sobreajuste durante el entrenamiento. En la segunda parte del capítulo, el enfoque se centra en los desafíos relacionados con el tratamiento de espacios 3D, detallando los procesos de representación geométrica (mallas, nubes de puntos y rejillas de vóxeles). También se presenta la construcción y el preprocesamiento de un clasificador volumétrico desde cero, utilizando la arquitectura ResNet3D-18 sobre el conjunto de datos ModelNet10, junto con un análisis crítico del desempeño del modelo.

TÉCNICAS MODERNAS EN EL APRENDIZAJE AUTOMÁTICO CON IMÁGENES

Autores/as

DOI:

Palabras clave:

Resumen

Descargas

Publicado

Número

Sección

Licencia

Cómo citar

Últimas publicaciones

Información

Idioma