MODERNAS TÉCNICAS NO APRENDIZADO DE MÁQUINA COM IMAGENS
DOI:
https://doi.org/10.56238/sevened2026.019-048Palavras-chave:
Visão Computacional, Aprendizado de Máquina, Detecção e Classificação, Vídeo, Imagens 3DResumo
Este capítulo apresenta técnicas modernas de Aprendizado de Máquina aplicadas à visão computacional, dividindo-se em duas frentes complementares: o processamento de imagens e vídeos 2D e a classificação de dados tridimensionais (imagens 3D). A primeira, encontra forte aplicação em segurança e em vendas de produtos e, o segundo, fundamental para, por exemplo, a indústria de peças e o tratamento de imagens médicas. Desse modo, a primeira parte do capítulo explora o uso prático do ecossistema YOLO (especificamente o YOLO26) para detecção de objetos e classificação de cenas, abrangendo a implementação de pipelines de inferência, anotação de dados, fine-tuning e técnicas de data augmentation para mitigar sobreajustes do treinamento. Na segunda parte do capítulo, o foco é sobre os desafios no tratamento de espaços 3D, detalhando os processos de representação geométrica (malhas, nuvens de pontos e grades de voxels). Apresenta-se aqui a construção e o pré-processamento de um classificador volumétrico do zero, utilizando a arquitetura ResNet3D-18 sobre o dataset ModelNet10, com uma análise crítica do desempenho do modelo.
Downloads
Publicado
Edição
Seção
Licença

Este trabalho está licenciado sob uma licença Creative Commons Attribution-NonCommercial 4.0 International License.