MODERNAS TÉCNICAS NO APRENDIZADO DE MÁQUINA COM IMAGENS

Autores

  • Bruno Seki Schenberg
  • Rafael Colen de Almeida
  • Rogério de Oliveira

DOI:

https://doi.org/10.56238/sevened2026.019-048

Palavras-chave:

Visão Computacional, Aprendizado de Máquina, Detecção e Classificação, Vídeo, Imagens 3D

Resumo

Este capítulo apresenta técnicas modernas de Aprendizado de Máquina aplicadas à visão computacional, dividindo-se em duas frentes complementares: o processamento de imagens e vídeos 2D e a classificação de dados tridimensionais (imagens 3D). A primeira, encontra forte aplicação em segurança e em vendas de produtos e, o segundo, fundamental para, por exemplo, a indústria de peças e o tratamento de imagens médicas. Desse modo, a primeira parte do capítulo explora o uso prático do ecossistema YOLO (especificamente o YOLO26) para detecção de objetos e classificação de cenas, abrangendo a implementação de pipelines de inferência, anotação de dados, fine-tuning e técnicas de data augmentation para mitigar sobreajustes do treinamento. Na segunda parte do capítulo, o foco é sobre os desafios no tratamento de espaços 3D, detalhando os processos de representação geométrica (malhas, nuvens de pontos e grades de voxels). Apresenta-se aqui a construção e o pré-processamento de um classificador volumétrico do zero, utilizando a arquitetura ResNet3D-18 sobre o dataset ModelNet10, com uma análise crítica do desempenho do modelo.

Publicado

2026-05-14

Como Citar

Schenberg, B. S., de Almeida, R. C., & de Oliveira, R. (2026). MODERNAS TÉCNICAS NO APRENDIZADO DE MÁQUINA COM IMAGENS. Seven Editora, 836-861. https://doi.org/10.56238/sevened2026.019-048