MODERN TECHNIQUES IN MACHINE LEARNING WITH IMAGES

Bruno Seki Schenberg; Rafael Colen de Almeida; Rogério de Oliveira

doi:10.56238/sevened2026.019-048

Autores

Bruno Seki Schenberg
Rafael Colen de Almeida
Rogério de Oliveira

DOI:

https://doi.org/10.56238/sevened2026.019-048

Palavras-chave:

Visão Computacional, Aprendizado de Máquina, Detecção e Classificação, Vídeo, Imagens 3D

Resumo

Este capítulo apresenta técnicas modernas de Aprendizado de Máquina aplicadas à visão computacional, dividindo-se em duas frentes complementares: o processamento de imagens e vídeos 2D e a classificação de dados tridimensionais (imagens 3D). A primeira, encontra forte aplicação em segurança e em vendas de produtos e, o segundo, fundamental para, por exemplo, a indústria de peças e o tratamento de imagens médicas. Desse modo, a primeira parte do capítulo explora o uso prático do ecossistema YOLO (especificamente o YOLO26) para detecção de objetos e classificação de cenas, abrangendo a implementação de pipelines de inferência, anotação de dados, fine-tuning e técnicas de data augmentation para mitigar sobreajustes do treinamento. Na segunda parte do capítulo, o foco é sobre os desafios no tratamento de espaços 3D, detalhando os processos de representação geométrica (malhas, nuvens de pontos e grades de voxels). Apresenta-se aqui a construção e o pré-processamento de um classificador volumétrico do zero, utilizando a arquitetura ResNet3D-18 sobre o dataset ModelNet10, com uma análise crítica do desempenho do modelo.

MODERNAS TÉCNICAS NO APRENDIZADO DE MÁQUINA COM IMAGENS

Autores

DOI:

Palavras-chave:

Resumo

Downloads

Publicado

Edição

Seção

Licença

Como Citar

Artigos mais recentes

Informações

Idioma