Leonardo, boa tarde. Gostaria que me tirasse uma dúvida. Essas convoluções são bastante utilizadas no processamentos de imagens. Por exemplo, manipulando os valores de uma vizinhança para modificar a imagem. Nesse caso, teríamos que aplicar essas operações para todas as imagens da base de dados que estamos estudando, correto? Após a aplicação desses filtros, as imagens modificadas servem de entrada para a rede neural. Um dos meus professores disse que as redes neurais convolucionais (e já li em artigos, também) demandam menos pré-processamento. Mas, nesse caso, a aplicação dessas convoluções (ou filtros) não seria um pré processamento? E ainda mais, dependendo do tamanho das imagens, eles seriam computacionalmente caros. Ao dizer que as CNN requerem menos pré-processamento, ele estaria se referindo que APÓS as imagens estarem prontas, fica mais fácil para a rede processá-las (porque as convoluções tornam as imagens mais fácil para a CNN analisar e até podem diminuir o tamanho das imagens)? Porque ao meu ver, em alguns estudos, que usam mais de 60 convoluções (ou filtros), não podemos dizer que esse processamento sai "barato", correto? Poderias me tirar essa dúvida? Uma coisa que não ficou clara para mim é como são feitas as convoluções. Da forma que você explicou, me parece que se passa a matriz de convolução diretamente na imagem. Depois, se apresenta a imagem fruto da convolução (e pooling) para um MLP da sua escolha. Em alguns lugares, essa parte da convolução é apresentada como uma cama da normal da CNN, na forma de neurônios. Como ela é feita, na verdade? Seria como um pré-processamento, antes de ir para o classificador ou seria uma camada normal, constituída por neurônios?
CORREÇÃO: quando eu falo sobre w_i: w_i não é um vetor e sim um parâmetro (um número real) que é multiplicado pelo píxel x_i.
Muito bom o vídeo, explica muito bem. Tem gente que tem a vontade de ensinar, mas tem gente que tem o dom.
Que bom aprender com um vídeo tão bacana. antes da metade já me inscrevi. Parabéns. Simples, profundo e direto.
Que explicação simples e excelente, parabéns!
melhor video pra ter uma ideia inicial de redes convolucionais
Mano! Seu canal é show demais! Parabéns mesmo.
OPA , cheguei aqui através da Facti vc é referencia parabéns.
Parabéns pelo vídeo 👏🏾👏🏾
Parabéns!
excelente conteúdo.
Parabéns pela didática Leonardo. Enfim consegui abstrair um pouco a CNN!!! Obrigado
Bem explicativo!
amei 💙
q aula boa
Show, sigo no aguardo de uma implementação qualquer de GNN 🥺😍
Olá Otávio, obrigado pelo feedback! Este assunto está na minha lista de pautas. Espero abordá-lo em um futuro breve. um abraço!! 🚀🚀
Massa! Bem esclarecedor!
Olá Fabrício, obrigado pelo feedback! A ideia é tentar explicar as CNNs de maneira mais intuitiva. Um abraço!! 🚀🚀
Leonardo, boa tarde. Gostaria que me tirasse uma dúvida. Essas convoluções são bastante utilizadas no processamentos de imagens. Por exemplo, manipulando os valores de uma vizinhança para modificar a imagem. Nesse caso, teríamos que aplicar essas operações para todas as imagens da base de dados que estamos estudando, correto? Após a aplicação desses filtros, as imagens modificadas servem de entrada para a rede neural. Um dos meus professores disse que as redes neurais convolucionais (e já li em artigos, também) demandam menos pré-processamento. Mas, nesse caso, a aplicação dessas convoluções (ou filtros) não seria um pré processamento? E ainda mais, dependendo do tamanho das imagens, eles seriam computacionalmente caros. Ao dizer que as CNN requerem menos pré-processamento, ele estaria se referindo que APÓS as imagens estarem prontas, fica mais fácil para a rede processá-las (porque as convoluções tornam as imagens mais fácil para a CNN analisar e até podem diminuir o tamanho das imagens)? Porque ao meu ver, em alguns estudos, que usam mais de 60 convoluções (ou filtros), não podemos dizer que esse processamento sai "barato", correto? Poderias me tirar essa dúvida? Uma coisa que não ficou clara para mim é como são feitas as convoluções. Da forma que você explicou, me parece que se passa a matriz de convolução diretamente na imagem. Depois, se apresenta a imagem fruto da convolução (e pooling) para um MLP da sua escolha. Em alguns lugares, essa parte da convolução é apresentada como uma cama da normal da CNN, na forma de neurônios. Como ela é feita, na verdade? Seria como um pré-processamento, antes de ir para o classificador ou seria uma camada normal, constituída por neurônios?
Estou a procura de um curso que me ao menor me oriente quando a esses modelos por ex: tranformer. pode me indicar um?
algum livro bom pra estudar essa brincadeira?