Understanding fully-connected and convolutional layers in ......Understanding fully-connected and...

Understanding fully-connected and convolutionallayers in unsupervised learning using face images

Lucas Fontes BuzutiDepartment of Electrical Engineering

FEI University CenterSao Bernardo do Campo-SP, Brazil

lucas.buzuti@outlook.com

Carlos Eduardo ThomazDepartment of Electrical Engineering

FEI University CenterSao Bernardo do Campo-SP, Brazil

cet@fei.edu.br

Abstract—The goal of this paper is to implement and comparetwo unsupervised models of deep learning: Autoencoder andConvolutional Autoencoder. These neural network models havebeen trained to learn regularities in well-framed face images withdifferent facial expressions. The Autoencoder’s basic topology isaddressed here, composed of encoding and decoding multilayers.This paper approaches these automatic codings using multivari-ate statistics to visually understand the bottleneck differencesbetween the fully-connected and convolutional layers and thecorresponding importance of the dropout strategy when appliedin a model.

Index Terms—deep neural network, autoencoder, convolutionalautoencoder, multivariate statistics

I. INTRODUCAO

Estudos relacionados a Inteligencia Artificial, com focoem Aprendizagem Profunda (Deep Learning) vem mostrandoresultados impressionantes na area de reconhecimento depadroes, chegando a superar o estado-da-arte [8] [11] [15].No contexto de reconhecer padroes em imagens de faces,capturadas com diferentes expressoes faciais, este artigoimplementa e analisa um modelo de aprendizado nao-supervisionado de redes neurais profundas denominado au-toencoders, com o objetivo de compreender regularidadesextraıdas destas imagens.

Historicamente, em 1986 os autoencoders tiveram umaprimeira citacao indiretamente em um artigo relacionado aoerro de propagacao [17], descrevendo um novo tipo de redefeedforward na epoca e seu formalismo matematico. A ideiaressurgiu em trabalhos subsequentes de pesquisa nos anosseguintes. Em 1989 Baldi e Hornik [2] introduziram os au-toencoders propondo uma descricao precisa das caracterısticassalientes da superfıcie anexada a funcao de erro quandoas unidades sao lineares. Durante as decadas de 1980 e1990, diversos algoritmos de aprendizado nao supervision-ados que foram sugeridos para redes neurais puderam servistos como variacoes de dois metodos basicos: Analise deComponentes Principais (Principal Components Analysis ouPCA) e Quantizacao Vetorial (Vector Quantization ou VQ).Entretanto, em 1994, Hinton e Zemel [9] descreveram umanova funcao objetiva para o treinamento de autoencoders quepermitiu extracoes de representacoes fatoriais nao lineares.Usando o autoencoder para reduzir a dimensionalidade de

dados, Hinton e Salakhutdinov comprovaram em 2006, aeficiencia do autoencoder em relacao ao PCA [8].

O uso de Deep Learning vem aumentando exponencial-mente e esse crescimento esta sendo possıvel porque redesneurais profundas com topologias muito complexas estaosendo computadas em GPUs (Graphics Processing Unit),permitindo comprovar na pratica, o que no passado havia sidorealizado matematicamente.

Neste artigo, sera investigado um autoencoder profundo(Deep Autoencoder) [8] para analise de padroes em imagensfaciais comparando dois tipos de camadas, sendo essas: To-talmente Conectada (Fully-Connected Layer) e Convolucional(Convolutional Layer). Tais redes neurais profundas contemmultiplas camadas nao lineares, tornando-as modelos adequa-dos para aprender relacoes complexas entre entradas e saıdasde imagens de faces, como exemplificado aqui.

II. MAPEAMENTO DE ENTRADAS EM SAIDAS

A. Autoencoders

Rumelhart, Hinton e Williams [17] descreveram um prob-lema em que um conjunto de padroes de entradas sao ma-peados para um conjunto de padroes de saıdas atraves deum numero reduzido de neuronios/unidades ocultas (hiddenunits). Para provar o problema proposto, conjecturaram omapeamento de N padroes binarios de entrada para N padroesde saıda, no qual N representa o numero de unidades deentrada e saıda, alem disso presumiram o numero de neuroniosda camada oculta atraves de log2N [17].

O sistema proposto aprende a usar as unidades da camadaoculta para formar um codigo com padrao binario distinto decada N padroes de entrada. A topologia da rede realiza acodificacao de N padroes de bits em log2N e entao decodificaessas representacoes para os padroes de saıda. O autoencoderpode ser descrito em duas partes: funcao do codificador (en-coder function) e funcao do decodificador (decoder function),tal que a funcao

h = f(xW + b) (1)

e a representacao latente, x os dados de entrada, W matriz depesos, b matriz bias e f a funcao de ativacao, e

Understanding fully-connected and convolutional layers in ......Understanding fully-connected and...

Documents

DenseCap: Fully Convolutional Localization Networks for ... · densecap: fully convolutional localization networks for dense captioning &odvvlilfdwlrq &dw &dswlrqlqj $ fdw ulglqj

Reducing MAC operation in convolutional neural network ... · A. Reducing the number of operations in convolution layers In convolutional layers in most of frequently used CNNs, each

Tracking by Segmentation - cvut.cz · 2) Segmentation pre-training (DAVIS, PASCAL VOC, …) Strip fully connected layers Convert into fully convolutional segmentation CNN 3) Fine-tuning

1 Fully Convolutional Networks for Semantic Segmentation · Fully Convolutional Networks for Semantic Segmentation Evan Shelhamer , Jonathan Long , and Trevor Darrell, Member, IEEE

Fully Convolutional Networks for Semantic Segmentation [1] › ~yjlee › teaching › ecs289g... · Fully Convolutional Networks for Semantic Segmentation [1] Jonathan Long, Evan

The Treasure Beneath Convolutional Layers: Cross ......The Treasure beneath Convolutional Layers: Cross-convolutional-layer Pooling for Image Classiﬁcation Lingqiao Liu 1, Chunhua

On more interesting blocksConventional to interesting ones 7 Conventional block, fully connected layers, convolutional, recurrent etc. All based on the Pitts model (1943) the ﬁrst

FCSS: Fully Convolutional Self-Similarity for Dense ...openaccess.thecvf.com/content_cvpr_2017/papers/Kim_FCSS_Fully... · FCSS: Fully Convolutional Self-Similarity for Dense Semantic

Fully Convolutional Networks for Semantic Segmentationjhoffman/yahooJapan... · 2016. 3. 25. · Fully Convolutional Networks for Semantic Segmentation Jonathan Long* Evan Shelhamer*

LIDAR-based Driving Path Generation Using Fully Convolutional … · LIDAR-based Driving Path Generation Using Fully Convolutional Neural Networks Luca Caltagirone , Mauro Bellone,

A Single-Resolution Fully Convolutional Network for

Fully Convolutional Networks

Convolutional Neural Networksimft.ftn.uns.ac.rs/ssip2017/wp-content/uploads/... · Convolutional Neural Networks for Semantic ... Shelhamer, Darrell, Fully Convolutional Networks

DenseCap: Fully Convolutional Localization Networks for Dense … · DenseCap: Fully Convolutional Localization Networks for Dense Captioning Justin Johnson Andrej Karpathy Li Fei-Fei

I-STM layer (size: (5, 1)) 7 convolutional layers

Multi-scale fully convolutional neural networks for histopathology … · 2020. 5. 12. · Multi-scale fully convolutional neural networks for histopathology image segmentation: from

Convolutional neural networks: an overview and application in ......pooling), and fully connected (FC) layers. A model’s performance under particular kernels and weights is calculated

Multi-Channel Multi-Scale Fully Convolutional Network for

Microscopy Cell Counting with Fully Convolutional ...vgg/publications/2015/Xie15/weidi15.pdf · Microscopy Cell Counting with Fully Convolutional Regression Networks ... 2 Counting

Transitioning between Convolutional and Fully Connected ...Transitioning between Convolutional and Fully Connected Layers in Neural Networks Shazia Akbar 1, Mohammad Peikari , Sherine