Mémo d'auto-apprentissage «Deep Learning from scratch» (n ° 10-2) Valeur initiale du poids

En lisant "Deep Learning from scratch" (écrit par Yasuki Saito, publié par O'Reilly Japan), je noterai les sites auxquels j'ai fait référence. Partie 10 ← → Partie 11

J'ai légèrement modifié le code source ch06 / optimizer_compare_mnist.py utilisé dans la comparaison de la méthode de mise à jour en utilisant l'ensemble de données MNIST, et j'ai essayé plusieurs façons de définir la valeur initiale.

# coding: utf-8
import os
import sys
sys.path.append(os.pardir)  #Paramètres d'importation des fichiers dans le répertoire parent
import matplotlib.pyplot as plt
from dataset.mnist import load_mnist
from common.util import smooth_curve
from common.multi_layer_net import MultiLayerNet
from common.optimizer import *

# 0:Lire les données MNIST==========
(x_train, t_train), (x_test, t_test) = load_mnist(normalize=True)

train_size = x_train.shape[0]
batch_size = 128
max_iterations = 2000

# 1:Paramètres expérimentaux==========
optimizers = {}
optimizers['SGD'] = SGD()
optimizers['Momentum'] = Momentum()
optimizers['AdaGrad'] = AdaGrad()
optimizers['Adam'] = Adam()
#optimizers['RMSprop'] = RMSprop()

networks = {}
train_loss = {}
for key in optimizers.keys():
    networks[key] = MultiLayerNet(
        input_size=784, hidden_size_list=[100, 100, 100, 100],
        output_size=10,
        activation='relu',weight_init_std='relu', 
        weight_decay_lambda=0)
    train_loss[key] = []    

# 2:Début de la formation==========
for i in range(max_iterations):
    batch_mask = np.random.choice(train_size, batch_size)
    x_batch = x_train[batch_mask]
    t_batch = t_train[batch_mask]
    
    for key in optimizers.keys():
        grads = networks[key].gradient(x_batch, t_batch)
        optimizers[key].update(networks[key].params, grads)
    
        loss = networks[key].loss(x_batch, t_batch)
        train_loss[key].append(loss)

#Évaluer avec des données de test
x = x_test
t = t_test

for key in optimizers.keys():
    network = networks[key]

    y = network.predict(x)

    accuracy_cnt = 0
    for i in range(len(x)):
        p= np.argmax(y[i])
        if p == t[i]:
            accuracy_cnt += 1

    print(key + " Accuracy:" + str(float(accuracy_cnt) / len(x)))

Spécifiez "Relu" pour la fonction d'activation et définissez "Valeur initiale de He"

activation='relu', weight_init_std='he',

Résultat du traitement des données de test

SGD Accuracy:0.9325 Momentum Accuracy:0.966 AdaGrad Accuracy:0.9707 Adam Accuracy:0.972

Spécifiez «igmoïde »pour la fonction d'activation et définissez« Valeur initiale de Xavier »

activation='sigmoid', weight_init_std='xavier',

Résultat du traitement des données de test

SGD Accuracy:0.1135 Momentum Accuracy:0.1028 AdaGrad Accuracy:0.9326 Adam Accuracy:0.9558

SGD et Momentum avaient un mauvais taux de reconnaissance, j'ai donc fixé le nombre de lots à 10000.

SGD Accuracy:0.1135 Momentum Accuracy:0.9262 AdaGrad Accuracy:0.9617 Adam Accuracy:0.9673

Le taux de reconnaissance de Momentum a tellement augmenté, mais SGD est totalement inutile.

Spécifiez "relu" comme fonction d'activation et définissez la distribution normale avec un écart type de 0,01 comme valeur initiale.

activation='relu', weight_init_std=0.01,

Résultat du traitement des données de test

SGD Accuracy:0.1135 Momentum Accuracy:0.1135 AdaGrad Accuracy:0.9631 Adam Accuracy:0.9713

SGD et Momentum ne semblent pas du tout apprendre.

Partie 10 ← → Partie 11

Recommended Posts

Mémo d'auto-apprentissage «Deep Learning from scratch» (n ° 10-2) Valeur initiale du poids

Mémo d'auto-apprentissage «Deep Learning from scratch» (n ° 11) CNN

Mémo d'auto-apprentissage «Deep Learning from scratch» (n ° 19) Augmentation des données

Mémo d'auto-apprentissage «Deep Learning from scratch» (n ° 18) One! Miaou! Grad-CAM!

Mémo d'auto-apprentissage "Deep Learning from scratch" (partie 12) Deep learning

Mémo d'auto-apprentissage "Deep Learning from scratch" (n ° 15) Tutoriel pour débutants TensorFlow

[Deep Learning from scratch] Poids initial du réseau neuronal lors de l'utilisation de la fonction Relu

Mémo d'auto-apprentissage "Deep Learning from scratch" (n ° 13) Essayez d'utiliser Google Colaboratory

Mémo d'auto-apprentissage "Deep Learning from scratch" (glossaire illisible)

"Deep Learning from scratch" Mémo d'auto-apprentissage (n ° 9) Classe MultiLayerNet

[Mémo d'apprentissage] Apprentissage profond à partir de zéro ~ Mise en œuvre de l'abandon ~

Mémo d'auto-apprentissage «Deep Learning from scratch» (10) Classe MultiLayerNet

"Deep Learning from scratch" Mémo d'auto-apprentissage (n ° 16) J'ai essayé de créer SimpleConvNet avec Keras

"Deep Learning from scratch" Mémo d'auto-apprentissage (n ° 17) J'ai essayé de créer DeepConvNet avec Keras

Deep learning / Deep learning made from scratch Chapitre 6 Mémo

[Mémo d'apprentissage] Deep Learning fait de zéro [Chapitre 5]

[Mémo d'apprentissage] Le Deep Learning fait de zéro [Chapitre 6]

Deep learning / Deep learning made from scratch Chapitre 7 Mémo

Enregistrement d'apprentissage de la lecture "Deep Learning from scratch"

[Mémo d'apprentissage] Deep Learning fait de zéro [~ Chapitre 4]

"Deep Learning from scratch" Mémo d'auto-apprentissage (n ° 14) Exécutez le programme du chapitre 4 sur Google Colaboratory

Deep Learning from scratch Chapter 2 Perceptron (lecture du mémo)

TensorFlow> Apprentissage de la courbe sinusoïdale> Reproduction du résultat d'apprentissage à partir du poids, biais v0.3 (Échec) / python> réussite: pas d'opération

Installation de TensorFlow, une bibliothèque d'apprentissage automatique de Google

Mémo d'auto-apprentissage «Deep Learning from scratch» (n ° 10-2) Valeur initiale du poids

Apprentissage profond à partir de zéro 1 à 3 chapitres

Application de Deep Learning 2 à partir de zéro Filtre anti-spam

Deep learning / Deep learning from scratch 2 Chapitre 4 Mémo

Deep learning / Deep learning made from scratch Chapitre 3 Mémo

Deep Learning / Deep Learning à partir de Zero 2 Chapitre 5 Mémo

Apprentissage profond à partir de zéro (calcul des coûts)

Deep Learning / Deep Learning à partir de Zero 2 Chapitre 7 Mémo

Deep Learning / Deep Learning à partir de Zero 2 Chapitre 8 Mémo

Deep learning / Deep learning made from scratch Chapitre 5 Mémo

Deep learning / Deep learning from scratch 2 Chapitre 3 Mémo

Deep Learning / Deep Learning à partir de Zero 2 Chapitre 6 Mémo

Mémo d'auto-apprentissage "Deep Learning from scratch" (partie 8) J'ai dessiné le graphique du chapitre 6 avec matplotlib

Pourquoi ModuleNotFoundError: Aucun module nommé'dataset.mnist 'n'apparaît dans "Deep Learning from scratch".

Écrivez vos impressions sur l'édition du framework Deep Learning 3 créée à partir de zéro

Apprentissage profond à partir de zéro (propagation vers l'avant)

Apprentissage profond / Apprentissage profond à partir de zéro 2-Essayez de déplacer GRU

"Deep Learning from scratch" avec Haskell (inachevé)

[Windows 10] Construction de l'environnement "Deep Learning from scratch"

[Deep Learning from scratch] À propos de l'optimisation des hyper paramètres

Python vs Ruby "Deep Learning from scratch" Chapitre 4 Implémentation de la fonction de perte

Deep Learning from scratch ① Chapitre 6 "Techniques liées à l'apprentissage"

GitHub du bon livre "Deep Learning from scratch"

Résumé Python vs Ruby "Deep Learning from scratch"

Python vs Ruby "Deep Learning from scratch" Chapitre 3 Implémentation d'un réseau neuronal à 3 couches

Deep Learning from scratch La théorie et la mise en œuvre de l'apprentissage profond appris avec Python Chapitre 3

[Deep Learning from scratch] J'ai implémenté la couche Affine

Django memo n ° 1 à partir de zéro

Deep learning 1 Pratique du deep learning

Python vs Ruby "Deep Learning from scratch" Chapitre 1 Graphique de la fonction sin et de la fonction cos

Othello ~ De la troisième ligne de "Implementation Deep Learning" (4) [Fin]

[Deep Learning from scratch] J'ai essayé d'expliquer le décrochage

Chapitre 3 Réseau de neurones Ne découpez que les bons points de Deeplearning à partir de zéro

Un mémo lors de l'exécution de l'exemple de code de Deep Learning créé à partir de zéro avec Google Colaboratory

Chapitre 2 Implémentation de Perceptron Ne découpez que les bons points de Deeplearning à partir de zéro

Un amateur a trébuché dans le Deep Learning à partir de zéro Note: Chapitre 1

Un amateur a trébuché dans le Deep Learning ❷ fait à partir de zéro Note: Chapitre 5