2017-09-27

SNSを解析

python 機械学習目標

気になる本の１つ

ソーシャルメディアの解析

twitterやfacebookの解析は，人類の性質を如実に表す．最初に手を出すのは，どこから行けばよいのか．qiitaのようなサイトからか，オライリ本か，はたまたオンライン学習コンテンツか．選択肢が豊かなのは喜ぶべきことなのだが，片っ端から試してみるという気概がない．いささか無精者すぎる．

gakuseibiz.com

このような人は尊敬する．

2017-09-26

ruby on rails 環境設定

ruby

ruby on rails

webアプリケーションを作るので，必要になった．

そして詰まった．

nokogiriができないエラー

Mac OS X Mavericksで”gem i nokogiri”失敗の解決方法 - Qiita

基本的流れ

プロジェクトごとの手順を示してくれている．

[Rails 5] rbenvでRubyをインストールして新規Rails開発環境を準備する

Rails開発環境の構築（rbenvでRuby導入からBundler、Rails導入まで）（Macport編） - Qiita

bundle execが必要なくなる

$ bundle install --path=vendor/bundle --binstubs=bundle_bin

Ruby の gem をプロジェクト毎に Bundler で管理する - fugafuga.write

【翻訳+解説】binstubをしっかり理解する: RubyGems、rbenv、bundlerの挙動

railsを学ぶ為にやるサイト

railsgirls

Rails Girls - Japanese

2017-08-28

AIによる感情推定システムの確立

思ったこと機械学習

Silver Logic Labs（SLL）は、映像解析により人が何を感じているかを把握するAIを開発した。

要旨

記事によれば，動画から，89%の確率で人の感情を特定することができるようになったそうだ．これはすなわち，皆がメンタリストの得るということであり，感情を偽れなくなるということだ．

所感

これは，人間に不可逆な変化を与える．圧倒的インパクトを持つ記事に思える．

　人間は社会的生物として嘘を巧みに使い，高度なコミュニケーションを取ることで現代社会の秩序を維持している．

　これがすべて嘘がわかるとしたらどうだろう．誰かに対して，お世辞を言うことはできなくなる．常識ある社会人として，否定するべき非社会的でショッキングな映像(etc…喧嘩の映像など)を見て，否定的コメントをしたとき，幸福，楽しい，等の感情を読み取られてしまったら，どうすれば良いのか．

　Happiness,Neutral,Contempt,Sadness,Surprise,Anger,Fear,などかなり細かく感情を分類することができる．これではもう数種の映像に対する反応で，その人の性格,嗜好は確実に分析することができるだろう．

参考

https://www.fashionsnap.com/the-posts/2017-08-24/sll/

2017-08-14

私的!最速!CNNによるMNIST分類問題!

深層学習/DeepLearning ゼロから作るDeep Learning python

私的!最速!CNNによるMNIST分類問題!
注意
実験内容
参考

私的!最速!CNNによるMNIST分類問題!

　三層CNNによりMNIST分類問題を最短距離で実装します．

注意

必要最小限の説明のみをしているため，誤差逆伝播法などの部分の説明を省いています．

実験内容

実験

　本稿ではKeras用いて，手書き数字(以降MNIST)の画像を分類(以降MNIST分類)し，次に学習結果の向上の考察をする．

　まずはじめに，畳み込みニューラルネットワーク(以降CNN)ではない実装の１つ，結合を全結合で行うレイヤ(以降Affineレイヤ)によるMNISTの実装を行う．次に，CNNを用いた，MNIST分類を行う．

CNNを用いないMNIST分類の実装

データの確認

MNISTのデータをニューラルネットワーク(以降NN)に入力したい．

%matplotlib inline
import keras
from keras.datasets import mnist
import matplotlib.pyplot as plt

#Kerasの関数でデータの読み込み。データをシャッフルして学習データと訓練データに分割している.
(x_train, y_train), (x_test, y_test) = mnist.load_data()

#MNISTデータの表示
fig = plt.figure(figsize=(9, 9))
fig.subplots_adjust(left=0, right=1, bottom=0, top=0.5, hspace=0.05, wspace=0.05)
for i in range(81):
    ax = fig.add_subplot(9, 9, i + 1, xticks=[], yticks=[])
    ax.imshow(x_train[i].reshape((28, 28)), cmap='gray')

png f:id:forhighlow:20170814154824p:plain

60,000枚の28x28，10個の数字の白黒画像と10,000枚のテスト用画像データセット

num_classes = 10 # 出力層(output layer)のニューロンは10個 分類したい数に対応している．
x_train = x_train.reshape(60000, 784) #  reshapeは28×28画素の画像を784×1のデータに変換している．
x_test = x_test.reshape(10000, 784)
#各データを扱いにくいので、RGBの値(白なら255、黒なら0)を利用して0から1までの間に正規化.
x_train = x_train.astype('float32') 
x_test = x_test.astype('float32')
x_train /= 255
x_test /= 255

y_train = y_train.astype('int32')
y_test = y_test.astype('int32')
y_train = keras.utils.np_utils.to_categorical(y_train, num_classes)
y_test =  keras.utils.np_utils.to_categorical(y_test, num_classes)

print('x_train shape:', x_train.shape)
print(x_train.shape[0], 'train samples')
print(x_test.shape[0], 'test samples')

60000 train samples
10000 test samples

#to_categorical()は，num_classの数の要素を持つ前からy_trainがonehotのリストを作る．
#0#[1,0,0,0,0,0,0,0,0,0]
#1#[0,1,0,0,0,0,0,0,0,0]

3層ニューラルネットワーク

　MNISTのデータを受け取り,学習する3層ニューラルネットワーク．

　Affine->relu->Affine->relu->softmax の順でデータを渡す，線形スタックである．

Affineレイヤとは

　Affineレイヤは，ニューロン同士が全結合のニューラルネットワークレイヤを指す．

CNNにおけるAffineレイヤ

　CNNはAffineレイヤに加え，畳み込みレイヤ(Convolution)とプーリングレイヤ(Pooling)を用いる．

softmaxレイヤとは

　入力されたデータを足した値が1になるように出力する層．各要素の大小関係は変わらない．NNにおいて往々にして出力層はsoftmaxレイヤである．この特性から，a%で結果A,b%で結果B,c%で結果Cという確率的な答えが求められる場合がある．しかし，今回のようなクラス分類問題では，出力の一番大きいニューロンに相当するものみが選ばれるため，その役割は満たせない．

ReLUレイヤとは

　活性化関数として使われる．回路におけるスイッチの様に機能する．

from keras.models import Sequential
from keras.layers import Dense, Dropout, Activation
from keras.optimizers import RMSprop

##add()でレイヤーを重ねる．
##Affine->relu->Affine->relu->softmax の3層NNの線形スタック
##dropout()で過学習を抑制．
##512はニューロンの数
##activationで活性化関数をreluに指定．
##最後の出力層にはsoftmaxを指定．

model = Sequential()
model.add(Dense(512, activation='relu', input_shape=(784,))) ## 入力のshapeは(512,784,)になる．
model.add(Dropout(0.2))
model.add(Dense(512, activation='relu')) ## ２度目以降は入力のshapeをkerasが推定．
model.add(Dropout(0.2))
model.add(Dense(10, activation='softmax'))## softmaxは今回は分類問題なので，必要性は低い．

##訓練プロセスの設定
##RMSprop()は学習係数を過去の勾配を徐々に忘れる，"指数移動平均"を使う．
model.compile(loss='categorical_crossentropy',
              optimizer=RMSprop(),
              metrics=['accuracy'])

バッチ処理

　バッチ処理によって，実行時間を短縮することができる． imageのサイズ/バッチのサイズ ->1epochでの計算回数

batch_size = 128
epochs = 20 ##学習の回数
##historyにfittingの課程を保存．
history = model.fit(x_train, y_train,
                    batch_size=batch_size, epochs=epochs,
                    verbose=1, validation_data=(x_test, y_test))

Train on 60000 samples, validate on 10000 samples
Epoch 1/20
60000/60000 [==============================] - 15s - loss: 0.2501 - acc: 0.9226 - val_loss: 0.1096 - val_acc: 0.9650
Epoch 2/20
60000/60000 [==============================] - 13s - loss: 0.1025 - acc: 0.9682 - val_loss: 0.1021 - val_acc: 0.9685
Epoch 3/20
60000/60000 [==============================] - 14s - loss: 0.0776 - acc: 0.9764 - val_loss: 0.0755 - val_acc: 0.9778
Epoch 4/20
60000/60000 [==============================] - 13s - loss: 0.0615 - acc: 0.9818 - val_loss: 0.0894 - val_acc: 0.9746
Epoch 5/20
60000/60000 [==============================] - 13s - loss: 0.0506 - acc: 0.9846 - val_loss: 0.0784 - val_acc: 0.9794
Epoch 6/20
60000/60000 [==============================] - 13s - loss: 0.0451 - acc: 0.9872 - val_loss: 0.0778 - val_acc: 0.9806
Epoch 7/20
60000/60000 [==============================] - 13s - loss: 0.0398 - acc: 0.9886 - val_loss: 0.0697 - val_acc: 0.9831
Epoch 8/20
60000/60000 [==============================] - 13s - loss: 0.0366 - acc: 0.9893 - val_loss: 0.1008 - val_acc: 0.9812
Epoch 9/20
60000/60000 [==============================] - 13s - loss: 0.0322 - acc: 0.9907 - val_loss: 0.0854 - val_acc: 0.9831
Epoch 10/20
60000/60000 [==============================] - 13s - loss: 0.0284 - acc: 0.9918 - val_loss: 0.0904 - val_acc: 0.9817
Epoch 11/20
60000/60000 [==============================] - 13s - loss: 0.0268 - acc: 0.9918 - val_loss: 0.0958 - val_acc: 0.9820
Epoch 12/20
60000/60000 [==============================] - 13s - loss: 0.0262 - acc: 0.9930 - val_loss: 0.1001 - val_acc: 0.9797
Epoch 13/20
60000/60000 [==============================] - 12s - loss: 0.0238 - acc: 0.9930 - val_loss: 0.0951 - val_acc: 0.9834
Epoch 14/20
60000/60000 [==============================] - 12s - loss: 0.0228 - acc: 0.9937 - val_loss: 0.0975 - val_acc: 0.9847
Epoch 15/20
60000/60000 [==============================] - 14s - loss: 0.0214 - acc: 0.9942 - val_loss: 0.0984 - val_acc: 0.9831
Epoch 16/20
60000/60000 [==============================] - 13s - loss: 0.0191 - acc: 0.9946 - val_loss: 0.0994 - val_acc: 0.9842
Epoch 17/20
60000/60000 [==============================] - 13s - loss: 0.0192 - acc: 0.9948 - val_loss: 0.1141 - val_acc: 0.9834
Epoch 18/20
60000/60000 [==============================] - 13s - loss: 0.0191 - acc: 0.9948 - val_loss: 0.1025 - val_acc: 0.9846
Epoch 19/20
60000/60000 [==============================] - 13s - loss: 0.0182 - acc: 0.9950 - val_loss: 0.1054 - val_acc: 0.9834
Epoch 20/20
60000/60000 [==============================] - 13s - loss: 0.0171 - acc: 0.9958 - val_loss: 0.1104 - val_acc: 0.9834

#正答率
plt.plot(history.history['acc'])
plt.plot(history.history['val_acc'])
plt.title('model accuracy')
plt.ylabel('accuracy')
plt.xlabel('epoch')
plt.legend(['train', 'test'], loc='upper left')
plt.show()
#loss
plt.plot(history.history['loss'])
plt.plot(history.history['val_loss'])
plt.title('model loss')
plt.ylabel('loss')
plt.xlabel('epoch')
plt.legend(['train', 'test'], loc='upper left')
plt.show()

png f:id:forhighlow:20170814154827p:plain

png f:id:forhighlow:20170814154831p:plain

考察

　上記出力結果のmodel lossが,学習が進むに連れて悪くなっていった．これは過学習をしかけていると考えられる．

考察を踏まえた改善

Dropout関数

　過学習を防ぐ手法にDropoutがある．ランダムにニューロンを削除することにより，過学習を防いでいる．

最適化関数

RMSpropsから，Adadeltaへ変更した．これらは最適化関数Adagradは急速に学習率が低下するという問題点から，過去の勾配を利用するという共通点がある．

Adadelta

過去の勾配による影響を減衰させる.

\begin{align} r &\leftarrow \gamma r + (1 - \gamma) g\vec{w}^{2} \ v &\equiv \frac{\sqrt{s + \epsilon}}{\sqrt{r + \epsilon}} g\vec{w} \ w &\leftarrow w - \alpha v \ s &\leftarrow \gamma s + (1 - \gamma) v^{2} \end{align}

RMSprop

学習率は、勾配の二乗の指数関数的減衰平均の除算．過去の勾配による影響を減衰させる．

\begin{align} r &\leftarrow \gamma r + (1 - \gamma) g\vec{w}^{2} \ w &\leftarrow w - \frac{\alpha}{\sqrt{r} + \epsilon} g\vec{w} \end{align}

from keras.models import Sequential
from keras.layers import Dense, Dropout, Activation
from keras.optimizers import Adadelta


model = Sequential()
model.add(Dense(512, activation='relu', input_shape=(784,))) 
model.add(Dropout(0.2))## dropout()で過学習を抑制．
model.add(Dense(512, activation='relu')) 
model.add(Dropout(0.2))## dropout()で過学習を抑制．
model.add(Dense(10, activation='softmax'))


model.compile(loss='categorical_crossentropy',
              optimizer=keras.optimizers.Adadelta(),
              metrics=['accuracy'])

batch_size = 128
epochs = 20
history = model.fit(x_train, y_train,
                    batch_size=batch_size, epochs=epochs,
                    verbose=1, validation_data=(x_test, y_test))

Train on 60000 samples, validate on 10000 samples
Epoch 1/20
60000/60000 [==============================] - 21s - loss: 0.3602 - acc: 0.8959 - val_loss: 0.1609 - val_acc: 0.9517
Epoch 2/20
60000/60000 [==============================] - 18s - loss: 0.1556 - acc: 0.9540 - val_loss: 0.1114 - val_acc: 0.9667
Epoch 3/20
60000/60000 [==============================] - 15s - loss: 0.1121 - acc: 0.9658 - val_loss: 0.0936 - val_acc: 0.9712
Epoch 4/20
60000/60000 [==============================] - 14s - loss: 0.0885 - acc: 0.9726 - val_loss: 0.0741 - val_acc: 0.9781
Epoch 5/20
60000/60000 [==============================] - 12s - loss: 0.0734 - acc: 0.9782 - val_loss: 0.0719 - val_acc: 0.9779
Epoch 6/20
60000/60000 [==============================] - 12s - loss: 0.0607 - acc: 0.9816 - val_loss: 0.0654 - val_acc: 0.9791
Epoch 7/20
60000/60000 [==============================] - 13s - loss: 0.0518 - acc: 0.9840 - val_loss: 0.0669 - val_acc: 0.9796
Epoch 8/20
60000/60000 [==============================] - 13s - loss: 0.0454 - acc: 0.9858 - val_loss: 0.0629 - val_acc: 0.9806
Epoch 9/20
60000/60000 [==============================] - 13s - loss: 0.0391 - acc: 0.9882 - val_loss: 0.0614 - val_acc: 0.9810
Epoch 10/20
60000/60000 [==============================] - 13s - loss: 0.0354 - acc: 0.9891 - val_loss: 0.0614 - val_acc: 0.9816
Epoch 11/20
60000/60000 [==============================] - 15s - loss: 0.0310 - acc: 0.9903 - val_loss: 0.0576 - val_acc: 0.9833
Epoch 12/20
60000/60000 [==============================] - 15s - loss: 0.0286 - acc: 0.9911 - val_loss: 0.0573 - val_acc: 0.9831
Epoch 13/20
60000/60000 [==============================] - 15s - loss: 0.0262 - acc: 0.9922 - val_loss: 0.0585 - val_acc: 0.9831
Epoch 14/20
60000/60000 [==============================] - 16s - loss: 0.0221 - acc: 0.9929 - val_loss: 0.0561 - val_acc: 0.9845
Epoch 15/20
60000/60000 [==============================] - 15s - loss: 0.0196 - acc: 0.9940 - val_loss: 0.0567 - val_acc: 0.9835
Epoch 16/20
60000/60000 [==============================] - 14s - loss: 0.0184 - acc: 0.9943 - val_loss: 0.0575 - val_acc: 0.9830
Epoch 17/20
60000/60000 [==============================] - 13s - loss: 0.0164 - acc: 0.9953 - val_loss: 0.0572 - val_acc: 0.9837
Epoch 18/20
60000/60000 [==============================] - 13s - loss: 0.0153 - acc: 0.9953 - val_loss: 0.0626 - val_acc: 0.9828
Epoch 19/20
60000/60000 [==============================] - 15s - loss: 0.0142 - acc: 0.9956 - val_loss: 0.0630 - val_acc: 0.9820
Epoch 20/20
60000/60000 [==============================] - 16s - loss: 0.0133 - acc: 0.9959 - val_loss: 0.0615 - val_acc: 0.9831

改善の結果

　Dropoutを用いた結果，過学習を防ぐことができた．

#正答率
plt.plot(history.history['acc'])
plt.plot(history.history['val_acc'])
plt.title('model accuracy')
plt.ylabel('accuracy')
plt.xlabel('epoch')
plt.legend(['train', 'test'], loc='upper left')
plt.show()
#loss
plt.plot(history.history['loss'])
plt.plot(history.history['val_loss'])
plt.title('model loss')
plt.ylabel('loss')
plt.xlabel('epoch')
plt.legend(['train', 'test'], loc='upper left')
plt.show()

png f:id:forhighlow:20170814154834p:plain

png f:id:forhighlow:20170814154838p:plain

CNNによるMNIST分類の実装

異なる点

　CNNを用いない上記の実装では，28ピクセル×28ピクセルのデータを1次元のベクトルに変換して入力していた．CNNは行列で入力するため，次元数を落とすことによるデータの形状の情報の欠損がない．

import keras
from keras.datasets import mnist
from keras.models import Sequential
from keras.layers import Dense, Dropout, Flatten
from keras.layers import Conv2D, MaxPooling2D
from keras import backend as K

batch_size = 128
num_classes = 10
epochs = 12

img_rows, img_cols = 28, 28 ##画像のピクセル数

(x_train, y_train), (x_test, y_test) = mnist.load_data()

#Kerasのバックエンドで動くTensorFlowとTheanoでは入力チャンネルの順番が違うので場合分けして書いています
if K.image_data_format() == 'channels_first':
    x_train = x_train.reshape(x_train.shape[0], 1, img_rows, img_cols)
    x_test = x_test.reshape(x_test.shape[0], 1, img_rows, img_cols)
    input_shape = (1, img_rows, img_cols)
else:
    x_train = x_train.reshape(x_train.shape[0], img_rows, img_cols, 1)
    x_test = x_test.reshape(x_test.shape[0], img_rows, img_cols, 1)
    input_shape = (img_rows, img_cols, 1)

Using TensorFlow backend.

x_train = x_train.astype('float32')
x_test = x_test.astype('float32')
x_train /= 255
x_test /= 255

print(x_train.shape[0], 'train samples')
print(x_test.shape[0], 'test samples')

y_train = y_train.astype('int32')
y_test = y_test.astype('int32')
y_train = keras.utils.np_utils.to_categorical(y_train, num_classes)
y_test =  keras.utils.np_utils.to_categorical(y_test, num_classes)

60000 train samples
10000 test samples

CNNによる3層ニューラルネットワーク

　Convolution->relu->Convolution->relu->softmaxの線形スタック．

Convolutionレイヤ

畳み込み層．形状を維持する．

画像の場合，入力データを3次元のデータとして受け取り，同じく3次元のデータとして，次の層にデータを出力する．

畳み込み演算

フィルター演算とも言う．

入力データをフィルターの一定のウィンドウの要素との乗算をし，その和を求める．積和演算とも言う．

Poolingレイヤ

縦,横方向の空間を小さくする演算を行う．

Flatten関数

入力を平滑化する．バッチサイズの影響を受けない．コード中では，1次元配列へ変換している．

model = Sequential()
model.add(Conv2D(32, kernel_size=(3, 3),
                 activation='relu',
                 input_shape=input_shape))#行列で入力
model.add(Conv2D(64, (3, 3), activation='relu'))
model.add(MaxPooling2D(pool_size=(2, 2))) #Poolingレイヤ
model.add(Dropout(0.25))#dropout
model.add(Flatten())#1次元配列へ変換
model.add(Dense(128, activation='relu'))
model.add(Dropout(0.5))
model.add(Dense(num_classes, activation='softmax'))

model.compile(loss=keras.losses.categorical_crossentropy,
              optimizer=keras.optimizers.Adadelta(),
              metrics=['accuracy'])
history = model.fit(x_train, y_train, batch_size=batch_size, epochs=epochs,
          verbose=1, validation_data=(x_test, y_test))

Train on 60000 samples, validate on 10000 samples
Epoch 1/12
60000/60000 [==============================] - 254s - loss: 0.3201 - acc: 0.9028 - val_loss: 0.0764 - val_acc: 0.9761
Epoch 2/12
60000/60000 [==============================] - 247s - loss: 0.1121 - acc: 0.9668 - val_loss: 0.0531 - val_acc: 0.9824
Epoch 3/12
60000/60000 [==============================] - 226s - loss: 0.0859 - acc: 0.9750 - val_loss: 0.0436 - val_acc: 0.9861
Epoch 4/12
60000/60000 [==============================] - 224s - loss: 0.0725 - acc: 0.9785 - val_loss: 0.0394 - val_acc: 0.9874
Epoch 5/12
60000/60000 [==============================] - 249s - loss: 0.0618 - acc: 0.9814 - val_loss: 0.0354 - val_acc: 0.9885
Epoch 6/12
60000/60000 [==============================] - 217s - loss: 0.0556 - acc: 0.9832 - val_loss: 0.0354 - val_acc: 0.9876
Epoch 7/12
60000/60000 [==============================] - 223s - loss: 0.0503 - acc: 0.9846 - val_loss: 0.0331 - val_acc: 0.9893
Epoch 8/12
60000/60000 [==============================] - 215s - loss: 0.0472 - acc: 0.9860 - val_loss: 0.0314 - val_acc: 0.9883
Epoch 9/12
60000/60000 [==============================] - 232s - loss: 0.0445 - acc: 0.9871 - val_loss: 0.0291 - val_acc: 0.9898
Epoch 10/12
60000/60000 [==============================] - 200s - loss: 0.0427 - acc: 0.9874 - val_loss: 0.0280 - val_acc: 0.9909
Epoch 11/12
60000/60000 [==============================] - 219s - loss: 0.0396 - acc: 0.9884 - val_loss: 0.0286 - val_acc: 0.9897
Epoch 12/12
60000/60000 [==============================] - 205s - loss: 0.0379 - acc: 0.9884 - val_loss: 0.0281 - val_acc: 0.9902

実行結果

import matplotlib.pyplot as plt
#正答率
plt.plot(history.history['acc'])
plt.plot(history.history['val_acc'])
plt.title('model accuracy')
plt.ylabel('accuracy')
plt.xlabel('epoch')
plt.legend(['train', 'test'], loc='upper left')
plt.show()
#loss
plt.plot(history.history['loss'])
plt.plot(history.history['val_loss'])
plt.title('model loss')
plt.ylabel('loss')
plt.xlabel('epoch')
plt.legend(['train', 'test'], loc='upper left')
plt.show()

png f:id:forhighlow:20170814154841p:plain

png f:id:forhighlow:20170814154846p:plain

実行結果の比較

CNNではない実装

Epoch 12/20
60000/60000 [==============================] - 15s - loss: 0.0286 - acc: 0.9911 - val_loss: 0.0573 - val_acc: 0.9831

Epoch 20/20
60000/60000 [==============================] - 16s - loss: 0.0133 - acc: 0.9959 - val_loss: 0.0615 - val_acc: 0.9831

CNNによる実装

Epoch 5/12
60000/60000 [==============================] - 249s - loss: 0.0618 - acc: 0.9814 - val_loss: 0.0354 - val_acc: 0.9885
Epoch 6/12
60000/60000 [==============================] - 217s - loss: 0.0556 - acc: 0.9832 - val_loss: 0.0354 - val_acc: 0.9876

Epoch 12/12
60000/60000 [==============================] - 205s - loss: 0.0379 - acc: 0.9884 - val_loss: 0.0281 - val_acc: 0.9902

正答率

　どちらも，98.8%以上の確率で文字を認識している．しかし，CNNを用いた実装のほうが，収束が遅い．

　原因は二つ考えられる．

1つは一番の違いである，ニューラルネットワーク層の構造が複雑になったことから，12というephoch数では，足りなかったと考えられる．

2つ目は，原因はなく，この差はただの誤差であると考えることだ．ニューラルネットワークの実装の課程で，ランダムにニューロンを削除するdropoutや，正答かどうかを判断するための教師データを元データからランダムに選び出したりなど，ランダムに選ぶことがよくある．この為にたまたま収束が遅い事があり得ると考えられる．

今後の課題

　本稿では，MNIST分類問題をテーマに，畳み込みニューラルネットワーク(CNN)とそれ以前のニューラルネットワークを比較して実装し，CNNの特徴について学んだ．

　本稿ではMNIST分類をテーマとして選択したが，CNNの特徴であるデータの形状が持つ情報を活かせる複雑なテーマではなかったことがCNNとそうでない実装の実験結果の比較からも分かる．次はこれらの違いが如実に出るような，複雑な分類問題に取り組みたい．

引用元

https://keras.io/ja/

本稿を参照したい場合

本稿を参照したい場合 https://github.com/psato/Keras-MNIST

参考

今回も大変役立った参考書こちらを見れば，基本的構造はすべてわかると言って過言でない．ただ，コードを実際に引用してもあまり旨味はない．Kerasを用いていないため理論的理解は進む．

O'Reilly Japan - ゼロから作るDeep Learning

Kerasが公開しているMNISTの例

keras/mnist_cnn.py at master · fchollet/keras · GitHub

画像の確認や，基本的構造を解説しているわかりやすいサイト

KerasでDeep Learning：KerasでMNISTデータを扱ってみる - データサイエンティスト(仮)

Keras

日本語ドキュメント

最適化 - Keras Documentation

分からないモジュールの引用を，ここで検索すると，機能がわかる．簡潔で分かりやすい！

次はこれにチャレンジ

Deep Learning はじめました【CIFAR-10の識別】 - sonickun.log

CIFAR-10 and CIFAR-100 datasets

ipython からスライド作成

iPython でスライド作り - Qiita

Converting notebooks to other formats — IPython 3.2.1 documentation

Jupyter nbconvert（ファイル変換）メモ - はしくれエンジニアもどきのメモ

エラーの対処パッケージのインストールで済むことが多い．

2017-07-25

就職活動

先輩の事例から
まとめ
- やること

先輩の事例から

就職した先輩の話を聞いて，重要であると感じたことを書く．

github

先輩は，企業のgithubにpullリクエストを送りまくっていたそうだ．

githubへのcommit数でその人のやってきたことを見ている．

hcm-jinjer.com

成果物を作ることの必要性

githubにスクリプトが置かれているだけでは，イマイチよくわからない．

動くサービスがある．それを動かしている．あるいは，他人が使える状態にある．

良きにつけ悪しきにつけ，人に見られて評価されている．

面接の練習

私も，インターンシップのskype面接を経験してわかったことだが，面接の力は面接をやらないと力がつかない．

なんでも，先輩の一人は，職安の無料面接講習を予約し，練習していたそうだ．

インターンシップ

インターンシップで企業は，つばを付けたい．これは事実だそうだ．実際，いくつもの企業が内々定を出してきたそうだ．

コーディングスキルチェック

先輩「自分は自分のスキルを知っているが，面接官にとっては未知の世界」

paizaコーディングスキルチェックとは | ITプログラマー・エンジニア転職のpaiza転職

いくら面接が上手で，喋りが上手でも，技術力は証明できない．

paizaは企業と直接繋がれるのでおすすめ，だそうだ．

学習コースを修める

www.weblio.jp

MITなどのオンライン学習コースを修めると，修了書がもらえる．

「これは偽造可能なので，これで技術力は証明できない．しかし，"自己学習するくらい意欲があるんだよ"とわからせることはできる」

面接官から見て

人事担当の人の言葉で印象的だったのは，「新卒は見込み採用である．よって，技術よりがんばりそうだと思わせなければならない．」

「面接官は，"時間2000をこいつに払えるか，一年500万はこいつに払えるか，(生涯賃金として)3億払えるか"を考えている．」

値踏みされる自分

これらの言葉は，当たり前ではあるが，自分が値踏みされるということだ．誰だって自分を値踏みしてくるやつは嫌いだし，そんなことは考えたくない．しかし，それことが就活，というより，自己分析の本質であるし，成長の機会でもある．

まとめ

先輩たちは，日頃からコーディングをしたり，面接練習したり，努力をしていた．

自分もそれにならって，勉強していきたい．

やること

汚くても成果物を作り，公開する．
paizaでコーディング
コースへの加入

2017-07-25

英単語学習のメモ

やる気目標英語学習

ルール決め

ルール決め

効率的な英単語学習をするために，守るべきルールを決める．

それを守って，精神衛生状態をよく保ち，勉強していく．

これをわざわざ恥ずかしげもなく，blogに書く理由．

忘れてしまうから．
修正できるから．
見られていると気持ちが引き締まる．

興味のあるものから

範囲を絞り，一日に何度も見る

範囲を絞るとは，ページだけに限らない

本文を全て読んでいくよりは，目次や注目すべき単語を読んでいく．．

すべてやろうとしない．

すべてやらなければ，という気持ちは，勉強意欲を失わせ，プロジェクトの進度を遅くする．

ペンで強調する．

興味のあるものを，ペンで協調して，周回する．

いらない or 覚えたら消す．

ペンで，必要ない部分はバツじるしで消し，わかりやすくする．

汚す．

達成度を感じるために，勉強した後を積極的に残す．

覚えたかどうかを確認する．

覚えたら，消す作業をすることで，覚えたかを確認する．

ピボットで

興味のあるところから，ピボットで学習をすすめる．

そして，次の興味のあるところに進む．

blogに書くことでは無い気がする．

2017-07-25

本は買った時点で目を通す．

つくづく思うこと

つくづく思うこと

本は積んでおくと，読むのが億劫になる．

ソーシャルメディアの解析

nokogiriができないエラー

基本的流れ

bundle execが必要なくなる

railsを学ぶ為にやるサイト

railsgirls

要旨

所感

参考

私的!最速!CNNによるMNIST分類問題!

注意

実験内容

実験

CNNを用いないMNIST分類の実装

データの確認

3層ニューラルネットワーク

Affineレイヤとは

CNNにおけるAffineレイヤ

softmaxレイヤとは

ReLUレイヤとは

考察

考察を踏まえた改善

Dropout関数

最適化関数

Adadelta

RMSprop

改善の結果

CNNによるMNIST分類の実装

異なる点

CNNによる3層ニューラルネットワーク

Convolutionレイヤ

畳み込み演算

Poolingレイヤ

Flatten関数

実行結果

実行結果の比較

CNNではない実装

CNNによる実装

正答率

今後の課題

引用元

本稿を参照したい場合

参考

先輩の事例から

成果物を作ることの必要性

動くサービスがある．それを動かしている．あるいは，他人が使える状態にある．

良きにつけ悪しきにつけ，人に見られて評価されている．

面接の練習

コーディングスキルチェック

学習コースを修める

面接官から見て

値踏みされる自分

まとめ

やること

ルール決め

これをわざわざ恥ずかしげもなく，blogに書く理由．

興味のあるものから

範囲を絞り，一日に何度も見る

すべてやろうとしない．

ペンで強調する．

いらない or 覚えたら消す．

汚す．

覚えたかどうかを確認する．

ピボットで

blogに書くことでは無い気がする．

つくづく思うこと

本は買った日に読む.

参考書は買った日に問題を解く.

技術書はサンプルを実行する．