かりんちゃんの随心遊戯日誌

ゲームの日記、たまに政治の話、香港の話

自然言語処理と遊ぶ…

最近は圧倒的にプログラミングのほうに夢中ですね…。ゼロから作るDeep Learning 2をやっと読了したが、最後のseq2seqとAttentionに惹かれて、色々と遊びんでいた。もちろん複雑なモデルを組むと行列のサイズに苦戦したこともあるが(正直そこはまだ慣れてない)、どこかで50000個の翻訳サンプルをモデルを入れて、うまく学習できたとみた時、なかなか達成感があるんですね。(Testデータでは正解率が10%しかないけど、よくみたら「彼は私の古い友人です。」と「彼は僕の古い友人です。」のような違いが多いので、おそらくそこまで悪くない。)

Googleの翻訳もこうやって作られたし、ぼくもある程度Googleに近づいたね!とか。

ただ、本場の翻訳はさすがに50000個でも足りないだろうし、それ以上だとボクのパソコンも限界に来ていた。すでにGPUのリソースを使ったんですが、やはり翻訳はそんなじゃ全然足りないと思うな…。

結局、やはりTensorflowなどを使うしか無いよね。以前ではTensorflowを何本も読んだことけど、どれも頭に入らなかった。一つの理由は原理の解説はあまりはっきりにしてない(ただ使えば良いんだよ!というのはぼくは全然納得しないのです)。しかしゼロから作るDeep Learning 2を通じて、関数からレイヤー、レイヤーからモデル、こうやって全部自分の手で組むと、原理も覚えていく。こうして後ろの理論も覚えたいま、もう一度以前理解できなかったTensorflowの本にチャレンジしてみたい。

ただ、あまり遊びすぎて最近脳内はLSTMのレイヤーばっかりになっていて、ちょっと頭が混雑になってしまう。

 

ゲームは、一応零改を進んでいますが、わりと遅め…つーか、買った鬼滅の最新巻すら読む暇がないんです…。