21:48 ? # /question/来源:知乎著作权归作者所有商业转载请联系作者获得授权,非商业转载请注明出处 调了快1年的rnn, 深刻的感受到,深度学习是一门实验科学,下面是一些炼丹心得. 后面会鈈断补充. 有问题的地方,也请大家指正. ...
19:11 ? 参数初始化 下面几种方式,随便选一个,结果基本都差不多。但是一定要做否则可能会减慢收敛速度,影响收敛结果甚至造成Nan等一系列问题。n_in为网络的输入大小n_out为网络的输出大小,n为n_in或(n_in+n_out)*0.5Xavier初始法论文:http://jmlr.org/proc...