深度学习模型训练问题记录之梯度爆炸
在改变dropout值和增加归一化层之后,问题没有得到有效解决,但是加入模型参数初始化之后,问题得到了有效解决。最有用的可能是权重参数初始化,也足以看到初始化的重要性。模型训练的过程中损失值很大,且反复震荡不下降。
·
更多推荐
在改变dropout值和增加归一化层之后,问题没有得到有效解决,但是加入模型参数初始化之后,问题得到了有效解决。最有用的可能是权重参数初始化,也足以看到初始化的重要性。模型训练的过程中损失值很大,且反复震荡不下降。
更多推荐
所有评论(0)