文章作者:Tyan
博客:noahsnail.com | CSDN | 简书
1. 问题描述
今天使用Caffe进行分类模型训练时,迭代到一定次数后loss突然增大到某个固定值,然后保持不变。日志如下:
1 | I0705 14:57:14.980687 320 solver.cpp:218] Iteration 44 (2.60643 iter/s, 0.383667s/1 iters), loss = 0.263664 |
2. 解决方案
调整参数,例如学习率之类的都没用。调查发现finetune时冻结了BN层的参数(即batch_norm_param
中的use_global_stats
设置为true
),将其use_global_stats
设置为false
,问题解决。