文章作者:Tyan
博客:noahsnail.com | CSDN | 简书
注:本文为李沐大神的《动手学深度学习》的课程笔记!
高维线性回归数据集
1 | # 导入mxnet |
定义训练和测试
1 | %matplotlib inline |
训练模型并观察过拟合
1 | train(0) |
('learned w[:10]:',
[[ 1.04817235 -0.02568591 0.86764944 0.29322273 0.01006198 -0.56152564
0.38436413 -0.3084037 -2.32450151 0.03733355]]
<NDArray 1x10 @cpu(0)>, '\nlearned b:',
[ 0.79914868]
<NDArray 1 @cpu(0)>)
使用Gluon的正则化
1 | train(5) |
('learned w[:10]:',
[[ 0.00107634 -0.00052574 0.00450234 -0.00110544 -0.00683913 -0.00181657
-0.00530634 0.00512847 -0.00742552 -0.00058494]]
<NDArray 1x10 @cpu(0)>, '\nlearned b:',
[ 0.00449433]
<NDArray 1 @cpu(0)>)
可用权重衰减代替L2正则化的原因
注:图片来自Gluon社区。