它们更像是在“记忆”数据而不是拟合数据

它们更像是在“记忆”数据而不是拟合数据它们更像是在“记忆”数据而不是拟合数据可以看到,低维隐藏层能够很好地捕捉到数据的总体趋势。更高的维度则更倾向于过拟合。它们更像是在“记忆”数据而不是拟合数据的大体形状。假如我们打算在独立测试集上评测该模型(你也应当这样做),隐藏层规模较小的模型会因为能更好的泛化而表现更好。虽然我们可以使用更强的泛化来抵消过拟合,但是为隐藏层选择一个合适的规模无疑是更加“经济”的方案。

直达链接
  • 我的微信
  • weinxin
  • 我的微信公众号
  • weinxin
avatar

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: