机器学习为什么需要策略

机器学习(machine learning)已然成为无数重要应用的基石——如今,在网络搜索、垃圾邮件检测、语音识别以及产品推荐等领域,你都能够发现它的身影。如果你或你的团队正在研发一款机器学习相关应用,并期待取得较快进展,那么这本书将会是你的得力助手。

案例:建立猫咪图片初创公司

想象一下,你正在建立一家初创公司,这家公司的产品目标是为猫咪爱好者们提供数不尽的猫咪图片,你打算应用神经网络(neural network)技术来构建一套计算机视觉系统,通过该系统来识别图片中的猫。

但悲剧的是,目前你的学习算法准确度还不够好。为了改进这个猫咪检测器,你正面临着巨大的压力。可你该怎么做呢?

你的团队给出了许多建议,例如:

  • 获取更多的数据,即收集更多的猫咪图片
  • 收集更加多样化的训练数据集,图片中猫的位置可能不常见,也有可能颜色奇异,或者拍摄时使用不同的相机参数
  • 通过增加梯度下降的迭代次数,使算法训练得久一些
  • 尝试一个拥有更多层/更多隐藏元/更多参数的,规模更大的神经网络
  • 尝试一个更小的神经网络
  • 尝试加入正则化(例如 L2 正则化)
  • 改变神经网络的架构(激活函数,隐藏元数量等等)

在上面众多的方向中,如果你做出了正确的选择,就将建立起一个效果领先的猫咪图片识别平台,并带领你的公司取得成功。但如果你选择了一个糟糕的方向,则可能因此浪费掉几个月的时间。那么你该如何做出决定呢?

这本书将告诉你应该怎么做。众多的机器学习问题会留下一些线索,告诉你什么样的尝试有用,什么样的没用。而学会解读这些线索将会节省你几个月甚至几年的开发时间。


改进当前页面