现在,你已经知道了很多关于机器学习的知识。然而,学过了这么多概念,你可能会感到有些迷失,所以让我们退回去,回顾一下重要的:

  • 机器学习是让机器通过学习数据对某些任务做得更好,而不使用确定的代码规则。

  • 有许多不同类型的机器学习系统:监督或非监督,批量或线上,基于实例或基于模型,等等。

  • 在一个ML项目中,您在训练集中收集数据,并将训练集提供给学习算法。如果该算法是基于模型的,它会调整一些参数,让模型拟合到训练集(例如:对训练集本身作出好的预测),然后希望它对新样本也能有好预测。如果该算法是基于实例的,那么它就会凭借记忆学习这些样本,然后用相似性度量泛化到新实例。

  • 如果您的训练集太小,或者数据不具有代表性、含有噪声或被不相关的特性(垃圾、垃圾)污染,系统将无法正常运行。最后,您的模型需要既不太简单(在这种情况下,它将会发生欠拟合),也不太复杂(在这种情况下,它将会过拟合)。

还差最后一个主题要学习:一旦你训练了一个模型,你就不会仅仅希望它能泛化到新的案例。你想要对它进行评估,并在必要时对其进行优化。让我们来看看。

results matching ""

    No results matching ""