机器学习是编程计算机的科学(和艺术),因此他们可以从数据中学习。

这里有一个更一般的定义:

机器学习是一个研究领域,它使计算机能够在不被明确编程的情况下学习。    -------------Arthur Samuel, 1959

还有一个更工程化的定义:

对于某类任务T和性能度量P,如果一个计算机程序在T上以P衡量的性能随着经验E而自我完善,那么我们称这个计算机程序在从经验E学习
                                                                 ----------Tom Mitchell, 1997

例如,您的垃圾邮件过滤器是一个机器学习程序,可以根据给定的垃圾邮件样本(例如,用户标记的垃圾邮件)和正常的(非垃圾邮件,也叫“ham”)邮件的样本,学习标记垃圾邮件。系统用来学习的例子被称为训练集(training set)。每个训练样本被称为训练实例(training instance)/训练样本(training example)。在这种情况下,任务T是为新邮件标记是否为垃圾邮件,经验E是训练数据(training data),而性能度量P需要被定义;例如,你可以使用正确分类的邮件的成功比例。这种特殊的性能度量被称为精度(accuracy),它通常用于分类任务。

如果你只是下载了维基百科的副本,你的电脑就会有更多的数据,但它在任何任务上都不会突然变得更好。因此,这不是机器学习。

results matching ""

    No results matching ""