到目前为止,您只需快速浏览一下数据,就能大致了解您所操纵的数据类型。现在的目标是深入一点的了解数据。

首先,确定你已经把测试集放在一边,你只探索训练集。另外,如果训练集非常大,你可能想要取样一个探索集,使操作简单快捷。在我们的例子中,这个训练集非常小,所以你可以直接在整个训练集上工作。让我们创建一个副本,这样你就可以在不伤害训练集的情况下使用它:

housing = strat_train_set.copy()

results matching ""

    No results matching ""