首先,您需要安装Python。它可能已经安装在您的系统上。如果没有,您可以访问https://www.python.org/。

接下来,您需要为机器学习代码和数据集创建一个工作区目录。打开终端并键入以下命令(在$提示之后):

$ export ML_PATH="$HOME/ml" # You can change the path if you prefer
$ mkdir -p $ML_PATH

您将需要一些Python模块:Jupyter、NumPy、Pandas、Matplotlib和Scikit-Learn。如果您已经安装了所有这些模块的Jupyter,您可以安全地跳过第43页的“下载数据”。如果还没有它们,有很多方法可以安装它们(以及它们的依赖关系)。你可以使用你的系统的打包系统(例如,apt-get on Ubuntu,或MacPorts或macOS上的HomeBrew),安装一个科学的分布式Python版,比如Anaconda,使用它的打包系统,或者只是使用Python自己的打包系统,pip,它现在已经被默认的包含在Python的安装包中,您可以通过键入以下命令来检查是否安装了pip:

$ pip3 --version
pip 9.0.1 from [...]/lib/python3.5/site-packages (python 3.5)

您应该确保已经安装了最新版本的pip,至少版本在也要在1.4以上,以中支持二进制模块安装(也称为“车轮”)。要升级pip模块,请键入。

$ pip3 install --upgrade pip
Collecting pip
[...]
Successfully installed pip-9.0.1

创建一个孤立的环境

如果你想在一个孤立的环境工作(强烈建议这么做,因为您可以在不同的项目上工作,而不需要有冲突的库版本)。通过运行以下pip命令来安装virtualenv:

$ pip3 install --user --upgrade virtualenv
Collecting virtualenv
[...]
Successfully installed virtualenv

现在,您可以通过输入创建一个孤立的Python环境:

$ cd $ML_PATH
$ virtualenv env
Using base prefix '[...]'
New python executable in [...]/ml/env/bin/python3.5
Also creating executable in [...]/ml/env/bin/python
Installing setuptools, pip, wheel...done.

现在每次你想激活这个环境,只要打开一个终端,并键入:

$ cd $ML_PATH
$ source env/bin/activate

虽然环境被激活了,但是您安装的任何包都将安装在这个隔离的环境中,而Python也只能访问这些包(如果您还希望访问系统的站点包,您应该使用virtualenv的——系统站点包选项创建环境)。查看virtualenv的文档了解更多信息。

现在,您可以使用这个简单的pip命令来安装所有必需的模块和它们的依赖关系:

$ pip3 install --upgrade jupyter matplotlib numpy pandas scipy scikit-learn
Collecting jupyter
Downloading jupyter-1.0.0-py2.py3-none-any.whl
Collecting matplotlib
[...]

要检查您的安装,请尝试导入每个模块:

$ python3 -c "import jupyter, matplotlib, numpy, pandas, scipy, sklearn"

应该没有输出,也没有错误。现在,你可以通过键入下面额命令来启动Jupyter:

$ jupyter notebook
[I 15:24 NotebookApp] Serving notebooks from local directory: [...]/ml
[I 15:24 NotebookApp] 0 active kernels
[I 15:24 NotebookApp] The Jupyter Notebook is running at: http://localhost:8888/
[I 15:24 NotebookApp] Use Control-C to stop this server and shut down all
kernels (twice to skip confirmation).

一个Jupyter服务器现在正在您的终端上运行,监听端口8888。您可以通过将web浏览器打开到http://localhost:8888/\(这通常在服务器启动时自动发生\)访问此服务器。您应该看到您的空的工作区目录\(如果您遵循前面的virtualenv指令,那么只包含env目录\)。

现在,通过单击new按钮创建一个新的Python笔记本,并选择合适的Python版本(参见图2-3)。

这做了三件事:首先,它在您的工作区创建了一个名为Untitled.ipynb的新的笔记本文件。在您的工作区ipynb;其次,它启动了一个Jupyter Python内核来运行这个笔记本;第三,它在新标签页打开了这个笔记本。您应该首先将这个笔记本重命名为“Housing”(这将自动将文件重命名为Housing.ipynb),方法是单击“Untitled”并输入新名称。

图2 - 3 你在Jupyter中的工作区

一个笔记本包含一个单元格列表。每个单元格可以包含可执行代码或格式化的文本。现在,笔记本只包含一个空的代码单元格,标记为“In[1]:”。在单元格中尝试键入print(“Hello world!”),然后单击play按钮(参见图2-4)或按Shift-Enter。这会将当前单元格发送到该笔记本的Python内核,该内核运行它并返回输出。结果显示在单元格下面,当我们到达笔记本的末尾时,会自动创建一个新的单元格。从Jupyter的帮助菜单中浏览用户界面,了解基本情况。

图2 - 4 Hello world Python笔记本

results matching ""

    No results matching ""