Alan Hou的个人博客

使用Python进行数据分析I 环境准备

下载Python包并安装:https://www.continuum.io/downloads

Alan采用Mac OSX进行操作,这里下载最新版Python 3.5

在Terminal中输入python即可进入python命令行界面通过输出Hello, world!来进行验证,后面我们将需要NumPy, Pandas, Matplotlib, iPython和Seaborn安装包,通过import来查看,no news is good news, 只要不报错就说明已正确安装

>>> print("Hello, world!")  //测试命令
Hello, world!
>>> import numpy
>>> import matplotlib
>>> import pandas
>>> import IPython
>>> import seaborn
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
ImportError: No module named 'seaborn'

这里可以看到Seaborn并未正确安装,通过exit()或快捷键Ctrl+D可退出Python命令行,然后执行pip install seaborn来进行安装

 

常见问题
1.socket.timeout: The read operation timed out报错

... ...
pip._vendor.requests.packages.urllib3.exceptions.ReadTimeoutError: HTTPSConnectionPool(host='pypi.python.org', port=443): Read timed out.

出现这一问题猜测是由于网络连接问题,默认timeout的时间是15秒,可以使用参数–timeout中加大这一设置,如

pip install --timeout 1000 seaborn

为方便Python程序的编写和调试,我们将使用iPython Notebook来进行操作,在Terminal中输入ipython notebook就会自动在浏览器中打开http://localhost:8888/tree,首先我们新建一个文件:

默认为code模式,可以在里面直接输入命令并按下Shift+Return来执行命令,以下为演示模式:

如上图我们还可以在下拉框中选择Markdown模式来输入注释等内容,我们这里输入以下内容

This is a comment. Text can Be _italic_, **bold**.
# title level 1
## title level 2
* bullet 1
* bullet 2

$\sqrt(2+x)$

按下Shift+Return输出结果如下图所示

 

退出移动版