手机版
你好,游客 登录 注册 搜索
背景:
阅读新闻

Python进行数据分析及相关Package的安装

[日期:2017-06-11] 来源:Linux社区  作者:leohahah [字体: ]

一、为什么要使用Python进行数据分析?

Python拥有一个巨大的活跃的科学计算社区,拥有不断改良的库,能够轻松的集成C,C++,Fortran代码(Cython项目),可以同时用于研究和原型的构建以及生产系统的构建。

二、Python的优势与劣势:

1.Python是一种解释型语言,运行速度比编译型数据慢。
2.由于python有一个全局解释器锁(GIL),防止解释器同时执行多条python字节码,所以python不适用于高并发、多线程的应用程序。
 
三、使用Python进行数据分析常用的扩展包。
 
目前初始阶段的学习主要涉及4个包的安装:numpy、scipy、pandas、matplotlib
我笔记本里安装的是Python2.7版本,在安装了pip和setuptools工具,关于pip和setuptools工具的安装详见相关笔记。
最初使用的安装命令很简单:
pip install pandas
pip install numpy
pip install scipy
pip install matplotlib

但是只安装成功了numpy和matplotlib两个包,pandas和scipy安装失败,查阅了相关资料发现可能是版本问题或者包的依赖相关。

最终在stack overflow发现了一个很棒的Python包提供网址:http://www.lfd.uci.edu/~gohlke/pythonlibs/#scipy

当然官网也是非常好的,但是有些包更新的太频繁,官网可能不提供2.7某些包的支持。

--这里要Mark一下,后边争取写一个爬虫,搞下来所有的包防止丢失。

以上网址是加州大学欧文分校提供的Python相关库的下载地址,修改#后边的名字可以进去其他包的下载页面,此页面中提供了安装某个包需要依赖的前置包的说明,非常友好。

依赖包说明类似:

Pandas, a cross-section and time series data analysis toolkit.
Requires numpy, dateutil, pytz, setuptools, and optionally numexpr, bottleneck, scipy, matplotlib, pytables, lxml, xarray, blosc, backports.lzma, statsmodels, sqlalchemy and other dependencies.

然后就是一堆的pandas下载地址。

最终根据各个包的相关性先安装了numpy+mkl的whl文件,然后是安装scipy最后是pandas。

安装的方法如下:

1.下载对应的4个包放在D:\目录下(很奇怪我笔记本是AMD64位的但是安装amd64版本的包报不支持的platform的错误,安装了32位的可以正常import)

2.cmd命令行进入D:\目录执行:pip install <包的全名>进行安装。(如果已安装了其他错误的版本,使用pip uninstall卸载)

最后使用如下类似命令查看包的安装位置:

 

Python 安装setuptools和pip工具

 

setuptools模块和pip模块是python进行第三方库扩展的极重要工具,例如我们在需要安装一些爬虫或者数据分析的包时就可以使用pip install命令来直接安装这些包了,因此pip工具一定要提前安装。

 

一、安装setuptools

 

在python交互界面执行如下命令,脚本我单独拿出来:

 

 

from urllib import urlopen
data = urlopen('http://peak.telecommunity.com/dist/ez_setup.py')
open('ez_setup.py','wb').write(data.read())
exit()

 

执行完毕后可以发现在C:\Users\Administrator目录下出现了一个ez_setup.py的文件,cmd执行python ez_setup.py,则安装setuptools完毕

 

二、安装pip工具

 

安装setuptool之后就可以安装pip啦。

 

安装setuptools完毕后在C:\Python27\Scripts就可以看到easy_install的模块了,可以使用cmd命令进入此目录,运行easy_install.exe pip来安装pip模块。

 

运行安装完毕后就可以在C:\Python27\Scripts下看到pip.exe工具,将C:\Python27\Scripts加入PATH则可以安装其他第三方标准库模块了,例如:

 

pip install requests可以安装requests模块。

本文永久更新链接地址http://www.linuxidc.com/Linux/2017-06/144606.htm

linux
相关资讯       Python进行数据分析 
本文评论   查看全部评论 (0)
表情: 表情 姓名: 字数

       

评论声明
  • 尊重网上道德,遵守中华人民共和国的各项有关法律法规
  • 承担一切因您的行为而直接或间接导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款