
上QQ阅读APP看书,第一时间看更新
1.2 为什么要使用Python进行数据分析
在成为数据分析和人工智能等领域的“头号选手”之前,Python早就因其大量的Web框架、丰富的标准库,以及众多的扩展库等特点成为网络建站、系统管理、信息安全等领域的热门方案。例如,有名的豆瓣网站就是基于Python开发的,Linux所有的发行版都默认安装了Python。
近年来,Python的科学计算库(如结构化数据操作库Pandas、机器学习库scikit-learn)不断进行改良,使得利用Python进行数据分析成了优选方案。Python还有一个“胶水语言”的称号,这来源于它能够非常轻松地集成C、C++等底层代码,进行计算优化。与SAS和R等分析建模领域特定编程语言相比,Python可以同时用于项目原型的构建和生产(前者则主要用于项目原型的构建),从而避免了使用多个语言的麻烦。加上Python本身多年来不断提升的强大编程能力,用户只需要使用Python就可以实现以数据为中心的建模、分析与应用。
可以说,Python在数据分析领域的迅猛发展与其本身非常成熟且广泛的应用是分不开的,Python开源、简明易用的特点也让开发者和使用者自觉倾注精力共同维护社区环境,构建了整个Python计算分析领域的良好生态系统。