2015 年Python 数据科学的5个重大进展

Python部落(python.freelycode.com)组织翻译,禁止转载,欢迎转发。

有时候想跟上Python数据科学领域发生的所有新技术是很难的,而且谁又有时间观看PyData 和SciPy交流大会的视频呢?好吧,我刚看过会议的视频,所以我给大家简单总结一下里面最棒的东西。

 Numba

     ——即时编译

   它让python代码编写变得越来越酷而且运行越来越快。以前,为了让代码运行速度有显著提升,你不仅需要重构代码而且必须把代码分割成可编译的单元。现在你不需要重写你的代码,也不需要预编译!你只需要一个装饰器。

代码举例如下:


blob.png


  它甚至会提醒你哪些东西能做的更棒。如果你想了解更多,看看这个2015 Scipy的视频(https://youtu.be/eYIPEDnp5C4


 Conda

    ——替换pipvirtualenv


           Conda是未来,为什么? 因为它在包管理方面比pip更好,在虚拟环境管理方面比virtualenv更好而且它是与平台无关的。

我推荐阅读“为什么我提倡用Conda” 或者“我的python工作环境和Conda”关于他们用Conda的原因。

  

 The Jupyter notebook

  ——有GitHub... 和Binder... 还有Pinapple…以及tmpnb.org!


   直到我的iPython 记事本突然换了个新Logo我才知道它。 这个记事本项目已经发展壮大并且扩展了其他语言,现在已经从IPython 记事本内核分离出来了。这意味着任何语言都可以实现用新的Jupyter 记事本工作。这次分离已经产生了一个围绕Jupyter记事本的完整生态系统。

   下面列的这些我最喜欢的。

          GitHub rendering

          .ipynb类型的文件现在可以直接在github里面呈现。 BuzzFeed新闻已经通过这种方式开源他们的数据分析!

blob.png


          Binder

    让你即刻把一个GitHub仓库变成一系列运行在云端的可交互的笔记本并且可以通过浏览器进行交互。这将是完全革命化的技术并且把资料新闻学提升到下一水平方便共享,容易复制

          Tmpnb.org

    让你立刻打开一个临时记事本,去试试吧

          Pineapple

    一个在苹果电脑上运行的桌面应用程序。 虽然它还需要完善,但是我已经爱上它了!

           视频: https://youtu.be/68xK4KQXRI4

    而且Jupyter 团队正在继续开发,不久Jupyter 记事本会支持实时协作。

 

 Matplotlib 2.0

    ——它现在有点漂亮了

   

    你相信吗?现在Matplotlib 制图 看起来有些漂亮了 。虽然每次你需要用老的默认的matplotlib画些东西的时候,它总会让你尖叫,但是现在你可以用一小撮不同的预定义的熟悉的样式像ggplot,面向黑客的贝叶斯方法或FiveThirtyEigh。只要输入如下blob.png  


这里是一些样式图:

blob.png

 

blob.png


       matplotlib 2.0 会打破向后兼容性 ,此举有望让它更便于使用。 但是我仍然推荐通过Seabornmatplotlib 交互。

 

  上面展示的样式图不是新的,matplotlib 2.0新的功能是将会用一个漂亮的默认样式。具体是哪一个还没定,但是老的matplotlib 1.x的样式可以像这样恢复:

blob.png


  TensorFlow

      ——  一个Google的第二代深度学习库 


           可能你不是没见过它。如果这样的话,你可以一探究竟。虽然这个项目仍然有些初期的毛病,但是在GitHub上它很快获得了比其他开源深度学习库更多的追随者。主要是因为疯狂的大量炒作. 但是让我们拭目以待。

   目前为止我见过的最好的深度学习框架间的对比是这个

 

 

 


英文原文:https://medium.com/@elgehelge/the-5-most-important-python-data-science-advancements-of-2015-a136482da89b#.jqoqy2o77
译者:geek123
 

2月15日11:00到13:00网站停机维护,13:00前恢复