uvloop!让Python asyncio异步编程性能直逼Go协程性能

思考后端优化的事情,了解到了uvloop,它是python原生asyncio事件循环的替代品。

Python中的用法其实跟javascript中的asyncawait相似,毕竟脚本语言的规范,基本都是抄来抄去,都愿意把隔壁语言的优秀语法吸纳进来。这对开发者也很爽,更容易学另一门语言了。

Python3.4和3.5算是推动了一场革命,自此,Python异步编程越来越火(基于协程)。

也许你不懂协程,我简单介绍下:

以前我们用Python写爬虫,可能会用requests这个库,requests.get(url)发请求,等到有了结果,代码再继续进行下去。它是顺序的同步的执行。当请求发生时,你只能傻傻的等,不能让代码去做另一件事。除非你新开一个线程去做另一件事。

但是现在,我们有了异步编程。基于内置的事件循环,我们可以达到这样的效果:遇到I/O操作(例如Http请求)时,我们先暂停这段代码(这个任务)的执行,再去看看有没有其它任务可以执行,如果有其它任务可执行,就执行其它任务。如果所有任务都无法执行,就等着,直到有1个任务可执行了,就执行它,直到它运行完毕或者遇到I/O操作,再暂停它,执行其它任务。

注意,Python中的异步编程,是基于事件循环的。今天,我们要聊的就是事件循环。

为什么提高了性能

(说法来源于uvloop官方博客)

  • uvloop是基于Cython写的,执行效率更高。
  • uvloop底层基于libuv,而libuv是高性能、跨平台的异步IO库,nodejs的事件循环也是基于libuv的。
  • Benchmarks

    这不是我做的,我只是转发一下uvloop官方测试结果。

    分为两种测试:TCP协议和HTTP协议。

    TCP

    这是用简单的echo服务做的测试,不能代表所有生产环境的情况。

    分别用1KiB数据包、10KiB、100KiB做了测试。

    uvloop!让Python asyncio异步编程性能直逼Go协程性能

    可以看到uvloop确实牛逼,性能直逼Go。

    HTTP

    uvloop!让Python asyncio异步编程性能直逼Go协程性能

    解释下:官方人员本来想用aiohttp这个Python中最常用的异步http服务库测试的。但是它的http解析器效率太低了,已然成为整个系统的瓶颈,所以他们手动实现了http-parser(起初是为Nginx设计的,所以效率非常高)的Python版本,称之为httptools

    可以看到,asyncio原生事件循环和uvloop,对aiohttp没有性能提升!(看完后,我想:以后不敢用aiohttp了)

    而把http解析器这个瓶颈解决掉后,asyncio原生事件循环和uvloop性能都明显提升,但uvloop明显更牛逼,在10KiB和100KiB场景下,性能超越了Go。