1. 程式人生 > >Python Web框架Tornado的異步處理代碼演示樣例

Python Web框架Tornado的異步處理代碼演示樣例

str lease 異步處理 item 行業 異步模式 業務 怎樣 mvc

1. What is Tornado

Tornado是一個輕量級但高性能的Python web框架,與還有一個流行的Python web框架Django相比。tornado不提供操作數據庫的ORM接口及嚴格的MVC開發模式,但能夠提供主要的web server功能。故它是輕量級的;它借助non-blocking and event-driven的I/O模型(epoll或kqueue)實現了一套異步網絡庫,故它是高性能的。

Tornado的輕量級+高性能特性使得它特別適用於提供web api的場合,使用合理的話,其非堵塞+異步能力能夠應對C10K問題。

須要特別註意的是,因為Python的GIL導致多線程總是單核運行的”特點”,tornado處理http請求時,若某個請求的後端響應有堵塞現象(如從DB或磁盤讀數據導致處理時間非常長),則會導致其他http請求也被block,這會嚴重拖累tornado在高並發場景下的性能。

幸運的是。tornado提供了異步處理請求的能力,在異步模式下,我們能夠通過傳入回調函數或借助tornado提供的tornado.gen.coroutine裝飾器,使得tornado內部的io loop在等待當前請求響應結果的同一時候,仍然能夠接受其他的http請求,這樣就避免了某個耗時操作影響tornado的處理能力。

2. 怎樣在tornado框架下編寫異步處理代碼

Tornado官網文檔給出了幾個簡單的異步代碼演示樣例,只是說實話,代碼太過簡單(都是在某個uri的handler類的get或post函數中展現了主要的異步語法),沒有多大的實戰意義。

在實際項目中。復雜的處理邏輯不可能都堆在get或post函數中,而是會封裝在其他class中供handler類的get或post函數調用。

所以,本文給出一個稍復雜的實例,旨在說明怎樣在其他class的函數中實現異步處理邏輯,以實現http請求異步化處理的目的。

如果如今的需求是用tornado實現一個web server,支持名為cityhotel的uri方法,當client通過http GET請求訪問該uri時,web server依據query參數指定的城市,去請求存放hotel具體數據的還有一個後端api。進行業務處理後返回某個連鎖hotel在該城市的全部門店給client。


如果client GET請求的url格式為:http://host/api/hotel/cityhotel?city=xxx
再如果存放hotel具體數據的後端api接口為:

city=xxx">http://hotel_backend/getCityHotels?

city=xxx

依據上面的場景,因為我們用tornado實現的web server接到client的請求後,還要去還有一個API接口請求基礎數據,而後者在返回前,tornado會block,所以,這樣的場景下,tornado最好以異步方式請求那個提供基礎數據的API。避免不可控的後端拖累tornado的響應性能。

依據上面描寫敘述的業務需求。以下的代碼示範了怎樣通過異步方式處理業務處理。

模塊入口文件(main.py):

#!/bin/env python

import tornado.ioloop
import tornado.web
import tornado.gen
import hotelcore


class CityHotelHandler(tornado.web.RequestHandler):
    @tornado.gen.coroutine
    def get(self):
        ## parse query params
        params = {}
        keys = [‘city‘]
        for key in keys:
            value = self.get_query_argument(key)
            params[key] = value
        (status, rsp) = yield hotelcore.HotelApiHandler.get_city_hotel(params[‘city‘])
        if 200 == status:
            self.set_header(‘content-type‘, ‘application/json‘)
            self.finish(rsp)
        else:
            self.set_status(404)
            self.finish()



def main():
    app_inst = tornado.web.Application([
        (r‘/api/hotel/cityhotel‘, CityHotelHandler),
    ], compress_response = True)

    app_inst.listen(8218)
    tornado.ioloop.IOLoop.current().start()


if ‘__main__‘ == __name__:
    main()

處理業務邏輯的module封裝在hotelcore.py文件裏,代碼例如以下:

#!/bin/env python
#-*- encoding: utf-8 -*-

import json

from tornado import gen
from tornado import httpclient


class HotelApiHandler(object):
    _cfg_dict = {
        ‘api_host‘ : ‘api.hotelbackend.com‘,
    }


    @classmethod
    @gen.coroutine
    def get_city_hotel(cls, city):
        ret = yield cls._parallel_fetch_city_hotel(city)
        raise gen.Return((200, ret))


    @classmethod
    @gen.coroutine
    def _parallel_fetch_city_hotel(cls, city):
        base_url = ‘http://%s/v1/getCityHotel‘ % (cls._cfg_dict[‘api_host‘])
        ## hote type: 1=normal room; 2=deluxe room
        hotel_type = {‘normal‘: 1, ‘deluxe‘: 2}
        urls = []
        for v in hotel_type.values():
            api_url = ‘%s?city=%s&level=%s‘ % (base_url, city, v)
            urls.append(api_url)
        ## issue async http request
        http_clt = httpclient.AsyncHTTPClient()
        rsps_dict = yield dict(normal_room = http_clt.fetch(urls[0]), deluxe_room = http_clt.fetch(urls[1]))
        city_hotel_info = cls._parse_city_hotel(rsps_dict, city)
        ret = { }
        if len(city_hotel_info):
            ret[‘errno‘]  = 0
            ret[‘errmsg‘] = ‘SUCCESS‘
            ret[‘data‘]   = city_hotel_info
        else:
            ret[‘errno‘]  = 1
            ret[‘errmsg‘] = ‘Service Not Found at This City‘
            ret[‘data‘]   = ‘‘
        raise gen.Return(ret)


    @classmethod
    def _parse_city_hotel(cls, rsp_dict, city):
        city_hotel_info = {}
        for hotel_level, rsp in rsp_dict.items():
            rsp_json = json.loads(rsp.body)
            datas = rsp_json[‘data‘]
            for city_id, city_detail in datas.items():
                name = city_detail[‘name‘]
                if city in name:
                    city_hotel_info[hotel_level] = city_detail
                    break
        return city_hotel_info

對以上代碼的幾點補充說明:

  • 編寫tornado異步處理代碼須要對Python的decorator語法和generator/yield語法比較熟悉
  • tornado提供的裝飾器@gen.coroutine表明被裝飾函數是個異步處理函數,該函數的調用不會block tornado主線程
  • 被@gen.coroutine裝飾的函數中,須要異步運行的耗時函數用yield來調用,yield本身返回的是個generator,結合@gen.coroutine後。它返回一個tornado定義的Future類型的對象
  • yield調用的函數在運行過程中。進程控制權會返給主線程,故即使該函數須要較長運行時間,tornado的主線程也能夠繼續處理其他請求
  • 在Python 2.x版本號的語法中。generator中不同意用return返回函數的返回值。必須用tornado提供的raise gen.Return(ret)達到返回的目的。這是個比較tricky的方法
  • yield返回的Future對象能夠通過調用body屬性來獲取通過yield調用的函數的返回值
  • 僅僅要結合上述幾點理解了@gen.coroutine和yield在tornado異步編程中的語法意義,那麽,寫出復雜的異步調用代碼與編寫實現同樣功能但tornado總體性能無法保證的同步調用代碼相比。實現難度就差點兒不存在了。

上面的代碼非常多語法細節沒有展開,希望實現思路能幫助到有緣人。^_^

參考資料

  1. Tornado Doc: User’s guide
  2. Book: Introduction to tornado chapter 5. asynchronous web services

Python Web框架Tornado的異步處理代碼演示樣例