使用Python搭建http伺服器

為了提高Python網絡服務的可移植性，Python社區在PEP 333中提出了Web伺服器網關接口(WSGI，Web Server Gateway Interface)。

WSGL標準就是添加了一層中間層。通過這一個中間層，用Python編寫的HTTP服務就能夠與任何Web伺服器進行交互了。現在，WSGI已經成為了使用Python進行HTTP操作的標準方法。

按照標準的定義，WSGI應用程式是可以被調用的，並且有兩個輸入參數。

1、WSGI

下面是第一段代碼，第一個參數是environ，用於接收一個字典，字典中提供的鍵值對是舊式的CGI環境集合的拓展。第二個參數本身也是可以被調用的，習慣上會將其命名為start_response()，WSGI應用程式通過這個參數來聲明響應頭信息。

# 用WSGI應用形式編寫的簡單HTTP服務。

#!/usr/bin/env python3 
# A simple HTTP service built directly against the low-level WSGI spec. 
 
from pprint import pformat 
from wsgiref.simple_server import make_server 
 
def app(environ, start_response): 
 headers = {'Content-Type': 'text/plain; charset=utf-8'} 
 start_response('200 OK', list(headers.items())) 
 yield 'Here is the WSGI environment: 
 
'.encode('utf-8') 
 yield pformat(environ).encode('utf-8') 
 
if __name__ == '__main__': 
 httpd = make_server('', 8000, app) 
 host, port = httpd.socket.getsockname() 
 print('Serving on', host, 'port', port) 
 httpd.serve_forever()

上述只是一個簡單的情況。但是在編寫伺服器程序時，複雜度就大大提升了。這是因為要完全考慮標準中的描述的許多注意點和邊界情況。

2、前向代理與反向代理

無論前向代理還是反向代理，HTTP代理其實就是一個HTTP伺服器，用於接收請求，然後對接收到的請求(至少是部分請求)進行轉發。轉發請求時代理會扮演客戶端的角色，將轉發的HTTP請求發送至真正的伺服器，最後將從伺服器接受到的響應發揮扮演客戶端的角色，將轉發的請求發送至真正的伺服器，最後將從伺服器接受到的響應發回給最初的客戶端。

下面是前向代理和反向代理的簡圖。

反向代理已經廣泛應用於大型的HTTP服務當中。反向代理是Web服務的一部分，對於HTTP客戶端並不可見。

3、四種架構

架構師一般都使用很多種複雜的機制來將多個子模塊組合建成一個HTTP服務。現在在Python社區中，已經形成了4種基本的模式。如果已經編寫了用於生成動態內容的Python代碼，並且已經選擇了某個支持WSGI的API或框架，應該如何將HTTP服務部署到線上呢?

運行一個使用Python編寫的伺服器，伺服器的代碼中可以直接調用WSGI接口。現在最流行的是Green Unicorn(Gunicorn)伺服器，不過也有其他已經可以用於生產環境的純Python伺服器。

配置mod_wsgi並運行Apache，在一個獨立的WSFIDaemonProcess中運行Python代碼，由mod_wsgi啟動守護進程。

在後端運行一個類似於Gunicorn的Python HTTP伺服器(或者支持所選異步框架的任何伺服器)，然後在前端運行一個既能返回靜態文件，又能對Python編寫的動態資源服務進行反向代理的Web伺服器。

在最前端運行一個純粹的反向代理(如Varnish)，在該反向代理後端運行Apache或者nginx，在後端運行Python編寫的HTTP伺服器。這是一個三層的架構。這些反向代理可以分布在不同的地理位置，這樣子就能夠將離客戶端最近的反向代理上的緩存資源返回給發送請求的客戶端。

長期以來，對這4個架構的選擇主要基於CPython的3個運行時的特性，即解釋器占用內存大、解釋器運行慢、全局解釋器(GIL，Global Interpreter Lock)禁止多個線程同時運行Python位元組碼。但同時帶來了內存中只能載入一定數量的Python實例。

4、平台即服務

這個概念的出現是因為現在的自動化部署、持續集成以及高性能大規模服務的相關技術的出現和處理有一些繁雜。所以有一些提供商提出了PaaS(Platform as a Service)，現在只需關心應該如何打包自己的應用程式，以便將自己的應用部署到這些服務之上。

PaaS提供商會解決構建和運行HTTP服務中的出現的各種煩心事。不需要再關心伺服器，或者是提供IP位址之類的事情。

PaaS會根據客戶規模提供負載均衡器。只需要給PaaS提供商提供配置文件即可完成各種複雜的步驟。

現階段比較常用的有Heroku和Docker。

大多數PaaS提供商不支持靜態內容，除非我們在Python應用程式中實現了對靜態內容的更多支持或者向容器中加入了Apache或ngnix。儘管我們可以將靜態資源和動態頁面的路徑放在兩個完全不同的URL空間內，但是許多架構師還是傾向於將兩者放在同一個名字空間內。

5、不使用Web框架編寫WSGI可調用對象

下面第一段代碼是用於返回當前時間的原始WSGI可調用對象。

#!/usr/bin/env python3 
# A simple HTTP service built directly against the low-level WSGI spec. 
 
import time 
 
def app(environ, start_response): 
 host = environ.get('HTTP_HOST', '127.0.0.1') 
 path = environ.get('PATH_INFO', '/') 
 if ':' in host: 
 host, port = host.split(':', 1) 
 if '?' in path: 
 path, query = path.split('?', 1) 
 headers = [('Content-Type', 'text/plain; charset=utf-8')] 
 if environ['REQUEST_METHOD'] != 'GET': 
 start_response('501 Not Implemented', headers) 
 yield b'501 Not Implemented' 
 elif host != '127.0.0.1' or path != '/': 
 start_response('404 Not Found', headers) 
 yield b'404 Not Found' 
 else: 
 start_response('200 OK', headers) 
 yield time.ctime().encode('ascii')

第一段比較冗長。下面使用第三方庫簡化原始WGSI的模式方法。

第一個示例是使用WebOb編寫的可調用對象返回當前時間。

#!/usr/bin/env python3 
# A WSGI callable built using webob. 
 
import time, webob 
 
def app(environ, start_response): 
 request = webob.Request(environ) 
 if environ['REQUEST_METHOD'] != 'GET': 
 response = webob.Response('501 Not Implemented', status=501) 
 elif request.domain != '127.0.0.1' or request.path != '/': 
 response = webob.Response('404 Not Found', status=404) 
 else: 
 response = webob.Response(time.ctime()) 
 return response(environ, start_response)

第二個是使用Werkzeug編寫的WSGI可調用對象返回當前時間。

#!/usr/bin/env python3 
# A WSGI callable built using Werkzeug. 
 
import time 
from werkzeug.wrappers import Request, Response 
 
@Request.application 
def app(request): 
 host = request.host 
 if ':' in host: 
 host, port = host.split(':', 1) 
 if request.method != 'GET': 
 return Response('501 Not Implemented', status=501) 
 elif host != '127.0.0.1' or request.path != '/': 
 return Response('404 Not Found', status=404) 
 else: 
 return Response(time.ctime())

大家可以對比這兩個庫在簡化操作時的不同之處，Werkzeug是Flask框架的基礎。

使用Python搭建http伺服器

oracle和mysql的優缺點對比

ping命令的七種用法總結

redis中一些常用工具介紹

redis cli命令詳解

將Linux中的目錄映射到Windows系統

nginx使用geoip做區域限制

全球最厲害的 14 位程式設計師！

Nginx與安全有關的幾個配置

解決PHP導出CSV文件中文亂碼問題

linux解決文件已刪除空間不釋放的問題

Laravel Eloquent 必備的實用技巧

四種好用的PHP自定義加密函數（可逆/不可逆）

一文看懂IP、UDP和TCP三者的關係

分享幾款API設計、開發和測試的免費工具

新手入門linux之最常用的10條命令

10個好用的網站數據實時分析工具

Ubuntu系統怎麼禁止軟體更新

php+nginx實現自動化部署腳本

PHP生命周期及fpm的運作方式

ab壓測工具安裝與使用

小編教你Python安裝配置uWSGI

Python 多進程和數據傳遞的理解

一文看懂inode是什麼

詳解Linux中php環境下安裝redis擴展