5年Python功力，總結了10個開發技巧

作者 | 寫代碼的明哥

來源 |Python編程時光（ID: Cool-Python）

如何在運行狀態查看原始碼？

查看函數的原始碼，我們通常會使用 IDE 來完成。

比如在 PyCharm 中，你可以 Ctrl + 滑鼠點擊進入函數的原始碼。

那如果沒有 IDE 呢？

當我們想使用一個函數時，如何知道這個函數需要接收哪些參數呢？

當我們在使用函數時出現問題的時候，如何通過閱讀原始碼來排查問題所在呢？

這時候，我們可以使用 inspect 來代替 IDE 幫助你完成這些事。

# demo.py

importinspect

defadd(x, y):

returnx + y

print( "===================")

print(inspect.getsource(add))

運行結果如下

$python demo.py

===================

def add(x, y):

return x + y

如何關閉異常自動關聯上下文？

當你在處理異常時，由於處理不當或者其他問題，再次拋出另一個異常時，往外拋出的異常也會攜帶原始的異常信息。

就像這樣子。

try:

print( 1/ 0)

exceptException asexc:

raiseRuntimeError( "Something bad happened")

從輸出可以看到兩個異常信息

Traceback (most recent call last):

File "demo.py", line 2, in

print( 1/ 0)

ZeroDivisi: division by zero

During handling of the above exception, another exception occurred:

Traceback (most recent call last):

File "demo.py", line 4, in

raiseRuntimeError( "Something bad happened")

RuntimeError: Something bad happened

如果在異常處理程序或 finally 塊中引發異常，默認情況下，異常機制會隱式工作會將先前的異常附加為新異常的 __context__屬性。這就是 Python 默認開啟的自動關聯異常上下文。

如果你想自己控制這個上下文，可以加個 from 關鍵字（from語法會有個限制，就是第二個表達式必須是另一個異常類或實例。），來表明你的新異常是直接由哪個異常引起的。

try:

print( 1/ 0)

exceptException asexc:

raiseRuntimeError( "Something bad happened") fromexc

輸出如下

Traceback (most recent call last):

File "demo.py", line 2, in

print( 1/ 0)

ZeroDivisi: division by zero

The above exception was the direct cause of the following exception:

Traceback (most recent call last):

File "demo.py", line 4, in

raiseRuntimeError( "Something bad happened") fromexc

RuntimeError: Something bad happened

當然，你也可以通過with_traceback方法為異常設置上下文__context__屬性，這也能在traceback更好的顯示異常信息。

try:

print( 1/ 0)

exceptException asexc:

raiseRuntimeError( "bad thing").with_traceback(exc)

最後，如果我想徹底關閉這個自動關聯異常上下文的機制？有什麼辦法呢？

可以使用 raise...from None，從下面的例子上看，已經沒有了原始異常

$ cat demo.py

try:

print( 1/ 0)

exceptException asexc:

raiseRuntimeError( "Something bad happened") fromNone

$ python demo.py

Traceback (most recent call last):

File "demo.py", line 4, in

raiseRuntimeError( "Something bad happened") fromNone

RuntimeError: Something bad happened

(PythonCodingTime)

最快查看包搜索路徑的方式

當你使用 import 導入一個包或模塊時，Python 會去一些目錄下查找，而這些目錄是有優先級順序的，正常人會使用 sys.path 查看。

>>> importsys

>>> frompprint importpprint

>>> pprint(sys.path)

[ '',

'/usr/local/Python3.7/lib/python37.zip',

'/usr/local/Python3.7/lib/python3.7',

'/usr/local/Python3.7/lib/python3.7/lib-dynload',

'/home/wangbm/.local/lib/python3.7/site-packages',

'/usr/local/Python3.7/lib/python3.7/site-packages']

>>>

那有沒有更快的方式呢？

我這有一種連 console 模式都不用進入的方法呢？

你可能會想到這種，但這本質上與上面並無區別

[wangbm@localhost ~]$ python -c "print('n'.join(__import__('sys').path))"

/usr/lib/python2 .7/site-packages/pip -18.1-py2 .7.egg

/usr/lib/python2 .7/site-packages/redis -3.0.1-py2 .7.egg

/usr/lib64/python27.zip

/usr/lib64/python2 .7

/usr/lib64/python2 .7/plat-linux2

/usr/lib64/python2 .7/lib-tk

/usr/lib64/python2 .7/lib-old

/usr/lib64/python2 .7/lib-dynload

/home/wangbm/.local/lib/python2 .7/site-packages

/usr/lib64/python2 .7/site-packages

/usr/lib64/python2 .7/site-packages/gtk -2.0

/usr/lib/python2 .7/site-packages

這裡我要介紹的是比上面兩種都方便的多的方法，一行命令即可解決

[wangbm@localhost ~]$ python3 -m site

sys.path = [

'/home/wangbm',

'/usr/local/Python3.7/lib/python37.zip',

'/usr/local/Python3.7/lib/python3.7',

'/usr/local/Python3.7/lib/python3.7/lib-dynload',

'/home/wangbm/.local/lib/python3.7/site-packages',

'/usr/local/Python3.7/lib/python3.7/site-packages',

]

USER_BASE: '/home/wangbm/.local' (exists)

USER_SITE: '/home/wangbm/.local/lib/python3.7/site-packages' (exists)

ENABLE_USER_SITE: True

從輸出你可以發現，這個列的路徑會比 sys.path 更全，它包含了用戶環境的目錄。

將嵌套 for 循環寫成單行

我們經常會如下這種嵌套的 for 循環代碼

list1 = range( 1, 3)

list2 = range( 4, 6)

list3 = range( 7, 9)

foritem1 inlist1:

foritem2 inlist2:

foritem3 inlist3:

print(item1+item2+item3)

這裡僅僅是三個 for 循環，在實際編碼中，有可能會有更層。

這樣的代碼，可讀性非常的差，很多人不想這麼寫，可又沒有更好的寫法。

這裡介紹一種我常用的寫法，使用 itertools 這個庫來實現更優雅易讀的代碼。

fromitertools importproduct

list1 = range( 1, 3)

list2 = range( 4, 6)

list3 = range( 7, 9)

foritem1,item2,item3 inproduct(list1, list2, list3):

print(item1+item2+item3)

輸出如下

$python demo.py

如何使用 print 輸出日誌

初學者喜歡使用 print 來調試代碼，並記錄程序運行過程。

但是 print 只會將內容輸出到終端上，不能持久化到日誌文件中，並不利於問題的排查。

如果你熱衷於使用 print 來調試代碼（雖然這並不是最佳做法），記錄程序運行過程，那麼下面介紹的這個 print 用法，可能會對你有用。

Python 3 中的 print 作為一個函數，由於可以接收更多的參數，所以功能變為更加強大，指定一些參數可以將 print 的內容輸出到日誌文件中

代碼如下：

>>> withopen( 'test.log', mode= 'w') asf:

... print( 'hello, python', file=f, flush= True)

>>> exit

$ cat test.log

hello, python

如何快速計算函數運行時間

計算一個函數的運行時間，你可能會這樣子做

importtime

start = time.time

# run the function

end = time.time

print(end-start)

你看看你為了計算函數運行時間，寫了幾行代碼了。

有沒有一種方法可以更方便的計算這個運行時間呢？

有。

有一個內置模塊叫 timeit

使用它，只用一行代碼即可

importtime

importtimeit

defrun_sleep(second):

print(second)

time.sleep(second)

# 只用這一行

print(timeit.timeit( lambda:run_sleep( 2), number= 5))

運行結果如下

10.020059824

利用自帶的緩存機制提高效率

緩存是一種將定量數據加以保存，以備迎合後續獲取需求的處理方式，旨在加快數據獲取的速度。

數據的生成過程可能需要經過計算，規整，遠程獲取等操作，如果是同一份數據需要多次使用，每次都重新生成會大大浪費時間。所以，如果將計算或者遠程請求等操作獲得的數據緩存下來，會加快後續的數據獲取需求。

為了實現這個需求，Python 3.2 + 中給我們提供了一個機制，可以很方便的實現，而不需要你去寫這樣的邏輯代碼。

這個機制實現於 functool 模塊中的 lru_cache 裝飾器。

@functools.lru_cache(maxsize=None, typed=False)

參數解讀：

maxsize：最多可以緩存多少個此函數的調用結果，如果為None，則無限制，設置為 2 的冪時，性能最佳
typed：若為 True，則不同參數類型的調用將分別緩存。

舉個例子

fromfunctools importlru_cache

@lru_cache(None)

defadd(x, y):

print( "calculating: %s + %s"% (x, y))

returnx + y

print(add( 1, 2))

print(add( 2, 3))

輸出如下，可以看到第二次調用並沒有真正的執行函數體，而是直接返回緩存里的結果

calculating: 1 + 2

calculating: 2 + 3

下面這個是經典的斐波那契數列，當你指定的 n 較大時，會存在大量的重複計算

deffib(n):

ifn < 2:

returnn

returnfib(n - 2) + fib(n - 1)

第六點介紹的 timeit，現在可以用它來測試一下到底可以提高多少的效率。

不使用 lru_cache 的情況下，運行時間 31 秒

importtimeit

deffib(n):

ifn < 2:

returnn

returnfib(n - 2) + fib(n - 1)

print(timeit.timeit( lambda:fib( 40), number= 1))

# output: 31.2725698948

由於使用了 lru_cache 後，運行速度實在太快了，所以我將 n 值由 30 調到 500，可即使是這樣，運行時間也才 0.0004 秒。提高速度非常顯著。

importtimeit

fromfunctools importlru_cache

@lru_cache(None)

deffib(n):

ifn < 2:

returnn

returnfib(n - 2) + fib(n - 1)

print(timeit.timeit( lambda:fib( 500), number= 1))

# output: 0.0004921059880871326

在程序退出前執行代碼的技巧

使用 atexit 這個內置模塊，可以很方便的註冊退出函數。

不管你在哪個地方導致程序崩潰，都會執行那些你註冊過的函數。

示例如下

如果clean函數有參數，那麼你可以不用裝飾器，而是直接調用atexit.register(clean_1, 參數1, 參數2, 參數3='xxx')。

可能你有其他方法可以處理這種需求，但肯定比上不使用 atexit 來得優雅，來得方便，並且它很容易擴展。

但是使用 atexit 仍然有一些局限性，比如：

如果程序是被你沒有處理過的系統信號殺死的，那麼註冊的函數無法正常執行。
如果發生了嚴重的 Python 內部錯誤，你註冊的函數無法正常執行。
如果你手動調用了os._exit，你註冊的函數無法正常執行。

實現類似 defer 的延遲調用

在 Golang 中有一種延遲調用的機制，關鍵字是 defer，例如下面的示例

import"fmt"

funcmyfunc{

fmt.Println( "B")

}

funcmain{

defermyfunc

fmt.Println( "A")

}

輸出如下，myfunc 的調用會在函數返回前一步完成，即使你將 myfunc 的調用寫在函數的第一行，這就是延遲調用。

那麼在 Python 中否有這種機制呢？

當然也有，只不過並沒有 Golang 這種簡便。

在 Python 可以使用 上下文管理器達到這種效果

importcontextlib

defcallback:

print( 'B')

withcontextlib.ExitStack asstack:

stack.callback(callback)

print( 'A')

輸出如下

如何流式讀取數G超大文件

使用 with...open... 可以從一個文件中讀取數據，這是所有 Python 開發者都非常熟悉的操作。

但是如果你使用不當，也會帶來很大的麻煩。

比如當你使用了 read 函數，其實 Python 會將文件的內容一次性的全部載入內存中，如果文件有 10 個G甚至更多，那麼你的電腦就要消耗的內存非常巨大。

# 一次性讀取

withopen( "big_file.txt", "r") asfp:

content = fp.read

對於這個問題，你也許會想到使用 readline 去做一個生成器來逐行返回。

defread_from_file(filename):

withopen(filename, "r") asfp:

yieldfp.readline

可如果這個文件內容就一行呢，一行就 10個G，其實你還是會一次性讀取全部內容。

最優雅的解決方法是，在使用 read 方法時，指定每次只讀取固定大小的內容，比如下面的代碼中，每次只讀取 8kb 返回。

defread_from_file(filename, block_size = 1024* 8) :

withopen(filename, "r") asfp:

whileTrue:

chunk = fp.read(block_size)

ifnotchunk:

break

yieldchunk

上面的代碼，功能上已經沒有問題了，但是代碼看起來代碼還是有些臃腫。

藉助偏函數和 iter 函數可以優化一下代碼

fromfunctools importpartial

defread_from_file(filename, block_size = 1024* 8) :

withopen(filename, "r") asfp:

forchunk initer(partial(fp.read, block_size), ""):

yieldchunk

明哥原創文都已傳至 Github：

https://github.com/iswbm/PythonCodingTime

博客連結：

http://python.iswbm.com/en/latest/c03/c03_07.html

5年Python功力，總結了10個開發技巧

人工智慧在消費領域，都做了哪些事？

清華 CVer 對自監督學習的一些思考

這個開源的「搶茅台腳本」，火了

2020年人工智慧十大技術進展

舌尖上的AI：人工智慧技術正在被「端上」餐桌

AI 和 SEO 的結合：是福還是禍？

當 AI 闖入法律界，第一步是當律師的得力助手

重磅推出開發者計劃、App Store，賽靈思普及自適應計算的一大步

湘苗培優 | 值不值？效果告訴你

視覺+Transformer最新論文出爐，華為聯合北大、雪梨大學發表

CSDN湘苗培優

機器學習和計算機視覺的前20個圖像數據集

尋找長沙「科技之星」，CSDN星城大巡禮

2020年中國AI算力報告發布：超大算法模型挑戰之下，公共AI算力基建是關鍵

完全免費，簡化版Plotly推出，秒繪各類可視化圖表

深度學習中的注意力機制（三）

短視頻特效「耍花招」：線上投籃、擺攤，讓畫中人搖擺，淺談騰訊微視的AR基建

AI化身監工，上班還能摸魚嗎？

《賽博朋克2077》是捏臉遊戲？上科大學生社團開發了一款賽博「濾鏡」

鯤鵬高校行太原站來襲，兩大課程一站式掌握未來潮流

3行Python代碼就能獲取海量數據？

實戰｜手把手教你用Python爬取存儲數據，還能自動在Excel中可視化

CSDN湘苗培優，遇見更好的自己

丟棄Transformer，FCN也可以實現E2E檢測