您好,登錄后才能下訂單哦!
本篇內容介紹了“如何用迭代器設計模式提升Python性能”的有關知識,在實際案例的操作過程中,不少人都會遇到這樣的困境,接下來就讓小編帶領大家學習一下如何處理這些情況吧!希望大家仔細閱讀,能夠學有所成!
在開始介紹設計模式之前,我們先來看一個簡單的需求。假設現在我們需要根據傳入的變量獲取每周的前幾天,比如說我們傳入3返回的就是[Mon, Tue, Wed],我們傳入5返回[Mon, Tue, Wed, Thu, Fri]。這個需求大家應該都能理解,非常非常簡單。
如果用一個函數來實現的話,就是這樣:
def return_days(n): week = ['Mon', 'Tue', 'Wed', 'Thu', 'Fri', 'Sat', 'Sun'] return week[:n]
你看三行代碼就實現了,在這個問題場景當中這樣寫當然是沒有問題。但假如我們把題目稍微變一變,這里的week不是一個固定的數據,而是從上游或者是某個文件當中讀取的。這里的n也是一個很大的數,我們把這個函數改寫成這樣:
def get_data(n): data = [] for i in range(n): data.append(get_from_upstream()) return data
我們假設get_from_upstream這個函數當中實現了獲取數據的具體邏輯,那么上面這一段函數有一個什么問題?
有些同學會說這沒有問題啊,因為像是其他語言實現數據獲取的時候也都是這么干的。的確,像是Java等語言可能都是這么干的。但是其他語言這么干沒錯,不代表Python這么干也沒錯。因為我們 沒有把Python的能力發揮到最大 。
這里有兩個問題,第一個問題是 延遲 ,因為前面說了,n是一個很大的數。我們從上游獲取數據,無論是通過網絡還是文件讀取,本質上都是IO操作,IO操作的延遲是非常大的。那么我們把這n條數據全部搜集完可能需要很長的時間,導致下游的漫長等待。第二個問題就是內存,因為我們存儲了這n條數據一起返回的,如果n很大,對于內存的開銷壓力也很大,如果機器內存不夠很有可能導致崩潰。
那怎么解決呢?
其實解決的方法很簡單,如果對迭代器熟悉的話,會發現迭代器針對的恰恰是這兩個問題。我們把上面的邏輯改寫成迭代器實現即可,這也就是iterator模式。
iterator模式嚴格說起來其實只是迭代器的一種應用,它非常巧妙地 將迭代器與匿名函數結合在一起 ,里面也沒有太多的門道可以說,我們把剛才的代碼改寫一下,細節都在代碼當中。
def get_data(n): for i in range(n): yield get_from_upstream() data_10 = lambda: get_data(10) data_100 = lambda: get_data(100) # use for d in data_10: print(d)
很簡單吧,但可能你要問了,我們既然寫出了get_data這個迭代器,那么我們使用的時候直接for d in get_data(10)這樣用不就好了,為什么中間要用匿名函數包一層呢?
道理也很簡單,如果這個數據是我們自己使用,當然是沒必要中間包一層的。但如果我們是傳給下游使用的話,對于下游來說它肯定是不希望考慮上游太多的細節的,越簡單越好。所以我們直接丟一個包裝好的迭代器過去,下游直接call即可。否則的話,下游還需要感知get_data這個函數傳入的參數,顯然是不夠合理的。
“如何用迭代器設計模式提升Python性能”的內容就介紹到這里了,感謝大家的閱讀。如果想了解更多行業相關的知識可以關注億速云網站,小編將為大家輸出更多高質量的實用文章!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。