在Python中,迭代器可以幫助你編寫(xiě)更多Pythonic的代碼,并在處理長(zhǎng)序列時(shí)提高效率。內(nèi)置的itertools模塊提供了幾個(gè)有用的函數(shù)來(lái)創(chuàng)建迭代器。
【itertools】:https://docs.python.org/3/library/itertools.html
當(dāng)你只需要遍歷迭代器、檢索序列中的元素并對(duì)其進(jìn)行處理,而無(wú)需將它們存儲(chǔ)在內(nèi)存中時(shí),這些函數(shù)尤其有用。今天本文將學(xué)習(xí)如何使用以下四個(gè)itertools過(guò)濾函數(shù):
接下來(lái)跟隨本文開(kāi)始吧!
圖片
在本教程中:
我們將討論的所有四個(gè)函數(shù)都返回了迭代器。為了清楚起見(jiàn),本文將使用簡(jiǎn)單的序列,并使用list()獲取包含迭代器返回的所有元素的列表。但在處理長(zhǎng)序列時(shí),除非必要,否則請(qǐng)不要這樣做,因?yàn)檫@樣做會(huì)失去迭代器帶來(lái)的內(nèi)存節(jié)省。
對(duì)于簡(jiǎn)單的謂詞函數(shù),也可以使用lambdas。但為了提高可讀性,本文將定義常規(guī)函數(shù)并將它們用作謂詞。
如果你在Python中編程已經(jīng)有一段時(shí)間了,可能已經(jīng)使用過(guò)內(nèi)置的filter函數(shù),語(yǔ)法如下:
filter(pred,seq)# pred:謂詞函數(shù)# seq:任何有效的Python可迭代對(duì)象
filter函數(shù)返回一個(gè)迭代器,該迭代器返回謂詞函數(shù)返回True的序列中的元素。
示例如下:
nums = list(range(1,11)) #[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]def is_even(n): return n % 2 == 0
在這里,nums列表和is_even函數(shù)分別是序列和謂詞。
要獲取nums中所有偶數(shù)的列表,需要使用如下所示的filter:
nums_even = filter(is_even, nums)print(list(nums_even))
Output >>> [2, 4, 6, 8, 10]
現(xiàn)在跟隨本文來(lái)學(xué)習(xí)一下filterfalse。本文將從itertools模塊中導(dǎo)入filterfalse函數(shù)(以及本文將要討論的所有其他函數(shù))。
正如其名稱(chēng)所示,filterfalse執(zhí)行與filter函數(shù)相反的操作。它返回一個(gè)迭代器,該迭代器返回謂詞返回False的元素。以下是使用filterfalse函數(shù)的語(yǔ)法:
from itertools import filterfalsefilterfalse(pred,seq)
is_even函數(shù)對(duì)于nums中的所有奇數(shù)返回False。因此,使用filterfalse得到的nums_odd列表是nums中所有奇數(shù)的列表:
from itertools import filterfalsenums_odd = filterfalse(is_even, nums)print(list(nums_odd))
Output >>> [1, 3, 5, 7, 9]
使用takewhile函數(shù)的語(yǔ)法如下:
from itertools import takewhiletakewhile(pred,seq)
takewhile函數(shù)返回了一個(gè)迭代器,只要謂詞函數(shù)返回True,它就會(huì)返回元素。當(dāng)謂詞函數(shù)第一次返回False時(shí),它就停止返回元素。
對(duì)于長(zhǎng)度為n的序列,如果seq[k]是第一個(gè)使謂詞函數(shù)返回False的元素,則迭代器會(huì)返回seq[0]、seq[1]、...、seq[k-1]。
考慮以下的nums列表和謂詞函數(shù)is_less_than_5。本文使用takewhile函數(shù),如下所示:
from itertools import takewhiledef is_less_than_5(n): return n < 5nums = [1, 3, 5, 2, 4, 6]filtered_nums_1 = takewhile(is_less_than_5, nums)print(list(filtered_nums_1))
在這里,謂詞is_less_than_5對(duì)于數(shù)字5首次返回False:
Output >>> [1, 3]
從功能上講,dropwhile函數(shù)的作用與takewhile函數(shù)相反。
以下是如何使用dropwhile函數(shù)的示例:
from itertools import dropwhiledropwhile(pred,seq)
dropwhile函數(shù)返回一個(gè)迭代器,只要謂詞為T(mén)rue,該迭代器就會(huì)持續(xù)刪除元素。也就是說(shuō),迭代器在謂詞第一次返回False之前不返回任何元素。一旦謂詞返回False,迭代器就會(huì)返回序列中的所有后續(xù)元素。
對(duì)于長(zhǎng)度為n的序列,如果謂詞函數(shù)第一次返回False的元素是seq[k],那么迭代器會(huì)返回seq[k]、seq[k+1]、…、seq[n-1]。
接下來(lái)使用相同的序列和謂詞函數(shù):
from itertools import dropwhiledef is_less_than_5(n): return n < 5nums = [1, 3, 5, 2, 4, 6]filtered_nums_2 = dropwhile(is_less_than_5, nums)print(list(filtered_nums_2))
由于謂詞函數(shù)is_less_than_5第一次返回False是在元素5上,因此本文得到從5開(kāi)始的序列中的所有元素:
Output >>> [5, 2, 4, 6]
你可能已經(jīng)熟悉了對(duì)Python可迭代對(duì)象(如列表、元組和字符串)進(jìn)行切片操作。切片的語(yǔ)法是:iterable[start:stop:step]。
然而,這種切片操作具有以下缺點(diǎn):
islice函數(shù)解決了上述限制:
可以按以下方式使用islice函數(shù):
from itertools import isliceislice(seq,start,stop,step)
下面是使用islice函數(shù)的幾種不同方式:
接下來(lái)以一個(gè)示例列表來(lái)更好地理解這個(gè)問(wèn)題:
nums = list(range(10)) #[0,1, 2, 3, 4, 5, 6, 7, 8, 9]
現(xiàn)在,跟隨本文使用已學(xué)過(guò)的islice函數(shù)的語(yǔ)法。
這里本文只指定停止索引:
from itertools import islice# 僅指定停止索引sliced_nums = islice(nums, 5)print(list(sliced_nums))
以下是輸出結(jié)果:
Output >>> [0, 1, 2, 3, 4]
在這里,本文同時(shí)使用起始值和停止值:
# 指定起始和停止索引sliced_nums = islice(nums, 2, 7)print(list(sliced_nums))
切片從索引2開(kāi)始,一直延伸到索引7但不包括索引7:
Output >>> [2, 3, 4, 5, 6]
當(dāng)本文使用起始、停止和步長(zhǎng)值時(shí):
# 使用起始、停止和步長(zhǎng)sliced_nums = islice(nums, 2, 8, 2)print(list(sliced_nums))
得到一個(gè)從索引2開(kāi)始、一直延伸到索引8但不包括索引8的切片,步長(zhǎng)為2(每隔一個(gè)元素返回一次))。
Output >>> [2, 4, 6]
希望本教程能幫助你理解itertools過(guò)濾函數(shù)的基礎(chǔ)知識(shí)。通過(guò)查看一些簡(jiǎn)單的示例,可以更好地理解這些函數(shù)的工作原理。
本文鏈接:http://www.www897cc.com/showinfo-26-11871-0.html四個(gè)鮮為人知的Python迭代過(guò)濾函數(shù)
聲明:本網(wǎng)頁(yè)內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問(wèn)題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com