<rp id="wnpn7"><ruby id="wnpn7"></ruby></rp>
<progress id="wnpn7"><track id="wnpn7"><rt id="wnpn7"></rt></track></progress>
<ruby id="wnpn7"></ruby>
<ruby id="wnpn7"><blockquote id="wnpn7"><div id="wnpn7"></div></blockquote></ruby>

    1. <em id="wnpn7"><ruby id="wnpn7"><input id="wnpn7"></input></ruby></em>
      1. <button id="wnpn7"><acronym id="wnpn7"></acronym></button><button id="wnpn7"><acronym id="wnpn7"></acronym></button>

        <rp id="wnpn7"><acronym id="wnpn7"></acronym></rp>

        <li id="wnpn7"><object id="wnpn7"><u id="wnpn7"></u></object></li>
        VB.net 2010 視頻教程 VB.net 2010 視頻教程 python基礎視頻教程
        SQL Server 2008 視頻教程 c#入門經典教程 Visual Basic從門到精通視頻教程
        當前位置:
        首頁 > 編程開發 > Python基礎教程 >
        • python基礎教程之Python——迭代器的幾個高級用法

        本站最新發布   Python從入門到精通|Python基礎教程
        試聽地址  
        http://www.squ68.com/eschool/python.html


        今天我們依然介紹的是迭代器,不過介紹的是幾個比較常用的 高級用法 ,在實際場景當中非常實用,可以幫助我們大大簡化代碼的復雜度。

        跳過開頭

        首先是跳過開始部分,這個在我們讀取文本的時候最常用。在實際的應用當中,比如記錄的日志或者是代碼等等,一般來說 頭部都會附上一段說明 ,或者用注釋標注或者是用特殊的符號標記。這些信息是給用到數據的程序員看的,當我們通過代碼獲取數據的時候,顯然是希望可以過濾掉這些信息的。

        比如我們有一段數據,它的開頭用#做了一些注釋:

        # This is a data for student
        # Rows 100
        
        xiaoming, 17, 99;
        xiaoli, 18, 98;
        ...
        

        常規操作當中,我們會創建一個打開文件的迭代器,我們通過遍歷這個迭代器去獲取文件當中的數據:

        with open('xxxx.txt') as f:
            for line in f:
                print(line)
        

        如果只是用來輸出還好,如果我們需要加工文件當中的數據,那么頭部的注釋信息就會干擾我們代碼的運行。我們當然可以手動加入一些判斷,但是這會比較麻煩,代碼也不夠美觀。針對這個問題,一個比較好的解決方案是 dropwhile 。

        dropwhile是itemtools當中的一個函數,它可以 接收一個我們自定義的過濾函數和迭代器重新生成一個新的迭代器 ,這個新的迭代器當中會過濾掉之前迭代器頭部不符合我們要求的數據:

        在剛才的例子當中我們想要過濾掉頭部加了#注釋的部分,我們可以這么操作:

        from itertools import dropwhile
        with open('xxxx.txt') as f:
            for line in dropwhile(lambda line: line.startswith('#'), f):
                print(line)
        

        這樣出來的結果就沒有頭部我們不需要的內容了。

        當我們知道頭部不符合情況的數據的格式的時候,可以使用dropwhile來規定過濾的格式。如果我們 知道需要過濾的條數 ,則可以使用另外一個工具,叫做islice,它的本質是一個切片函數,就像是Python當中數組的切片功能一樣,可以切出迭代器當中指定片段的數據。

        舉個例子:

        from itertools import dropwhile
        with open('xxxx.txt') as f:
            for line in islice(f, 3, None):
                print(line)
        

        這樣我們就會從第三行開始獲取,之前的數據會被過濾掉。它其實就代表著數組當中[3: ]的切片操作。

        迭代排列組合

        我們都知道在C++當中有一個叫做next_permutation的函數,可以傳入一個數組,返回下一個字典序的排列。在Python當中也有同樣的功能,但是是以迭代器的形式使用的。

        舉個簡單的例子,比如我們有a, b, c三個元素,我們希望求出它的所有排列:

        items = ['a', 'b', 'c']
        from itertools import permutations
        
        for p in permutations(items):
            print(p)
        

        permutations還支持多傳一個參數,比如上述的排列當中我們希望只保留前兩個元素,除了切片之外,我們只需要多傳一個參數就好了,like this:

        for p in permutations(items, 2):
            print(p)
        

        除了排列之外,itertools當中還支持組合,用法還是一樣,只是把函數名稱換成是combinations而已:

        from itertools import combindations
        for c in combinations(items):
            print(c)
        

        在一般的組合當中,一個元素一旦被選中那么它接下來就會從候選集當中移除,再也不會被選中。如果我們希望獲得有放回的組合,我們可以再換一個函數,這個函數名稱有點長,但是名字倒也直觀叫做combinations_with_replacement。但既然是有放回的抽樣,我們 需要設定元素的數量 ,否則抽樣可以無限進行下去。

        for c in combinations_with_replacement(items, 3):
            print(c)
        

        迭代合并后的序列

        上一篇文章當中我們介紹了zip可以同時迭代多個迭代器,除此之外還有一種情況是我們需要 把多個迭代器串起來迭代 。比如系統的日志打在了多個文件當中,我們希望找出其中有error的日志來分析。這個時候,我們希望的不是同時讀取多個迭代器,而是希望能夠有辦法將多個迭代器的內容串聯起來。這個功能就是itertools當中的 chain 方法,它接受多個迭代器,當我們遍歷的時候,會自動將多個迭代器的內容串聯起來,我們可以無縫迭代。

        舉個例子:

        from itertools import chain
        nums = [1, 2, 3]
        chars = ['a', 'b', 'c']
        
        for i in chain(nums, chars):
            print(i)
        

        這樣我們會把nums和chars當中的內容一起輸出出來, 就好像從頭到尾只執行了一個迭代器一樣 。

        你可能會說我們不用chain也可以實現啊,我們可以這樣:

        for i in nums + chars:
            print(i)
        

        的確,從結果上來看這樣也是行得通的。但是如果我們分析一下內部執行的時候的中間變量,會發現當我們執行nums+chars的時候,實際上是 先創建了一個新的臨時list 。然后在這個list當中存儲nums和chars的數據,也就是說我們迭代的其實是這個新的list。這帶來的結果是我們 額外開辟了一段內存 ,并且花費了一些時間。如果我們使用chain,它并不會有這樣的中間變量,完全是通過迭代器來執行的迭代,非常節省內存,這也是chain的優點。

        歸并迭代的內容

        對于歸并操作我們應該都不陌生,在之前的歸并排序以及一些題解的文章當中我們見過很多次。同樣,我們在使用工具合并多個迭代器內容的時候,如果迭代器當中的內容有序,我們也可以 對多個迭代器當中的元素進行歸并 ,而不再需要我們自己手動操作。

        使用我們之前介紹的heapq的庫可以非常輕松地做到這一點,我們一起來看一個例子:

        a = [1, 3, 5]
        b = [2, 4, 6]
        
        import heapq
        
        for c in heapq.merge(a, b):
            print(c)
        

        執行之后,我們會得到[1, 2, 3, 4, 5, 6]的結果。也就是說通過heapq.merge操作,我們把多個有序的迭代器合并到了一起。當然我們也可以自己合并,但如果我們只是需要利用當中的數據的話,使用merge操作可以節省內存空間。

        到這里內容就結束了,本文和之前的文章基本上列舉完了常用的迭代器用法。當然,除了上述講到的內容之外,Python當中的迭代器還有一些其他的用法,不過相對不太常用

        相關教程
                
        免费看成年人视频大全_免费看成年人视频在线观看