10. 標準庫簡(jiǎn)介?
10.1. 操作系統接口?
os 模塊提供了許多與操作系統交互的函數:
>>> import os
>>> os.getcwd() # Return the current working directory
'C:\\Python312'
>>> os.chdir('/server/accesslogs') # Change current working directory
>>> os.system('mkdir today') # Run the command mkdir in the system shell
0
一定要使用 import os 而不是 from os import * 。這將避免內建的 open() 函數被 os.open() 隱式替換掉,因為它們的使用方式大不相同。
內置的 dir() 和 help() 函數可用作交互式輔助工具,用于處理大型模塊,如 os:
>>> import os
>>> dir(os)
<returns a list of all module functions>
>>> help(os)
<returns an extensive manual page created from the module's docstrings>
對于日常文件和目錄管理任務(wù), shutil 模塊提供了更易于使用的更高級別的接口:
>>> import shutil
>>> shutil.copyfile('data.db', 'archive.db')
'archive.db'
>>> shutil.move('/build/executables', 'installdir')
'installdir'
10.2. 文件通配符?
glob 模塊提供了一個(gè)在目錄中使用通配符搜索創(chuàng )建文件列表的函數:
>>> import glob
>>> glob.glob('*.py')
['primes.py', 'random.py', 'quote.py']
10.3. 命令行參數?
通用實(shí)用程序腳本通常需要處理命令行參數。這些參數作為列表存儲在 sys 模塊的 argv 屬性中。例如,以下輸出來(lái)自在命令行運行 python demo.py one two three
>>> import sys
>>> print(sys.argv)
['demo.py', 'one', 'two', 'three']
argparse 模塊提供了一種更復雜的機制來(lái)處理命令行參數。 以下腳本可提取一個(gè)或多個(gè)文件名,并可選擇要顯示的行數:
import argparse
parser = argparse.ArgumentParser(
prog='top',
description='Show top lines from each file')
parser.add_argument('filenames', nargs='+')
parser.add_argument('-l', '--lines', type=int, default=10)
args = parser.parse_args()
print(args)
當在通過(guò) python top.py --lines=5 alpha.txt beta.txt 在命令行運行時(shí),該腳本會(huì )將 args.lines 設為 5 并將 args.filenames 設為 ['alpha.txt', 'beta.txt']。
10.4. 錯誤輸出重定向和程序終止?
sys 模塊還具有 stdin , stdout 和 stderr 的屬性。后者對于發(fā)出警告和錯誤消息非常有用,即使在 stdout 被重定向后也可以看到它們:
>>> sys.stderr.write('Warning, log file not found starting a new one\n')
Warning, log file not found starting a new one
終止腳本的最直接方法是使用 sys.exit() 。
10.5. 字符串模式匹配?
re 模塊為高級字符串處理提供正則表達式工具。對于復雜的匹配和操作,正則表達式提供簡(jiǎn)潔,優(yōu)化的解決方案:
>>> import re
>>> re.findall(r'\bf[a-z]*', 'which foot or hand fell fastest')
['foot', 'fell', 'fastest']
>>> re.sub(r'(\b[a-z]+) \1', r'\1', 'cat in the the hat')
'cat in the hat'
當只需要簡(jiǎn)單的功能時(shí),首選字符串方法因為它們更容易閱讀和調試:
>>> 'tea for too'.replace('too', 'two')
'tea for two'
10.6. 數學(xué)?
math 模塊提供對浮點(diǎn)數學(xué)的底層C庫函數的訪(fǎng)問(wèn):
>>> import math
>>> math.cos(math.pi / 4)
0.70710678118654757
>>> math.log(1024, 2)
10.0
random 模塊提供了進(jìn)行隨機選擇的工具:
>>> import random
>>> random.choice(['apple', 'pear', 'banana'])
'apple'
>>> random.sample(range(100), 10) # sampling without replacement
[30, 83, 16, 4, 8, 81, 41, 50, 18, 33]
>>> random.random() # random float
0.17970987693706186
>>> random.randrange(6) # random integer chosen from range(6)
4
statistics 模塊計算數值數據的基本統計屬性(均值,中位數,方差等):
>>> import statistics
>>> data = [2.75, 1.75, 1.25, 0.25, 0.5, 1.25, 3.5]
>>> statistics.mean(data)
1.6071428571428572
>>> statistics.median(data)
1.25
>>> statistics.variance(data)
1.3720238095238095
SciPy項目 <https://scipy.org> 有許多其他模塊用于數值計算。
10.7. 互聯(lián)網(wǎng)訪(fǎng)問(wèn)?
有許多模塊可用于訪(fǎng)問(wèn)互聯(lián)網(wǎng)和處理互聯(lián)網(wǎng)協(xié)議。其中兩個(gè)最簡(jiǎn)單的 urllib.request 用于從URL檢索數據,以及 smtplib 用于發(fā)送郵件:
>>> from urllib.request import urlopen
>>> with urlopen('http://worldtimeapi.org/api/timezone/etc/UTC.txt') as response:
... for line in response:
... line = line.decode() # Convert bytes to a str
... if line.startswith('datetime'):
... print(line.rstrip()) # Remove trailing newline
...
datetime: 2022-01-01T01:36:47.689215+00:00
>>> import smtplib
>>> server = smtplib.SMTP('localhost')
>>> server.sendmail('soothsayer@example.org', 'jcaesar@example.org',
... """To: jcaesar@example.org
... From: soothsayer@example.org
...
... Beware the Ides of March.
... """)
>>> server.quit()
(請注意,第二個(gè)示例需要在localhost上運行的郵件服務(wù)器。)
10.8. 日期和時(shí)間?
datetime 模塊提供了以簡(jiǎn)單和復雜的方式操作日期和時(shí)間的類(lèi)。雖然支持日期和時(shí)間算法,但實(shí)現的重點(diǎn)是有效的成員提取以進(jìn)行輸出格式化和操作。該模塊還支持可感知時(shí)區的對象。
>>> # dates are easily constructed and formatted
>>> from datetime import date
>>> now = date.today()
>>> now
datetime.date(2003, 12, 2)
>>> now.strftime("%m-%d-%y. %d %b %Y is a %A on the %d day of %B.")
'12-02-03. 02 Dec 2003 is a Tuesday on the 02 day of December.'
>>> # dates support calendar arithmetic
>>> birthday = date(1964, 7, 31)
>>> age = now - birthday
>>> age.days
14368
10.9. 數據壓縮?
常見(jiàn)的數據存檔和壓縮格式由模塊直接支持,包括:zlib, gzip, bz2, lzma, zipfile 和 tarfile。:
>>> import zlib
>>> s = b'witch which has which witches wrist watch'
>>> len(s)
41
>>> t = zlib.compress(s)
>>> len(t)
37
>>> zlib.decompress(t)
b'witch which has which witches wrist watch'
>>> zlib.crc32(s)
226805979
10.10. 性能測量?
一些Python用戶(hù)對了解同一問(wèn)題的不同方法的相對性能產(chǎn)生了濃厚的興趣。 Python提供了一種可以立即回答這些問(wèn)題的測量工具。
例如,元組封包和拆包功能相比傳統的交換參數可能更具吸引力。timeit 模塊可以快速演示在運行效率方面一定的優(yōu)勢:
>>> from timeit import Timer
>>> Timer('t=a; a=b; b=t', 'a=1; b=2').timeit()
0.57535828626024577
>>> Timer('a,b = b,a', 'a=1; b=2').timeit()
0.54962537085770791
與 timeit 的精細粒度級別相反, profile 和 pstats 模塊提供了用于在較大的代碼塊中識別時(shí)間關(guān)鍵部分的工具。
10.11. 質(zhì)量控制?
開(kāi)發(fā)高質(zhì)量軟件的一種方法是在開(kāi)發(fā)過(guò)程中為每個(gè)函數編寫(xiě)測試,并在開(kāi)發(fā)過(guò)程中經(jīng)常運行這些測試。
doctest 模塊提供了一個(gè)工具,用于掃描模塊并驗證程序文檔字符串中嵌入的測試。測試構造就像將典型調用及其結果剪切并粘貼到文檔字符串一樣簡(jiǎn)單。這通過(guò)向用戶(hù)提供示例來(lái)改進(jìn)文檔,并且它允許doctest模塊確保代碼保持對文檔的真實(shí):
def average(values):
"""Computes the arithmetic mean of a list of numbers.
>>> print(average([20, 30, 70]))
40.0
"""
return sum(values) / len(values)
import doctest
doctest.testmod() # automatically validate the embedded tests
unittest 模塊不像 doctest 模塊那樣易于使用,但它允許在一個(gè)單獨的文件中維護更全面的測試集:
import unittest
class TestStatisticalFunctions(unittest.TestCase):
def test_average(self):
self.assertEqual(average([20, 30, 70]), 40.0)
self.assertEqual(round(average([1, 5, 7]), 1), 4.3)
with self.assertRaises(ZeroDivisionError):
average([])
with self.assertRaises(TypeError):
average(20, 30, 70)
unittest.main() # Calling from the command line invokes all tests
10.12. 自帶電池?
Python有“自帶電池”的理念。通過(guò)其包的復雜和強大功能可以最好地看到這一點(diǎn)。例如:
The
xmlrpc.clientandxmlrpc.servermodules make implementing remote procedure calls into an almost trivial task. Despite the modules' names, no direct knowledge or handling of XML is needed.email包是一個(gè)用于管理電子郵件的庫,包括MIME和其他符合 RFC 2822 規范的郵件文檔。與smtplib和poplib不同(它們實(shí)際上做的是發(fā)送和接收消息),電子郵件包提供完整的工具集,用于構建或解碼復雜的消息結構(包括附件)以及實(shí)現互聯(lián)網(wǎng)編碼和標頭協(xié)議。json包為解析這種流行的數據交換格式提供了強大的支持。csv模塊支持以逗號分隔值格式直接讀取和寫(xiě)入文件,這種格式通常為數據庫和電子表格所支持。 XML 處理由xml.etree.ElementTree,xml.dom和xml.sax包支持。這些模塊和軟件包共同大大簡(jiǎn)化了 Python 應用程序和其他工具之間的數據交換。sqlite3模塊是 SQLite 數據庫庫的包裝器,提供了一個(gè)可以使用稍微非標準的 SQL 語(yǔ)法更新和訪(fǎng)問(wèn)的持久數據庫。