一千萬個為什麽

搜索

設置超時以使用python lxml解析網頁

我使用python lxml庫來解析html頁面:

import lxml.html

# this might run indefinitely
page = lxml.html.parse('http://stackoverflow.com/')

有沒有辦法設置超時解析?

最佳答案

它看起來使用 urllib.urlopen 作為開啟者,但最簡單的方法是修改套接字處理程序的默認超時。

import socket
timeout = 10
socket.setdefaulttimeout(timeout)

當然,這是一個快速而骯臟的解決方案。

轉載註明原文: 設置超時以使用python lxml解析網頁