怎么用python爬數(shù)據(jù) python如何讀取網(wǎng)頁中的數(shù)據(jù)？

2021-03-12

2133

python如何讀取網(wǎng)頁中的數(shù)據(jù)？用Beautiful Soup這類解析模塊： Beautiful Soup 是用Python寫的一個HTML/XML的解析器，它可以很好的處理不規(guī)范標(biāo)記并生成剖析樹(

python如何讀取網(wǎng)頁中的數(shù)據(jù)？

用Beautiful Soup這類解析模塊： Beautiful Soup 是用Python寫的一個HTML/XML的解析器，它可以很好的處理不規(guī)范標(biāo)記并生成剖析樹(parse tree)；它提供簡單又常用的導(dǎo)航(navigating)，搜索以及修改剖析樹的操作；用urllib或者urllib2(推薦)將頁面的html代碼下載后，用beautifulsoup解析該html；然后用beautifulsoup的查找模塊或者正則匹配將你想獲得的內(nèi)容找出來，就可以進(jìn)行相關(guān)處理了，例如： from BeautifulSoup import BeautifulSoup html = "

test body

" soup = BeautifulSoup(html) soup.contents[0]

.name

# u"html" soup.comtents[0].contents[0]

.name

# u"head" head = soup.comtents[0].contents[0]

head.parent.name

# u"html"

head.next

# u"<title>test</title>

国产成人毛片视频|星空传媒久草视频|欧美激情草久视频|久久久久女女|久操超碰在线播放|亚洲强奸一区二区|五月天丁香社区在线|色婷婷成人丁香网|午夜欧美6666|纯肉无码91视频

python如何讀取網(wǎng)頁中的數(shù)據(jù)？

相關(guān)推薦

python如何讀取網(wǎng)頁中的數(shù)據(jù)？