#-*- encoding: gb2312 -*-
import HTMLParser
class MyParser(HTMLParser.HTMLParser):
def __init__(self):
HTMLParser.HTMLParser.__init__(self)
def handle_starttag(self, tag, attrs):
# 這里重新定義了處理開(kāi)始標(biāo)簽的函數(shù)
if tag == 'a':
# 判斷標(biāo)簽<a>的屬性
for name,value in attrs:
if name == 'href':
print value
if __name__ == '__main__':
a = '<html><head><title>test</title><body><a href="http://www.tjdsmy.cn">鏈接到163</a></body></html>'
my = MyParser()
# 傳入要分析的數(shù)據(jù),是html的。
my.feed(a)