这里会显示出您选择的修订版和当前版本之间的差别。
— |
python-hacks:re-find [2010/06/02 01:18] (当前版本) |
||
---|---|---|---|
行 1: | 行 1: | ||
+ | ====== 得到正则表达式中特定单元内容 ====== | ||
+ | 下面的例子是用Python得到网页的标题 | ||
+ | ===== 代码 ===== | ||
+ | |||
+ | <code python> | ||
+ | import urllib | ||
+ | import re | ||
+ | f = urllib.urlopen("http://www.google.com/") | ||
+ | raw_html = f.read() | ||
+ | patt = """<title>([^<]*)</title>""" | ||
+ | all = re.findall(patt, raw_html, re.IGNORECASE) | ||
+ | title = "".join(all) | ||
+ | print title | ||
+ | </code> | ||
+ | |||
+ | ===== 技巧 ===== | ||
+ | 使用 join 方法可以将得到的列表转为字符串 | ||
+ |