用户工具

站点工具


python-hacks:re-find

差别

这里会显示出您选择的修订版和当前版本之间的差别。

到此差别页面的链接

python-hacks:re-find [2010/06/02 01:18] (当前版本)
行 1: 行 1:
 +====== 得到正则表达式中特定单元内容 ======
  
 +下面的例子是用Python得到网页的标题
 +===== 代码 =====
 + 
 +<code python>
 +import urllib
 +import re
 +f = urllib.urlopen("​http://​www.google.com/"​)
 +raw_html = f.read()
 +patt = """<​title>​([^<​]*)</​title>"""​
 +all = re.findall(patt,​ raw_html, re.IGNORECASE)
 +title = ""​.join(all)
 +print title
 +</​code>​
 +
 +===== 技巧 =====
 +使用 join 方法可以将得到的列表转为字符串
 + 
python-hacks/re-find.txt · 最后更改: 2010/06/02 01:18 (外部编辑)