python使用正则表达式提取网页URL的方法

雪花在空中嬉戏着、飞舞着,它净化了世间的一切尘埃,送走了严冬的寂寞,它自由地来,潇洒地去,多少著名的诗词都赞美过它: "忽如一夜春风来,千树万树梨花开 ",多么俏丽呀! "瑞雪兆丰年 ",它还是丰收的预言家呢!

本文实例讲述了python使用正则表达式提取网页URL的方法。分享给大家供大家参考。具体实现方法如下:

import re
import urllib
url="//www.haodaima.com"
s=urllib.urlopen(url).read()
ss=s.replace(" ","")
urls=re.findall(r"<a.*?rel="nofollow noopener noreferrer" href=.*?<\/a>",ss,re.I)
for i in urls:
 print i
else:
 print 'this is over'

PS:这里再为大家提供2款非常方便的正则表达式工具供大家参考使用:

JavaScript正则表达式在线测试工具:
http://tools.haodaima.com/regex/javascript

正则表达式在线生成工具:
http://tools.haodaima.com/regex/create_reg

希望本文所述对大家的Python程序设计有所帮助。

到此这篇关于python使用正则表达式提取网页URL的方法就介绍到这了。人生就像迷宫,我们用上半生寻找入口,用下半生寻找出口。更多相关python使用正则表达式提取网页URL的方法内容请查看相关栏目,小编编辑不易,再次感谢大家的支持!