请教个python爬虫问题,如下

#获取二级页面url
def findUrl2(html):
re1 = r'
http://tuchong.com/
\d+/\d+/|http://\w+(?<!photos).tuchong.com/\d+/'
url2list = re.findall(re1,html)
url2lstfltr = list(set(url2list))
url2lstfltr.sort(key=url2list.index)
#print url2lstfltr
return url2lstfltr

代码中
url2lstfltr = list(set(url2list))
url2lstfltr.sort(key=url2list.index)
请问这两句作用是什么,或是python那部分函数&模块内容,怎么用啊
多谢
最新回答
山间风

2024-06-27 02:02:56

list和set都是内建的模块,无需import即可使用。
就是列表和集合的意思。
作用就是findall之后再按index排序