Kod:
import re, urllib #Bu bölümde gerekli kütüphaneleri dahil ediyoruz
site = urllib.urlopen("http://www.turkhackteam.org/") #Urllib kütüphanesi ile sitemizi girip kaynak kodlarını çekiyoruz
kardiz = site.read()#kaynak kodu değişkene yazıyoruz
#href=[\'"]?([^\'" >]+) <<< burada gördüğünüz ise regex **** karakter dizisi bknz :Regex for Python
baglantilar = re.findall(r"""href=[\'"]?([^\'" >]+)""", kardiz) #regex uyguluyoruz
for s in baglantilar:#Döngü ile bulduğumuz linkleri ekrana düzgün bir şekilde yaqzdırıyoruz
if "http" in s:# olası hatalı regex verilerini eliyoruz.
print s
elif "https" in s:
print s
else:
print ""
Bu kod ile Herhangi bir site kaynak kodundaki tüm Htpp lnkleri döndüre biliriz
Son düzenleme:

