Python ile Bir Sitenin HTML Kaynağını Çekmek

Merhaba arkadaşlar. Bu yazımızda sizlere Python ile bir sitenin HTML kaynak kodlarını çekmek konusunda bilgiler vereceğim. Aslında oldukça basit ve 5 satırlık bir kod parçası ile bu işi yapabilirsiniz.

Python ile birçok konuda işlem yapabildiğiniz gibi bir sitenin kaynak kodlarını da çekebiliyorsunuz. Ayrıca Python’un hızlı bir dil olması nedeniyle de bu işi hızlı bir şekilde yapabiliyorsunuz. Şimdi bu işi nasıl yapacağımıza bakalım.

Python HTML Kaynak Kodu Çekmek

Öncelikle Pycharm’ı açtık ve kodlarımızı yazmaya başlayalım. Kaynak kodları çekebilmek için “urllib.request” kütüphanesini import etmemiz gerekiyor. Sonrasında aşağıdaki kodlar ile bu işlemi yapabilirsiniz.


import urllib.request

siteadresi = input("Girmek istediğiniz site adresini yazınız...")
htm=urllib.request.urlopen(siteadresi)
print("\n İstediğiniz sitenin kaynak kodu : \n\n")
print(htm.read())

Python HTML Kaynak Kodu Çekmek Video

 

3 Yorum on “Python ile Bir Sitenin HTML Kaynağını Çekmek

  1. Hocam birden fazla sitenin çekmek istersek örneğin bir txt dosyasına 10 adet site koydum ve o sitelerin kaynak kodlarını tek tek alıp bir metine kaydediyor tüm kaynak kodlarını bir metin dosyasına

  2. Hocam, ellerine sağlık.

    Fakat ben farklı bir şey sormak istiyorum.
    Açık/çalışan olan bir browserın(Chrome, Firefox gibi) içindeki web sitesinin kaynak kodlarını çekebilme nasıl yapılabiliyor(Selenium kütüphanesinde kullanılan geckodriver ve chromedriver kullanmadan)?

    Daha açıklayıcı olmak adına: Bir Browser dan bir web sitesi açılır ve ve bu açık olan web sitesinin içindeki dinamik/statik bilgileri alınır.

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir