Python ile Web Scraping: Adım Adım Rehber

Python ile Web Scraping: Adım Adım Rehber

Web scraping, bir web sitesinden bilgi çıkarma işlemine denir ve genellikle büyük ölçekte veri analizi ve otomatikleştirme için kullanılır. Python, web scraping için popüler bir dil olup, bu görevi yürütmek için çok sayıda kütüphane ve araç içerir. Bu yazıda, Python'da web scraping işlemlerini nasıl gerçekleştirebileceğinizi adım adım öğreneceksiniz.

Adım 1: Gereken Araçları Kurun

Python'da web scraping yapmak için, genellikle BeautifulSoup ve Requests gibi paketlere ihtiyacınız olacak. İlk olarak, bunları kurmanız gerekiyor. Python'un pip aracıyla, aşağıdaki komutları kullanabilirsiniz:

pip install requests beautifulsoup4

Adım 2: Bir Web Sayfasına İstek Gönderin

İlk adım, çizmek istediğiniz web sayfasına bir istekte bulunmaktır. Bu genellikle requests.get() fonksiyonu ile yapılır.

import requests

url = "http://example.com"
response = requests.get(url)

Adım 3: Web Sayfasını Çözümleyin

Ardından, BeautifulSoup kullanarak HTML'yi çözümlemeli ve veri çıkarmanız gereken öğeleri bulmalısınız.

from bs4 import BeautifulSoup

soup = BeautifulSoup(response.text, 'html.parser')

Adım 4: Bilgileri Çıkarın

Bilgi çıkarma işlemi, çıkarmanız gereken bilgiye bağlı olarak değişir. HTML etiketleri ve CSS sınıflarına dayalı olarak belirli öğeleri seçebilirsiniz. Örneğin, sayfadaki tüm başlık etiketlerini (h1) çıkaralım:

titles = soup.find_all('h1')
for title in titles:
    print(title.get_text())

Adım 5: Verileri Kaydedin

Son olarak, çıkarılan verileri kullanıma uygun bir formatta kaydetmelisiniz. Bu genellikle CSV veya JSON gibi bir dosya formatında yapılır.

import csv

with open('titles.csv', 'w', newline='') as file:
    writer = csv.writer(file)
    for title in titles:
        writer.writerow([title.get_text()])

Bu, Python ile web scraping'in temel bir örneğidir. Ancak, gerçek dünyada web scraping genellikle daha karmaşıktır. Web siteleri, verilerini korumak için çeşitli önlemler alabilirler ve bu da web scraping'i daha karmaşık ve zorlu bir işlem haline getirebilir. Bu nedenle, Python ile web scraping yaparken etik kurallara ve web sitesinin kullanım politikalarına uymak çok önemlidir.