"Python ile Haber Verileri Çekme ve Dosyaya Kaydetme" (Farklı Apiler Eklenilebilir)

boyka48

Yeni üye
7 Nis 2013
39
4
alert("Artık Burdayım")
Merhaba arkadaşlar

  • Bu paylaşımımda, Python kullanarak CNN Türk'ün RSS beslemesinden haberleri nasıl çekeceğinizi ve bu haberleri dosyalara nasıl kaydedeceğinizi anlatan bir kodu sizlerle paylaşıyorum.
  • Bu kod sayesinde, CNN Türk'teki son haberleri otomatik olarak çekebilir ve her bir haberi ayrı bir dosyada saklayabilirsiniz.
  • Özellikle veri toplama ve analiz projelerinde kullanabileceğiniz bu kod,
  • BeautifulSoup ve feedparser kütüphanelerini kullanarak basit ama etkili bir çözüm sunuyor.
  • Kodlar Aşşağıda Yer Alıyor.


Örnek Resim:
kp7spz6.png




Python:
import requests
from bs4 import BeautifulSoup
import feedparser

# RSS besleme URL'si
feed_url = "https://www.cnnturk.com/feed/rss/news"

# RSS beslemesini çek
feed = feedparser.parse(feed_url)

# Daha önce alınan haberleri takip etmek için bir set kullanın
previously_seen_links = set()

# Her bir haber öğesini döngü ile gezin
for i, item in enumerate(feed.entries, start=1):
    link = item.link  # Haber öğesinin bağlantısı (link)
    title = item.title  # Haber öğesinin başlığı (title)
    description = item.description  # Haber öğesinin açıklaması (description)

    # Aynı link daha önce alınmadıysa işlem yap
    if link not in previously_seen_links:
        previously_seen_links.add(link)

        # Haber sayfasına git
        response = requests.get(link)

        # Sayfanın içeriğini parçala
        soup = BeautifulSoup(response.text, 'html.parser')

        # Tüm <p> etiketlerini bulun
        paragraphs = soup.find_all("p")

        # Her bir haberin metnini ayrı bir dosyaya yazdırın
        with open(f"haber{i}.txt", "w", encoding="utf-8") as file:
            file.write(f"Başlık:\n{title}\n\n")  # Başlığı ekleyin
            file.write(f"Açıklama:\n{description}\n\n")  # Açıklamayı ekleyin
            for paragraph in paragraphs:
                paragraph_text = paragraph.get_text()
                file.write(paragraph_text)
                file.write("\n\n")  # Paragraf sonlarına bir boş satır ekleyin

        print(f"Haber {i} başarıyla haber{i}.txt dosyasına kaydedildi.")
    else:
        print(f"Haber {i} zaten alındı, atlandı.")
 

SiberAslan

Üye
24 May 2024
128
52
Ötüken.
Merhaba arkadaşlar

  • Bu paylaşımımda, Python kullanarak CNN Türk'ün RSS beslemesinden haberleri nasıl çekeceğinizi ve bu haberleri dosyalara nasıl kaydedeceğinizi anlatan bir kodu sizlerle paylaşıyorum.
  • Bu kod sayesinde, CNN Türk'teki son haberleri otomatik olarak çekebilir ve her bir haberi ayrı bir dosyada saklayabilirsiniz.
  • Özellikle veri toplama ve analiz projelerinde kullanabileceğiniz bu kod,
  • BeautifulSoup ve feedparser kütüphanelerini kullanarak basit ama etkili bir çözüm sunuyor.
  • Kodlar Aşşağıda Yer Alıyor.


Örnek Resim:
kp7spz6.png




Python:
import requests
from bs4 import BeautifulSoup
import feedparser

# RSS besleme URL'si
feed_url = "https://www.cnnturk.com/feed/rss/news"

# RSS beslemesini çek
feed = feedparser.parse(feed_url)

# Daha önce alınan haberleri takip etmek için bir set kullanın
previously_seen_links = set()

# Her bir haber öğesini döngü ile gezin
for i, item in enumerate(feed.entries, start=1):
    link = item.link  # Haber öğesinin bağlantısı (link)
    title = item.title  # Haber öğesinin başlığı (title)
    description = item.description  # Haber öğesinin açıklaması (description)

    # Aynı link daha önce alınmadıysa işlem yap
    if link not in previously_seen_links:
        previously_seen_links.add(link)

        # Haber sayfasına git
        response = requests.get(link)

        # Sayfanın içeriğini parçala
        soup = BeautifulSoup(response.text, 'html.parser')

        # Tüm <p> etiketlerini bulun
        paragraphs = soup.find_all("p")

        # Her bir haberin metnini ayrı bir dosyaya yazdırın
        with open(f"haber{i}.txt", "w", encoding="utf-8") as file:
            file.write(f"Başlık:\n{title}\n\n")  # Başlığı ekleyin
            file.write(f"Açıklama:\n{description}\n\n")  # Açıklamayı ekleyin
            for paragraph in paragraphs:
                paragraph_text = paragraph.get_text()
                file.write(paragraph_text)
                file.write("\n\n")  # Paragraf sonlarına bir boş satır ekleyin

        print(f"Haber {i} başarıyla haber{i}.txt dosyasına kaydedildi.")
    else:
        print(f"Haber {i} zaten alındı, atlandı.")
Haber sayfasi plan arkadaslar icin kullanisli bir tool elinize saglik hocam.
 

Privarp

Anka Team Junior
8 Nis 2022
138
45
Merhaba arkadaşlar

  • Bu paylaşımımda, Python kullanarak CNN Türk'ün RSS beslemesinden haberleri nasıl çekeceğinizi ve bu haberleri dosyalara nasıl kaydedeceğinizi anlatan bir kodu sizlerle paylaşıyorum.
  • Bu kod sayesinde, CNN Türk'teki son haberleri otomatik olarak çekebilir ve her bir haberi ayrı bir dosyada saklayabilirsiniz.
  • Özellikle veri toplama ve analiz projelerinde kullanabileceğiniz bu kod,
  • BeautifulSoup ve feedparser kütüphanelerini kullanarak basit ama etkili bir çözüm sunuyor.
  • Kodlar Aşşağıda Yer Alıyor.


Örnek Resim:
kp7spz6.png




Python:
import requests
from bs4 import BeautifulSoup
import feedparser

# RSS besleme URL'si
feed_url = "https://www.cnnturk.com/feed/rss/news"

# RSS beslemesini çek
feed = feedparser.parse(feed_url)

# Daha önce alınan haberleri takip etmek için bir set kullanın
previously_seen_links = set()

# Her bir haber öğesini döngü ile gezin
for i, item in enumerate(feed.entries, start=1):
    link = item.link  # Haber öğesinin bağlantısı (link)
    title = item.title  # Haber öğesinin başlığı (title)
    description = item.description  # Haber öğesinin açıklaması (description)

    # Aynı link daha önce alınmadıysa işlem yap
    if link not in previously_seen_links:
        previously_seen_links.add(link)

        # Haber sayfasına git
        response = requests.get(link)

        # Sayfanın içeriğini parçala
        soup = BeautifulSoup(response.text, 'html.parser')

        # Tüm <p> etiketlerini bulun
        paragraphs = soup.find_all("p")

        # Her bir haberin metnini ayrı bir dosyaya yazdırın
        with open(f"haber{i}.txt", "w", encoding="utf-8") as file:
            file.write(f"Başlık:\n{title}\n\n")  # Başlığı ekleyin
            file.write(f"Açıklama:\n{description}\n\n")  # Açıklamayı ekleyin
            for paragraph in paragraphs:
                paragraph_text = paragraph.get_text()
                file.write(paragraph_text)
                file.write("\n\n")  # Paragraf sonlarına bir boş satır ekleyin

        print(f"Haber {i} başarıyla haber{i}.txt dosyasına kaydedildi.")
    else:
        print(f"Haber {i} zaten alındı, atlandı.")
Elinize Sağlık güzel olmuş
 
Üst

Turkhackteam.org internet sitesi 5651 sayılı kanun’un 2. maddesinin 1. fıkrasının m) bendi ile aynı kanunun 5. maddesi kapsamında "Yer Sağlayıcı" konumundadır. İçerikler ön onay olmaksızın tamamen kullanıcılar tarafından oluşturulmaktadır. Turkhackteam.org; Yer sağlayıcı olarak, kullanıcılar tarafından oluşturulan içeriği ya da hukuka aykırı paylaşımı kontrol etmekle ya da araştırmakla yükümlü değildir. Türkhackteam saldırı timleri Türk sitelerine hiçbir zararlı faaliyette bulunmaz. Türkhackteam üyelerinin yaptığı bireysel hack faaliyetlerinden Türkhackteam sorumlu değildir. Sitelerinize Türkhackteam ismi kullanılarak hack faaliyetinde bulunulursa, site-sunucu erişim loglarından bu faaliyeti gerçekleştiren ip adresini tespit edip diğer kanıtlarla birlikte savcılığa suç duyurusunda bulununuz.