Robots.txt Dosyası Nedir?

X-Code

Uzman üye
19 Mar 2019
1,855
335
Localhost

jyo2qm.png

Merhaba TürkHackTeam Üyeleri.
Bu Konumda Sizlere Robots.txt Dosyasının Ne Olduğundan Bahsedeceğim.


dWHR1f.gif



Konu İçeriği

Robots.txt Dosyası Nedir?

Robots.txt Dosyası İle Neler Yapılabilir?

Robots.txt Dosyası Nasıl Oluşturulur?

Örnek Robots.txt Dosyası



PN002A.png



Robots.txt Dosyası Nedir?

Robots, arama motorlarıyla web sunucunuzun iletişim kurduğu bir dosyadır. Bu dosya sayesinde arama motorlarına sitenizin nerelerini indexleyeceğini, nerelere girmeyeceğini söyleyebilirsiniz. Arama motorlarının botları sitenizi ziyaret ettiklerinde ilk olarak robots.txt dosyasını incelerler ve sizin robots.txt dosyasına yazdığınız komutlara göre indexlemelerini yaparlar. Robots dosyasına yazacağınız uygun komutlar ile sitenizin sınırlarını belirlerlediğiniz için SEO açısından çok önemlidir.

nTaHpV.jpg



Robots.txt Dosyası İle Neler Yapılabilir?

» Sitenizin erişilmesini istemediğiniz bölümlerini gizleyebilirsiniz.

» Site haritasının nerede olduğunu belirtebilirsiniz.

» Siteniz yapım aşamasında ve bakım aşamasında olduğu zamanlarda erişimi kısıtlayabilirsiniz.

» Tarayıcıların fazla içerik yüklemesi yaparak sunucularınıza fazla yüklenmemesi için tarama gecikmeleri yapabilirsiniz.

» Sitenizdeki istediğiniz dosyaların/bölümlerin indexlenmesini engelleyebilirsiniz.


byk4No.png



Robots.txt Dosyası Nasıl Oluşturulur?

Robots dosyası hem manuel olarak hemde otomatik programlar/siteler ile oluşturulabilir. Otomatik oluşturmak için internetde robots.txt generator şeklinde bir arama yaparak buradaki gibi bir tool kullanabilirsiniz. Manuel olarak oluşturmak için ise öncelikle robots.txt adında bir dosya oluşturuyoruz ve bu dosyayı sitemizin ana dizinine ekliyoruz. Şimdi dosyamıza yazacağımız komutları eklememiz gerekiyor. Robots dosyasına yazacağımız komutlara ve ne işe yaradıklarına geçelim...

1.png



User-agent: Komutların hangi arama botlarında çalışması gerektiğini belirtir. Aşağıdakiler Google ve Yandex in kullandığı arama motoru botlarıdır.

'Googlebot'— Temel indeksleme robotu
'APIs-Google' — API servis robotu
'Mediapartners-Google' — Reklam servisine kayıtlı sitelerde kullanılmak üzere
'Mediapartners (Googlebot)' — Reklam servisine kayıtlı sitelerde kullanılmak üzere
'AdsBot-Google-Mobile' — Android web sayfası reklam kalitesini kontrol eder
'AdsBot-Google-Mobile' — iPhone web sayfası reklam kalitesini kontrol eder
'AdsBot' — Masaüstü web sayfası reklam kalitesini denetler
'Googlebot-Image' — Görsel robotu
'Googlebot-News' — Haber robotu
'Googlebot-Video' — Video robotu
'AdsBot-Google-Mobile-Apps' — Android uygulama sayfası reklam kalitesini kontrol eder. AdsBot-Google robotlarının kurallarına uyar
'YandexBot' — Temel indeksleme robotu
'YandexMedia' — Multimedya verilerini indeksleyen robot
'YandexImages' — Yandex.Görsel indeksleyicisi
'YaDirectFetcher' — Yandex.Direct robotu, Direct servisinde kayıtlı sitelerin incelenmesi
'YandexBlogs' — Gönderilen yorumları indeksleyen blog araması robotu
'YandexNews' — Yandex.Haberler robotu
'YandexPagechecker' — Mikro etiket doğrulayıcısı
'YandexMetrika' — Yandex.Metrica robotu
'YandexMarket'— Yandex.Market robotu
'YandexCalendar' — Yandex.Takvim robotu

Disallow: Belirtilen dosyanın/dizinin indexlenmesine izin verilmediğini belirtir.

Allow: Belirtilen dosyanın/dizinin indexlenmesine izin verildiğini belirtir.

Crawl-delay: Tarayıcının sunucunuza çok yüklenmemesi için işlemler arasında tarayıcının bekleyeceği süreyi belirtir.

Sitemap: Sitenizin xml uzantılı sitemapını robota bildirir.

Clean-param: Sitenizin sayfa adresleri içeriklerini etkilemeyen dinamik parametreler (örneğin: oturum, kullanıcı, başvuran vs. tanımlayıcıları) içerdiğini belirtirmenizi sağlar.

#: Dosyaya yorum ve not koymayı sağlar.

*: Herhangibir şeyi belirtmenizi sağlar.

$: URL nin sonunu belirtir.


iiXJIk.png



Örnek Robots.txt Dosyası

Kod:
[FONT="System"][SIZE="3"][COLOR="RoyalBlue"][COLOR="White"]#TurkHackTeam  [/COLOR]   → [COLOR="silver"]Turkhackteam[/COLOR] Adında Bir Yorum Bırakır.
[COLOR="white"]User-agent: *  [/COLOR]   → [COLOR="silver"]*[/COLOR] İşareti Tüm Arama Botları İçin Çalışmasını Tanımlar.
[COLOR="white"]Allow: /dosya1/ [/COLOR]    → [COLOR="silver"]dosya1[/COLOR] Dizinindeki Her Şeye Arama Botlarının Erişmesi İçin İzin Verir.
[COLOR="white"]Disallow: /dosya2/private.html [/COLOR]    → [COLOR="silver"]dosya2[/COLOR] Dizinindeki [COLOR="silver"]private.html[/COLOR] Dosyasına Arama Botlarının Erişmesine İzin Vermez.
[COLOR="white"]Disallow: /dosya3/*.txt$ [/COLOR]    → [COLOR="silver"]dosya2[/COLOR] Dizinindeki Tüm txt Uzantılı Dosyalara Arama Botlarının Erişmesine İzin Vermez.
[COLOR="white"]Crawl-delay: 4.5  [/COLOR]   → Tarayıcının İşlem Geçişlerinde Belirtilen Süre Kadar Beklemesini Sağlar.
[COLOR="white"]Sitemap: https://www.site.com/dosya4/sitemap.xml [/COLOR]    → Arama Botlarına Sitenin Haritasının Yolunu Belirtir.[/COLOR][/SIZE][/FONT]


jQG9Gn.gif



Konum Bu Kadardı Umarım Beğenmişinizdir Ve Faydalı Olmuştur.

Okuduğunuz İçin Teşekkür Ederim.
Esenlikle Kalın...

Saygılarımla:Smiley1021:


giphy.gif

 

Vuanays

Katılımcı Üye
15 Eyl 2018
400
72
UZAY
Merhaba, :)

Öncelikle eline sağlık

Mesela web siteme erişimi geçici olarak kapatmak istiyorum onu nasıl yapabilirim tam anlayamadım.

Ve;

Site dosyalarının içine mi yükleyeceğim bu robots.txt'i?
 

X-Code

Uzman üye
19 Mar 2019
1,855
335
Localhost
Merhaba, :)

Öncelikle eline sağlık

Mesela web siteme erişimi geçici olarak kapatmak istiyorum onu nasıl yapabilirim tam anlayamadım.

Ve;

Site dosyalarının içine mi yükleyeceğim bu robots.txt'i?

Merhaba;

1) Bunu Aşağıdaki Kod İle Yapabilirsiniz

Kod:
User-agent: *
Disallow: /

2) Site Dosyalarının İçine Yukleyeceksiniz. Fakat kök(root) Dizinine Yüklemeniz Gerekmekte.

Yanlış Kullanım :
https://www.site.com/dizin/robots.txt

Doğru Kullanım :
https://www.site.com/robots.txt
 
Üst

Turkhackteam.org internet sitesi 5651 sayılı kanun’un 2. maddesinin 1. fıkrasının m) bendi ile aynı kanunun 5. maddesi kapsamında "Yer Sağlayıcı" konumundadır. İçerikler ön onay olmaksızın tamamen kullanıcılar tarafından oluşturulmaktadır. Turkhackteam.org; Yer sağlayıcı olarak, kullanıcılar tarafından oluşturulan içeriği ya da hukuka aykırı paylaşımı kontrol etmekle ya da araştırmakla yükümlü değildir. Türkhackteam saldırı timleri Türk sitelerine hiçbir zararlı faaliyette bulunmaz. Türkhackteam üyelerinin yaptığı bireysel hack faaliyetlerinden Türkhackteam sorumlu değildir. Sitelerinize Türkhackteam ismi kullanılarak hack faaliyetinde bulunulursa, site-sunucu erişim loglarından bu faaliyeti gerçekleştiren ip adresini tespit edip diğer kanıtlarla birlikte savcılığa suç duyurusunda bulununuz.