robots txt -podstawy SEO |
|
Robots.txt - to plik w formacie tekstowym, który należy umieścić w katalogu domowym hostowanej witryny internetowej. Katalog domowy to miejsce na serwerze WWW, gdzie znajdują się wszystkie pliki i podkatalogi składające się na Twój serwis internetowy. Plik robots.txt spełnia funkcję podobną jak lampy sygnalizacyjne na skrzyżowaniu - wskazuje robotom wyszukiwarek internetowych mapę strony (mapa serwisu internetowego) oraz zabrania im indeksowania podkatalogów. Niektóre podkatalogi mogą zawierać pliki z treściami (np. fotografie, filmy) które nie powinny być indeksowane przez wyszukiwarki. To Ty decydujesz o tym, które treści chcesz udostępniać robotowi. Możesz to uczynić poprzez odpowiedni wpis w pliku robots.txt.
Każdy serwis internetowy powinien posiadać plik robots.txt, zwłaszcza, że jego obecność wpływa korzystnie na pozycjonowanie strony w wyszukiwarce Google.
Musisz jednak być świadom/a, że robot wyszukiwarki nie musi respektować poleceń zawartych w pliku robots.txt i może odwiedzić podkatalogi (podstrony serwisu). Jeśli naprawdę chcesz je zabezpieczyć - możesz do tego celu wykorzystać inne sposoby, np. plik .htaccess na serwerach Apache.
Przykład zawartości pliku robots.txt - znak # oznacza komentarz: # Pierwsza zasada SEO - przygotuj mapę serwisu (sitemap.xml lub sitemap.xml.gz) # Wskaż robotom gdzie ją mogą znaleźć, aby zrobiły jej kopię dla wyszukiwarki Sitemap: http://www.adsecur.com/sitemap.xml
# Znak * oznacza wszystkie roboty # Wpis wskazuje że w/w roboty nie powinny indeksować poniższych katalogów Disallow: /SEOTajniki
# Wpis wskazuje że robot Google ma dostęp do wszystkich podkatalogów serwisu
# Wpis wskazuje że robot określonej wyszukiwarki nie powinien mieć dostępu # do wszystkich podkatalogów serwisu, przestrzegaj tej zasady SEO
# Wpis wskazuje że robot Google-Image nie powinien mieć dostępu # do plików graficznych - nie powinien ich indeksować
# Wpis wskazuje że roboty nie powinien mieć dostępu do numeru sesji (sklepy) # nie powinien indeksować stron z określonym końcem adresu (numer sesji) User-agent: * ##################################################### Matt Cutts z Google dokładnie tłumaczy, więcej na jego blogu.
Jak zrobić plik robots.txt dla robotów wyszukiwarki Google, Bing, Yahoo?
Jeśli nie masz pewności czy firma, która zrobiła dla Ciebie stronę internetową, przygotowała plik robots.txt, możesz to sprawdzić, wpisując za nazwą swojej domeny: /robots.txt Plik robots.txt możesz utworzyć za pomocą dowolnego programu - edytora tekstu - np. notatnika Windows (notepad.exe). Polecamy jeden z lepszych programów z rodziny open source - notepad++. Robots.txt ma wpływ na widoczność stron internetowych w wyszukiwarce Google - robot internetowy widzi otwarte drzwi do Twojego serwisu (wpis Allow: /). Wpada do niego i szuka pliku sitemap.xml, jeśli go nie znajdzie, sam buszuje po serwisie. |

