Deutsch

Яндекс?

325  
Валидол коренной житель11.01.13 14:05
NEW 11.01.13 14:05 
Последний раз изменено 11.01.13 14:09 (Валидол)
Некто, (141.8.147.12) гугль утверждает что это Яндекс, в течении уже пары месяцев, сканирует сайт по 10 раз на дню . Пока я его забанил, бо слишком уж часто паучит.
На сколько часто он приходит к вам?
#1 
project33 коренной житель11.01.13 14:40
project33
NEW 11.01.13 14:40 
в ответ Валидол 11.01.13 14:05, Последний раз изменено 11.01.13 14:41 (project33)
частота посещения ботами зависит от частоты обновления информации на сайте. можно приучить бота заходить несколько раз в час при необходимости
Продвижение сайтов, реклама: https://www.pro33.net
#2 
Валидол коренной житель11.01.13 14:47
NEW 11.01.13 14:47 
в ответ project33 11.01.13 14:40, Последний раз изменено 11.01.13 15:18 (Валидол)
a как приучить пореже?
Контент практически не обновляется, да и не оссобенно мне этот яндекс нужен, поэтому и без зазрения совести его забанил. Я согласен на его посещение раз в день, но не каждый час.
#3 
helper2008 свой человек11.01.13 15:01
helper2008
NEW 11.01.13 15:01 
в ответ Валидол 11.01.13 14:47
Вы какой то странный человек.
Люди голову себе сломали, как бы этого бота почаще к себе звать, а Вам 10 посещений в сутки жалко.
Наверное от него нагрузка на сервер охренительная. Сайт падает от Яндекса, не иначе ...
вполяне - жизнь в лесу
#4 
Валидол коренной житель11.01.13 15:17
NEW 11.01.13 15:17 
в ответ helper2008 11.01.13 15:01
Речь идет о вебшопе работающий только на немецкоязычную аудиторию. Русский store там был, но из за отсутствия в нем продаж, отключен. Поэтому русский яндекс не нужен.
#5 
compman знакомое лицо11.01.13 15:55
compman
NEW 11.01.13 15:55 
в ответ Валидол 11.01.13 15:17
10 это не сканирует. Хотите я вам покажу что значит сканировать сайт? :-) Оставьте яндекс в покое вам же лучше.
#6 
Валидол коренной житель11.01.13 16:04
NEW 11.01.13 16:04 
в ответ compman 11.01.13 15:55
Не надо, я знаю что такое сканирут
#7 
project33 коренной житель11.01.13 18:13
project33
11.01.13 18:13 
в ответ Валидол 11.01.13 16:04
В ответ на:
a как приучить пореже?

пропиши в robots.txt правило для яндекса и он от тебя отстанет
User-agent: Yandex
Disallow: /
Продвижение сайтов, реклама: https://www.pro33.net
#8 
Валидол коренной житель11.01.13 19:06
NEW 11.01.13 19:06 
в ответ project33 11.01.13 18:13, Последний раз изменено 11.01.13 19:17 (Валидол)
пореже, не значит совсем
#9 
project33 коренной житель11.01.13 19:43
project33
NEW 11.01.13 19:43 
в ответ Валидол 11.01.13 19:06, Последний раз изменено 11.01.13 19:54 (project33)
а ты чего собственно добиваешься? заблокировав адрес бота ты совсем ему кислород перекрыл, а так будет заходить иногда, смотреть на robots.txt на случай если ты передумаешь когда-нибудь...
если че, можещь юзать параметр Crawl delay.
В ответ на:
Позволяет указать индексирующему роботу минимальный промежуток времени (в секундах) между обращениями к страницам сайта. Этот параметр полезен для крупных проектов, содержащих десятки тысяч страниц и более. Поисковый робот Яндекса при индексировании может создать на такой сайт большую нагрузку, что может вызвать перебои и задержки в работе сайта, поэтому, возможно, вам следует ограничить количество обращений в секунду. Например, директива Crawl-delay: 2 укажет роботу, что он должен выжидать 2 секунды между обращениями к серверу.

Продвижение сайтов, реклама: https://www.pro33.net
#10 
Валидол коренной житель11.01.13 20:11
NEW 11.01.13 20:11 
в ответ project33 11.01.13 19:43, Последний раз изменено 11.01.13 20:16 (Валидол)
Как раз таки я перекрыл ему всего один Ip из многих. а РоботТХТ закроет все подчистую. Официально по крайней мере.
У яндекса есть и другие диапозоны. Поговаривают что всего у него имеется около 50 диапозонов
А надо мне от него не много.
#11 
helper2008 свой человек11.01.13 20:49
helper2008
NEW 11.01.13 20:49 
в ответ Валидол 11.01.13 20:11
Разные боты для разных целей.
Кто то ищет только картинки, кто то только новую информацию, кто то изменение старой и тэдэ ...
вполяне - жизнь в лесу
#12 
Валидол коренной житель11.01.13 21:32
NEW 11.01.13 21:32 
в ответ helper2008 11.01.13 20:49
да, конечно. каждой службе свое
#13 
helper2008 свой человек11.01.13 21:50
helper2008
NEW 11.01.13 21:50 
в ответ Валидол 11.01.13 21:32
Так можть ты отрезал картиночника ...
вполяне - жизнь в лесу
#14 
project33 коренной житель12.01.13 09:31
project33
NEW 12.01.13 09:31 
в ответ Валидол 11.01.13 20:11
В ответ на:
У яндекса есть и другие диапозоны.

достаточно один перекрыть, чтоб яндекс отказался от индексирования сайта
Продвижение сайтов, реклама: https://www.pro33.net
#15 
Vovan(ator) старожил12.01.13 14:08
Vovan(ator)
NEW 12.01.13 14:08 
в ответ Валидол 11.01.13 14:05
В ответ на:
На сколько часто он приходит к вам?

А разве нельзя указать с какой частотой они сайт посещать должны?
не знаю на сколько эффективно для Яндекса, но в sitemap.xml можно выставить и раз в год.
#16 
Валидол коренной житель12.01.13 15:11
NEW 12.01.13 15:11 
в ответ Vovan(ator) 12.01.13 14:08
Имеешь ввиду changefreq? Или что-то другое?
changefreq, сейчас выставлю, посмотрим что будет. Спасибо.
#17 
Vovan(ator) старожил12.01.13 16:17
Vovan(ator)
NEW 12.01.13 16:17 
в ответ Валидол 12.01.13 15:11
Да, это и имел в виду.
#18 
ant_01 посетитель12.01.13 17:47
NEW 12.01.13 17:47 
в ответ project33 11.01.13 18:13
robots.txt это рекомендация для поискового бота - можно ли индексировать директорию файлы и т.д. "пастись" на сервере он все равно будет
Закрывать доступ к сайту для ненужных ботов для снижения нагрузки на сервер лучше через .htacess если стоит apache
У тебя скорее всего "веселятся" вот эти два YandexMedia и YandexImagesк
Закрыть можно по этому принципу
RewriteCond %{HTTP_USER_AGENT} .*YandexMedia.* [NC,OR]
RewriteCond %{HTTP_USER_AGENT} .*YandexImagesк.* [NC,OR]
RewriteRule .* - [F,L]
P.S могу накосячить с кодом надо проверят на сервисах гугла правильность кода и проконтролировать по логам.
P.S.S у меня апача нет стоит nginx там запрет по правилам:
if ( $http_user_agent ~* (Googlebot|bingbot|AhrefsBot) ){
return 404;
}
VPN сервис без логов - Ваша анонимность в сети!
#19 
Валидол коренной житель12.01.13 19:50
NEW 12.01.13 19:50 
в ответ ant_01 12.01.13 17:47
YandexMedia , YandexImagesк
Спасибо. прописал в .htaccess, посмотрим что будет.
...
Я обратил внимание на этого янндекс-паука, по одной причине, он постоянно перенаправлялся на старницу "Ваш броузер не поддерживает куки, включите". Tакой сканер, не только мне, он никому не нужен
#20