Ваша ситуация стандартная. Такое происходит со многими сайтами, у которых имеются несколько альтернативных имен или зеркал сайта.
Проблема состоит в том что после захода на сайт робота поисковой системы по его неосновному имени, робот может посчитать, что Ваш старый сайт был обновлен или перенесен на новое пространство в Интернет. В результате происходит привязка упоминания о сайте к альтернативному имени, а его основное имя забывается.
Однако поведением поисковых роботов можно если не управлять, то координировать. Для предотвращения подобных неоднозначных ситуаций следует использовать специальный служебный файл, расположенный в корне сайта robots.txt
Файл robots.txt состоит из секций, разделяемых пустыми строками. Пустые строки очень важны - ведь именно они разделяют секции, которые в свою очередь состоят из строк:
<имя-поля>:[<пробел>]<значение>[<пробел>]
В файлах robots.txt возможно использование комментария:
# комментарий до конца строки
Секция начинается с одной или нескольких строк, которые содержат поле "User-agent". За ними следуют строки, содержащие другие поля (Disallow и прочие инструкции). В конце последней секции в файле рекомендуется ставить пустую строку.
Поле "User-agent" определяет имя робота, к которому должны применяться описанные в секции инструкции (регистр символов не важен). Использование символа * в качестве значения поля определяет правила для всех роботов.
Например, сайт пермской студии веб-дизайна "Жанр" содержит файл robots.txt состоящий из двух простейших строк:
User-Agent: * Host: janr.perm.ru
В результате происходит идексация сайта по основному имени, а его альтернативное имя "ganr.perm.ru", по которому доступен этот же самый сайт не индексируется поисковыми системами.
Если же у Вас не имеется возможности корректировать служебный файл robots.txt, то можно попытаться выносить рекомендации поисковым роботам за счет использования HTML инструкции, размещенной в шапке страниц сайта:
<META NAME="ROBOTS" CONTENT="КОМАНДА_РОБОТУ">
где КОМАНДА_РОБОТУ (по умолчанию - ALL) - это список ключевых слов,
перечисленных через запятую:
INDEX - данный документ разрешается индексировать FOLLOW - робот может переходить по ссылкам из текущего документа NOINDEX - индексация документа запрещена NOFOLLOW - переходы по ссылкам запрещены ALL - INDEX + FOLLOW - разрешается все (по умолчанию) NONE - NOINDEX + NOFOLLOW - запрещено все
Например:
<meta name="robots" content="noindex,nofollow">
Не забывайте, что инструкции META носят рекомендательный характер.
|