Как Гугл видит сайт
Начиная объяснение, как Гугл видит сайт, начнем с того, что поисковая система «разглядеть» не в состоянии:
-
Видеоролики, которые хороши и интересны для пользователей, но их содержание недоступно поисковикам.
-
Иллюстрации необходимы для каждого ресурса, но что именно на них показано, Google тоже не видит.
-
Flash файлы он понимает выборочно и лучше ими не злоупотреблять.
-
А теперь переходим к вопросу, как Гугл видит страницу и на чем делает акцент?
-
Он может анализировать любой текст, который вы можете выделить курсором компьютерной мышки.
-
Боту доступны также любые графические и текстовые ссылки, что хорошо влияет на SEO-продвижение сайта.
-
Кодировка HTML. Поисковый робот замечает текстовые разметки, включая различные теги (для заглавия, описания, авторского права), а также ключевые слова и прочие данные.
-
Видеоконтент и изображения. Бот «не понимает» собственно содержание, но он может узнать об этом по ближайшему контексту содержимого.
-
Тег ALT, который используется для текстовой разметки иллюстраций. Данное описание к фото отобразится, если сам рисунок не сможет быть загружен.
Чтобы понять, как выглядит страница с позиции Google, разработчики пользуются сервисом «Просмотреть как Googlebot». Он находится в блоке «Сканирование», который доступен с аккаунта Инструментов для веб-мастеров.
С его помощью сайт сканируется и отображается в определенном виде, причем процесс обработки может занимать немало времени. Затем наводим курсор на требуемый URL и просматриваем результат.
Робот обрабатывает коды с учетом инструкций, прописанных в файле robots.txt для сайта. Таким образом можно ограничить доступ к определённым параметрам ресурса и Гугл не станет использовать их при предварительном просмотре. Это возможно при отсутствии ответа от сервера либо повторяет сбой.
Но специалисты рекомендуют дать Googlebot проверить сайт целиком, то есть предоставить программе возможность просканировать все встроенные элементы, имеющиеся на электронной странице или макете. Только в этом случае контент сможет корректно проиндексироваться, а вы узнаете, как именно сканируются страницы вашего сетевого проекта.