• Автор:

    Flesha
  • Добавлено:

    мар 27, 2013
  • Комментариев:

    0
  • Просмотров:

    1 836

Особенности индексации различных типов контента

Особенности индексации различных типов контента

Всем известно, что основа контента большинства сайтов – это текст (заметки, статьи, обзоры и т.д.). Текст одинаково хорошо индексируется всеми поисковыми системами, так как именно для анализа такого типа контента и создавались изначально Гугл, Яндекс, Бинг и другие поисковики.

Формат, в котором представлен текст в интернете – это HTML. То есть непосредственно к тексту добавляются разнообразные теги форматирования (абзац, выделение жирным и подчеркиванием, заголовки различных уровней, списки и т.д.). В результате текст приобретает читабельный и удобоваримый для пользователей вид.

Через какое-то время поисковые системы научились индексировать изображения различных форматов. Самые основные из них – это JPG, PNG, GIFF и другие. Необходимость индексации картинок была вызвана новой ступенью развития интернета. Пользователя уже интересовал не только текст, но и графика, а кто-то целенаправленно искал картинки по определенной тематике. Нужно было удовлетворять все эти запросы. Полноценная индексация картинок стала возможной благодаря атрибутам Title и Alt, в которых при помощи текста указывалось содержимое картинки. Сегодня все популярные поисковые системы имеют отдельный поиск по картинкам.

Затем настала эпоха видео. Многочисленные видеоролики буквально заполонили сайты (особенно развлекательной тематики). Кто-то использовал собственный видеоплеер, а кто-то вставлял ролики с популярных видеохостингов. Многие оптимизаторы видят будущее интернета именно за видеоконтентом, так как он в полной мере может раскрыть ту или иную тему, а также является более наглядным для пользователей. Как же видео индексируется поисковиками? Тут вступают в дело несколько факторов – наличие самого видеофайла или кода вставки плеера на странице сайта, а также релевантное название этого файла и описание (description). Благодаря наличию этих составляющих поисковик понимает, что это именно видеоконтент, а также распознает тематику данного видео.

Кроме того, существуют другие типы файлов, которые часто используются на многих сайтах. К примеру, текстовые файлы .doc, файлы Java-скриптов, файлы PDF и так далее. Различные поисковики индексируют их по-разному. Как правило, все основные и часто используемые форматы файлов хорошо «понимаются» поисковыми машинами. Но те же скрипты еще недостаточно изучены поисковиками. В большинстве случаев они не имеют возможности прочитать такие файлы, из-за чего могут возникать различные проблемы с индексацией сложных и функциональных сайтов. Здесь уже в дело вступают модераторы, которые в ручном режиме анализируют подобные сайты и выставляют им соответствующий рейтинг.

Поисковые системы постоянно расширяют число поддерживаемых форматов файлов. Это делается с целью достижения максимальной объективности выдачи и для того, чтобы предоставлять пользователям самый широкий спектр информации. Но вебмастерам при создании сайта все равно нужно использовать минимальное число форматов (это не обязательная директива, а рекомендация), так как в этом случае поисковику будет намного проще проиндексировать содержимое, да и сделает он это быстрее. dle
Вернуться
Информация
Посетители, находящиеся в группе Гости, не могут оставлять комментарии к данной публикации.