В предыдущей статье про то, как google определяет релевантность страниц, я описал только внешнюю, видимую часть вопроса, лишь вскользь упомянув про техническую сторону. Сделал я это умышленно. Во первых следует разделять вопросы принципов работы чего-либо и «технического SEO». К тому же, если верить авторитетным аналитикам, многостраничные мануалы усваиваются не так хорошо, как более короткие узкотематические статьи.
Итак, про техническую сторону метода google по определению релевантности. Все началось еще в 2004 году, когда Джордж Харик и Моника Хейзингер, сотрудники корпорации Google запатентовали метод ранжирования документов, основанный на определении семантической близости терминов. Вот ссылка на оригинал патента. Права за корпорацией были закреплены только в мае 2010 года. Вот цитата из аннотации:
В патенте определена техника определения неявно определенных семантических структур между терминами в html документе. Определенные структуры могут быть использованы для определения семантической близости между терминами/словами. Эта близость может быть использована в качестве ранжирующего фактора при определении релевантности станицы поисковому запросу.
Для анализа используется информация head тегов, тегов организованных <ol> и неорганизованных списков <ol>, таблиц, div’ов, элементов заголовков и других тегов, отвечающих за отображение информации на странице.
К примеру, заголовок статьи должен быть в теге <h1> или в еще более увеличенном. Вся информация, следующая за ним рассматривается, как семантически близкая ему.
Другими словами, роботы google стараются упорядочить информацию со страницы на основе html разметки для получения семантических связей между терминами. Этот патент раскрывает некоторые подходы, которые следует учитывать при внутренней SEO оптимизации страницы. Это самая дешевая и обязательная раскрутка сайтов из всех возможных.
google оптимизация