Кластеры ключевых слов: для чего они нужны

Материал из Викиучебника — открытых книг для открытого мира
Схема работы алгоритма PageRank для ранжирования сайтов

Автор статьи: Марк Екимов.

Под ключевыми словами в IT-сфере и лингвистике, как правило, подразумеваются определённые слова и словосочетания, с помощью которых читатель способен не только понять содержимое текста, но и даже воспроизвести его без существенных искажений. Определённые ключевые слова используются авторами научных статей (и в том числе владельцами сайтов), чтобы результаты поисков по конкретным запросам выводили именно их статьи (или сайты) на первые страницы результатов поиска как наиболее актуальные. В настоящее время всё чаще используются так называемые «кластеры ключевых слов» (англ. keyword clusters) для улучшения результатов поиска, что может выгодно и владельцу сайта, предоставляющего некие услуги, и посетителям, которые могут опираться именно на этот сайт для получения какой-либо информации или оказания услуги. Маник Бхан (англ. Manick Bhan) из издания Search Engine Journal предпринял попытку разобраться в том, как этим должны пользоваться авторы сайта.

Нейронное сопоставление

За последние несколько лет команда Google сместила фокус своих исследований в сторону обработки естественного языка и более глубокого понимания соотношения контента на странице с запросами. Такая технология, как нейронное сопоставление (англ. neural matching), обеспечила поисковой системе Google связывать слова с понятиями и тем самым находить синонимы. К примеру, на запрос пользователя why does my TV look strange первый же результат поиска содержит словосочетание soap opera effect — об этом пользователь может и не знать, а система уже догадалась, о чём идёт речь. Аналогичный запрос на русском почему телевизор показывает как документальный фильм может вывести на сайт hdtv.ru с вопросом об эффекте мыльной оперы[1]. Нейронная сеть BERT помогает Google разобраться в этих хитросплетениях, и с каждым новым обновлением ядра Google становится грамотнее и умнее. Однако владельцы многих сайтов для вывода своего детища на первые страницы результатов поиска используют не так много ключевых слов. Подобный метод является устаревшим, особенно с учётом того, что посадочные страницы (англ. landing pages) ранжируются по сотням ключевых слов в любом случае. Для тех, кто работает в системе Google с самого начала её существования, это не новость. Нейролингвистические способности Google непрерывно развиваются, и требуется изменение подхода к стратегии SEO, чтобы все эти достижения также отражались в поиске. Что же именно необходимо предпринять для того, чтобы владельцы сайтов шли в ногу со временем и технологиями Google? Секрет успеха — кластеризация ключевых слов.

Кластеризация

Кластеризация ключевых слов связана с кластеризацией запросов в Google. Этот процесс представляет собой группировку семантического ядра (некоей структурированной базы ключевых слов) в кластеры — синонимов, схожих по значению словосочетаний, однокоренных слов и т.д. Запросы кластеризуются с учётом схожести поисковой выдачи по ним — определяются все похожие запросы, в которых речь идёт об одном и том же предмете, явлении и т.д. Без кластеризации автор сайта не может самостоятельно вывести его на первые страницы в результатах поиска по запросам. Пример кластеризации запросов — запросы linen curtains (шторы), linen window curtains (шторы на окна) или white curtains linen (белые шторы). По структуре представляют собой абсолютно разные словосочетания, однако эти запросы делают люди, которые намерены приобрести шторы. Используя только словосочетание linen curtains, автор конкретного сайта не может привлечь к себе достаточное количество посетителей. С другой стороны, можно взять запросы купить гироскутер, купить сигвей или купить гироборд — речь идёт об одном и том же, однако без кластеризации по всем трём запросам будет абсолютно разная выдача[2].

Подобная стратегия потребует больше ресурсов и времени от владельца сайта, ведь речь идёт не просто о тщательном подборе ключевых слов и словосочетаний. Нужно подготовить контент сайта, чтобы на сайте было именно то, что искал пользователь; нужно внимательно работать в плане SEO и в плане сотрудничества с командами по маркетингу. Однако всё это может окупиться и позволить сайту выйти на первые места не только в плане запросов по небольшим ключевым словам и различным словосочетаниям: дополнительно улучшается в целом ранжирование в SERP и появляются больше возможностей для создания внутренних ссылок (англ. internal linking). Кластеризация при всей своей трудности позволяет сэкономить время: ручная группировка 100 запросов занимает от 40 до 50 минут, в то время как на 1000 запросов уходит в среднем около двух рабочих дней — даже без учёта необходимости сравнивать выдачу по каждой паре запросов[2]. Сервисы автоматической кластеризации запросов легко находятся в Интернете.

Для подготовки к процедуре кластеризации требуется подготовить хотя бы один кластер ключевых слов. Бхан представляет следующий механизм создания такового кластера, состоящий из четырёх шагов:

1. Создание списка ключевых слов

Его построение начинается с выбора первичного ключевого слова (англ. primary keyword), на основании которого и будет ранжироваться сайт в результате поиска. Автор далее должен собрать все возможные варианты употребления данного ключевого слова: его различные грамматические формы; синонимы и однокоренные ему слова; его употребление в словосочетаниях; все возможные подтемы, связанные с данным ключевым словом — всё то, что могут искать пользователи в Интернете. Наиболее распространённые словосочетания можно найти при вводе запроса в Google — «подсказки» к данному запросу[1]. Примером Маник Бхан называет слово diversity, предлагая варианты таких словосочетаний, как diversity in the workplace, diversity equity and inclusion, diverse workspace, diversity hiring, diversity inclusion and equity и так далее.

Для поиска связанных ключевых слов можно использовать разные инструменты, но очень полезным опытом может послужить наблюдение за конкурентами (какие ключевые слова используют они). Всё это лучше оформить в виде некоей таблицы, проранжировав ключевые слова по таким параметрам, как cost per click, количество выводимых результатов, длина и сложность и т.д. Обычно хватает около ста ключевых слов для одного сайта (авторы научных статей, как правило, используют намного меньше слов для выведения своих результатов на первые страницы поиска, опираясь, прежде всего, на требования к журналам, в которых публикуются).

2. Разделение ключевых слов на кластеры

В подготовленном списке ключевых слов можно обнаружить некоторые закономерности: повторение одних и тех же слов, конструкций, синонимов или подтем, к которым обращаются пользователи, составляя очередной поисковый запрос. Эти шаблоны дают возможность разделить весь список на несколько кластеров (групп), каждый из которых используется для решения какой-либо конкретной задачи или связана с той или иной темой. В качестве примера Бханом представлена платформа ПО, которая помогает компаниям нанимать сотрудников и опрашивать их: в один кластер ключевых слов входят interview scheduling software, interview scheduling tool, interview scheduling tools (всё, что связано с расписанием собеседований); в другой — online interview software, virtual interviewing software, interview software и virtual interview software (ПО, используемое для организации собеседования).

Разделение на кластеры может осуществляться по принципам семантической схожести (одна и та же лексико-семантическая группа — то есть, грубо говоря, тема), по результатам поиска и количеству кликов (cost per click — чем больше, тем слово важнее и с большей вероятностью войдёт в группу), по структурной сложности (одно ключевое слово может представлять собой многокомпонентное словосочетание, в котором даже возможна перестановка некоторых элементов). Ключевые слова из одной группы должны дополнять друг друга и относиться к одной и той же теме: так, первый кластер, представленный выше, основан на словосочетании interview scheduling, второй — на словосочетании interview software. При этом необходимо помнить, что не все отобранные ключевые слова могут попасть в какой-либо кластер: от некоторых слово необходимо просто избавляться как от ненужных.

Кластеризация может носить характер мягкой (soft) и жёсткой (hard). При мягкой кластеризации попарно сравнивается выдача между запросами, и если в топ-10 появится определённое количество одинаковых результатов (варьируется от настроек), то запросы объединяются в кластер. При жёсткой кластеризации результаты выдачи сравниваются между всеми запросами внутри кластера, и те, по которым не будет заданное количество одинаковых результатов поиска, выпадет из группы. Мягкая кластеризация подходит преимущественно для информационных проектов, где не требуется подобная точность по выводу результатов; жёсткая же более пригодна для коммерческих проектов со сложной и разноплановой семантикой[2].

3. Выбор страниц для оптимизации

Кластеры ключевых слов слова являются основой для того, что должно размещаться на сайте. Страница, на которой размещается контент с данными ключевыми словами, называется ключевой страницей (англ. pillar page, буквально «страница-столп»). Исходя из примера пункта 2, на некоем сайте должны присутствовать две посадочные страницы, одна из которых связана с темой interview scheduling, вторая — с темой interview software. Для составления контента автор использует все свои навыки в области SEO: возможно использовать какой-либо инструмент оптимизации для более эффективного результата.

Чтобы наполнить страницу соответствующим контентом, на который мог бы выйти пользователь благодаря поисковому запросу, автору следует добавить туда какие-либо релевантные тексты. Как правило, автор определяет целевую аудиторию, закрываемую задачу и вносимую ценность[1] (аналогично в аннотации к научной статье указываются актуальность исследования, цели и задачи, результаты и даже возможное применение результатов в других сферах). Основой для данного текста служат не столько ключевые слова (interview scheduling или interview software), сколько собственно запросы пользователей, которые распознаются поисковой системой (например, если речь идёт об запросе поставить окна, Google выводить запрос купить окна, и автор обязан это учитывать)[1].

Рекомендуется использовать ключевые слова для формирования заголовков второго и третьего уровня; само собой разумеющимся является добавление различных видео, внешних и внутренних ссылок, а также различных интерактивных элементов, которые бы помогали пользователю ориентироваться в данном вопросе. Автор может использовать разные сервисы в качестве вспомогательных ресурсов.

4. Блог-контент в качестве подкрепления

Ключевые слова могут присутствовать не только непосредственно на ключевых страницах в пресловутом содержимом, но и в блог-контенте. Содержимое разных блогов можно репостить на сайт, и чем больше и разнообразнее контент, тем больше и разнообразнее содержимое кластеров тем (англ. topic clusters) на сайте. В блогах могут встречаться словосочетания, различные подтемы и даже вопросы, связанные с ключевыми словами. Это не только упрощает работу автора сайта, но и позволяет ему использовать новые возможности для развития сайта. Так, при необходимости открыть какой-то новый подраздел, посвящённый какой-то другой теме, он может подготовить новый кластер ключевых слов и проделать все необходимые манипуляции, чтобы выводить сайт на первые позиции по итогам иных запросов (не ограничиваясь уже заявленными выше двумя кластерами).

К итогу

Кластеры ключевых слов используются в качестве продвинутой стратегии SEO как один из инструментов вывода автором сайта на первые позиции в результате поиска. Эта технология опирается на две составляющие работы Google: естественную обработку языка и непарное индексирование (англ. unmatched indexing). Google в настоящее время обладает возможностью распознавать миллионы ключевых слов и словосочетаний, которые используют специалисты во всех областях современной жизни, а также может находить сходства и различия между запросами.

Использование принципа кластеризации является в настоящее время ключевым для владельцев различных сайтов (информационных и коммерческих проектов) методом, позволяющим выводить сайты на первые места в результате поисков — огромная часть запросов делается в Google, а результаты поиска по тому или иному запросу — это также отражение результатов кластеризации абсолютно любого сайта. Однако вместе со всеми преимуществами кластеризации на авторов сайтов возлагается ответственность за подготовку нового контента, соответствующего ожиданиям пользователей. В будущем, с точки зрения Бхана, кластеризация запросов станет фундаментом SEO.

Примечания[править]

Источники[править]