Счётчик частоты слов

Word frequency counter

Редакторам контента важно убедиться, действительно ли в посте блога целевой ключевой слово используется чаще, чем «the» или «and», а также не встречается ли какое-либо слово с такой частотой использования, что оно выглядит как ритмический элемент текста. Данный инструмент анализирует текст: фильтрует стоп-слова по языковым категориям, при необходимости объединяет варианты слов по корню и формирует список всех слов в тексте с указанием их количества и доли от общего числа слов. Копируя 50 наиболее значимых слов в электронную таблицу, вы получаете качественный отчёт по анализу текста.

Как подсчитать частоту слов

  1. 1

    Вставить текст

    От твита до главы книги — всё варьируется в зависимости от контекста. Чем длиннее текст, тем информативнее он.

  2. 2

    Настройте фильтры

    Слова-запрещённые по языку, минимальная длина, игнорирование цифр, включение/выключение стеминга

  3. 3

    Процесс

    Токен преобразуется в токены, регистрация их форматирования (большие и малые буквы) нормализуется, а каждый токен подсчитывается.

  4. 4

    Просмотрите отсортированные результаты

    Таблица с текстом слов, их количеством и процентным соотношением; поддерживает сортировку и экспортирование в формате CSV.

Как выглядит результат

Для типичной блог-поста объёмом 1500 слов слова-стоповы были отфильтрованы и подвергнуты стемингу:

Рейтинг Термин Количество % от общего числа
1 маркетинг 47 3,1 %
2 кампания 38 2,5 %
3 аудитория 29 1,9 %
4 электронная почта 27 1,8 %

Если слово, за которое вы действительно стремились добиться высокого ранжирования, не входит в первые пять позиций, вероятно, пост недостаточно сосредоточен на этом ключевом слове. Если же слово, которого вы не планировали использовать, оказывается на первом месте — это может быть проявлением несознательной речевой привычки.

Цели по плотности ключевых слов в SEO

Современные рекомендации по SEO более либеральны по сравнению с 2015 годом.

– 1–2 % для основного ключевого слова — это более чем достаточное количество. – 0,5–1 % для вторичных ключевых слов или терминов LSI. – Более чем на 3 % вероятность того, что текст будет помечен как переполненный ключевыми словами, особенно если само слово кажется неестественным в контексте. Цельный ключевой слово должно присутствовать в заголовке, элементе H1, первом абзаце и как минимум в одном подзаголовке независимо от плотности текста в основном тексте.

В рейтинге на 2026 год качество значительно превосходит плотность.

Стимминг и лемматизация

Удаление концов слов (алгоритм Портера): преобразует формы слов вида running, runs, ran в run. Процесс быстрый, однако иногда формируются неправильные слова (например, happilyhappili). – Лемматизация возвращает формы из словаря: например, bettergood. Метод более точный, однако требует использования языкового словаря.

Инструмент поддерживает метод стеминга Портера для английского языка и базовый метод стеминга для романских языков; лемматизация доступна только для английского языка.

Сценарии использования за пределами SEO

– Редактирование из-за чрезмерного использования слов: выявляйте случаи применения слов «just», «really» и «actually» в качестве дополнительных элементов в первых черновиках. – Уровень чтения: слова с высокой частотой использования свидетельствуют о повторном использовании лексики; применение тезауроса снижает разнообразие распределения слов. – Аудит содержания: анализ частоты публикаций в 100 блог-постах показывает, какие темы вы обсуждаете чаще, чем вы сами осознаёте. – Академическое письмо: проверка того, повторяются ли ключевые концепции тезиса на протяжении всех глав.

Часто задаваемые вопросы

Счётчик слов показывает общее количество: в вашем тексте — 1500 слов. Счётчик частоты даёт данные по отдельным словам: слово «marketing» встречается 47 раз. Разные инструменты для разных задач.

При анализе плотности SEO-кодирования метод стеминга обычно отражает то, в чём поисковые системы наиболее сильны: Google считает слова «run», «running» и «ran» связанными между собой. В литературном анализе точные формы слов сохраняют стильные особенности текста.

По умолчанию значение — нет. Включите опцию «включить стоп-слова», если хотите, чтобы исходный текст включал такие слова, как «the», «and» и «of». Такой формат удобен для чтения, но может мешать анализу содержания.

Нет. Все операции токенизации и подсчёта выполняются в вашем браузере.