Семантический анализ текста

Проект stxt.ru начался с анализа «пассивной привлекательности» страниц для посетителей из поисковых систем. В течение 6 месяцев мониторилась посещаемость 70 000 страниц разных сайтов разной тематики. Общее для всех этих страниц: на них не вело ни одной внешней ссылки; таким образом исключалось влияние внешних факторов поисковой оптимизации.

За 6 месяцев на 30 000 страниц были переходы посетителей из поисковых систем; после чего был проведен анализ соответствия текста поискового запроса тексту страницы. Результатом анализа стал алгоритм численной оценки «привлекательности» текста. Тексты с оценкой ниже «1» практически не имеют шансов получить посетителей из поисковых систем; тексты с оценкой выше «1» имеют такой шанс, и чем выше оценка — тем больше посетителей получит страница. Вместе с оценкой «привлекательности» производится и машинное определение темы текста, где в качестве тем выступают высокочастотные и среднечастотные запросы Яндекса (с частотой 2000 в месяц и выше).

Наш первый проект по практическому применению алгоритма задуман как «рабочее место копирайтера». «Рабочий стол» состоит из четырёх отделений:

  • Список ключей вордстата, имеющих полное вхождение в анализируемый текст;
  • Текст с разметкой «опорных» слов, при наведении мыши всплывает список ключей рекомендуемых к использованию в тексте;
  • Окошко ввода/редактирования с возможностью повторного анализа;
  • Список неполных ключей, слова которых не входят в анализируемый текст; ключи сгруппированы по темам.
Готовятся и другие проекты использующие наш алгоритм анализа текста.

Так что же можно сделать с помощью этого сервиса?
  • Написать текст, который соответствует тематике и, как следствие, будет «нравиться» поисковикам;
  • Дополнить текст недостающими ключами;
  • Проанализировать текст конкурентов, поверьте, это очень интересно.
Перейти к сервису