ЛСИ: что это такое и принцип действия

Признаны SEO-компанией №1 в Беларуси
по результатам рейтинга Байнета 2023

+375 (29) 667-88-83
+375 (29) 667-88-83
+375 (17) 276-07-85
+375 (17) 276-07-85

C 10:00 до 19:00 в будние дни

Что такое латентно-семантический индексЧто такое LSI?

Латентно-семантическое индексирование (latent semantic indexing, LSI) – это алгоритм поисковых систем для анализа веб-страниц, который учитывает не только ключевые слова/фразы на странице, но и присутствие их синонимов, а также слов, которые связаны с запросом тематически. Алгоритм направлен на то, чтобы в топе выдачи оказались документы, наиболее полно отвечающие поисковому запросу.

Происхождение термина LSI

LSI является частным случаем латентно-семантического анализа (latent semantic analysis, LSA) применительно к поисковым системам. Это метод автоматизированного анализа семантики (смысла) текстов, который был запатентован в конце 1980-х годов. Он применяется в тех областях, где требуется автоматизированная обработка большого количества документов:

  • классификация;
  • индексация;
  • поиск.

Алгоритм определяет семантическую структуру текста и находит неявные, латентные связи между элементами документа. Для этого используется база терминов, семантически (по смыслу) связанных со словами из поискового запроса. Поэтому система возвращает документы не только с точным вхождением запроса, но и близкие по смыслу.

Благодаря алгоритму LSI поисковые системы научились распознавать опечатки, различать синонимы и омонимы, “усваивать” неологизмы. Латентно-семантический анализ применяется, например, в таких системах, как:

  • системы распознавания речи;
  • системы оптического распознавания символов (OCR).

Принцип действия

При анализе нового текста LSI-робот сравнивает его с имеющейся базой трастовых сайтов по данной тематике, учитывает количество тематических слов и синонимов, определяет семантическое ядро страницы. Учитывается и количество отказов, закрытия страницы сразу после загрузки – статья должна заинтересовать читателя. Исходя из этого, робот “решает”, какое место определить тексту в выдаче.

Таким образом, отсеивается SEO-контент, напичканный ключами, но не содержащий полезной информации. А также тексты с нетематическими ключами. В результате пользователь получает действительно полезную статью по теме, а не пустой SEO-текст для продвижения сайта.

LSI-копирайтинг

В начале 2010-х годов в англоязычном интернете появился термин LSI-копирайтинг, как противопоставление SEO-копирайтингу. Подразумевается, что LSI-копирайтер пишет полезные тексты, полностью раскрывающие тему, отвечающие на поисковый запрос, то есть интересные для пользователя. В противоположность SEO-копирайтеру, который конструирует текст по заданной плотности ключевых слов, водности, тошнотности, то есть интересные для ПС. Появились сервисы и программы, которые составляют списки LSI-ключей для любого запроса.

На самом деле, LSI представляет собой эволюцию поисковой оптимизации, эволюцию SEO. На англоязычных сайтах в ходу такие термины, как органическое SEO, SEO-LSI, то есть контент, ориентированный больше на человека, чем на поискового робота. Благодаря алгоритмам латентно-семантического индексирования в топ выдачи выходят статьи экспертного уровня.

© ЧУП «Кропас», 2024. Все права защищены.