Что такое LSI?
Латентно-семантическое индексирование (latent semantic indexing, LSI) – это алгоритм поисковых систем для анализа веб-страниц, который учитывает не только ключевые слова/фразы на странице, но и присутствие их синонимов, а также слов, которые связаны с запросом тематически. Алгоритм направлен на то, чтобы в топе выдачи оказались документы, наиболее полно отвечающие поисковому запросу.
Происхождение термина LSI
LSI является частным случаем латентно-семантического анализа (latent semantic analysis, LSA) применительно к поисковым системам. Это метод автоматизированного анализа семантики (смысла) текстов, который был запатентован в конце 1980-х годов. Он применяется в тех областях, где требуется автоматизированная обработка большого количества документов:
- классификация;
- индексация;
- поиск.
Алгоритм определяет семантическую структуру текста и находит неявные, латентные связи между элементами документа. Для этого используется база терминов, семантически (по смыслу) связанных со словами из поискового запроса. Поэтому система возвращает документы не только с точным вхождением запроса, но и близкие по смыслу.
Благодаря алгоритму LSI поисковые системы научились распознавать опечатки, различать синонимы и омонимы, “усваивать” неологизмы. Латентно-семантический анализ применяется, например, в таких системах, как:
- системы распознавания речи;
- системы оптического распознавания символов (OCR).
Принцип действия
При анализе нового текста LSI-робот сравнивает его с имеющейся базой трастовых сайтов по данной тематике, учитывает количество тематических слов и синонимов, определяет семантическое ядро страницы. Учитывается и количество отказов, закрытия страницы сразу после загрузки – статья должна заинтересовать читателя. Исходя из этого, робот “решает”, какое место определить тексту в выдаче.
Таким образом, отсеивается SEO-контент, напичканный ключами, но не содержащий полезной информации. А также тексты с нетематическими ключами. В результате пользователь получает действительно полезную статью по теме, а не пустой SEO-текст для продвижения сайта.
LSI-копирайтинг
В начале 2010-х годов в англоязычном интернете появился термин LSI-копирайтинг, как противопоставление SEO-копирайтингу. Подразумевается, что LSI-копирайтер пишет полезные тексты, полностью раскрывающие тему, отвечающие на поисковый запрос, то есть интересные для пользователя. В противоположность SEO-копирайтеру, который конструирует текст по заданной плотности ключевых слов, водности, тошнотности, то есть интересные для ПС. Появились сервисы и программы, которые составляют списки LSI-ключей для любого запроса.
На самом деле, LSI представляет собой эволюцию поисковой оптимизации, эволюцию SEO. На англоязычных сайтах в ходу такие термины, как органическое SEO, SEO-LSI, то есть контент, ориентированный больше на человека, чем на поискового робота. Благодаря алгоритмам латентно-семантического индексирования в топ выдачи выходят статьи экспертного уровня.