Что такое «Стемминг»?

Стемминг – это процесс поискового алгоритма, предназначенный для нахождения и извлечения из слова его основы. Сущность понятия исходит от английского «stem», что в переводе означает «ствол». С помощью данного механизма системы, осуществляющие поиск, увеличивают релевантность выдаваемой информации (степень её соответствия желаемой).

Стемминг – это процесс поискового алгоритма, предназначенный для нахождения и извлечения из слова его основы. Сущность понятия исходит от английского «stem», что в переводе означает «ствол». С помощью данного механизма системы, осуществляющие поиск, увеличивают релевантность выдаваемой информации (степень её соответствия желаемой).

Что такое "Стемминг"?Непосредственно стемминг предоставляет возможность пользователю найти не только исходные словосочетания, но и их формы, что значительно расширяет круг поиска желаемых документов.

Стемминг текста на русском языке заключается в получении из слова его основы путём удаления таких морфем, как постфиксы и окончания. К примеру, из слова «поисковый» в данном процессе будет удалён постфикс «ов» и окончание «ый», и получится слово «поиск». После этого поисковая система будет выводить в том числе текстовую информацию, имеющую слово «поиск».

Далее практическая значимость найденной информации определяется процессами по типу лемматизации либо латентно-семантического индексирования. Благодаря стеммингу поисковик может предоставить человеку, осуществляющему поиск, потенциально полезную информацию, даже если она не содержит прямого запроса пользователя.

Он часто используется разработчиками, которые создают функцию поиска по сайту. Данный процесс производится с использованием соответствующих программ-стеммеров. Подобных программ существует большое количество, причем как бесплатных, так и требующих для использования материальных вложений.

Понравилась статья? Поделиться с друзьями:

Отправить ответ

Оставьте первый комментарий!

Уведомить
avatar
wpDiscuz