Що називається дізамбігуаціей

Дізамбігуаціей називається спеціальний програмний інструмент, який входить до складу алгоритмів пошукових систем. Ці алгоритми працюють зі словами з різним тлумаченням, які дуже часто набирають відвідувачі в рядку пошукача. При застосуванні способу дізамбігуаціі пошуковики здатні збільшити релевантність видачі.

Усунення неоднозначного тлумачення

У вітчизняних пошукових системах видалення неоднозначного тлумачення проводиться зняттям омонімії і глибоким аналізом словосполучень. Додатково пошуковики використовують дізамбігуацію, яка оперує оточуючим необхідне вираження контекстом.

Можна припустити, що відвідувач вводить таке пошукове пропозицію, як «позолочені вилки». Алгоритм пошукової системи, а якщо трохи точніше, то його частина, яка відповідає за видалення будь-неоднозначності, визначає основний зміст фрази, негайно відсікає і потім не пропускає в видачу такі поєднання слів, як «вилки овочів», «вилки інструментів» і «керівництво не здатне більше утримувати вилки вартості ». Інакше кажучи, в процесі дізамбігуаціі різниться економіка, овочівництво і електрику.

Прибираючи неоднозначність слів, алгоритм не навантажує сервера пошукачів, чистить від схожою і непотрібної інформації рядок видачі. Набагато складніше, якщо відвідувач вводить тільки слово, наприклад, просто «вилки». Повна відсутність сенсу фрази позбавляє можливості якісного використання дізамбігуаціі. При подібних випадках пошуковики застосовують інші інструменти, наприклад, використовують статистику, що відображає кількість звернень відвідувачів з таким запитом до пошукової системи. По відношенню до вилок Яндекс, наприклад, у верхніх рядках видачі покаже інформацію нема про столових приладах, а про ресурси букмекерських компаній, в яких дуже часто застосовується термін букмекерської вилки.

Дізамбігуація – складний алгоритм

Через те, що життєдіяльність людини все більше починає прив’язуватися до частого застосування інструментів з мережі і користування пошуковими системами, то удосконаленням якісно працюючих механізмів по дізамбігуаціі стали займатися компетентні люди в сфері знання мов і математичного моделювання. Така робота досить складна і пов’язана з особливою лексико-семантичною розбиранням величезного числа сполучень слів на деякі омонімічні складові. Основні результати подібної наукової та дослідницької роботи застосовуються для успішного удосконалення алгоритмів пошукових систем.

Всім відомо, що спочатку пошукова система не розуміє, яким в конкретному випадку зобов’язаний бути сенс фрази. Спеціально для цього її необхідно навчити. Для збільшення якості роботи дослідники застосовують абсолютно всі існуючі способи лексичного і математичного аналізу. Наприклад, часто використовуються методи, які застосовувалися при розробці іноземних семантичних систем FrameNet і WordNet.

Ссылка на основную публикацию