Как пользователи переформулируют запросы
Когда пользователь ищет что-то в Интернете и с первого раза не находит нужной информации, он старается переформулировать запрос, чтобы получить релевантный результат: убрать лишнее слово или уточнить запрос, добавить оператор поиска или радикально поменять слова запроса. Именно этот процесс – переформулировку запроса – изучили исследователи из университета University of Washington Information School.
Исследователи взяли около 36 миллионов логов запросов, сделанных к поисковой системе AOL в последние два года, и выяснили, что почти 3,5 миллиона из них являются переформулированными запросами. Получается, 10% запросов – это попытка найти информацию, которую пользователь не нашел по первому запросу.
В работе представлены варианты того, как пользователи переформулировали свои запросы. Исследователи не стали включать такие варианты, как добавления географического ограничения (т.е. изменения запроса с «лучшие театры» на «лучшие театры барселоны») или добавления даты («результаты легкая атлетика» на «результаты легкая атлетика весна 2009»). Также не рассматривались добавления к запросу операторов поиска, так как к ним прибегает небольшое количество интернет-пользователей.
Виды переформулировок запросов
Изменение порядка слов
Несмотря на то, что изменение порядка слов не сильно влияет на релевантность результатов, которые видит пользователь после переформулирования запроса, эта стратегия является одной из наиболее часто используемых (барселона лучшие театры -- лучшие театры барселона).
Изменение пунктуации или пробела
Пользователи часто убирают или добавляют вопросительные знаки, запятые, тире, чтобы получить более точные результаты (Лондон, стоимость туров -- Лондон стоимость туров).
Удаление слов
Обычно такая операция приводит к тому, что пользователь получает более широкий выбор результатов. Четырехсловные запросы, сформулированные пользователем, могут выдавать слишком специфические результаты. В то время как удаление одного или нескольких слов может дать искомый результат (курс валюты доллар рубль – курс доллар рубль).
Добавление слов
Уточнение запроса для получения меньшего количества более релевантных результатов (банк депозит – банк депозит ставки).
Урезание урла
Иногда пользователи вводят в адресную строку не запрос, а полноценный адрес страницы. После того как Google показывает им результаты для этого урла, часть пользователей удаляет начальные www. и последнее .com или .ru (www.seonews.ru – seonews) и продолжает поиск.
Отбрасывание окончаний
При поиске, который не показал нужных результатов, скажем, во множественном числе, пользователи используют запрос, переформулированный в единственное число. Также могут отрезаться падежные окончания или показатели формы глагола в английском языке (туры на крит – тур на крит).
Использование сокращений
После того как пользователь ввел полное название организации или явления и не получил нужных результатов, он может попробовать сокращенный вариант (программноеобеспечение – ПО).
Расшифровка сокращений
Обратная операция. Аббревиатура дала нерелевантные результаты, поэтому пользователь развернул ее в полноценный запрос (ООН – организация объединенных наций).
Замена слов
Пользователи могут заменять слова в запросе другими на основании различных отношений слов. Замена может производиться по принципу синонимичности или анонимичности; пользователь также может использовать гипонимы или гиперонимы. Гипероним — это слово с более широким значением, чем гипоним; оно выражает общее понятие по отношению к гипониму. В эти отношения могут входить виды транспорта и слово «транспорт» (трамвай, троллейбус, автобус – общественный транспорт). Похожие отношения наблюдаются между меронимом и холонимом, которые представляют собой часть и целое соответственно (ладонь -- рука).
Исправление ошибок
Запрос считается переформулированным по этому принципу, если пользователь сам заметил опечатку и исправил ее, и только после этого сделал второй запрос (поласкать – полоскать).
Эффективность переформулировок и качество поиска
После классификации основных способов переформулировки запроса, исследователи выяснили, какие из этих способов наиболее эффективны для нахождения релевантных результатов. Если рассмотреть процесс поиска, то можно выделить начальный и переформулированный запрос. Соответственно пользователь может действовать по четырем вероятным схемам:
- Не клик – клик.
- Клик – клик.
- Не клик – не клик.
- Клик – не клик.
Первая и вторая схема обозначают, что пользователь нашел релевантный результат во втором поиске, т.е. переформулированный запрос оказался полезен. Третья и четвертая – переформулировка не принесла результатов.
Если посмотреть на соотношение кликов и не кликов в первом запросе и соотнести их с разными способами переформулирования запросов, можно понять, в каких случаях пользователи прибегают к тому или иному способу. Так, высокий процент некликов обычно приводит к тому, что пользователи исправляют ошибки в запросе и расшифровывают аббревиатуры. А вот использование аббревиатуры вместо полного словосочетания, изменение порядка слов, удаление и замена слова обычно используются после довольно-таки удачных результатов поиска (клики) для того, чтобы получить более точные результаты.
Соотношение кликов и некликов во втором запросе позволяет увидеть, насколько помогли пользователю переформулировки. По результатам исследования, самыми эффективными переформулировками (в случае, когда первый запрос закончился некликом) можно считать добавление слов к запросу, исправление ошибок и расшифровка аббревиатуры. Это логично, так как расшифровка запроса делает его точным, позволяя избежать нескольких вариантов интерпретации; а добавление слова сужает область поиска с помощью контекстного уточнения. В случае, когда первый запрос закончился кликом, самыми эффективными для его уточнения стали изменение порядка слов, замена и добавление слов.
Если сравнивать первый и переформулированный запросы, которые оба закончились кликом, то можно оценить изменение качества выдачи. Исследование показало, что каждый повторный запрос сопровождался кликом по более высокому результату, чем первоначальный. В таблице можно увидеть, на сколько позиций в среднем поднимались релевантные пользовательскому запросу результаты и какое время проходило между первым и вторым запросом.
Самые значимые изменения в позициях результатов показали следующие способы переформулирования запросов: замена, добавление или удаление слов. В то время как изменение пунктуационных знаков минимально влияет на изменение позиций результатов.