Начнем с определения, что же такое рекомендательные системы. Это программы и сервисы, которые пытаются определить, что хотят видеть пользователи, и предоставить им это (или порекомендовать, откуда и название). Каждый из нас наверняка встречал подобные приемы на различных сайтах. Сегодня мы опишем типы, принцип работы подобных программ, а также дадим примеры этих алгоритмов в действии. Читайте до конца, будет интересно!
Подробнее о рекомендательных системах
Методики
Алгоритмы
Корреляция Пирсона
Кластеризация
Алгоритм совместной фильтрации
Алгоритм фильтрации содержимого
Вместо заключения
Подробнее о рекомендательных системах
Выше мы описали, что такое рекомендательные системы, теперь подробнее расскажем о том, какое значение они имеют. Эти программы усовершенствовали способы взаимодействия между сайтом и посетителем, потому что вместо того, чтобы предоставлять статическую информацию, пользователь получает интерактивные возможности.
Рекомендации формируются отдельно для каждого человека, опираясь на его предыдущие действия на конкретном веб-ресурсе или на основе прошлой активности. Кроме того, значение имеет и поведение предыдущих участников процесса.
Далее мы предоставим примеры рекомендательных систем разных типов. Вот то, как выглядят рекомендации на известном онлайн-гипермаркете Amazon.
Для интернет-магазинов это в принципе важная функция, а для таких крупных каталогов типа Amazon — один из немногих способов качественно работать. Способ рекомендации в данном случае не является обычной дополнительной опцией, она обеспечивает удобство навигации пользователя по веб-ресурсу. Если электронный каталог содержит более 20 000 наименований продукции, ориентация уже представляется непомерно тяжелой, что говорить, если товаров миллионы?
Насколько утомляет потенциального покупателя взаимодействие с подобным сайтом? Ответ очевиден. И на помощь приходит виджет поиска товаров, визуально похожих на искомый, или принадлежащий одной группе изделий, или комплиментарная продукция (когда к паре туфель предлагают выбрать сумочку, например). Такое решение увеличивает не только число просмотров, это положительно влияет на конверсию.
Как показывает практика, не только онлайн-магазины используют подобный прием. Социальные сети также не отстают. Ниже — пример из ВКонтакте.
Также подобные приемы легко можно увидеть на разных социальных платформах, порталах, посвященных литературе, путешествиям, на новостных ресурсах, в интернет-магазинах, словом — почти везде. Эта методика действительно очень популярна. Веб-ресурс Кинопоиск — еще один доступный пример.
Ниже мы рассмотрим несколько подходов к рекомендациям, классификацию и алгоритмы.
Методики
Рекомендательные сервисы собирают различную информацию о человеке, используя несколько методов, по которым и разделяют все системы.
Итак, первый тип — явный сбор данных. Как можно было догадаться из названия, пользователь сам предоставляет необходимые для работы материалы. Например, когда рекомендательные системы Яндекс или других поисковиков просят человека дать оценки разным элементам, составить список фаворитов определенной сферы или же ответить на несколько вопросов. Если же человек отказывается дать информацию самостоятельно, актуальной будет следующая методика.
Второй тип — неявный сбор данных. Условно говоря, это шпионская миссия, согласно которой действия участника процесса фиксируются программой для дальнейшей обработки и применения. Что нужно для этого? Программа распознает покупки, оценки на сайтах, собирает информацию по просмотрам, комментариям. Конечно, выбор такой методики ведет за собой некоторые этические проблемы, ведь защита персональных данных — одно из главных требований, предъявляемых пользователем поисковикам. Но пока факт остается фактом — своеобразная слежка возможна, и рядовые посетители сайтов проверить, действительно ли ведутся подобные мероприятия, не могут.
Существуют также виды рекомендательных систем, определяемых по подходам, которые они применяют.
Первая базовая методика называется коллаборативной фильтрацией (collaborative filtering). Рекомендации с использованием данной методики выдаются, основываясь на поведенческих характеристиках одного человека или группы людей, последнее даже является более эффективным. В группы собираются люди, которые похожи между собой по поведению и характеристикам.
Приведем пример, чтобы информация воспринималась проще. Создается сайт, где аудитории будут рекомендоваться музыкальные произведения. Как в данном случае будут работать сервисы рекомендации на основе коллаборативной методики? По такому принципу: за основу возьмут одно сообщество, где участники добавляют в плей-лист одинаковые по жанровой принадлежности треки. Далее, определяются самые популярные из всех музыкальных произведений и рекомендуются одному пользователю из группы, который пока еще не слушал эту мелодию.
Второй подход называется контентной фильтрацией (content-based filtering). Здесь рекомендация формируется исходя из поведения человека. При использовании этого подхода также может браться за основу история просмотров конкретного участника.
На этот раз приведем пример с тематическими онлайн-журналами. Итак, в случае, когда ранее человек читал материалы о горных велосипедах и регулярно комментировал статьи в блогах такого содержания, то методом фильтрации содержимого будет использоваться эта прошлая информация для определения схожих ресурсов и предложения их его в качестве рекомендации этого пользователя.
Выделяют также смешанные подходы, в соответствии с которыми осуществляется разработка рекомендательной системы.
Смешанный подход — это сочетание коллаборативной и контентной фильтрации. Как известно, больше — лучше, поэтому смешение этих двух методик увеличивают эффективность систем рекомендации, а именно значительно повышают точность прогнозов для конкретных людей.
Алгоритмы
Ниже мы рассмотрим алгоритмы рекомендательных систем, которые используются для получения корректных результатов.
Корреляция Пирсона
Этот алгоритм позволяет выделить общие характеристики между несколькими пользователями. Каким образом? С помощью простой математики, а именно определением линейной зависимости между двумя элементами. Важный момент — такая методика не подходит для сообщества людей.
Кластеризация
Этот принцип работы рекомендательных систем основывается на выделении сходства между элементами (пользователями) путем вычисления их близости друг другу в так называемом пространстве признаков. Признаками выступают те элементы, по которым сходятся интересы определенных участников процесса (для музыкальных ресурсов это треки, для кино-порталов — фильмы). Схожие по характеристикам пользователи объединяются в так называемые кластеры.
Алгоритм совместной фильтрации
Жесткую кластеризацию можно заменить и другим алгоритмом, который работает по довольно сложной формуле, и также как и все предыдущие, основывается на поведении пользователей из его группы. Однако в этой методике есть несколько довольно существенных минусов. Во-первых, новым или нетипичным пользователям (которые не объединяются в группы) сложно найти рекомендации. Во-вторых, так называемый «холодный старт», когда новые объекты не попадают в рекомендательные системы.
Алгоритм фильтрации содержимого
Алгоритм, симметричный предыдущему, но если в первом случае мы отталкивались от предположения, что объект понравится пользователю, потому что он нравится его «одногруппникам», то тут мы будем рекомендовать на основе похожих объектов, которые он уже отметил для себя. И здесь уже традиционно можно выделить несколько проблем. Тот же «холодный старт» и то, что рекомендации часто обыденны.
Вместо заключения
Итак, мы предоставили всю информацию, которую должен знать о рекомендательных системах новичок или простой обыватель. Будем откровенными, алгоритмы представляют некоторую сложность для неподготовленного человека, поэтому в этой статье нет математических формул, хотя алгоритмы основываются именно на них.
Программы рекомендаций — это полезные сервисы как для рядовых пользователей Интернета, так и для исследователей, онлайн-бизнесменов. Тем, кто хочет повысить конверсии и количество просмотров, следует обратить внимание на эту методику и обязательно внедрить ее для увеличения эффективности работы веб-ресурса, в особенности интернет-магазина.
Высоких вам конверсий!
Image Source: Irksome To Orcas