Что такое коллаборативная фильтрация и как работает

8 532
Оглавление

Онлайн-кинотеатры, интернет-магазины и другие интернет-ресурсы используют возможность подбора предложений с помощью коллаборативной фильтрации. Она позволяет сделать подборку для каждого пользователя, исходя из предыдущего выбора посетителей со схожими интересами. В статье расскажем, что это такое и как работает.

Используемые продукты и сервисы

Что такое коллаборативная фильтрация

Задача владельцев сайта — создать условия, чтобы пользователь дольше задержался, переходя с одной страницы на другую. Для этого нужен некий путеводитель, направляющий на интересующий контент. В последнее время используют алгоритмы, отслеживающие интересы целевой аудитории.

Алгоритм коллаборативной фильтрации активно используется торговыми площадками. Распространение он получил в социальных сетях, на сайтах, где размещаются фильмы, сериалы, музыка, мастер-классы. Основная цель — привлечь внимание покупателей и посетителей страницы к иным товарам и услугам, которые могли бы заинтересовать пользователя.

Коллаборативная фильтрация полезна для всех: владельцы интернет-ресурсов удерживают посетителей на сайте, продавцы делают допродажи товаров, пользователи экономят время на выборе.

Посетители сайтов нередко видят блоки: «С этим товаром выбирают», «Похожие фильмы» и т.д. Подборка выстраивается путем использования модели коллаборативной фильтрации.

Схема работы фильтрации состоит из нескольких этапов:

  • Система определяет, с какой целью пользователь зашел на сайт. Например, он посетил страничку с блендерами, миксерами.

  • Далее происходит сравнение запроса пользователя с другими посетителями, которых интересует тот же товар. Для анализа берутся клиенты, совершившие покупку.

  • Проводится анализ сопутствующих товаров, которые можно предложить потенциальному покупателю, Например, для блендеров рекомендуется посмотреть чаши для взбивания, средства для ухода за техникой

  • Составляется список рекомендаций.

Где используют

Особенно выгодна фильтрация интересов посетителей для торговых площадок, где предлагается много групп и наименований товаров. К примеру, потенциальный покупатель зашел на сайт интернет-магазина, чтобы выбрать зимнюю куртку. Внизу появляется блок, где дополнительно предлагаются сапоги, шапки и т.д. Посетитель сайта перейдет в другой блок и поинтересуется предложениями. Вполне вероятно, что что-то купит.

Коллаборативную фильтрацию используют онлайн-кинотеатры, когда при просмотре кинофильма внизу можно увидеть ленту с фильмами похожего жанра. А еще крупные сервисы (Amazon, eBay, AliExpress, Netflix) и соцсети (ВКонтакте). 

YouTube активно использует алгоритм отбора контента по интересам. После просмотра одного фильма в ленте предложений появляется схожий контент. Рекомендации по следующим видео основываются на том, что пользователи смотрели перед этим. 

Пример использования

Больше всего коллаборативная фильтрация помогает интернет-магазинам. Если пользователь сделал заказ, при следующем входе на сайт внизу находится лента с рекомендациями. 

Музыкальные сервисы, например, Яндекс.Музыка, предлагают музыкальные подборки, исходя из истории прослушивания контента. Пользователям рекомендуют новые песни понравившихся авторов или новых исполнителей в данном жанре.

Банки в мобильных приложениях размещают предложения, исходя из анализа профиля клиентов, его интересов и потребностей.

Типы

Корни коллаборативной фильтрации уходят в 90-е годы прошлого века. Изначально алгоритмы были простыми, но с годами совершенствовались. Обновления становятся дороже, так как усложняется алгоритм. В настоящее время используется три вида фильтрации.

Основанный на соседстве

Это наиболее дешевый вариант. Работа основана на распределении пользователей по группам интересов. Подключив сюда отзывы, алгоритм объединяет пользователей в сообщества. Им демонстрируется определенный контент. Не всегда оценка интересов бывает верной. Исходя из небольшого количества характеристик, положенных в основу анализа интересов аудитории, прогноз нельзя назвать точным. Однако такой тип пользуется популярностью из-за бюджетной цены и простоты настройки.

Основанный на модели

Данный тип предполагает самообучающийся алгоритм. Работа начинается с выявления закономерностей и воплощения их в определенные модели. Метод отличают точность, скорость, минимизация ошибок.

Тип, основанный по принципу соседства, уступает модельному методу по числу и точности рекомендаций. Но не все применяют его. Чаще всего препятствием является высокая стоимость внедрения и риск потери важной информации.

Гибридный

Третий тип позволяет избежать потери информации и гарантирует высокую точность. Единственный недостаток — высокая стоимость.

Проблемы

Интернет-ресурсы получают большие преимущества, используя коллаборативную фильтрацию. Но есть проблемы, о которых не следует забывать.

Разреженность данных. Для того чтобы правильно определить интересы аудитории, нужны оценки. Особенно сложно применять алгоритм для новых сайтов, если на них выставлено много товаров, а посещений и оценок мало. Система не может собрать достаточное количество данных для анализа.

Масштабируемость. Для изучения интересов пользователей и составления списка рекомендаций используется матрица. Когда достаточно много пользователей интернет-ресурса и выставленных на сайте товаров, матрица получается объемной, что затрудняет и замедляет анализ. Однако получение перечня рекомендаций требует оперативности.

Контролируйте выполнение показателей, увеличьте количество заявок для отдела продаж и выяснить количество лидов и стоимость привлечения лида с помощью Системы сквозной аналитики MANGO OFFICE. Система соберет в единый отчет цифры из коллтрекинга, CRM-системы, веб-метрик и рекламных площадок.

Узнать больше

Проблема холодного старта. Особая проблема возникает при запуске сайта. Еще нет достаточной информации о новых товарах/услугах. Но эта проблема решается проще. Разработчики пользуются общими характеристиками по схожим товарам, которые уже выставлены в интернете. С анализом посетителей сайта работа строится сложнее. Трудно дать рекомендации, так как нет базы отзывов и покупок, на которые можно ориентироваться при создании перечня.

Синонимия. Товары, выполняющие одни и те же функции, могут называться по-разному. Например, мобильный телефон называется смартфон. Системе сложно ориентироваться в синонимах, поэтому круг рекомендации может быть меньше, чем на самом деле имеется подходящих товаров. Из-за этого посетители интернет-ресурса не находят нужной вещи и покидают сайт.

Мошенничество. Информация может оказаться недостоверной из-за нечестной конкуренции. Компании, предлагающие идентичный товар, размещают негативные отзывы от имени покупателей на сайте конкурента. Алгоритм сбивается, а информация до посетителей интернет-ресурса доходит в искаженном виде.

Разнообразие. Соперничество мелких бизнесменов с крупными компаниями оказывается неудачным для первых. Использование коллаборативной фильтрации позволяет размещать оценки качества продукции ото всех производителей. Малый бизнес ищет в этом спасение. Однако сайты чаще всего не набирают достаточного количества оценок.

Белые вороны. Бывает, что по одному и тому же товару есть множество хороших оценок, но несколько негативных отзывов дополняют картину. Однако их мнение при выстраивании рекомендаций не берется в расчет.

Выводы

  • Коллаборативная фильтрация представляет собой алгоритм, позволяющий изучать потребности пользователей интернет-ресурсов и на основе анализа выдавать список рекомендаций. 

  • С ее помощью продавцы товаров увеличивают продажи, а владельцы интернет-ресурсов удерживают внимание посетителей и стараются подтолкнуть их к переходу на другие страницы. Есть несколько типов фильтрации, отличающихся по стоимости и эффективности.

  • Алгоритм применяется в социальных сетях, на сайтах интернет-магазинов, на ресурсах, на которых размещается развлекательный контент.

Используемые продукты и сервисы