Скачать книгу

нас появилась возможность получения данных по просмотрам в реальном времени, а это гораздо более ценная информация, чем то, что говорят сами пользователи о своих предпочтениях», – объясняет Елин. В Netflix бесконечно больше знают о том, что и как вы смотрите: когда вы смотрите, где вы смотрите, в какой момент прекращаете смотреть, что смотрите потом, пересматриваете ли. Что вы ищете – это еще один сигнал вашего вкуса. Елин заинтересованно, почти страстно мне об этом рассказывает. Он слегка тараторит, у него немного угловатый, напряженный взгляд, он лысоват – и всем своим видом напоминает гиперинформированного консультанта из магазина видеокассет ушедшей эпохи. Но только это консультант всемогущий, он знает, что крутит на своих «видаках» вся страна – и в какие моменты нажимает на «перемотку». Пусть это и выглядит как вмешательство в личную жизнь, но главный момент здесь такой: от своего вкуса не спрячешься!

      Появление компаний вроде Netflix, обладающих петабайтами данных о людских симпатиях и антипатиях в виде всех этих «лайков» и «избранных», позволило бросить взгляд в до этого всегда казавшуюся непроницаемой область: как формируются оценки, как выражаются предпочтения, каковы механизмы формирования вкуса? Обширное поле сетевой активности – сетевое «сарафанное радио». Вот где абстрактные, «непостижимые» вкусы попадают в эмпирически формируемую упорядоченность Интернета, с его алгоритмами совместной фильтрации, пространными наборами данных, бесконечными отчетами по произведенным действиям. Любая отдельно взятая рецензия или отдельный «лайк» совершенно бесполезны. Тут же возникает проблема «слово не деньги», как ее обозначил Рей Фишман. И лишь на агрегированном уровне с помощью чистой математики можно отфильтровать шум, отбросить аномальные значения и достичь статистической согласованности данных.

      Социологи вроде Пьера Бурдьё, посвятившие размышлениям о вкусе огромное количество времени (мы еще вспомним о нем позже), всегда сталкивались с проблемой «рассказчика»: спросить людей о том, что им нравится, совсем не то, что наблюдать за их действиями. Интернет прекрасен в том плане, что вне зависимости от того, что люди рассказывают, можно наблюдать со все возрастающей достоверностью за их реальным поведением. Практически любой из интересовавших Бурдьё аспектов человеческого вкуса ежедневно каталогизируется онлайн, причем в объемах, превосходящих любые мечты социологов. Какая музыка нравится? Посмотрите на Spotify, Pandora. Как выглядит идеальное человеческое лицо? Посмотрите OKCupid, Match.com. Какие фото нравятся больше всего? Посмотрите Flickr и Instagram.

      Так что, если раньше Netflix полагался на слова людей о том, что им нравится – на этом для того времени новом основании базировались все системы рекомендаций[85], – теперь компания стала фокусировать внимание на том, что люди реально смотрят. «В таком подходе заключена масса преимуществ. Одно из них в том, как именно люди выставляют оценки: это делается в духе

Скачать книгу


<p>85</p>

Джон Ридл, возглавлявший исследовательскую группу в Университете штата Миннесота и создавший одну из ранних систем, помогавшую ориентироваться в огромном потоке статей по рейтингам USENET, рассказал журналу «Нью-Йоркер»: «То, что вы рассказываете нам о своих предпочтениях, годится для предсказаний того, что вам понравится в будущем, больше любой другой информации, которую мы пробовали анализировать… Пусть это и глупо прозвучит, но вы иногда рассказываете это маркетологам, а они в ответ выглядят озадаченными». Сам Ридл чувствовал ограниченность систем на базе рейтингов, включая и ограничения по поводу того, как люди оценивают предметы. «Некоторые исследователи предлагали системы компенсаций для поощрения пользователей за оценки. Экономические последствия такого решения были бы интересны, но возникает вопрос: необходимы ли компенсации, если рейтинги можно собирать без каких-либо усилий со стороны пользователей? Мы верим в то, что оптимальным решением стало бы улучшение пользовательского интерфейса в целях выявления скрытых рейтингов путем наблюдения за поведением пользователей. Скрытые рейтинги включают меру интереса, например помогают узнать, прочитал ли пользователь статью, и если да, то сколько времени он на нее потратил. Наши исходные исследования показали, что мы можем получить гораздо более обширные данные рейтингов путем использования скрытых рейтингов, и прогнозы, сделанные на базе времени чтения, практически столь же точны, как и прогнозы на базе математики». См.: Джозеф А. Констан и др. Группы: применение коллаборативной фильтрации для статей USENET / «Сообщения АСМ». Т. 40, 1997. С. 77–87.