Скачать книгу

поисковых систем также хорошо понимают потребность пользователей в более качественном контенте. Как мы уже говорили ранее, качественный контент должен соответствовать интенту. Такие материалы должны удовлетворять пользователя тем, что отвечают на его вопрос. Сегодня мы живем в крайне любопытное время, когда сотни тысяч людей пишут страницы полезных для жизни данных, и при этом миллиарды людей имеют свободный доступ к ним. Однако есть и другая сторона – спамный и малоэффективный контент – материалы, которые не имеют никакой практической ценности и не способны приносить пользу людям. Более того, подобные материалы наносят определенный урон, так как отнимают свободное время пользователя, который каким-либо образом наткнулся на материал и пытается вычленить из него полезную информацию. Урон есть и для поисковых систем. Индексируя подобные материалы, поисковые машины попусту растрачивают ресурсы на своих серверах.

      Всё это исторически привело к борьбе со спамом и попыткам научиться лучше понимать тексты, чтобы выбирать лучшие из лучших и затем предлагать их пользователям в топе-10 поисковой выдачи. И здесь было бы неплохо углубиться в несколько исторических моментов возникновения важных поисковых алгоритмов.

      «Колибри» и «Королёв»

      26 сентября 2013 года Google сообщил о запуске алгоритма Hummingbird (в пер. с англ. – колибри). По свидетельству Google, последние столь серьезные перемены в Google происходили в 2001 году. Суть алгоритма заключается в том, что с 2013 года поисковая система Google умеет определять контекст страницы. Скажем, если вы использовали ключевую фразу «кубик Рубика» на странице по продаже апельсинов, Google поймет это и понизит вас в выдаче или выкинет из нее вовсе.

      22 августа 2017 года схожий алгоритм анонсировали представители Яндекса. Они назвали данный алгоритм «Королёв». Поиск Яндекса научился определять содержание текста не по набору слов, а по смыслу. Столь значительный прорыв в обеих поисковых системах произошел благодаря развитию нейронных сетей и искусственного интеллекта.

      Для того чтобы было проще воспринять эту информацию, я предлагаю вам зайти прямо сейчас в поиск Яндекса и вбить запрос «фильм, в котором у странного парня была шоколадная фабрика». Вы получите ответ «Чарли и шоколадная фабрика». Меня восхищает подобное развитие технологий. Поиск научился работать с longtail запросами. Longtail запросы это запросы с длинным «хвостом» из дополнительных уточняющих слов. В нашем случае это было: «у странного парня была шоколадная фабрика».

      Вернемся ненадолго к примеру с кубиком Рубика на странице по продаже апельсинов. Как в данном случае алгоритмы будут понимать, что речь идет о совершенно разных вещах? Быть может, мы продаем кубик Рубика апельсинового цвета? Поисковые алгоритмы способны понять, что кубик имеет кубическую форму, и это совершенно не связано с шарообразной формой апельсина. Кубик Рубика не может быть одного цвета, так как в данном случае теряется вся логическая необходимость

Скачать книгу