Аннотация

В статье предлагается алгоритм автоматизированного поиска и первичного анализа социологической информации для исследования территориальной идентичности жителей районов крупных городов в интернет-источниках. В качестве основного источника информации рассматриваются сообщества в социальных сетях (на примере социальной сети «Вконтакте»), в качестве вспомогательных – интернет-порталы о топографических объектах, находящихся на исследуемых территориях. Показано, что с точки зрения информационного обеспечения наибольшим потенциалом обладают публичные страницы и группы с открытой и ограниченной «стеной». Разработанный алгоритм предполагает выделение релевантных для решаемой задачи групп, выявление содержащихся в них записей по районной тематике и определение показателей активности участников сообщества при обсуждении территориальных проблем. Извлечение требуемой информации осуществляется посредством взаимодействия с сервером социальной сети с использованием официального программного интерфейса приложения (API). Для идентификации сообществ и записей предлагается использовать методы морфологического анализа текстовой информации. Описана программная реализация указанного алгоритма на языке Python 3.8.5, которая включает оригинальные функции для получения данных о сообществах по их идентификационным номерам, для формирования набора урбанонимов для заданного района и др. С использованием разработанной программы проведен анализ территориальных групп трех районов г. Москвы. Определена погрешность результатов работы программы относительно результатов, полученных вручную.