Сетевая наука — это изучение сложных отношений и связей, лежащих в основе обширных наборов данных, групп людей или других систем, состоящих из множества взаимодействующих частей. Это увлекательное исследование связей можно использовать для создания карт и изображений многочисленных областей жизни, от научных явлений до социальных групп и даже популярных средств массовой информации.
Милан Яносов, исследователь сетевых наук и главный специалист по данным Baoba, исследует связи, лежащие в основе бесчисленных повседневных сетей, романов , сериалов и социальных групп . В одной из своих последних статей, предварительно опубликованной на arXiv , он описывает связи между блестящими умами, которые на протяжении многих лет получали Нобелевские премии.
«Как сетевой ученый, я ищу эти скрытые связи и закономерности буквально во всем, с чем сталкиваюсь», — сказал Яносов. «Триггером для этого конкретного исследования стал документальный фильм о жизни Эйнштейна, который я посмотрел, и который заставил меня понять, сколько из самых известных людей той эпохи дружили или работали вместе, поэтому я начал задаваться вопросом, видно ли это в данных, и есть ли это Тесная кластеризация все еще сохраняется и в более поздние времена. Вскоре я захотел выяснить, насколько хорошо связаны между собой нобелевские лауреаты».
Основная цель недавней работы Яносова заключалась в том, чтобы лучше понять, как нобелевские лауреаты прошлого были социально связаны друг с другом. Для этого ему сначала пришлось собрать данные о нобелевских лауреатах, в которых также упоминались их связи с другими лауреатами Нобелевской премии.
«Логика исследования была довольно простой, и для любого, кто имеет опыт программирования на Python, техническая часть тоже будет такой же», — объяснил Яносов. «Прежде всего, мне нужны были источники данных. Хотя составить карту социальной сети людей, живущих сегодня, может быть несложно, связать ученых, живущих в прошлом столетии, может быть сложнее, поскольку мы не можем попросить их заполнить опрос. это известные, широко признанные люди, у большинства из них есть страницы в Википедии, и это все, что нужно специалисту по данным».
Таким образом, Яносов решил собрать информацию о нобелевских лауреатах на их страницах в Википедии, поскольку на этих страницах часто упоминаются другие известные люди, с которыми они были социально или профессионально связаны, а также гиперссылки, ведущие на страницы этих ученых или мыслителей в Википедии. Совместно он проанализировал страницы Википедии 682 нобелевских лауреатов, используя инструменты обработки данных, и смог визуально отобразить социальные связи между этими лауреатами.
«Если мы внимательно посмотрим, например, на Wiki-страницу Эйнштейна и начнем читать историю его жизни, мы заметим, что каждый раз, когда у него были какие-то дела с другим известным в Wiki человеком, этот человек упоминается, а его/ее Wiki-сайт связаны», — сказал Яносов. «Эта ссылка — именно то, что я искал — способ формализовать отношения между двумя нобелевскими лауреатами на основе того, знали ли они друг друга».
Анализ данных, проведенный Яносовым, дал интересные результаты, предполагающие, что многие нобелевские лауреаты на самом деле были каким-то образом социально связаны друг с другом. Исследователь создал визуальную карту взаимоотношений между нобелевскими лауреатами, состоящую из 682 узлов (т.е. точек) и 588 связей между этими узлами (представляющих связи между лауреатами).
«Самой поразительной особенностью сетевого графа является его сильная так называемая структура ядро-периферия», — объяснил Яносов. «Это означает, что в центре находится большой, связанный, широко взаимосвязанный компонент, который содержит более 30% узлов. Кроме того, выяснилось, что те, что расположены в центре сети, имеют — в среднем — вдвое больше узлов. взгляды в Википедии, поэтому они оба сосредоточены на своем собственном мире и на глазах общественности».
Интересно, что центральным компонентом визуальной карты, созданной Яносовым, является так называемая бимодальная сеть. По сути, это граф, состоящий из двух ярко выраженных половин, соединенных между собой несколькими узлами, в данном случае несколькими нобелевскими лауреатами.
«Слева от моста находится кластер наук, таких как физика, химия и физиология», — сказал Яносов. «Самые громкие имена здесь — Эйнштейн, Гейзенберг, Мария Кюри и, с недавнего времени, Роджер Пенроуз. В отличие от этого, справа от моста расположены лауреаты гуманитарных наук, таких как экономика, литература и мир, с ярко выраженными центрами. как Нельсон Мандела, Барак Обама и ЕС. Я думаю, что этот пример довольно хорошо показывает, как данные и сетевая наука могут использоваться для составления карты социальных систем, которые, по первому впечатлению, трудно отследить».
Недавняя работа Яносова демонстрирует огромный потенциал сетевой науки для понимания различных отношений, включая социальные связи между людьми, принадлежащими к одной и той же группе или категории. Его визуальная карта сети нобелевских лауреатов, например, показывает, что, хотя между получателями Нобелевских премий существует множество связей, похоже, существует несоответствие в видимости разных лауреатов. Другими словами, в то время как некоторые лауреаты Нобелевской премии тесно связаны друг с другом, другие остаются на «окраинах» сети, не будучи социально связанными с большинством других нобелевских лауреатов.
Нобелевская сеть Яносова также выявила четкое различие между теми, кто получал премии за научную и гуманитарную деятельность, поскольку лауреаты премий по этим различным дисциплинам редко оказывались социально связанными. Наконец, его визуальная карта подчеркнула недостаточную представленность женщин в некоторых номинациях Нобелевской премии, включая физику.
«Эта работа показывает, как обнаружить интересные или неожиданные закономерности в структуре сети и как описывать и интерпретировать сетевой граф», — добавил Яносов. «Подобный анализ отношений имеет множество применений, начиная с образования и социограмм. Учителя могут полагаться на такие карты, чтобы лучше организовывать свои занятия и помогать тем, кто остался позади. Мы также можем использовать эти методы для изучения и количественной оценки сотрудничества, от науки до рабочих пространств, Это подводит меня к другой важной группе приложений — HR-аналитике на основе данных. В этом случае, например, можно использовать внутренние данные, такие как опросы или электронная почта, чтобы наметить внутреннюю структуру компании и выявить слабые места, а также предложить планы развития.