15
Perkins, Meilman, Leichliter, Cashin, and Presley (1999).
16
См. таблицу 2 в Perkins, Haines, and Rice (2005).
17
Valente, Unger, and Johnson (2005).
18
Tucker et al. (2013). См. также Eom and Jo (2014), где приводится разбор некоторых других случаев, когда популярность коррелирует с теми или иными характеристиками или типами поведения.
19
См. Jackson (2016), где подробнее обсуждаются оба аспекта.
20
При помощи тщательных наблюдений можно оценить масштаб эффекта обратной связи: в какой мере меняется поведение того или иного человека благодаря тому, что все происходит в социальном контексте. Для самых разных видов общественно обусловленной деятельности этих аспектов будет уже не два, а больше (см., напр., Glaeser, Sacerdote, and Scheinkman [2003]). В главе 8 мы вернемся к обсуждению этих аспектов на примере целого ряда типов поведенияот совершения преступлений и уклонения от налогов до решения продолжать учебу или же искать работу.
21
Hodas, Kooti, and Lerman (2013).
22
Frederick (2012).
23
Разные варианты этой фразы приписываются разным людям. Например, похожую фразуЕсли мучить данные достаточно долго, они признаются в чем угодночасто приписывают Дарреллу Хаффу и его книге 1954 года Как лгать при помощи статистики. В действительности таких слов в этой книге нет, хотя ее автор вполне мог бы их написать, и, конечно же, из его книги становится ясно, почему все именно обстоит так, и почему эта цитата такая меткая. Нам в данном случае очень важно, что у многих вещей и явлений есть множество граней, и что с разных углов они могут выглядеть очень по-разному.
24
Если кто-то не знает, то это отсылка к ряду скетчей из комедийного шоу Saturday Night Live, где типичные спортивные болельщики из Чикаго спорят о сравнительных достоинствах разных чикагских спортсменов-героев, которым, конечно же, всегда под силу победить любых нечикагских спортсменов (и не спортсменов тоже).
25
Чтобы убедиться в ценности подобных сравнений, взгляните на Голубую обнаженную (Сувенир из Бискры) Матисса, которая задела за живое Пикассо и повлияла на его Авиньонских девиц. В книге Себастьяна Сми Искусство соперничества интересно рассказывается об истории их соперничества и о перекличках между их произведениями.
26
Есть и легкое различиев том, что теперь мы иногда ведем двойной счет: ведь одним из семи друзей Эллы является Нэнси, а значит, мы и саму Нэнси причисляем к друзьям второй степени. На самом деле, такой двойной счет немного облегчает арифметику, так как на каждом этапе нам нужно лишь установить количество связей, но не нужно вспоминать, кого мы уже считали, а кого нет. Влияние двойного счета обсуждается в работе Banerjee, Chandrasekhar, Duflo, and Jackson (2013, 2015).
27
Если вам интересны подробности показателей на рисунке 2.6, то квадраты показателей центральности в сумме дают единицу, так что вектор показателей центральности нормализован в обычном математическом смысле (в соответствии с L2 или с евклидовой нормой).
28
Их алгоритм учитывал и некоторые случайные перескоки к новым узлам, откуда весь процесс начинался заново, чтобы была уверенность, что все не зациклится на ограниченном наборе страниц, которые просто ведут одна к другой.
29
Поисковые машины, включая Google, быстро развивались по мере того, как компьютеры становились все более мощными, а наш опыт обращения с Сетьюболее богатым. Сейчас подобные машины содержат более полную информацию и о пользователях, и о разных веб-страницах, и более индивидуальную сетевую информацию о том, как люди перемещаются по Сети и что же они на самом деле ищут. Кроме того, Сеть в наши днисвоего рода подвижная мишень, ее содержание постоянно изменяется. Тем не менее, в принципе идея PageRank ознаменовала важный прорыв, точно отобразивший характер сетевой информации.
30
Отслеживание связей дальше первого уровня важно во многих средах, не только для работы поисковых машин и распространения информации. Вариации подобных итеративных вычислений центральности, причем с использованием собственных векторов, появлялись в литературе, посвященной социальным сетям, за несколько десятилетий до появления Google; стоит отметить новаторскую работу Лео Каца (Leo Katz) 1950-х годов и более позднюю, 1970-х годов работу Фила Боначича (Phil Bonacich), формализовавшую подобные методы. Вариации определения собственного вектора использовались для нахождения важнейших фигур в сетях, занятых нелегальной деятельностью, так как преступность имеет социальную составляющую: люди узнают друг от друга о возможности заняться чем-то незаконным и втягивают друг друга в преступную деятельность, а самые центральные фигуры в подобных сетях оказывают наибольшее влияние на других участников (см., напр., Lindquist and Zenou [2014]). Подобные критерии определения центральности применялись и для изучения общения между инвесторами, чтобы можно было предсказывать, у кого из инвесторов окажется наиболее высокая прибыль на фондовой бирже (см. Ozsoylev, Walden, Yavuz, and Bildik [2014]).
31
См., например, Karlan and Valdivia (2011), где рассказывается о том, какие результаты приносит такое простое обучение в подобной среде.
32
Мне бы не хотелось рисовать картину в слишком розовых тонах, потому что, как это бывает с любой масштабной инновацией, в целом успешной, иногда можно услышать и всякие ужасы. По всему миру рассказывают о людях, которые заняли слишком много денег, и для них все кончилось финансовой и личной катастрофой, это похоже на истории про людей, наделавших слишком много долгов по кредитным картам и затем объявивших о личном банкротстве. Кроме того, многие компании пришли в бизнес микрофинансирования из-за высоких процентов погашения, причем некоторыес агрессивной тактикой и с не слишком этичным подходом, и, опять-таки, то же самое наблюдается в сфере кредитных карт и потребительских финансовых компаний во всем развитом мире. Велись споры и о том, в какой мере микрофинансирование привело к улучшению жизни заемщиков. Для того чтобы в производительности наметился значительный рост, порой требуются годы, и трудно отделить данный фактор от других тенденций и программ, поэтому, несмотря на широчайшее распространение микрофинансирования по всему миру, не существует однозначных свидетельств, которые говорили бы о существенном росте благосостояния или доходов людей, берущих микрозаймы (см., напр., Banerjee and Duflo [2014]; Crépon, Devoto, Duflo, and Parienté [2015]). Тем не менее, доступ к кредитам до сих пор помогает людям упорядочить потребление и расходы, а для самых бедных это крайне ценно.
33
См., например, Schaner (2015), где говорится о том, как зависит характер расходов от того, какими путями деньги попали в семью.
34
Группы взаимопомощиэто неофициальные объединения сельских жителей, часто имеющих совместный банковский счет и/или делающих регулярные взносы в общую копилку группы, а затем по очереди получающих разные виды выплат и ссуд.
35
Иначе дело обстоит в больших городах, вроде Нью-Йорка, Лондона, Сиднея или Пекина, где люди могут взаимодействовать с одними людьми лично, с другими через социальные сети, с третьими по телефону, а их знакомые обычно живут в разных частях города и вообще мира. Получить относительно полное представление о такой обширной и разнообразной сети почти невозможно, а вот в маленьких деревушках охватить взглядом имеющиеся сети оказалось несложно. Мы отобразили эти сети, задав людям ряд вопросов о том, какими способами разные домохозяйства взаимодействуют между собой: занимают или одалживают деньги, дают советы, занимают и одалживают керосин (для приготовления пищи и отопления), помогают друг другу в случае необходимости и так далее. В среднем в этих деревнях насчитывалось по двести домохозяйств, и каждое из них взаимодействовало примерно с 15 другими, если учитывать все виды взаимодействий, и с существенными различиями для отдельных домохозяйств (у многих эта степень не доходила до 10, а у отдельных семей значительно превышала 20).
36
Фактически, прямой график, сопоставляющий окончательное участие людей в программе микрофинансирования с центральностью по степени первоначальных источников, демонстрирует слегка отрицательный (хотя и незначительный) уклон. После учета ряда характеристик деревень все равно никакой специфической взаимосвязи не наблюдается. Подробности исследования можно найти в Таблице S3 приложения к: Banerjee, Chandrasekhar, Duflo, and Jackson (2013).
37
Популярность этих источников могла бы быть гораздо важнее, если бы речь шла о новом продукте, который вызывал бы у людей сомнения, и им хотелось бы посмотреть, как поведут себя другие, а потом уже самим принимать решение. Обзор подобных ситуаций см. в работах Cai, de Janvry, and Sadoulet (2015); и Kim et al. (2015).
38
На количество участников могли влиять и многие другие факторы, в том числе решение друга примкнуть к программе. В нашем статистическом анализе данных мы тщательно контролировали все подобные факторы (см. Banerjee, Chandrasekhar, Duflo, and Jackson [2013], где приводятся подробности и описываются методы).
39
См. обсуждение в: Banerjee, Chandrasekhar, Duflo, and Jackson (2015), чтобы увидеть подробности вычислений, часть которых я здесь пропускаю.
40
Если предусмотреть дополнительную гибкость при оценке частоты общения и количества итераций, то следует ожидать, что данный критерий даст лучшие результаты, чем другие критерии. Но оказывается, что он дает лучшие результаты для тех же деревень, даже если выбрать фиксированные частоту общения и количество итераций, прежде чем приступить к анализу диффузии. Чтобы не давать диффузионной центральности предпочтений по отношению к другим критериям, мы приняли за неизменную единицу частоту взаимодействий между домохозяйствами, взяв за основу базовые сетевые характеристикизафиксировали их чуть выше того порога, вблизи которого у информации есть шанс добраться до всех участников сети, а количество итераций определили, исходя из количества времени, в течение которого люди в нашем исследовании имели возможность воспользоваться микрокредитами. И даже после этого критерий диффузионной центральности превосходит другие критерии (см. столбец [10] Таблицы S3 в разделе дополнительных материалов в: Banerjee, Chandrasekhar, Duflo, and Jackson [2013]). Дополнительный вариант появляется от сравнения R-квадратов (R2), помещенных внизу этой таблицы и показывающих, какие доли от возможного числа участников программы микрокредитования могут объясняться различными критериями определения центральности (учитывая некоторые подгонки). На деле, предельное улучшение результатов в R-квадрате, которые дает диффузионная центральность, по сравнению с центральностью по собственному вектору, более чем троекратное (напр., если из R2 из секции C, столбца (2) отнять R2 из столбца (3), получится 0,173, а из коэффициент столбца (4) sкоэффициент столбца (3), получится 0,055, где коэффициент из столбца (3) дает подгонку к центральности по степени, а центральность по степени не объясняет почти ничего).
41
Термин политический заместитель взят у Дейл КентDale Kent (1978), чьи данные, тщательно собранные в 1970-х годах, легли в основу анализируемых здесь сетей. Позднее собранные ею данные были дополнены и подвергнуты дальнейшему анализу с точки зрения сетевых закономерностей Джоном Паджеттом и Кристофером АнселломJohn Padgett and Christopher Ansell (1993). Данные, представленные здесь на рисунках, взяты из работы Рональда Брейгера и Пипа ПаттисонаRonald Breiger and Pip Pattison (1986), которые воспользовались данными Паджетта. В эти данные вошло другое подмножество семейиз работы Padgett and Ansell (1993). Я соответственным образом обновил данные. В них вошли брачные и деловые связи между Альбицци и Перуцци, а также еще одно семействоГуаскони, принадлежавшее к стану противников Медичи.