Опасность вооруженных данными правительств — КиберПедия 

Особенности сооружения опор в сложных условиях: Сооружение ВЛ в районах с суровыми климатическими и тяжелыми геологическими условиями...

Общие условия выбора системы дренажа: Система дренажа выбирается в зависимости от характера защищаемого...

Опасность вооруженных данными правительств

2019-12-21 138
Опасность вооруженных данными правительств 0.00 из 5.00 0 оценок
Заказать работу

Когда ее бывший бойфренд пришел на вечеринку по поводу дня рождения, Адриана Донато поняла, что он расстроен. Ей показалось, что он сошел с ума. Она знала, что он боролся с депрессией. Когда он пригласил ее покататься на машине, Донато, 20-летняя студентка-зоолог, не знала только одного. Она не знала, что ее бывший бойфренд, 22-летний Джеймс Стоунхэм, предыдущие три недели провел в поисках информации о том, как кого-то убить, и о наказании за убийство, вперемешку с редкими запросами о самой Адриане.

Если бы она знала это, она бы наверняка не села с ним в машину. И, скорее всего, он бы не зарезал ее в тот вечер.

В фильме «Особое мнение» экстрасенсы сотрудничают с полицией, чтобы предотвратить преступления еще до их возникновения. Следует ли для тех же целей предоставить большие данные и отделениям полиции? Нужно ли было по крайней мере предупредить Донато о поисковых запросах ее бывшего бойфренда, а полиции – допросить Стоунхэма?

Во-первых, следует признать: находится все больше доказательств того, что поисковые запросы в Google относительно преступной деятельности напрямую коррелируют с этой самой преступной деятельностью. Кристина Ма-Келламс, Флора Ор, Чжи Хен Баек и Ичиро Кавачи доказали, что количество запросов в Google, связанных с суицидом{185}, сильно коррелирует с количеством самоубийств. Кроме того, мы с Эваном Солтасом обнаружили, что еженедельное число исламофобских поисковых запросов – например, с текстом «я ненавижу мусульман» или «надо убивать мусульман» – напрямую коррелирует с количеством преступлений против мусульман на этой неделе. Если большее число людей выполняет поисковые запросы с сообщением о своем желании что-то сделать, это значит, что большее число людей это сделают.

Так как же нам быть с этой информацией? Есть одна простая и достаточно бесспорная идея: мы можем использовать данные по территориям. Если в каком-то городе сильно растет число поисковых запросов, связанных с самоубийством, мы можем быть уверены в том, что количество суицидов там также возрастет. Значит, местным властям или некоммерческим организациям пора запускать рекламу, объясняя, где люди могут получить психологическую помощь. Аналогично, если в городе сильно возросло число запросов «убивать мусульман», отделениям полиции стоит изменить принцип патрулирования улиц – например, можно направить больше сотрудников к местной мечети.

Но один шаг нам делать не слишком приятно: преследовать людей еще до того, как они совершат преступление. Нам кажется, что это вторжение в частную жизнь. С точки зрения этики, существует большая разница между возможностью правительства собирать информацию о поисковых запросах тысяч или сотен тысяч людей и возможностью полиции записывать аналогичные данные конкретного человека. С точки зрения этики, существует большая разница между защитой местной мечети и возможностью обшарить чужой дом. С точки зрения этики, существует большая разница между рекламой профилактики самоубийств и заключением кого бы то ни было в психиатрическую больницу против его воли.

Однако причина быть предельно осторожными с использованием информации личного характера выходит даже за рамки этики. Она заключается и в самих данных. С точки зрения науки о данных, есть большая разница между попытками предугадать вероятность определенных событий в городе и старанием предсказать действия отдельного человека.

Давайте вернемся к самоубийству. Каждый месяц в США делается около 3,5 миллиона связанных с суицидом поисковых запросов{186}. При этом в большинстве из них есть определенные намеки – слова «самоубийца», «самоубийство» и «способы самоубийства». Проще говоря, каждый месяц – больше одного запроса о самоубийстве на каждые 100 американцев. Как тут не вспомнить философа Фридриха Ницше: «Мысль о самоубийстве – это великое утешение: она помогает человеку преодолеть темноту ночи». Данные поисковых запросов в Google показывают, как это верно и насколько распространены мысли о суициде. Тем не менее каждый месяц в Соединенных Штатах совершается менее четырех тысяч самоубийств. То есть суицидальные мысли достаточно распространены, а самоубийства – нет. Поэтому полицейским нет смысла стучаться в двери каждый раз, когда кто-либо сообщает онлайн о желании вышибить себе мозги – если копы будут заниматься этим, у них ни на что больше не останется времени.

Или рассмотрим невероятно злобные исламофобские запросы. В 2015 году в Соединенных Штатах примерно 12 тысяч раз искали выражение «убивать мусульман». И, как сообщалось, на почве ненависти были убиты 12 мусульман{187}. Очевидно, что подавляющее большинство людей, делавших этот ужасающий запрос, не доходят до осуществления соответствующего действия.

Существуют математические выкладки, объясняющие разницу между предсказанием поведения конкретной личности и общей ситуацией в городе. Вот простой мысленный эксперимент. Предположим, в городе живет один миллион человек. И там есть одна мечеть. Предположим, что если кто-то не обратится к Google с запросом «убить мусульман», то он нападет на мечеть с вероятностью всего 1 на 100 миллионов. Предположим, что кто-то начнет искать в Сети выражение «убить мусульман». Тогда эта вероятность резко возрастает до 1 к 10 тысячам. Предположим, что исламофобия взлетела до небес и число поисковых запросов «убить мусульман» выросло со 100 до 1000.

Как показывает математика, в этой ситуации шансы нападения на мечеть возросли примерно в пять раз – с 2 до 10 процентов. Но вероятность того, что человек, писавший «убить мусульман», действительно нападет на мечеть, по-прежнему остается только 1 на 10 тысяч.

Правильная реакция в этой ситуации – не сажать в тюрьму всех людей, искавших, как «убить мусульман». Не обыскивать их дома. Да, имеется крошечный шанс, что любой из них все же совершит преступление. Но правильным ответом, однако, было бы защитить мечеть, шансы которой подвергнуться нападению возросли до 10 %.

Очевидно, что многие ужасные поисковые запросы не приводят к ужасным действиям.

Итак, хотя бы теоретически, существуют некоторые классы поисковых запросов, предполагающих достаточно высокую вероятность негативных последствий. И хотя бы теоретически возможно, например, что ученые, занимающиеся сбором и анализом данных, смогут в будущем построить модель, которая могла бы определить, что поисковые запросы Стоунхэма, связанные с Донато, должны вызвать серьезную обеспокоенность.

В 2014 году было зафиксировано около 6000 поисковых запросов с фразой «как убить подружку» и 400 убийств девушек. Если все эти убийцы перед совершением преступления выполнили поиск в Google, это будет означать, что 1 из 15 человек перешел от слов к делу. Конечно, многие – вероятно, большинство людей, убивших своих подруг, – не искали информацию о преступлении именно таким образом. Это будет означать: истинная вероятность того, что конкретно этот поиск привел к убийству, намного ниже.

Но если бы ученые, занимающиеся анализом данных, смогли построить модель, вычисляющую угрозу в отношении конкретного человека – скажем, 1 к 100, – мы могли бы захотеть что-то сделать с этой информацией. По крайней мере человек, которому угрожает опасность, вероятно, имеет право быть проинформированным о ней – о существовании 1 шанса из 100 того, что он будет убит конкретным преступником.

Однако в целом мы должны быть очень осторожны при использовании поисковых данных для предсказания преступлений на индивидуальном уровне. Статистика ясно говорит нам: имеется много, очень много ужасных запросов, редко приводящих к ужасным последствиям. И пока все еще нет никаких доказательств, что правительство может с высокой долей вероятности спрогнозировать конкретное действие просто на основании изучения этих поисковых запросов. Поэтому нам следует быть очень осторожными и не позволять властям принимать меры на индивидуальном уровне, используя данные поисков. И дело не только в этических или юридических причинах. Дело – по крайней мере сейчас – в науке о данных.

Заключение
Сколько людей дочитывают книгу до конца?

После подписания договора с издательством у меня было четкое видение того, как следует структурировать эту книгу. В начале – вы, возможно, помните – я описал сцену за столом у меня дома на День благодарения. Члены моей семьи обсуждали, в здравом ли я уме, и пытались выяснить, почему я к 33 годам никак не мог найти подходящую девушку.

Заключение к этой книге написалось практически само. Я хотел бы встречаться с хорошей девушкой и жениться на ней. Еще лучше – я хотел бы использовать большие данные, чтобы встретить подходящую девушку. Возможно, я смог бы вплести в книгу историю ухаживания, и тогда в заключении я бы описал, как все собрались вместе. А последние страницы включали бы описание дня моей свадьбы и любовное письмо к моей молодой жене.

К сожалению, жизнь не совпадает с фантазиями. Тот факт, что во время написания книги мне пришлось запереться в своей квартире и практически потерять связь с реальным миром, наверняка не способствовал развитию романтической стороны моей жизни. И – увы – я еще не нашел себе жену. И, что еще важнее, мне все еще нужно новое заключение.

Я корпел над многими из моих любимых книг, пытаясь найти то, что позволит мне написать отличный эпилог. И пришел к выводу, что в лучших заключениях подчеркивается самая главная мысль, проходящая через всю книгу. Основная мысль этой книги следующая: социальная наука становится самой настоящей наукой. И эта новая настоящая наука призвана улучшить нашу жизнь.

В начале второй части я обсуждал критику Карлом Поппером трудов Зигмунда Фрейда. Я отмечал что Поппер не считал необычные мысли Фрейда научными. Но я кое-что не упомянул о критике Поппера. На самом деле это было нечто гораздо более важное, чем просто нападки на Фрейда. Поппер не считал, что какой-либо социальный ученый являлся ученым в строгом смысле этого слова. Карлу не нравилось отсутствие строгости в положениях, высказывавшихся этими так называемыми учеными.

Что двигало Поппером{188}? Общаясь с лучшими интеллектуалами своего времени – физиками, историками, психологами, – он заметил поразительную разницу. Когда говорили физики, Поппер верил им. Конечно, они порой совершали ошибки. Конечно, иногда – вследствие своих подсознательных предубеждений – они обманывались. Но они были вовлечены в процесс познания глубоких истин о мире, завершившийся появлением теории относительности Эйнштейна. Когда же говорили самые известные социологи, Карлу казалось, что они несут откровенную чепуху.

Поппер – не единственный, кто так по-разному относился к представителям разных наук. Все согласны, что физики, биологи и химики – это настоящие ученые. Для того чтобы найти объяснение явлениям физического мира, они проводят строгие эксперименты. И напротив, многие люди думают, что экономисты, социологи и психологи – неполноценные ученые, использующие бессмысленный жаргон, просто чтобы получить свою должность.

До последнего времени это было правдой. Но революционное появление больших данных все изменило. Если бы Карл Поппер был жив сегодня и посетил презентацию Раджа Четти, Джесси Шапиро, Эстер Дюфло или (ну, а все-таки!) мою, сильно подозреваю, что его реакция была бы совсем иной. По правде говоря, скорее всего, он задался бы вопросом, являются ли сторонники теории струн действительно учеными или они просто развлекаются умственной гимнастикой.

Если в городе показывают жестокое кино, число совершаемых преступлений растет или снижается? Если больше людей смотрит рекламу, произойдет ли увеличение продаж рекламируемого продукта? Если бейсбольная команда выигрывает, когда человеку исполняется 20, будет ли он продолжать болеть за нее в 40 лет? Это все – вопросы, на которые можно дать ответ «да» или «нет». И горы правдивой информации позволяют сделать это.

Это наука, а не псевдонаука.

Но это не означает, что революция в социальных науках придет в виде простых, вечных законов.

Марвин Мински, бывший ученый Массачусетского технологического института и один из первых, кто взялся за изучение возможностей искусственного интеллекта, предположил, что в попытках копирования естественных наук, в которых удалось найти простые законы, верные везде и всегда, психология сбилась с пути.

Он считал, что человеческие мозги не могут быть объектом, подчиняющимся таким законам. Напротив, мозг, скорее всего – сложная система, в которой одна часть исправляет ошибки, возникшие в других. Экономика и политическая система могут быть не менее сложными.

Именно поэтому социальные науки вряд ли можно будет описать в виде аккуратной формулы вроде e = mc². В самом деле, если кто-то утверждает, что социальная наука может быть основана на сухих формулах, к этому следует отнестись весьма скептически.

Революционное преобразование социальных наук будет происходить постепенно, исследование за исследованием, поиск за поиском. Со временем мы начнем лучше понимать сложные системы строения человеческого сознания и общества.

 

Правильное заключение позволяет подвести итоги и наметить направление дальнейшей работы.

Что касается данной книги, это довольно легко. Наборы данных, о которых я говорил, революционны, но мало изучены. Еще многое нам только предстоит узнать. Честно говоря, подавляющее большинство ученых проигнорировали взрывное увеличение количества информации в цифровую эпоху. Самые известные в мире исследователи секса по-прежнему придерживаются испытанных и проверенных приемов. Они опрашивают несколько сотен человек об их желаниях, не собирая данные на сайтах вроде PornHub. Большинство известных лингвистов мира анализируют отдельные тексты, по большей части игнорируя закономерности, выявленные при анализе миллиардов книг. Цифровая революция в основном не затронула методики, по которым учат аспирантов в областях психологии, политологии и социологии. Огромные практически неисследованные просторы информации, возникшие вследствие взрывного увеличения числа данных, заинтересовали лишь небольшое число дальновидных преподавателей, бунтующих студентов и любителей.

Но это изменится.

На каждую идею, о которой я говорил в этой книге, приходятся сотни не менее важных, лишь ждущих решения. Исследования, обсуждаемые здесь – это верхушка айсберга, царапины на поверхности.

Так что же еще мы прогнозируем?

Например, радикальное расширение методологии, использованной в одном из самых успешных исследований общественного здравоохранения. В середине XIX века английский врач Джон Сноу заинтересовался причиной вспышки холеры в Лондоне.

Он выдвинул гениальную идею{189}: сопоставить все случаи этой болезни в городе. Сделав это, он обнаружил, что заболевания в значительной степени группируются вокруг одного конкретного водяного насоса. После чего предположил, что болезнь распространяется через заражение воды – опровергнув тем самым расхожую мысль о плохом воздухе.

Большие данные – и детализация, которую они обеспечивают – делают этот тип исследования очень простым. При любом заболевании мы можем проанализировать данные поисковых запросов в Google или других цифровых источниках о состоянии здоровья. Мы в состоянии найти на карте мира даже самые крошечные участки, где распространенность болезни является необычно высокой или необычно низкой. А затем оценить, что у них есть общего. Возможно, в воздухе? Или в воде? Или в социальных нормах?

Мы можем сделать это в отношении мигрени. Мы можем сделать это в отношении камней в почках. Мы можем сделать это в отношении беспокойства и депрессии, рака поджелудочной и болезни Альцгеймера, высокого кровяного давления и болей в пояснице, запоров и кровотечений из носа. Мы можем сделать это в отношении чего угодно. Анализ, некогда проведенный Сноу, мы могли бы провести 400 раз (некоторые исследования я начал уже во время написания этой книги).

Мы можем назвать это – применение простого метода и использование больших данных для проведения анализа несколько сот раз в течение короткого периода времени – наукой на высоком уровне. Да, социальные и поведенческие науки, безусловно, движутся к достижению таких позиций. Детализированные исследования в области медицины помогут этим наукам достичь требуемого масштаба. Этому также может поспособствовать использование А/B-тестирования. Мы обсуждали такой метод в контексте бизнеса – как добиться того, чтобы пользователи чаще кликали на рекламу. Сегодня эту эффективную методику используют повсеместно. Но А/В-тестирование можно применять для поиска ответов и на более фундаментальные – и социально значимые – вопросы, чем проблема кликов по рекламе.

Бенджамин Ф. Джонс{190} – экономист Северо-Западного университета, использующий А/В-тестирование для того, чтобы помочь детям лучше учиться. Он сумел создать платформу EDU STAR, которая позволяет школам случайным образом тестировать различные планы уроков.

Многие компании занимаются созданием образовательного программного обеспечения. Студенты входят в EDU STAR и случайным образом знакомятся с различными планами уроков. Затем они выполняют короткие тесты, призванные определить, насколько хорошо они разобрались с теми или иными заданиями. Иными словами, школы могут узнать, какое учебное программное обеспечение гарантирует лучшее усвоение материала.

EDU STAR, как и любая платформа на базе А/Б-тестирования, уже дает удивительные результаты. Один план урока, впечатливший представителей многих образовательных учреждений, позволял научить школьников работать с дробями. Считалось, что, если превратить математику в игру, ученики будут с бóльшим удовольствием узнавать новое и лучше выполнять тесты. Да? Неверно. Дети, изучавшие дроби посредством игры, проходили тесты хуже, чем те, кто знакомился с дробями стандартным способом.

Заинтересовать школьников в учебе – более захватывающее и социально полезное использование A/B-тестирования, чем его применение для того, чтобы заставить людей кликать на рекламу.

Средний американец спит каждую ночь 6,7 часа. Большинство из них хотят спать больше. Но вот наступает 11 вечера, и – спорт по телевизору или YouTube зовут. Так что сон подождет. «Jawbone», компания, производящая гаджеты и имеющая сотни тысяч клиентов, проводит тысячи тестов в поисках решения, которое помогло бы пользователям сделать то, чего они так хотят – пойти спать пораньше.

«Jawbone» добилась отличного результата с помощью двойной цели. Сначала специалисты компании просят клиентов реализовать не самую амбициозную цель. Они отправляют им такое сообщение: «Похоже, вы мало спите в последние 3 дня. Попробуйте лечь спать в 23:30! Мы знаем, что обычно вы встаете в 8 утра». Затем у пользователя появляется возможность кликнуть на кнопку «Согласен».

Затем, в 22:30, «Jawbone» отправляет еще одно сообщение: «Вы хотели пойти спать в 23:30. Сейчас 22:30. Почему бы не начать сейчас?»

В «Jawbone» обнаружили, что такая стратегия привела к дополнительным 23 минутам сна. Компания не заставляет клиентов ложиться спать в 22:30, но заманивает их в постель пораньше.

Конечно, каждая часть этой стратегии должна быть оптимизирована путем долгих экспериментов. Если озвучить первоначальную цель – просить пользователей пойти спать в 11 вечера – слишком рано, мало кто согласится. Попросите пользователей лечь спать в полночь, и вы не многого добьетесь.

«Jawbone» использует А/B-тестирование для поиска эквивалента стрелки «вправо» в Google. Но вместо того, чтобы добиться еще нескольких кликов на рекламу партнеров Google, компания дает измученным людям еще несколько минут отдыха.

На самом деле для значительного увеличения успешности своих исследований целая армия психологов вполне может использовать инструменты Силиконовой долины. Я с нетерпением ожидаю первой статьи об этом – вместо описания пары быстрых А/B-тестов, проведенных с несколькими студентами.

Времена, когда ученые месяцами занимаются вербовкой небольшого числа старшекурсников для проведения одного теста, подходят к концу. Вместо этого аналитики будут использовать цифровые данные для тестирования нескольких сотен или тысяч идей за несколько секунд. Мы сможем узнать гораздо больше за гораздо меньшее время.

Данные в виде текста научат нас намного большему. Как распространяются идеи? Как создаются новые слова? Как исчезают слова? Как создаются шутки? Почему некоторые слова смешны, а другие – нет? Как развиваются диалекты? Держу пари, в течение 20 лет мы получим интересные ответы на эти вопросы.

Думаю, в качестве дополнения к традиционным тестам мы могли бы изучить поведение в Сети детей – естественно, анонимно, – чтобы понять, как они учатся и развиваются. Нет ли у них признаков дислексии? Развиваются ли у них зрелые интеллектуальные интересы? Есть ли у них друзья? Подсказки для ответов на все эти вопросы содержатся в тысячах кликов, которые каждый ребенок делает каждый день.

Есть и еще одна совершенно нетривиальная и намного более ценная область использования подобных методов.

В песне «Shattered» Мик Джаггер описывает все, делающее Нью-Йорк – это Большое Яблоко – таким волшебным. Смех. Радость. Одиночество. Крысы. Клопы. Гордость. Жадность. Люди, одетые в бумажные мешки. Но большинство слов Джаггер посвящает описанию того, что делает этот город по-настоящему особенным: «секс, и секс, и секс, и секс».

То же и с большими данными. Благодаря цифровой революции нас ждут интересные открытия в здравоохранении и в науке о сне. В обучении. В психологии. В языке. И в сексе, в сексе, в сексе, в сексе.

В настоящее время я изучаю вопрос: сколько существует аспектов сексуальности? Мы обычно думаем, что люди бывают геями или натуралами – и все. Но сексуальность явно сложнее. Как среди геев, так и среди натуралов существуют различия – например, некоторым мужчинам нравятся блондинки, а другим – брюнетки. Могут ли эти предпочтения быть столь же сильными, как и предпочтения по полу? Другой вопрос: откуда они берутся? Так же, как мы в состоянии выяснить ключевой возраст, определяющий приверженность бейсболу или политические взгляды, возможно, нам удастся найти ключевой возраст формирования сексуальных предпочтений человека во взрослой жизни? Чтобы узнать ответы, вам придется купить мою следующую книгу под рабочим названием «Все (все еще) лгут».

Существование порно – и данных, полученных в этой области – дало возможность революционного развития исследований человеческой сексуальности.

Для того чтобы естественные науки начали менять нашу жизнь, требуется время. Постепенно были созданы пенициллин, спутники и компьютеры. Аналогично, может потребоваться время для того, чтобы большие данные смогли обеспечить серьезные успехи социальных и поведенческих наук, помогающих нам любить, учиться и жить. Но я считаю, что некоторые подвижки уже есть, и надеюсь, что в этой книге вы смогли увидеть хотя бы контуры такого развития событий. Надеюсь, некоторые из вас, прочитав эту книгу, помогут сдвинуть дело с мертвой точки.

 

Чтобы правильно написать заключение, автор должен прежде всего думать о том, почему он написал эту книгу. Какую цель он пытался достичь?

Думаю, самой важной причиной, по которой я взялся за эту книгу, стал обретенный в результате жизненный опыт, очень поспособствовавший моему развитию. Знаете, немногим более 10 лет назад вышла удивительная книга «Фрикономика». В ней описывались исследования Стивена Левитта, превосходного экономиста из Чикагского университета. Левитт считался «пройдошистым экономистом». Казалось, он получил возможность использовать данные для получения ответа на любой вопрос, который смог придумать его изворотливый ум. Мошенничают ли борцы сумо? Проявляют ли дискриминацию геймеры? Предлагают ли нам риэлторы то, что купили бы сами?

Я тогда только-только закончил колледж со специализацией по философии и слабо представлял, что собираюсь делать в жизни. После прочтения «Фрикономики» я понял: хочу сделать то же, что и Стивен Левитт. Я хотел прорваться через горы данных, чтобы выяснить, как устроен наш мир на самом деле. Я хотел последовать за ним и решил получить степень кандидата экономических наук.

За прошедшие 12 лет многое изменилось. В некоторых исследованиях Левитта были обнаружены ошибки обработки данных. Он говорил некоторые политически некорректные вещи о глобальном потеплении. Из-за этого «Фрикономика» впала в немилость в интеллектуальных кругах.

Но, думаю, несмотря на некоторые допущенные им ошибки, прошедшие годы показали важность того, что Левитт пытался сделать. Он рассказывал нам, что сочетание любопытства, творчества и большого объема данных могут значительно улучшить наше понимание мира. На основании полученной информации можно рассказать множество интересных историй – и это было неоднократно доказано.

Я надеюсь, что эта книга сможет оказать такое же влияние на других людей, какое «Фрикономика» оказала на меня. Я надеюсь, что какой-то молодой человек, читающий это прямо сейчас, так же, как и я когда-то, находится на распутье и не знает, что хочет делать в жизни. Если у вас есть немного умения работать со статистическими данными, творческая жилка и любопытство – добро пожаловать в мир анализа информации.

По сути, эта книга, если я могу настолько смело выразиться, может рассматриваться как следующий уровень «Фрикономики». Основное различие между исследованиями, описанными там и здесь – это их притязания. В 1990-е годы, когда делал себе имя Левитт, было не так много данных. Он гордился ответами на причудливые вопросы, полученными на основе анализа данных. И он в значительной степени игнорировал важные темы в тех областях, где информации не существовало. Сегодня, однако, везде имеется так много данных, что имеет смысл сразу перейти к наиболее значительным и самым глубоким вопросам, вникнуть в суть того, что значит быть человеком.

У анализа данных блестящее будущее. Я подозреваю, что следующий Кинси будет заниматься анализом данных. Следующий Фуко будет заниматься анализом данных. Следующий Фрейд будет заниматься анализом данных. Следующий Маркс будет заниматься анализом данных. Следующий Солк вполне может тоже заняться анализом данных.

 

Во всяком случае, я попытался сделать правильное заключение. Но пришел к выводу, что великие заключения способны на большее. Много большее. Великое заключение должно быть ироничным. Оно должно заставить действовать. Оно должно быть одновременно глубоким и веселым, насыщенным юмором и грустным. В великом заключении в одном-двух предложениях должно быть суммировано все то, о чем говорилось раньше, и все, что случится в будущем. Отличная книга должна заканчиваться умным, веселым, задорным, провокационным бабахом!

Теперь, возможно, пришло время поговорить немного о том, как я пишу. Я не очень плодовитый писатель. В этой книге всего около 75 тысяч слов, что совсем немного для такой емкой темы.

Но недостаток многословности я компенсирую одержимостью. За пять месяцев я написал 47 набросков моей первой колонки в «Нью-Йорк таймс», посвященной сексу – это две тысячи слов. Некоторые главы этой книги я правил 60 раз. Я могу часами искать правильное слово для предложения в сноске.

Большую часть прошлого года я прожил отшельником. Только я и мой компьютер. Я жил в фешенебельной части Нью-Йорка и почти не выходил на улицу. На мой взгляд, эта книга – мой magnum opus, лучшее, что я сотворил в жизни. И я был готов пожертвовать всем, чтобы все сделать правильно. Я хотел отшлифовать каждое слово в этой книге. В моем телефоне скопилось множество писем, на которые я забывал ответить, и сообщений, которые я проигнорировал[43].

После 13 месяцев напряженной работы я наконец смог отправить издателю завершенный проект книги. Одной части, правда, не хватало – заключения.

Я объяснил Дениз, моему редактору, что это может занять еще несколько месяцев. Я сказал ей, что, по-моему, мне потребуется на него еще шесть месяцев. Заключение, на мой взгляд – самая важная часть книги. И я только начал учиться писать отличные заключения. Излишне говорить, что Дениз не была довольна.

Затем однажды один мой знакомый прислал мне исследование Джордана Элленберга. Элленберг – математик, работающий в Университете Висконсина – поинтересовался, сколько людей на самом деле дочитывают книги до конца. Он придумал гениальный способ проверить это с помощью больших данных. «Amazon» сообщает, сколько людей цитируют несколько строк из книг. Элленберг понял, что может сравнить, как часто цитирование берется из начала книги и из конца. Это дало бы ориентировочную информацию о склонности читателей дочитывать книгу до последней страницы. В результате выяснилось, что более 90 % читателей закончили роман Донны Тартт «Щегол». В отличие от этой книги, только около 7 % дошли до конца опуса лауреата Нобелевской премии экономиста Даниэля Канемана «Думай медленно… Решай быстро». По этой грубой оценке, менее 3 % читателей добрались до финала много обсуждавшейся книги экономиста Томаса Пикетти «Капитал в XXI веке». Другими словами, люди не стремятся дочитывать трактаты экономистов{191}.

Один из важных выводов этой книги заключается в том, что мы всегда должны идти туда, куда нас ведут большие данные, – и действовать соответственно. Надеюсь, большинство читателей внимательно проследят за всем, здесь написанным, и постараются выявить закономерности, связывающие содержание последних страниц с тем, о чем говорилось раньше. Но, как бы я ни старался оттачивать фразы, большинство людей наверняка прочитают первые 50 страниц, ознакомятся с некоторыми интересными фактами и двинутся дальше по своим делам.

Таким образом, я завершаю эту книгу единственным адекватным способом – в соответствии с данными о том, что люди делают, а не с тем, что они говорят. Я собираюсь выпить пива с друзьями и перестать работать над этим чертовым заключением. Большие данные говорят мне: мало кто из вас все еще читает эту книгу.

Благодарности

Эта книга – плод совместных усилий многих людей.

Ее идеи разрабатывались в то время, когда я учился в Гарварде, работал в Google специалистом по обработке и анализу данных и писал для «Нью-Йорк Таймс».

Хэл Вариан, с которым мы работали в Google, оказал большое влияние на мое понимание идей этой книги. Насколько я могу судить, Хэл постоянно опережает время лет на 20. В его книге «Information Rules» («Информация решает все»), написанной совместно с Карлом Шапиро, будущее было предсказано, по большей части, удивительно точно. А его статья «Предсказание настоящего», написанная совместно с Юньянгом Чоем, во многом легла в основу революции больших данных в социальных науках, описанной в этой книге. Он также удивительно добрый наставник, что могут подтвердить многие трудившиеся с ним люди. Во время совместной работы над статьей Хэл нередко делает бóльшую часть, а затем настаивает, чтобы ваше имя стояло в списке авторов первым. Такое сочетание гения и щедрости, как у Хэла, встречается нечасто.

Моим процессом сочинительства во многом руководил Аарон Ретика, который был моим редактором в «Нью-Йорк Таймс» и обсуждал со мной каждую статью. Аарон – человек поистине энциклопедических знаний. Он разбирается в музыке, истории, спорте, политике, социологии, экономике и бог знает в чем еще – практически во всем. Благодаря ему в статьях, подписанных моим именем, появилось очень много интересных и важных сведений. Другими игроками в нашей команде являются Билл Марч, чьи графические материалы по-прежнему сводят меня с ума, Кевин Маккарти и Гита Данешьо. В эту книгу вошли отрывки из их статей, перепечатанные с их разрешения. Стивен Пинкер, любезно согласившийся написать предисловие, давно уже стал моим героем. Он установил высокую планку для современной книги по социологии – глубокое исследование основ человеческой природы, использование самых свежих данных из различных областей знаний. В своей дальнейшей работе я буду стараться никогда не опускаться ниже заданного им высокого уровня.

Моя диссертация, из которой выросла эта книга, была написана под руководством таких блестящих и терпеливых советников, как Альберто Алесина, Дэвид Катлер, Эд Глэзер и Лоуренс Кац. Дениз Освальд – замечательный редактор. Если вы хотите знать, насколько хорошо ее редактирование, сравните эту книгу с моим первым вариантом. На самом деле вы не сможете этого сделать, поскольку я не намерен никому его показывать, настолько он меня смущает. Я также благодарю всю команду HarperCollins, в том числе Майкла Баррса, Линн Грейди, Лорен Джанек, Шелби Мейзлик и Эмбер Оливер.

Эрик Лупфер, мой агент, видел потенциал этого проекта с самого начала. Он сыграл важную роль в формировании предложения и помог его реализовать.

Я благодарен Мелвису Акосте за превосходную проверку фактографического материала, а также многим другим людям, от которых я узнал много нового и важного для моей профессиональной и научной жизни – Сьюзен Атей, Шломо Бенарци, Джейсон Бордофф, Дэниэл Бауэрс, Дэвид Брукман, Бо Каугилл, Стивен Дельпом, Джон Донахью, Билл Гейл, Клаудия Голдин, Сюзанна Гринберг, Шейн Гринштейн, Стив Гроув, Майкл Хойт, Дэвид Лейбсон, А. И. Магнусон, Дана Мэлони, Джеффри Олдхэм, Питер Орзаг, Дэвид Рейли, Джонатан Розенберг, Майкл Шварц, Стив Скотт, Рич Шавельзон, Майкл Д. Смит, Лоуренс Саммерс, Джон Вавер, Майкл Уиггинс и Цин Ву.

Я благодарен Тиму Рекварту и NeuWrite за помощь в разработке текста. Я также благодарен Кристоферу Чабрису, Раджу Четти, Мэтту Генцкоу, Соломону Мессингу и Джесси Шапиро за помощь в интерпретации моих исследований.

Я спросил Эмму Пирсон и Катю Собольски, могут ли они дать мне какие-либо советы по различным главам этой книги. Они решили – по непонятным мне причинам – сперва прочитать всю книгу, а затем дать мудрые советы по каждому пункту.

Моя мать, Эстер Давидовиц, неоднократно читала всю книгу и помогала кардинально улучшить ее. Она также научила меня, например, следовать моему любопытству, независимо от того, куда это приведет. Когда я беседовал со своим руководителем относительно содержания моей диссертации, он спрашивал меня: «Что ваша мама думает о том, чем вы занимаетесь?» Он полагал, что моей маме может быть стыдно из-за того, что я изучаю секс и другие запретные темы. Но я всегда знал, что она гордится разнообразием моих интересов.

Многие люди читали различные части будущей книги и давали полезные комментарии. Я благодарю Эдуардо Асеведо, Корен Апичелла, Сэма Ашера, Дэвида Катлера, Стивена Дабнера, Кристофера Глазека, Джессику Голдберг, Лорен Голдман, Аманду Гордон, Якоба Лешно, Алексея Пейсаховича, Ноя Поппа, Рамона Руйяра, Грега Собольски, Эвана Солтаса, Ноя Стивенс-Давидовица, Лорен Стивенс-Давидовиц и Джейн Янг. Вообще-то Джейн была моей лучшей подругой в то время, когда я писал эту книгу, за что я особенно ей благодарен.

Я благодарю за помощь в сборе данных Бретта Голденберга, Джеймса Роджерса и Майка Уильямса из MindGeek, Роба Маккууна и Сэма Миллера из Baseball Prospectus. Я благодарен Фонду Альфреда Слоуна за финансовую поддержку.

Во время написания этой книги в какой-то момент я серьезно застрял – настолько, что был готов бросить все и отказаться от проекта. Тогда мы с отцом, Митчеллом Стивенсом, поехали в деревню. В течение недели папа заставил меня собраться. Он брал меня с собой на прогулки, во время которых мы обсуждали любовь, смерть, успех, счастье и текст книги. А позже он сел рядом со мной и заставил заново просмотреть каждое предложение книги. Я бы не смог закончить этот труд без него. Все ошибки, безусловно, мои собственные.

* * *

 

 

Notes

Сноски

1

Неофициальное название законов о расовой сегрегации в США в период с 1890 по 1964 год. – Прим. ред.

2

Приложение Google Trends – источник большей части данных, содержащихся в моей работе. Однако, поскольку оно позволяет лишь сравнивать относительную частоту разных запросов, но не сообщает точное их число по какому-либо конкретному виду поиска, я обычно дополнял его результаты данными, полученными из Google Adwords –


Поделиться с друзьями:

Археология об основании Рима: Новые раскопки проясняют и такой острый дискуссионный вопрос, как дата самого возникновения Рима...

Таксономические единицы (категории) растений: Каждая система классификации состоит из определённых соподчиненных друг другу...

Адаптации растений и животных к жизни в горах: Большое значение для жизни организмов в горах имеют степень расчленения, крутизна и экспозиционные различия склонов...

Семя – орган полового размножения и расселения растений: наружи у семян имеется плотный покров – кожура...



© cyberpedia.su 2017-2024 - Не является автором материалов. Исключительное право сохранено за автором текста.
Если вы не хотите, чтобы данный материал был у нас на сайте, перейдите по ссылке: Нарушение авторских прав. Мы поможем в написании вашей работы!

0.104 с.