С самого начала клинические психологи отнеслись к идеям Мила с недоверием и враждебностью. Судя по всему, они пребывали во власти иллюзии умения — особенно умения давать долгосрочные прогнозы. Если вдуматься, то легко заметить, откуда взялась иллюзия, и так же легко посочувствовать клиницистам в их неприятии трудов Мила.
Статистические доказательства несовершенства клинических предсказаний противоречат повседневному впечатлению клиницистов о качестве их собственных суждений. Практикующие психологи во время каждой терапевтической встречи неоднократно переживают наития: как пациент отреагирует на вмешательство или что произойдет в следующий момент. Многие из этих наитий подтверждаются, тем самым «доказывая» существование клинического профессионализма.
Проблема в том, что верные суждения включают краткосрочные прогнозы в контексте терапевтического опроса — умение, которое терапевты оттачивают годами. Непосильной задачей для них оказывается долгосрочный прогноз на будущее для конкретного пациента (с этим неважно справляются даже формулы). Вдобавок у клиницистов нет практической возможности приобрести навык долгосрочного прогнозирования — слишком много лет требуется для обратной связи, для получения подтверждения своим гипотезам. Граница между тем, что психологи могут делать хорошо, и тем, чего они не могут, довольно размыта и не всегда заметна им самим. Они знают о собственном профессионализме, но редко догадываются, где заканчивается граница их умений. Поэтому стоит ли удивляться, если опытному терапевту представляется абсурдной идея о том, что механическая комбинация нескольких переменных дает лучшие результаты, чем утонченная сложность человеческого суждения?
Дискуссии по поводу достоинств и недостатков клинического и статистического методов прогнозирования всегда имели моральную подоплеку. Статистический метод, как пишет Мил, подвергался критике со стороны опытных клиницистов как «механический, сухой, атомистичный, отрывочный, искусственный, не связанный с реальностью, ущербный, произвольный, мертвый, педантичный, бессистемный, надуманный, банальный, косный, поверхностный, выхолощенный, псевдонаучный, ограниченный и слепой». С другой стороны, клинический метод восхвалялся его сторонниками как «динамичный, всеобъемлющий, глубокий, целостный, тонкий, гибкий, системный, чувствительный, сложный, продуманный, практический, истинный, живой, толковый, естественный и близкий к жизни».
Нам всем понятно такое отношение. Когда человек соперничает с машиной, будь то Джон Генри, долбящий гору быстрее парового молота, или Гарри Каспаров, играющий шахматную партию против компьютера, мы неизменно сочувствуем человеку. Антипатия к алгоритмам, которые принимают решения, касающиеся людей, коренится в стойком убеждении, что многие предпочтут естественное синтетическому или искусственному. Если спросить людей, какое яблоко они выберут — деревенское или с наклейкой из супермаркета, большинство проголосует за «натуральное», хотя бы их заранее предупредили, что оба плода одинаковы по вкусу, в равной степени питательны и экологически чисты. Даже производители пива обнаружили, что можно увеличить продажи, написав на этикетке «только натуральное сырье» и «без консервантов».
Упорное сопротивление демистификации профессиональных умений ярко проявилось в реакции европейских виноделов на формулу Ашенфельтера. Формула, казалось бы, стала ответом на молитвы гурманов; можно было ожидать, что те будут благодарны за шанс с точностью определять, какие вина будут хорошими, а какие нет. Однако все вышло иначе. Отзывы французских виноделов, по словам обозревателей New York Times, были «либо агрессивными, либо истерическими». Ашенфельтер отмечает, что один ценитель бордо назвал его открытие «смехотворным и нелепым», а другой проворчал: «Это как судить о фильмах, не посмотрев их».
Предубеждения против алгоритма усиливаются, когда решения имеют важные последствия.
«Я не знаю, как побороть тот ужас, — пишет Мил, — который испытывают некоторые клиницисты, когда излечимому, по их мнению, больному отказывают в терапии потому, что „сухая, искусственная“ формула причисляет его к другой группе». Отвечая оппонентам, Мил и его сторонники воззвали к этике — заявили, что неэтично полагаться на интуитивные суждения в важных решениях, если имеющийся алгоритм сделает меньше ошибок. Аргумент веский, но против него вырастает стена психологической реальности: для многих людей важна причина ошибки. Рассказ о ребенке, погибшем из-за ошибки алгоритма, вызывает большее негодование, чем если бы виноват был человек; разница в эмоциональном накале быстро формирует моральное предпочтение.
К счастью, враждебное отношение к алгоритмам, вероятно, будет ослабевать по мере увеличения их роли в повседневной жизни. Когда мы ищем книги или музыку, рекомендации специальных программ нам только помогают. Мы принимаем как должное, что решения о размерах кредитования обходятся без человеческого контроля. Нам все чаще приходится следовать советам в виде простых алгоритмов (например, коэффициент соотношения «хорошего» и «плохого» холестерина в организме). Сейчас публика куда лучше понимает, что в спортивном мире в некоторых критических случаях лучше полагаться на формулу, чем на решение человека, — например, сколько следует заплатить за нового игрока профессиональной спортивной команды и так далее. С удлинением списка задач, выполняемых алгоритмами, люди, возможно, начнут спокойнее реагировать на результаты, описанные Милом в его «подрывающей основы книжечке».
Учимся у Мила
В 1955 году я, лейтенант Армии обороны Израиля двадцати одного года от роду, получил приказ разработать общеармейскую процедуру проведения собеседований. Если вам любопытно, почему юнцу вроде меня доверили столь серьезное дело, не забывайте, что самому израильскому государству тогда было всего семь лет — все институты государства только создавались, и кто-то должен был этому содействовать. Как бы странно это ни прозвучало, я со своим дипломом бакалавра считался самым образованным психологом в армии (мой непосредственный начальник был блестящим исследователем-химиком).
Когда мне поручили это задание, в армии уже существовала процедура собеседований: каждый призывник проходил психометрические тесты, а тех, кого отбирали на боевые задания, опрашивали для оценки личных качеств. Все это производилось для оценки общей боевой подготовки каждого новобранца и определения, где он проявит себя наилучшим образом — в артиллерии, пехоте, бронетанковых войсках и так далее. Вели собеседования такие же молодые новобранцы, отличающиеся высокими интеллектуальными показателями и желанием общаться с людьми. Большинство интервьюеров составляли женщины, которых в то время не допускали к боевым заданиям. Две-три недели их обучали ведению собеседований продолжительностью пятнадцать-двадцать минут; требовалось обсудить ряд тем и составить впечатление о будущих успехах призывника на службе.
К сожалению, последующие аттестации доказали, что результаты собеседований можно не принимать в расчет: по ним нельзя было предсказать будущие успехи новобранцев. Мне приказали составить собеседование так, чтобы оно было более информативным, но не более длительным, и в дополнение велели оценить его точность. С точки зрения профессионала, я был подготовлен для этого задания не больше, чем для постройки моста через Амазонку.
К счастью, годом раньше мне довелось прочесть «книжонку» Пола Мила, и меня убедил довод, что простые правила статистики превосходят интуитивные суждения экспертов. Я решил, что прежняя процедура собеседования оказалась неудачной отчасти потому, что позволяла интервьюерам-ведущим заниматься интересным (с их точки зрения) исследованием динамики психического развития респондента. Вместо этого следовало бы использовать те же пятнадцать минут собеседования, чтобы получить как можно больше сведений о жизни новобранца в привычной для него среде. Из уроков Мила я усвоил, что следует отказаться от процедуры, при которой на принятие решения влияет общая оценка новобранца. По опыту Мила, таким оценкам нельзя доверять; большую достоверность дает статистическая сводка отдельно оцененных качеств респондента.
Я склонялся к процедуре, при которой интервьюеры могли бы выделить значимые личностные характеристики и оценивать их по отдельности. Конечная оценка боепригодности должна была вычисляться по стандартной формуле без каких-либо дополнительных вкладов со стороны оценщиков. Я составил список из шести характеристик, важных, как мне казалось, для выполнения боевых задач, — «ответственность», «коммуникабельность», «мужская гордость» и так далее. Затем были составлены вопросы по каждому пункту, в основном касающиеся жизни новобранца до призыва: места его работы, отношение к службе или учебе, частота встреч с друзьями, спортивные интересы и тому подобное. Нам необходимо было как можно объективнее определить, насколько хорошо новобранец себя проявил в каждой из областей.
Отдавая предпочтение стандартным, фактическим вопросам, я надеялся победить эффект ореола, при котором благоприятное первое впечатление влияет на последующие суждения. В дальнейшем для предотвращения этой ошибки я предлагал вести опрос в строгой последовательности по списку качеств и оценивать каждое по пятибалльной шкале, прежде чем переходить к следующему. На этом нововведения закончились. Я посоветовал интервьюерам не тревожиться о будущем призывников на новом поприще — в их задачи входил лишь поиск фактов о прошлом новобранцев и применение этих фактов для оценки личностных качеств в баллах. «Ваше дело — произвести измерения, а прогностическую оценку предоставьте мне», — сказал я своим подопечным, имея в виду, что займусь составлением формулы, которая сочетала бы данные по всем параметрам.
Интервьюеры готовы были взбунтоваться. Смышленым девушкам и парням не понравилось, когда кто-то чуть старше их велел отключить интуицию и целиком сосредоточиться на нудных опросах. «Вы превращаете нас в роботов!» — возмутился один. Я пошел им навстречу. «Проведите опрос точно как я сказал, а когда закончите, закройте глаза, представьте новобранца в качестве солдата и поставьте ему балл от одного до пяти».
Мы провели несколько сот собеседований по новому методу, а спустя несколько месяцев собрали данные об успехах солдат от офицеров тех подразделений, к которым приписали новобранцев. Результаты нас порадовали. Как и предполагалось в работе Мила, новая процедура собеседования значительно превзошла старую в результативности. Комплексная оценка по всем шести показателям предсказывала успехи новобранца гораздо точнее, нежели прежняя. Правда, метод все же был далек от совершенства. Мы сделали «абсолютно бесполезное» «умеренно полезным», но не более.
Меня поразило, что интуитивные суждения интервьюеров по методу «закрой глаза» также хорошо себя зарекомендовали — результат был не хуже, чем при механическом суммировании шести отдельных оценок. Я получил урок, которого никогда не забуду: интуиция спасает даже в случае справедливо раскритикованного отборочного собеседования, но лишь после продуманного сбора объективных данных и продуманного же подсчета баллов по каждому параметру. Оценкам, полученным в ходе метода «закрой глаза», я придавал тот же вес, что и сумме оценок по шести параметрам. Иначе говоря, я научился не доверять интуитивным суждениям (как своим, так и чужим), но вместе с тем и не отметать их.
Примерно сорок пять лет спустя, после вручения мне Нобелевской премии по экономике, какое-то время в Израиле меня чествовали как знаменитость. В один из приездов кто-то предложил устроить мне посещение той самой военной базы, где я служил, — там до сих пор сохранился отдел собеседований с новобранцами. Меня представили новому командиру подразделения психологов, и она описала процедуру собеседования, которой они пользуются. Оказалось, мои нововведения прижились, да и многолетние исследования подтвердили их практическую пользу. В конце своего рассказа психолог добавила: «А потом мы говорим интервьюерам: „Закройте глаза…“»