• задание, которое дал им я, то есть предсказание будущей оценки кандидата в школе.
Командиры подразделения перевели свои оценки в шкалу, используемую в школе офицеров, с помощью сопоставления интенсивности. И вновь неспособность справиться с (существенной) неопределенностью своих предсказаний привела к тому, что их прогнозы оказались совершенно нерегрессивными.
Коррекция интуитивных предсказаний
Вернемся к Джули, нашей одаренной читательнице. Метод правильного предсказания ее среднего балла описан в предыдущей главе. Как и ранее — для гольфа несколько дней подряд или для веса и игры на пианино, — я приведу схематическую формулу для факторов, определяющих оценку навыков чтения и оценки в колледже:
оценка навыков чтения = общие факторы + факторы, важные для оценки навыков чтения = 100%
средний балл = общие факторы + факторы, важные для среднего балла = 100%
К общим факторам относятся генетические способности, то, насколько семья поддерживает интерес к учебе, и все то, из-за чего одни и те же люди в детстве рано начинают читать, а в юности успешно учатся. Конечно, есть множество факторов, которые повлияют только на одно из этих событий: возможно, слишком требовательные родители научили Джули читать в раннем возрасте, или ее оценки в колледже пострадали из-за несчастной любви, или подростком, катаясь на лыжах, она получила травму, вызвавшую задержку в развитии, и так далее.
Вспомните, что корреляция между двумя величинами — в данном случае между оценкой навыков чтения и средним баллом — равна доле совпадающих определяющих факторов в их общем числе. По-вашему, как велика эта доля? По моим самым оптимистичным оценкам — примерно 30 %. Если взять за основу эту цифру, то мы получим все исходные данные для того, чтобы сделать неискаженное предсказание, производя следующие четыре действия:
1. Начните с оценки типичного среднего балла.
2. Определите средний балл, соответствующий вашим впечатлениям от имеющихся сведений.
3. Оцените корреляцию между вашими данными и средним баллом.
4. Если корреляция составляет 0,30, переместитесь от типичного среднего балла на 30 % расстояния в сторону среднего балла, соответствующего впечатлениям.
Первый пункт дает вам точку отсчета, средний балл, который вы предсказали бы для Джули, если бы ничего о ней не знали. В отсутствие информации вы бы предсказали типичный средний балл. (Это похоже на то, как без других данных о Томе В. ему приписывают априорную вероятность студента по специальности «управление бизнесом».) Второй пункт — интуитивное предсказание, соответствующее вашей оценке данных. Третий пункт перемещает вас от точки отсчета в сторону интуиции на расстояние, зависящее от вашей оценки корреляции. В четвертом пункте вы получаете предсказание, учитывающее вашу интуицию, но гораздо более умеренное.
Это — общий подход, который можно применять при любой необходимости прогнозировать количественную переменную: например, средний балл, или доход от инвестиций, или рост компании. Он основывается на интуиции, но умеряет ее, сдвигает к среднему. Если существует веская причина доверять точности интуитивных предсказаний (то есть сильная корреляция между предсказанием и данными), такая поправка будет небольшой.
Интуитивные прогнозы необходимо корректировать, поскольку они нерегрессивны, а потому искажены. Предположим, я предскажу, что у каждого гольфиста на второй день турнира будет то же число очков, что и в первый. Эта оценка не учитывает регрессию к среднему: те, кто в первый день играл хорошо, в среднем на следующий день справятся хуже, а те, кто играл плохо, в основном станут играть лучше. Нерегрессивные предсказания всегда будут искаженными в сравнении с реальными результатами. В среднем они слишком оптимистичны для тех, кто хорошо играл вначале, и слишком мрачны для тех, кто плохо стартовал. Экстремальность прогноза соответствует экстремальности данных. Сходным образом, если использовать детские успехи для предсказания оценок в колледже без регрессии к среднему, то юношеские достижения ранних чтецов разочаровывают, а успехи тех, кто стал читать относительно поздно, приятно удивляют. Скорректированные интуитивные предсказания избавляются от этих искажений, так что и высокие, и низкие прогнозы примерно одинаково переоценивают и недооценивают истинное значение. Разумеется, даже неискаженные предсказания бывают ошибочны, но в таких случаях ошибки меньше и не склоняются в сторону завышенного или заниженного результата.
Защита экстремальных предсказаний?
Ранее мы познакомились с Томом В. для иллюстрации предсказаний дискретных результатов, например области специализации или успеха на экзамене, которые выражаются присвоением вероятности определенному событию (или, в случае с Томом, расположением результатов от наиболее до наименее вероятного). Я также описал процесс противодействия распространенным искажениям дискретных предсказаний: пренебрежению априорными вероятностями и нечувствительности к качеству информации.
Искажения в прогнозах, выражающихся в шкале, как, например, средний балл или доход фирмы, сходны с искажениями, наблюдающимися при оценке вероятностей исходов.
Процедуры коррекции также схожи:
• Обе содержат исходное предсказание, которое бы вы сделали при отсутствии информации. В случае с категориями это были априорные вероятности, в случае с цифрами — средний результат в соответствующей категории.