Шрифт:
Закладка:
Ответ на этот вопрос можно найти в работе Sober (2009), посвященной применению критериев отбора моделей к рассматриваемому случаю. Как отмечалось выше, можно задать такие значения параметров для моделей BRH и MRH, что они будут делать схожие предсказания; то есть их можно заставить соответствовать данным (примерно) одинаково хорошо. Однако введение вмешивающейся переменной уменьшает количество причинных стрелок, а значит, и регулируемых параметров, необходимых для причинной модели. Интересно, что это имеет важные эпистемические последствия.
Одна из главных задач моделирования - найти правильный баланс между недооптимизацией (неспособностью уловить "сигнал") и переоптимизацией данных (улавливанием "шума"). Модели с большим числом параметров обычно обеспечивают более точное соответствие данным, но при этом возникает риск чрезмерного соответствия шуму; поэтому моделистам хорошо известно, что более простые модели часто оказываются более точными с прогностической точки зрения (Bozdogan 1987, Forster and Sober 1994). Критерии отбора моделей - это попытки формально описать этот компромисс между пригодностью и сложностью (измеряемой числом параметров). Собер использует один из таких критериев,8 информационный критерий Акаике (AIC), который, как было доказано, обеспечивает несмещенную оценку прогностической точности модели.9 AIC учитывает соответствие модели данным (Pr[data | L(M)]) и вычитает штраф за количество настраиваемых параметров, k:
Показатель AIC модели M = log [Pr(data | L(M))] - k
Таким образом, модели, которые примерно одинаково хорошо подходят к данным, могут отличаться по показателю AIC, при этом более сложные модели имеют более низкую ожидаемую предсказательную точность.
В итоге получается, что хотя модели BRH и MRH могут одинаково хорошо соответствовать данным, последняя часто содержит меньше настраиваемых параметров, поскольку в нее вмешивается переменная психического состояния. Поэтому можно ожидать, что субъект, использующий такую ментальную модель, будет делать более точные предсказания. Это подтверждает утверждение Уитена о том, что для человека, читающего мысли, "анализ поведения может стать эффективным в каждом отдельном случае, способствуя быстрой и изощренной тактике, например, в том, что было описано как политическое маневрирование у шимпанзе" (Whiten 1996, 287). Это также показывает, что даже если бы единственной функцией чтения мыслей была систематизация уже известных наблюдаемых закономерностей, оно все равно могло бы внести значительный вклад в прогнозирование.
Однако есть несколько проблем с предположением, что отличительная функция постулирования переменных психического состояния заключается в том, что они позволяют пользователям делать те же самые предсказания, но быстрее и точнее. Во-первых, эту функцию трудно проверить: какой базовой скорости или точности мы должны ожидать от устройства для чтения поведения, чтобы сравнить его с устройством для чтения мыслей? Во-вторых, мы можем задаться вопросом, стоит ли чтение мыслей инвестиций, если оно не обеспечивает действительно новые виды прогностических способностей. И наконец, как мы вскоре увидим, существуют переменные вмешательства в чтение поведения, которые могут выполнять ту же синтаксическую роль упрощения моделей.
Различение моделей с различными причинно-следственными структурами
Хотя соображения выбора модели проливают свет на преимущества использования модели, содержащей вмешивающиеся переменные, они не дают методологии для их проверки. Однако для этого более перспективны другие инструменты из области каузального моделирования.
Согласно подходу, основанному на вмешательстве переменных, предсказания, которые читатели мыслей делают в различных контекстах, имеют общую причину - переменную, обозначающую наличие или отсутствие психического состояния. В отличие от этого, предсказания людей, читающих поведение, в разрозненных ситуациях независимы друг от друга. Для простоты рассмотрим две модели предсказаний, сделанных в наблюдаемых контекстах, O1 и O2, где прямая причинно-следственная связь между двумя переменными существует тогда и только тогда, когда между ними есть стрелка, показанная на Рисунок 23.4 .
Например, O1 может быть контекстом, в котором доминантный шимпанзе ориентирован на кусок пищи, а O2 - контекстом, в котором доминант находится в пределах слышимости от куска пищи (где это наблюдаемое свойство, например, расстояние), получить который было бы шумно (как в экспериментах Melis et al. 2006). Каждое из этих состояний ассоциируется с тем, что доминант наказывает подчиненного за то, что тот взял еду (P1), сам идет за едой (P2) и так далее. Шимпанзе, читающий мысли, представляет обе эти ситуации как ситуации, в которых доминант находится в некотором ментальном состоянии М, например, воспринимает, что подчиненный берет еду, или знает, где она находится. Шимпанзе, читающий поведение, представляет их в виде различных заученных условностей.
Рисунок 23.4. Модели MRH и BRH для предсказаний, сделанных в различных контекстах наблюдения
Каждая из этих моделей предсказывает, что А будет проявлять адаптивные реакции в обоих наблюдаемых контекстах. Однако они делают разные предсказания более высокого порядка о корреляциях между этими видами поведения. Это следует из условия каузального Маркова (CMC), фундаментального предположения большинства известных подходов к каузальному моделированию. Неформально оно гласит, что если нам известны состояния непосредственных причин переменной (ее "родителей"), то эта переменная будет независима от всех других переменных в графе, кроме переменных, которые она вызывает (ее "потомков"). Чуть менее неформально, если есть причинная стрелка из A в B (и нет других стрелок в B), то при условии состояния A состояние B не зависит от всех других переменных в графе, кроме любой переменной C, для которой существует направленный причинный путь из B в C.
Применительно к модели BRH на рис. 23.4, CMC утверждает, что, как только мы учтем наблюдаемые состояния среды, убеждение А в том, что O1, будет независимым от всех других переменных в графе, кроме тех, которые оно вызывает; таким образом, оно будет независимым от любых его убеждений или поведения в контексте 2 (переменные в нижней строке). Ответы читателя поведения в двух ситуациях будут вероятностно независимыми после того, как мы обусловим наблюдаемое состояние среды. То есть вероятность того, что читающий поведение человек, который выполняет адаптивную реакцию в контексте 1, не будет выше, чем в контексте 2 (или наоборот).
Однако это не относится к MRH. Если мы просто обусловливаем наблюдаемые состояния среды, мы еще не учли общую причину адаптивных реакций в обоих контекстах. Поскольку вера в психическое состояние Б является более непосредственной причиной такого поведения, и мы ожидаем, что последствия общей причины будут коррелировать, мы должны ожидать, что поведение читателя мыслей в двух контекстах будет вероятностно зависимым, даже после того, как мы обусловили наблюдаемые состояния