Теория условной вероятности
Мы можем дихотомизировать таблицу совместных вероятностей любых двух сценарных спектров при условии, что известны сами эти сценарные спектры (т. е. вероятности, ассоциированные с каждым сценарием) и коэффициент корреляции между ними. То есть мы можем определить величины в каждом из четырех квадрантов таблицы совместных вероятностей.
Мы можем продолжить дихотомизацию таблицы для получения более детальных вероятностей, не ограничиваясь уровнем четырех квадрантов таблицы. Так, мы можем взять, скажем, верхний левый квадрант и использовать его в качестве исходной таблицы. Проделав это со всеми четырьмя квадрантами, мы получим по четыре квадранта для каждого квадранта из четырех исходных. То есть мы получим совместные вероятности для каждой из шестнадцати частей таблицы. Мы можем продолжить эту процедуру, если требуется еще больший уровень детализации.
Здесь, однако, мы сталкиваемся с затруднением, в котором отражается вся суть взаимосвязи условных вероятностей и корреляции. А именно у каждого квадранта есть свой собственный коэффициент корреляции. Чтобы убедиться в этом, вернемся к нашему предыдущему примеру. Мы начали со следующих двух потоков исходов:
Исходя из этих потоков, мы можем построить следующую таблицу:
Мы знаем, что коэффициент корреляции r между этими двумя потоками равен 0,33333. Но этот коэффициент корреляции касается только первого квадранта, представляющего собой всю таблицу.
Теперь, применяя нашу формулу для определения совместных вероятностей, в которую входит коэффициент корреляции потоков, для дихотомизированных сценарных спектров, найдем совместные вероятности для всех квадрантов таблицы:
Если умножить эти вероятности на количество исходов (12), то получим следующую таблицу частот ожидаемых исходов:
Теперь мы можем утверждать, что квадрант «–»«–», то есть верхний левый квадрант, является таблицей, которую мы хотели бы дихотомизировать, например, для того, чтобы узнать совместные вероятности, ассоциированные с X и Y, когда они оба отрицательны:
Но теория условных вероятностей, опирающаяся на корреляцию, говорит нам, что здесь мы не можем пользоваться коэффициентом корреляции всего потока (он, как мы знаем, равен 0,333). Вместо этого мы должны использовать коэффициент корреляции только тех исходов, где и X, и Y отрицательны. Поэтому, беря только те отрезки потоков исходов, где они оба отрицательны, получаем:
Определяя коэффициент корреляции этих двух потоков, получаем, что он равен 0. Заметьте также, что вероятности появления -1 и -2 в каждом из двух потоков равны 0,5, и мы должны использовать 0,5 в качестве индивидуальных вероятностей. Отсюда мы получаем следующие совместные вероятности:
Следовательно, 0,25 верхнего левого квадранта должны приходиться на (-2,-2), и, поскольку 0,3333 всего распределения сосредоточено в верхнем левом квадранте, мы могли бы ожидать, что 0,25 * 0,3333, или 0,08333 всего распределения, придется на -2,-2.
Следовательно, 0,25 верхнего левого квадранта должны приходиться на -2,-1, и, поскольку 0,3333 всего распределения сосредоточено в верхнем левом квадранте, мы могли бы ожидать, что 0,25 * 0,3333, или 0,08333 всего распределения, придется на -2-1.
Следовательно, 0,25 верхнего левого квадранта должны приходиться на -1,-2, и, поскольку 0,3333 всего распределения сосредоточено в верхнем левом квадранте, мы могли бы ожидать, что 0,25 * 0,3333, или 0,08333 всего распределения, придется на -1,-2.
Следовательно, 0,25 верхнего левого квадранта должны приходиться на -1,-1, и, поскольку 0,3333 всего распределения сосредоточено в верхнем левом квадранте, мы могли бы ожидать, что 0,25 * 0,3333, или 0,08333 всего распределения, придется на -1, -1).
Вспомните, что исходные потоки дали 12 исходов, представленных в таблице. Умножая найденные вероятности (0,08333) на 12, получаем 1. То есть мы будем иметь следующую таблицу ожидаемых частот исходов:
Заметьте, что это абсолютно совпадает с левым верхним квадрантом таблицы для полных потоков.
Нижний правый квадрант может быть получен аналогичным образом. Поэтому займемся нижним левым квадрантом (а, значит, и верхним правым квадратом, который можно получить аналогично тому, как мы собираемся действовать с нижним левым).
Коэффициент корреляции равен 1. Вероятность получения -1 или -2 в потоке X равна 0,5, как и вероятность, ассоциированная с получением 1 или 2 в потоке Y. Отсюда мы имеем следующие совместные вероятности:
Следовательно, 0,5 нижнего левого квадранта должны приходиться на -2,1, и, поскольку 0,16666 всего распределения сосредоточено в нижнем левом квадранте, мы могли бы ожидать, что 0,5 * 0,16666, или 0,08333 всего распределения, придется на -2,1.
Следовательно, 0 нижнего левого квадранта должен приходиться на -2,2, и, поскольку 0,16666 всего распределения сосредоточено в нижнем левом квадранте, мы могли бы ожидать, что 0 * 0,16666, или 0 всего распределения, придется на -2,2.
Следовательно, 0 нижнего левого квадранта должен приходиться на -1,1, и, поскольку 0,16666 всего распределения сосредоточено в нижнем левом квадранте, мы могли бы ожидать, что 0 * 0,16666, или 0 всего распределения, придется на -1,1.
Следовательно, 0,5 нижнего левого квадранта должны приходиться на -1,2, и, поскольку 0,16666 всего распределения сосредоточено в нижнем левом квадранте, мы могли бы ожидать, что 0,5 * 0,16666, или 0,08333 всего распределения, придется на -1,2. Таким образом, нижний левый квадрант может быть дихотомизирован к виду:
Отсюда, умножая найденные вероятности на общее число исходов в исходных потоках (12), получаем следующие ожидаемые частоты:
Заметьте, что это абсолютно совпадает с таблицей для исходных потоков.
Таким образом, вы можете дихотомизировать сценарные спектры и, применяя формулу, получить условные вероятности, учитывающие корреляцию. Трудность состоит лишь в том, что вместо использования одного коэффициента корреляции для всей таблицы вы должны использовать коэффициенты корреляции только тех исходов, которые составляют обрабатываемую подтаблицу.
Давайте рассмотрим еще один пример. Предположим, что мы бросаем три монетки по 10 центов и три монетки по 25 центов. Пусть в сценарный спектр А входят общее количество орлов на всех шести монетах, а в сценарный спектр В – общее количество орлов только на 25-центовиках. Таблица совместных вероятностей будет иметь вид:
Всего здесь имеется 26 (64) различных исходов, а коэффициент корреляции составляет 0,707 (рис. 3.7). Поэтому, если мы хотим определить совместные вероятности, ассоциированные с А = 2 и В = 1 (т.е. вероятность при бросании всех шести монет получить два или менее орлов среди всех шести монет и не более одного орла среди 25-центовиков), то:
Что при умножении на 64 (общее число исходов) дает в данном квадранте ожидание, равное 20,1344 исходам. Мы же знаем, что в этом квадранте имеется 19 исходов.
Обратите внимание, что, хотя мы и дихотомизировали В на уровне 0,5, мы не дихотомизировали А. Отсюда расхождения наших результатов с эмпирическими данными. Если бы мы и А дихотомизировали на уровне 0,5, то получили бы совершенно точный результат.
После дихотомизации таблицы мы можем взять одну из ее новых частей и дихотомизировать ее при условии, что известен коэффициент корреляции этой новой таблицы.
Поэтому, если бы мы захотели дихотомизировать верхний левый квадрант этой таблицы, то не смогли бы использовать 0,707 в качестве коэффициента корреляции. Нам пришлось бы определить (или оценить) коэффициент корреляции только для такого набора данных, где при бросании наших шести монет выпадают не более двух орлов на всех монетах и не более одного орла на 25-центовиках.
Таким образом, при наличии двух сценарных спектров и коэффициента (ов) корреляции между ними мы можем определить совместные вероятности реализации двух сценариев, по одному из каждого спектра.
Тот, кто следует среднедисперсионному подходу, или старой методологии, опирается в основном на совместные распределения, у которых только четыре квадранта, – так уж они используют коэффициент корреляции в качестве меры взаимозависимости компонентов. Это плохо приближает реальные совместные распределения, что еще раз подчеркивает предпочтительность нашей новой методологии по сравнению со старыми подходами.
|