Шрифт:
Закладка:
Но даже и после такого обоснования остается открытым вопрос: при наличии одинаково направленных трендов двух причинно-связанных признаков не преувеличится ли теснота связи за счет трендов? Если, например, в стране растет производство и применение минеральных удобрений, растет и урожайность сельскохозяйственных культур, но последняя растет не только по причине увеличения применения удобрений, а также и за счет других факторов — селекции новых сортов, мелиорации, орошения, механизации производства, роста экономической заинтересованности фермеров и др. А при коррелировании уровней урожайности и доз удобрений за 20–25 лет прогресс всех факторов урожайности будет отнесен на дозу удобрений. Получится коэффициент детерминации, превышающий 50 или даже 70 %, и где гарантия, что к истинной корреляции и здесь не примешана ложная? Такой гарантии нет.
Могут возразить: «А разве не может так случиться, что и в пространственной совокупности предприятий, у тех из них, которые вносят большие дозы минеральных удобрений, одновременно и семена лучше, и сельскохозяйственные машины, и кадры более подготовлены, и экономика сильнее?» Да, это возможно, но именно лишь возможно, как возможно и несовпадение факторов, влияющих на урожайность. А параллельная тенденция динамики факторов во времени — это не просто возможность, а в 90 % стран и регионов — достоверный факт. Так что примесь ложной корреляции в пространственных совокупностях намного меньше, чем при коррелировании временных рядов. И, следовательно, если есть возможность изучать, измерять, моделировать связь результативного признака с его факторами не по рядам динамики, а в пространственной совокупности, это обязательно следует делать.
Проблема ложной корреляции почти целиком снимается, если причинная связь обоснована не столько между тенденциями динамики, сколько между колебаниями факторного и результативного признаков. Например, колебания урожайности во влагонедостаточных регионах, например, таких, как Оренбургская область, причинно связаны не с какой-либо тенденцией изменения суммы осадков, а с ее колебаниями в отдельные годы. К тенденции же роста урожайности осадки никакого отношения (причинной связи) не имеют. Снимается ложная корреляция тем, что колебания других факторов, влияющих на урожайность, — экономических, организационных — не связаны или слабо связаны с колебаниями осадков. Тенденции факторов связаны часто, колебания — почти никогда. Поэтому связь между колебаниями одного фактора с результативным показателем (его колебаниями) почти всегда свободна от ложной корреляции, наведенной другими факторами.
В последующих разделах данной главы в основном будут рассматриваться корреляция между колебаниями признаков, а также методики ее измерения и моделирования. Что же касается измерения связи между тенденциями, между самими уровнями временных рядов, включающих тенденцию, а не только колебания, то эта проблема не может считаться решенной. Некоторые указания читатели учебника могут найти в разделе о смешанных прогностических моделях (гл. 10). Излагаемые здесь методики решают только ограниченный класс задач — измерение связи между колебаниями факторного (факторных) признака и колебаниями результативного признака.
Строго говоря, это жесткое ограничение относится и к пространственной корреляции в том смысле, что и в ней измеряется связь вариации результативного признака с вариацией фактора. Например, за счет вариации дозы минеральных удобрений объясняется 38 % вариации урожайности пшеницы между хозяйствами области (r2 = 0,38), а не 38 % уровня урожайности, как иногда неверно считают.
9.4. Методы измерения корреляции между колебаниями признаков
Итак, в предыдущем разделе было установлено, что единственная «чистая» задача об измерении корреляции временных рядов — это измерение связи между колебаниями их уровней. Колебания — это, как правило, случайная составляющая, в отличие от тренда. Если же и колебания не случайны, а строго упорядочены, как, например, сезонные, то и задача о связи таких колебаний не является «чистой», так как содержит риск ложной связи. В связи с этим далее рассматриваются лишь случайно распределенные во времени колебания, например колебания урожайности.
Классический пример, иллюстрирующий отличие корреляции отклонений от тренда и корреляции уровней ряда, — это связь, наблюдавшаяся в 1970–1989 гг. в СССР между урожайностью сельскохозяйственных культур и себестоимостью единицы их продукции. Урожайность большинства культур в подавляющей части регионов в 70–80 % хозяйств имела тенденцию роста, хотя и медленного, а в отдельных хозяйствах — довольно быстрого. Согласно законам экономики, как рыночной, так и плановой, рост урожайности должен приводить к снижению себестоимости единицы продукции. Однако на самом деле в большинстве, если не во всех хозяйствах и регионах, наоборот, себестоимость имела тенденцию роста. Скрытой причиной этого явления была не признаваемая официально инфляция — рост цен на все элементы затрат на производство: сельскохозяйственные машины, энергоносители, удобрения. Рассмотрим пример, представленный в табл. 9.3.
Средние: х‾ =119,92 ~= 120; у‾ = 19,0.
Уравнения трендов:
урожайности: х^ = 119,9 + 3,81t;
себестоимости: у^ = 19,0 + 1,22t, где t = 0 в 1983 г.
Если рассчитывать коэффициент корреляции между уровнями рядов по обычной формуле
то получаем величину -0,055, незначимо отличную от нуля. Параллельность трендов урожайности и себестоимости погасила обратную связь их колебаний, что привело к результату, противоречащему законам экономики.
Рассмотрим теперь другую методику: измерение корреляции между отклонениями уровней от трендов. Подставляя отклонения от трендов в обычную формулу коэффициента корреляции, имеем:
Однако так как средние величины отклонений от линейных и параболических трендов всегда равны нулю, а от других форм тренда близки к нулю, если эти формы трендов правильно выбраны, то
U‾x = U‾y = 0
и формула приобретает вид:
Соответственно формула коэффициента регрессии также меняется:
Свободный член уравнения регрессии определяем по обычной формуле: а = у‾ — Ьх‾, т. е. для отклонений от трендов: а = U‾y — bU‾x = 0
Уравнение регрессии имеет вид:
UYi = bUXi (9.10)
Подставляя данные из табл. 9.3, получаем:
rUxUy = -952,7/√(7678∙133,3) = -0,9414; r2 = 88%
Таким образом, колебания себестоимости картофеля в совхозе почти целиком были связаны с колебаниями