Шрифт:
Закладка:
Для основного параметра параболы II порядка с средняя ошибка репрезентативности выборочной оценки параметра вычисляется по формуле
Под корнем, при условии отсчета номеров периодов (моментов времени) от середины ряда, стоят выражения: средняя величина четвертых степеней ti минус квадрат среднего квадрата ti; по существу это дисперсия, но не линейная, а квадратическая аргумента параболы. Если же отсчет периодов времени идет не от середины ряда, а от начала, то подкоренное выражение принимает вид:
Здесь черта над скобками — знак средних величин. Рассмотрим пример по данным, представленным на рис. 4.2, - динамика экспорта Японии в 1988–1995 гг., имеющая параболический тренд. Его уравнение имеет вид:
y^i = 323,2 + 25,2ti + 2,40ti2.
Проверим, надежно ли отличие от нуля параметра с, половины ускорения. Колеблемость уровней экспорта измеряется величиной
S(t) = √ [67/(8–2)] = 3,66.
Находим необходимые для расчета ошибки параметра величины при измерении периодов от середины ряда при п = 8. Имеем:
Имеем:
mc = 3,66/√(48,56–27,56) = 0,7987 ~ 0,8
Критерий Стьюдента равен отношению
c/mc = 2,4/0,8 = 3,0
Табличное значение критерия при пяти степенях свободы составляет 2,57. Таким образом, отличие ускорения роста экспорта Японии от нуля за 1988–1995 гг. установлено с надежностью, большей, чем 0,95.
Для оценки основного параметра экспоненциального тренда — среднего коэффициента изменения уровней k — целесообразнее всего применить предложенную Е.М. Четыркиным [18, с. 173–174] методику: проверяется отличие от нуля логарифма среднего коэффициента изменения с учетом среднего квадратического отклонения логарифмов фактических уровней от логарифмов уровней тренда. Иначе говоря, методика та же, как для прямой линии, но только не для абсолютных величин, а для их логарифмов.
Формула средней ошибки логарифма коэффициента изменения к имеет вид:
Рассмотрим эту методику на примере экспоненциального роста народонаселения Земли по десятилетиям 1950–2000 гг. (см. рис. 4.3 и табл. 5.6). Тренд имеет вид:
y^i = 4004∙1,195t
В логарифмическом виде
In y^i = 8,295 + 0,1783ti.
Дополнительно вычисляем отклонения логарифмов уровней от логарифмов тренда (табл. 7.2).
Среднее квадратическое отклонение логарифмов:
S(t)lnyi = √[0,000859/(6–2)] = 0,014654
Средняя ошибка логарифма коэффициента изменения:
mlnk = 0,014654/√17,5 = 0,003503
Критерий Стьюдента:
lnk/mlnk = 0,1783/0,003503 = 50,9.
Табличный критерий Стьюдента при четырех степенях свободы и значимости 0,01 равен 4,60. Полученное значение критерия много больше табличного, так что вероятность нулевой гипотезы можно считать равной нулю, а рост населения Земли — достоверным. Понятно, что столь очевидное явление и не требовало проверки, пример приведен для показа методики надежности экспоненциального тренда, а не для проверки самого факта роста населения, как это имело место в примере с ростом среднегодовой температуры.
Для кривых, не имеющих постоянного основного параметра, вышеизложенный метод проверки надежности неприменим. В таких случаях можно, во-первых, проверять сам факт наличия какого-либо тренда путем сравнения средних уровней за первую и за вторую половины периода, во-вторых, с помощью обычной методики проверки надежности различия двух средних величин в теории выборочного метода. Если различие средних уровней в более ранний период и в более поздний период надежно (нулевая гипотеза отвергается), значит, тренд существует. А о форме уравнения тренда судим по тем методикам и показателям, которые изложены в гл. 5.
7.2. Доверительные границы тренда
Если уравнение тренда рассматривается как выборочное, имеющее ошибки репрезентативности своих параметров, то можно рассчитать доверительные границы, внутри которых с заданной, достаточно большой вероятностью, проходит линия тренда в генеральной совокупности. Рассмотрим этот случай на примере простейшего, линейного тренда. Оба его параметра — свободный член а и среднее изменение за единицу времени Ь имеют ошибки репрезентативности выборочных оценок. Свободный член уравнения тренда — это выборочная средняя величина уровней временного ряда, средняя ошибка репрезентативности которой определяется по формуле
ma = S(t)/√n
Средняя ошибка репрезентативности параметра Ь, как упоминалось выше, равна:
Свободный член уравнения линейного тренда и среднее изменение за единицу времени — величины независимые, а следовательно, согласно теореме сложения дисперсий независимых величин, дисперсия их суммы равна сумме дисперсий слагаемых, а среднее квадратическое отклонение (средняя ошибка) — корню квадратному из суммы дисперсий, т. е. из суммы квадратов ошибок m2а и m2Ь. Однако мы рассматриваем ошибку не в статике, а в динамике. Средняя ошибка положения линии тренда за счет ошибки свободного члена — это константа для любой точки линии тренда, а средняя ошибка изменения уровня тренда за счет ошибки параметра Ь — это величина переменная, ибо в разных точках линии тренда его уровень равен а + bti, и ошибка параметра Ь возрастет в ti раз по сравнению с ошибкой в точке, где ti = 1. Следовательно, ошибка линии тренда минимальна в середине базы его расчета — в середине временного ряда. В этой точке, где t = 0, средняя ошибка положения линии тренда равна ошибке его свободного члена, т. е. S (t)/√n, а в любой иной точке тренда его средняя ошибка вычисляется по формуле
— для однократного выравнивания и при ti = 0 в середине ряда. При нумерации периодов времени от начала ряда вместо ti в формулу следует подставить величину (ti — t‾);(tm - t‾)2.
При многократном скользящем определении параметра Ь второе слагаемое подкоренного выражения примет вид:
где n — длина одной базы расчета тренда;
l — число баз.
Рассчитаем среднюю ошибку тренда среднегодовой температуры воздуха в Санкт-Петербурге:
Для середины ряда — 1977 г. — средняя ошибка тренда составила:
1,121∙√(1841) = 0,175°
А для крайних уровней — 1957 г. и 1997 г.-
средняя ошибка тренда составляет:
Таким образом, ошибка тренда возрастает от середины базы его расчета (середина ряда) к его краям, образуя конусообразную зону вероятных значений генерального тренда.
Если эту зону мы хотим определить с достаточно большой вероятностью, то среднюю ошибку следует умножить на величину t-критерия Стьюдента для соответствующей вероятности. Границы доверительной зоны тренда среднегодовой температуры с вероятностью 0,95 изображены на рис. 7.1.
Чем сильнее колеблемость уровней и чем меньше база расчета тренда, тем шире доверительная зона генерального тренда и тем быстрее