Значение коэффициента регрессии

Татьяна Ефимова предлагает статью на тему: "значение коэффициента регрессии" с детальным описанием.

Значимость коэффициентов регрессии проверяется по критерию

1) Фишера; 2) Чоу; 3) Стьюдента; 4) Пирсона; 5) Дарбина-Уотсона.

1.21. Из перечисленных моделей выберите регрессионные модели с одним уравнением: 1) модель цены от объема поставки; 2) модель спроса и предложения; 3) модель тренда и сезонности; 4) модель зависимости объема производства от производственных факторов:

а) 2, 4; б)1, 4; в) 2, 3; г) все.

Исходные значения фиктивных переменных предполагают значения . . .

1) количественно измеримые

4) нулевые значения

Из пары коллинеарных факторов в эконометрическую модель включается тот фактор . . .

1) который при отсутствии связи с результатом имеет меньшую связь с другими факторами

2) который при достаточно тесной связи с результатом имеет меньшую связь с другими факторами

3) который при отсутствии связи с результатом имеет максимальную связь с другими факторами

4) который при достаточно тесной связи с результатом имеет нелинейную связь с другими факторами

1.16. Какое определение соответствует понятию «эконометрика»:

а) это наука, предметом изучения которой является количественная сторона массовых социально-экономических явлений и процессов в конкретных условиях места и времени;

б) это наука, предметом изучения которой является количественное выражение взаимосвязей экономических явлений и процессов;

в) это наука, предметом изучения которой являются общие закономерности случайных явлений и методы количественной оценки влияния случайных факторов.

1.17. Какова цель эконометрики:

а) представить экономические данные в наглядном виде;

б) разработать способы моделирования и количественного анализа реальных экономических объектов;

в) определить способы сбора и группировки статистических данных;

г) изучить качественные аспекты экономических явлений.

1.2. Какое из определений подходит для науки эконометрика?[ ]

1) наука, которая осуществляет качественный анализ

взаимосвязей экономических явлений и процессов

2) это наука, которая дает количественное выражение

взаимосвязей экономических явлений и процессов

3) это единство составляющих её наук: статистики,

экономической теории и математики

4) специальный раздел информатики, посвящённый анализу

1.8. К классам эконометрических моделей относятся:[ ]

1) регрессионные модели с одним уравнением

2) системы эконометрических уравнений

3) автокорреляционные функции

4) модели временных рядов

1.9. К классам эконометрических моделей относятся: [ ]

Модели временных рядов

Системы нормальных уравнений

Корреляционно-регрессионные модели

Автокорреляционные функции

1.19. Какая задача эконометрики является задачей параметризации модели:

а) составление прогноза и рекомендаций для конкретных экономических явлений по результатам эконометрического моделирования;

б) оценка параметров построения модели;

в) проверка качества параметров модели и самой модели в целом;

г) построение эконометрических моделей для эмпирического анализа?

Каким приёмом формирования обеспечивается репрезентативность

Выборочной совокупности?

1) целенаправленным отбором;

2) использованием специальных правил отбора,

+3) случайным отбором.

1.40. Контролирующая выборка нужна для …

1) проверки адекватности экзогенных переменных

2) проверки адекватности обучающей выборки

+3) проверки адекватности модели

4) проверки адекватности эндогенных переменных

Квантиль порядка р – это

1) значение показателя, при котором функция распределения равна р;

2) значение показателя, вероятность которого равна р;

3) значение показателя, при котором функция плотности равна р;

4) вероятность положительного значения показателя;

5) значение показателя, вероятность отклонения которого от математического ожидания равна р.

2.4. Коэффициент парной корреляции характеризует …

1) тесноту нелинейной связи между несколькими переменными

2) тесноту нелинейной связи между двумя переменными

3) тесноту линейной связи между двумя переменными

4) тесноту линейной связи между несколькими переменными

2.17. Коэффициент парной корреляции характеризует тесноту____связи между____переменными.

Линейной . . . двумя

2) линейной . . . несколькими

3) нелинейной . . . двумя

4) нелинейной . . . несколькими

Какое свойство ненаблюдаемой случайной составляющей регрессии обеспечивает несмещённость получаемых с помощью МНК оценок?

2) равенство дисперсий;

3) равенство нулю математического ожидания.

8. 25Как поступают в том случае, если дисперсия случайной составляющей пропорциональна одной из независимых переменных моделей:

1) все данные умножить на эту независимую переменную;

2) все данные разделить на эту независимую переменную;

3) зависимую переменную разделить на эту независимую переменную.

Как поступают в том случае, если дисперсия случайной составляющей зависит от нескольких независимых переменных?

1) применяют обобщенный МНК с произвольной диагональной матрицей Ω;

2) применяют обычный МНК, реализуемый в три этапа;

3) применяют доступный обобщённый МНК, реализуемый в три этапа.

9.1 Корреляционное поле представляет собой.

1) матрицу коэффициентов корреляций

2) графическое изображение реальных данных в виде точек

3) матрицу частных коэффициентов корреляций

4) графическое представление расчетных данных в виде точек

9.2 Коэффициент парной линейной корреляции равен нулю. Это значит, что …

1) отсутствует автокорреляция результативного признака

2) между признаками отсутствует какая-либо зависимость

3) между признаками нет линейной корреляционной зависимости

4) отсутствует автокорреляция факторного признака

9.3 Корреляция подразумевает наличие связи между …

1) результатом и случайными факторами

4) случайными факторами

9.4 Коэффициент линейной корреляции между признаками Y и Х равен 0,8. Следовательно, процент дисперсии результирующего признака Y, объяснённый линейной парной регрессией Y по фактору Х будет равен …

1) 80% 2) 36% 3) 20% 4) 64%

10.3 Коэффициент детерминации рассчитывается для оценки качества …

1) подбора уравнения регрессии

2) факторов, не включённых в уравнение регрессии

3) мультиколлинеарных факторов

4) параметров уравнения регрессии

10.6. Коэффициент детерминации рассчитывается для оценки качества…

Параметров уравнения регрессии

Факторов, не включенных в уравнение регрессии

Мультиколлинеарных факторов

Еще статьи:  17 советов, как всегда быть при деньгах

Подбора уравнения регрессии

12.20 Критической областью называется совокупность значений критерия, при которых …

1) гипотеза Но отвергается

2) гипотеза Но принимается

3) гипотеза Но не отвергается

1.10. Математическая форма записи уравнения зависимости переменной у от одного или нескольких факторов х называется ______ эконометрической модели.

Измерением

Апробацией

Спецификацией

Адаптацией

2.7. Матрица парных линейных коэффициентов корреляции отражает.

1) значения стандартизированных коэффициентов линейной регрессии

2) величину вклада каждой объясняющей переменной в

общую дисперсию зависимой переменной

3) тесноту линейной связи между переменными

4) вероятность значимости каждой объясняющей переменной

3.8. Методом присвоения числовых значений фиктивным переменным не является …

2) нахождение среднего значения

3) присвоение цифровых меток

4) присвоение количественных значений

5.1. Метод наименьших квадратов используется для оценивания …

1) средней ошибки аппроксимации

2) величины коэффициента корреляции

3) параметров линейной регрессии

4) величины коэффициента детерминации

3.13. Методом присвоения числовых значений фиктивным переменным не является . . .

2) присвоение количественных значений

3) нахождение среднего значения

4) присвоение цифровых меток

5.8. Метод наименьших квадратов не применим для . . .

1) полиномиальных уравнений парной регрессии

2) уравнений нелинейных по оцениваемым параметрам

3) линейных уравнений парной регрессии

4) линейных уравнений множественной регрессии

5.9. Метод наименьших квадратов позволяет оценить _______ уравнений регрессии

Значение коэффициента регрессии

При наличии корреляционной связи между факторными и результативными признаками врачам нередко приходится устанавливать, на какую величину может измениться значение одного признака при изменении другого на общепринятую или установленную самим исследователем единицу измерения.

Например, как изменится масса тела школьников 1-го класса (девочек или мальчиков), если рост их увеличится на 1 см. В этих целях применяется метод регрессионного анализа.

Наиболее часто метод регрессионного анализа применяется для разработки нормативных шкал и стандартов физического развития.

    Определение регрессии. Регрессия — функция, позволяющая по средней величине одного признака определить среднюю величину другого признака, корреляционно связанного с первым.

С этой целью применяется коэффициент регрессии и целый ряд других параметров. Например, можно рассчитать число простудных заболеваний в среднем при определенных значениях среднемесячной температуры воздуха в осенне-зимний период.

Определение коэффициента регрессии. Коэффициент регрессии — абсолютная величина, на которую в среднем изменяется величина одного признака при изменении другого связанного с ним признака на установленную единицу измерения.

Формула коэффициента регрессии. Rу/х = rху x (σу / σx)
где Rу/х — коэффициент регрессии;
rху — коэффициент корреляции между признаками х и у;
у и σx) — среднеквадратические отклонения признаков x и у.

В нашем примере [rху = – 0,96 коэффициент корреляции между изменениями среднемесячной температуры в осенне-зимний период (х) и средним числом инфекционно-простудных заболеваний (у)];
σх = 4,6 (среднеквадратическое отклонение температуры воздуха в осенне-зимний период;
σу = 8,65 (среднеквадратическое отклонение числа инфекционно-простудных заболеваний).
Таким образом, Rу/х — коэффициент регрессии.
Rу/х = -0,96 х (4,6 / 8,65) = 1,8, т.е. при снижении среднемесячной температуры воздуха (x) на 1 градус среднее число инфекционно-простудных заболеваний (у) в осенне-зимний период будет изменяться на 1,8 случаев.

Уравнение регрессии. у = Му + Ry/x (х – Мx)
где у — средняя величина признака, которую следует определять при изменении средней величины другого признака (х);
х — известная средняя величина другого признака;
Ry/x — коэффициент регрессии;
Мх, Му — известные средние величины признаков x и у.

Например, среднее число инфекционно-простудных заболеваний (у) можно определить без специальных измерений при любом среднем значении среднемесячной температуры воздуха (х). Так, если х = – 9°, Rу/х = 1,8 заболеваний, Мх = -7°, Му = 20 заболеваний, то у = 20 + 1,8 х (9-7) = 20 + 3,6 = 23,6 заболеваний.
Данное уравнение применяется в случае прямолинейной связи между двумя признаками (х и у).

Назначение уравнения регрессии. Уравнение регрессии используется для построения линии регрессии. Последняя позволяет без специальных измерений определить любую среднюю величину (у) одного признака, если меняется величина (х) другого признака. По этим данным строится график — линия регрессии, по которой можно определить среднее число простудных заболеваний при любом значении среднемесячной температуры в пределах между расчетными значениями числа простудных заболеваний.

Сигма регрессии (формула).

где σRу/х — сигма (среднеквадратическое отклонение) регрессии;
σу— среднеквадратическое отклонение признака у;
rху — коэффициент корреляции между признаками х и у.

Так, если σу – среднеквадратическое отклонение числа простудных заболеваний = 8,65; rху — коэффициент корреляции между числом простудных заболеваний (у) и среднемесячной температурой воздуха в осенне-зимний период (х) равен — 0,96, то

Назначение сигмы регрессии. Дает характеристику меры разнообразия результативного признака (у).

Например, характеризует разнообразие числа простудных заболеваний при определенном значении среднемесячной температуры воздуха в осеннне-зимний период. Так, среднее число простудных заболеваний при температуре воздуха х1 = -6° может колебаться в пределах от 15,78 заболеваний до 20,62 заболеваний.
При х2 = -9° среднее число простудных заболеваний может колебаться в пределах от 21,18 заболеваний до 26,02 заболеваний и т.д.

Сигма регрессии используется при построении шкалы регрессии, которая отражает отклонение величин результативного признака от среднего его значения, отложенного на линии регрессии.

  • Данные, необходимые для расчета и графического изображения шкалы регрессии
    • коэффициент регрессии — Rу/х;
    • уравнение регрессии — у = Му + Rу/х (х-Мx);
    • сигма регрессии — σRx/y
  • Последовательность расчетов и графического изображения шкалы регрессии.
    • определить коэффициент регрессии по формуле (см. п. 3). Например, следует определить, насколько в среднем будет меняться масса тела (в определенном возрасте в зависимости от пола), если средний рост изменится на 1 см.
    • по формуле уравнения регрессии (см п. 4) определить, какой будет в среднем, например, масса тела (у, у2, у3. )* для определеного значения роста (х, х2, х3. ).
      ________________
      * Величину “у” следует рассчитывать не менее чем для трех известных значений “х”.
    Еще статьи:  Что значит креативность

    При этом средние значения массы тела и роста (Мх, и Му) для определенного возраста и пола известны

  • вычислить сигму регрессии, зная соответствующие величины σу и rху и подставляя их значения в формулу (см. п. 6).
  • на основании известных значений х1, х2, х3 и соответствующих им средних значений у1, у2 у3, а также наименьших (у — σrу/х)и наибольших (у + σrу/х) значений (у) построить шкалу регрессии.

    Для графического изображения шкалы регрессии на графике сначала отмечаются значения х, х2, х3 (ось ординат), т.е. строится линия регрессии, например зависимости массы тела (у) от роста (х).

    Затем в соответствующих точках у1, y2, y3 отмечаются числовые значения сигмы регрессии, т.е. на графике находят наименьшее и наибольшее значения у1, y2, y3.

    Практическое использование шкалы регрессии. Разрабатываются нормативные шкалы и стандарты, в частности по физическому развитию. По стандартной шкале можно дать индивидуальную оценку развития детей. При этом физическое развитие оценивается как гармоничное, если, например, при определенном росте масса тела ребенка находится в пределах одной сигмы регрессии к средней расчетной единице массы тела — (у) для данного роста (x) (у ± 1 σRy/x).

    Физическое развитие считается дисгармоничным по массе тела, если масса тела ребенка для определенного роста находится в пределах второй сигмы регрессии: (у ± 2 σRy/x)

    Физическое развитие будет резко дисгармоничным как за счет избыточной, так и за счет недостаточной массы тела, если масса тела для определенного роста находится в пределах третьей сигмы регрессии (у ± 3 σRy/x).

    По результатам статистического исследования физического развития мальчиков 5 лет известно, что их средний рост (х) равен 109 см, а средняя масса тела (у) равна 19 кг. Коэффициент корреляции между ростом и массой тела составляет +0,9, средние квадратические отклонения представлены в таблице.

    Требуется:

    • рассчитать коэффициент регрессии;
    • по уравнению регрессии определить, какой будет ожидаемая масса тела мальчиков 5 лет при росте, равном х1 = 100 см, х2 = 110 см, х3= 120 см;
    • рассчитать сигму регрессии, построить шкалу регрессии, результаты ее решения представить графически;
    • сделать соответствующие выводы.

    Условие задачи и результаты ее решения представлены в сводной таблице.

    Условия задачи Pезультаты решения задачи
    уравнение регрессии сигма регрессии шкала регрессии (ожидаемая масса тела (в кг))
    М σ rху Rу/x х У σ Rx/y y – σRу/х y + σRу/х
    1 2 3 4 5 6 7 8 9 10
    Рост (х) 109 см ± 4,4см +0,9 0,16 100см 17,56 кг ± 0,35 кг 17,21 кг 17,91 кг
    Масса тела (y) 19 кг ± 0,8 кг 110 см 19,16 кг 18,81 кг 19,51 кг
    120 см 20,76 кг 20,41 кг 21,11 кг

    Решение.

      Коэффициент регрессии:
      Rу/х = rху х (σу / σх) = +0,9 х (0,8 / 4,4) = 0,16 кг/см.

    Таким образом, при увеличении роста мальчиков 5 лет на 1 см масса тела увеличивается на 0,16 кг.

    х1 = 100 см у1 = 19 + 0,16 (100-109) = 17,56 кг
    х2 = 110 см у2 = 19 + 0,16 (110-109) = 19,16 кг
    х3 = 120 см У3 = 19 + 0,16 (120-109) = 20, 76 кг

    Рост и его значения Среднее значение массы тела Наименьшее значение массы тела Наибольшее значение массы тела
    х У У – σRy/x У – σRy/x
    100 см (1) 17,56 кг 17,21 кг 17,91 кг
    110 см (2) 19,16 кг 18,81 кг 19,51 кг
    120 см (3) 20,76 кг 20,41 кг 21,11 кг

    Графическое изображение регрессии. Шкала регрессии массы тела по росту 5-летних мальчиков

    Вывод. Таким образом, шкала регрессии в пределах расчетных величин массы тела позволяет определить ее при любом другом значении роста или оценить индивидуальное развитие ребенка. Для этого следует восстановить перпендикуляр к линии регрессии.

    Применение методов статистического анализа для изучения общественного здоровья и здравоохранения. Под ред. чл.-корр. РАМН, проф. В.З.Кучеренко. М., “Гэотар-Медиа”, 2007, учебное пособие для вузов

    1. Власов В.В. Эпидемиология. — М.: ГЭОТАР-МЕД, 2004. — 464 с.
    2. Лисицын Ю.П. Общественное здоровье и здравоохранение. Учебник для вузов. — М.: ГЭОТАР-МЕД, 2007. — 512 с.
    3. Медик В.А., Юрьев В.К. Курс лекций по общественному здоровью и здравоохранению: Часть 1. Общественное здоровье. — М.: Медицина, 2003. — 368 с.
    4. Миняев В.А., Вишняков Н.И. и др. Социальная медицина и организация здравоохранения (Руководство в 2 томах). — СПб, 1998. -528 с.
    5. Кучеренко В.З., Агарков Н.М. и др.Социальная гигиена и организация здравоохранения (Учебное пособие) — Москва, 2000. — 432 с.
    6. С. Гланц. Медико-биологическая статистика. Пер с англ. — М., Практика, 1998. — 459 с.

    Оценка значимости коэффициентов регрессии

    Для проверки значимости анализируется отношение коэффициента регрессии и его среднеквадратичного отклонения. Это отношение является распределением Стьюдента, то есть для определения значимости используем t – критерий:

    (7)

    где ;

    СКО от остаточной дисперсии;

    – сумма отклонений от среднего значения

    Если tрас.>tтаб., то коэффициент bi является значимым.

    Доверительный интервал определяется по формуле:

    , (8)

    ПОРЯДОК ВЫПОЛНЕНИЯ РАБОТЫ

    Взять исходные данные согласно варианту работы (по номеру студента в журнале). Задан статический объект управления с двумя входами X1, X2 и одним выходом Y. На объекте проведен пассивный эксперимент и получена выборка объемом 30 точек, содержащая значения Х1, Х2 и Y для каждого эксперимента.

    Еще статьи:  Алене каре бросить курить

    Открыть новый файл в Excel 2007. Ввести исходную информацию в столбцы исходной таблицы – значения входных переменных X1, Х2 и выходной переменной Y.

    Подготовить дополнительно два столбца для ввода расчетных значений Y и остатков.

    Вызвать программу «Регрессия»: Данные/ Анализ данных/ Регрессия.

    Рис. 1. Диалоговое окно «Анализ данных».

    Ввести в диалоговое окно «Регрессия» адреса исходных данных:

    входной интервал Y, входной интервал X (2 столбца),

    установить уровень надежности 95%,

    в опции «Выходной интервал, указать левую верхнюю ячейку места вывода данных регрессионного анализа (первую ячейку на 2-странице рабочего листа),

    включить опции «Остатки» и «График остатков»,

    нажать кнопку ОК для запуска регрессионного анализа.

    Рис. 2. Диалоговое окно «Регрессия».

    Excel выведет 4 таблицы и 2 графика зависимости остатков от переменных Х1 и Х2.

    Отформатировать таблицу «Вывод итогов» – расширить столбец с наименованиями выходных данных, сделать во втором столбце 3 значащие цифры после запятой.

    Отформатировать таблицу «Дисперсионный анализ»- сделать удобным для чтения и понимания количество значащих цифр после запятых, сократить наименование переменных и настроить ширину столбцов.

    Отформатировать таблицу коэффициентов уравнения – сократить наименование переменных и скорректировать при необходимости ширину столбцов, сделать удобным для чтения и понимания количество значащих цифр, удалить 2 последних столбца (значения и разметку таблицы).

    Данные из таблицы «Вывод остатка» перенести в подготовленные столбцы исходной таблицы, затем таблицу «Вывод остатка» удалить (опция «специальная вставка»).

    Ввести полученные оценки коэффициентов в исходную таблицу.

    Подтянуть таблицы результатов по максимуму вверх страницы.

    Построить под таблицами диаграммы Yэксп, Yрасч и ошибки прогноза (остатка).

    Отформатировать диаграммы остатков. По полученным графикам оценить правильность модели по входам Х1, Х2.

    Распечатать результаты регрессионного анализа.

    Разобраться с результатами регрессионного анализа.

    По промежуточным результатам рассчитать коэффициент множественной корреляции, расчетные значения t-критериев, доверительные интервалы, остаточную ошибку модели .

    Подготовить отчет по работе.

    ПРИМЕР ВЫПОЛНЕНИЯ РАБОТЫ

    Прием выполнения регрессионного анализа в пакете EXCEL представлен на рисунках 3-5.

    Рис. 3. Пример регрессионного анализа в пакете EXCEL.

    Рис.4 . Графики остатков переменных Х1, Х2

    Рис. 5. Графики Yэксп,Yрасчи ошибки прогноза (остатка).

    По данным регрессионного анализа можно сказать:

    1. Уравнение регрессии полученное с помощью Excel, имеет вид:

    Вариация результата на 46,5% объясняется вариацией факторов.

    Общий F-критерий проверяет гипотезу о статистической значимости уравнения регрессии. Анализ выполняется при сравнении фактического и табличного значения F-критерия Фишера.

    Так как фактическое значение превышает табличное

    , то делаем вывод, что полученной уравнение регрессии статистически значимо.

    Коэффициент множественной корреляции:

    Определяем доверительный интервал для коэффициента b:

    Проверка значимости коэффициента b:

    Определяем доверительный интервал для коэффициента b1:

    Проверка значимости коэффициента b1:

    tрас.>tтаб., коэффициент b1 является значимым

    Определяем доверительный интервал для коэффициентаb2:

    Проверка значимости для коэффициентаb2:

    Оценка параметров уравнения регреcсии. Пример

    Задание:
    По группе предприятий, выпускающих один и тот же вид продукции, рассматриваются функции издержек:
    y = α + βx;
    y = α x β ;
    y = α β x ;
    y = α + β / x;
    где y – затраты на производство, тыс. д. е.
    x – выпуск продукции, тыс. ед.

    Требуется:
    1. Построить уравнения парной регрессии y от x :

    • линейное;
    • степенное;
    • показательное;
    • равносторонней гиперболы.

    2. Рассчитать линейный коэффициент парной корреляции и коэффициент детерминации. Сделать выводы.
    3. Оценить статистическую значимость уравнения регрессии в целом.
    4. Оценить статистическую значимость параметров регрессии и корреляции.
    5. Выполнить прогноз затрат на производство при прогнозном выпуске продукции, составляющем 195 % от среднего уровня.
    6. Оценить точность прогноза, рассчитать ошибку прогноза и его доверительный интервал.
    7. Оценить модель через среднюю ошибку аппроксимации.

    1. Уравнение имеет вид y = α + βx
    1. Параметры уравнения регрессии.
    Средние значения

    Связь между признаком Y фактором X сильная и прямая
    Уравнение регрессии

    Коэффициент детерминации
    R 2 = 0.94 2 = 0.89, т.е. в 88.9774 % случаев изменения х приводят к изменению y. Другими словами – точность подбора уравнения регрессии – высокая

    x y x 2 y 2 x ∙ y y(x) (y-y cp ) 2 (y-y(x)) 2 (x-x p ) 2
    78 133 6084 17689 10374 142.16 115.98 83.83 1
    82 148 6724 21904 12136 148.61 17.9 0.37 9
    87 134 7569 17956 11658 156.68 95.44 514.26 64
    79 154 6241 23716 12166 143.77 104.67 104.67
    89 162 7921 26244 14418 159.9 332.36 4.39 100
    106 195 11236 38025 20670 187.33 2624.59 58.76 729
    67 139 4489 19321 9313 124.41 22.75 212.95 144
    88 158 7744 24964 13904 158.29 202.51 0.08 81
    73 152 5329 23104 11096 134.09 67.75 320.84 36
    87 162 7569 26244 14094 156.68 332.36 28.33 64
    76 159 5776 25281 12084 138.93 231.98 402.86 9
    115 173 13225 29929 19895 201.86 854.44 832.66 1296
    16.3 20669.59 265.73 6241
    1027 1869 89907 294377 161808 1869 25672.31 2829.74 8774

    Примечание: значения y(x) находятся из полученного уравнения регрессии:
    y(1) = 4.01*1 + 99.18 = 103.19
    y(2) = 4.01*2 + 99.18 = 107.2
    . . .

    2. Оценка параметров уравнения регрессии
    Значимость коэффициента корреляции

    По таблице Стьюдента находим Tтабл
    Tтабл (n-m-1;α/2) = (11;0.05/2) = 1.796
    Поскольку Tнабл > Tтабл , то отклоняем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициента корреляции статистически – значим.

    Анализ точности определения оценок коэффициентов регрессии

    S a = 0.1712
    Доверительные интервалы для зависимой переменной

    Рассчитаем границы интервала, в котором будет сосредоточено 95% возможных значений Y при неограниченно большом числе наблюдений и X = 1
    (-20.41;56.24)
    Проверка гипотез относительно коэффициентов линейного уравнения регрессии
    1) t-статистика

    Еще статьи:  Мужская и женская дружба

    Статистическая значимость коэффициента регрессии a подтверждается

    Статистическая значимость коэффициента регрессии b не подтверждается
    Доверительный интервал для коэффициентов уравнения регрессии
    Определим доверительные интервалы коэффициентов регрессии, которые с надежность 95% будут следующими:
    (a – t S a; a + t S a)
    (1.306;1.921)
    (b – t b S b; b + t bS b)
    (-9.2733;41.876)
    где t = 1.796
    2) F-статистики

    Fkp = 4.84
    Поскольку F > Fkp, то коэффициент детерминации статистически значим

    Корреляция и регрессия

    Линейное уравнение регрессии имеет вид y = bx + a + ε
    Здесь ε – случайная ошибка (отклонение, возмущение).
    Причины существования случайной ошибки:
    1. Невключение в регрессионную модель значимых объясняющих переменных;
    2. Агрегирование переменных. Например, функция суммарного потребления – это попытка общего выражения совокупности решений отдельных индивидов о расходах. Это лишь аппроксимация отдельных соотношений, которые имеют разные параметры.
    3. Неправильное описание структуры модели;
    4. Неправильная функциональная спецификация;
    5. Ошибки измерения.
    Так как отклонения εi для каждого конкретного наблюдения i – случайны и их значения в выборке неизвестны, то:
    1) по наблюдениям xi и yi можно получить только оценки параметров α и β
    2) Оценками параметров α и β регрессионной модели являются соответственно величины а и b, которые носят случайный характер, т.к. соответствуют случайной выборке;
    Тогда оценочное уравнение регрессии (построенное по выборочным данным) будет иметь вид y = bx + a + ε, где ei – наблюдаемые значения (оценки) ошибок εi, а и b соответственно оценки параметров α и β регрессионной модели, которые следует найти.
    Для оценки параметров α и β – используют МНК (метод наименьших квадратов).
    Система нормальных уравнений.

    Для наших данных система уравнений имеет вид:

    10a + 356b = 49
    356a + 2135b = 9485

    Из первого уравнения выражаем а и подставим во второе уравнение
    Получаем b = 68.16, a = 11.17

    Уравнение регрессии:
    y = 68.16 x – 11.17

    1. Параметры уравнения регрессии.
    Выборочные средние.

    1.1. Коэффициент корреляции
    Рассчитываем показатель тесноты связи. Таким показателем является выборочный линейный коэффициент корреляции, который рассчитывается по формуле:

    Линейный коэффициент корреляции принимает значения от –1 до +1.
    Связи между признаками могут быть слабыми и сильными (тесными). Их критерии оцениваются по шкале Чеддока:
    0.1 Y фактором X весьма высокая и прямая.

    1.2. Уравнение регрессии (оценка уравнения регрессии).

    Линейное уравнение регрессии имеет вид y = 68.16 x -11.17
    Коэффициентам уравнения линейной регрессии можно придать экономический смысл. Коэффициент уравнения регрессии показывает, на сколько ед. изменится результат при изменении фактора на 1 ед.
    Коэффициент b = 68.16 показывает среднее изменение результативного показателя (в единицах измерения у ) с повышением или понижением величины фактора х на единицу его измерения. В данном примере с увеличением на 1 единицу y повышается в среднем на 68.16.
    Коэффициент a = -11.17 формально показывает прогнозируемый уровень у , но только в том случае, если х=0 находится близко с выборочными значениями.
    Но если х=0 находится далеко от выборочных значений x , то буквальная интерпретация может привести к неверным результатам, и даже если линия регрессии довольно точно описывает значения наблюдаемой выборки, нет гарантий, что также будет при экстраполяции влево или вправо.
    Подставив в уравнение регрессии соответствующие значения x , можно определить выровненные (предсказанные) значения результативного показателя y(x) для каждого наблюдения.
    Связь между у и x определяет знак коэффициента регрессии b (если > 0 – прямая связь, иначе – обратная). В нашем примере связь прямая.

    1.3. Коэффициент эластичности.
    Коэффициенты регрессии (в примере b) нежелательно использовать для непосредственной оценки влияния факторов на результативный признак в том случае, если существует различие единиц измерения результативного показателя у и факторного признака х.
    Для этих целей вычисляются коэффициенты эластичности и бета – коэффициенты. Коэффициент эластичности находится по формуле:

    Он показывает, на сколько процентов в среднем изменяется результативный признак у при изменении факторного признака х на 1%. Он не учитывает степень колеблемости факторов.
    В нашем примере коэффициент эластичности больше 1. Следовательно, при изменении Х на 1%, Y изменится более чем на 1%. Другими словами – Х существенно влияет на Y.
    Бета – коэффициент показывает, на какую часть величины своего среднего квадратичного отклонения изменится в среднем значение результативного признака при изменении факторного признака на величину его среднеквадратического отклонения при фиксированном на постоянном уровне значении остальных независимых переменных:

    Т.е. увеличение x на величину среднеквадратического отклонения этого показателя приведет к увеличению среднего Y на 0.9796 среднеквадратичного отклонения этого показателя.

    1.4. Ошибка аппроксимации.
    Оценим качество уравнения регрессии с помощью ошибки абсолютной аппроксимации.

    Поскольку ошибка больше 15%, то данное уравнение не желательно использовать в качестве регрессии.

    1.6. Коэффициент детерминации.
    Квадрат (множественного) коэффициента корреляции называется коэффициентом детерминации, который показывает долю вариации результативного признака, объясненную вариацией факторного признака.
    Чаще всего, давая интерпретацию коэффициента детерминации, его выражают в процентах.
    R 2 = 0.98 2 = 0.9596
    т.е. в 95.96 % случаев изменения x приводят к изменению у . Другими словами – точность подбора уравнения регрессии – высокая. Остальные 4.04 % изменения Y объясняются факторами, не учтенными в модели.

    x y x 2 y 2 x • y y(x) (yi-ycp) 2 (y-y(x)) 2 (xi-xcp) 2 |y – yx|:y
    0.371 15.6 0.1376 243.36 5.79 14.11 780.89 2.21 0.1864 0.0953
    0.399 19.9 0.1592 396.01 7.94 16.02 559.06 15.04 0.163 0.1949
    0.502 22.7 0.252 515.29 11.4 23.04 434.49 0.1176 0.0905 0.0151
    0.572 34.2 0.3272 1169.64 19.56 27.81 87.32 40.78 0.0533 0.1867
    0.607 44.5 .3684 1980.25 27.01 30.2 0.9131 204.49 0.0383 0.3214
    0.655 26.8 0.429 718.24 17.55 33.47 280.38 44.51 0.0218 0.2489
    0.763 35.7 0.5822 1274.49 27.24 40.83 61.54 26.35 0.0016 0.1438
    0.873 30.6 0.7621 936.36 26.71 48.33 167.56 314.39 0.0049 0.5794
    2.48 161.9 6.17 26211.61 402 158.07 14008.04 14.66 2.82 0.0236
    7.23 391.9 9.18 33445.25 545.2 391.9 16380.18 662.54 3.38 1.81
    Еще статьи:  Понятие и сущность личности

    2. Оценка параметров уравнения регрессии.
    2.1. Значимость коэффициента корреляции.

    По таблице Стьюдента с уровнем значимости α=0.05 и степенями свободы k=7 находим tкрит:
    tкрит = (7;0.05) = 1.895
    где m = 1 – количество объясняющих переменных.
    Если tнабл > tкритич, то полученное значение коэффициента корреляции признается значимым (нулевая гипотеза, утверждающая равенство нулю коэффициента корреляции, отвергается).
    Поскольку tнабл > tкрит, то отклоняем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициент корреляции статистически – значим
    В парной линейной регрессии t 2 r = t 2 b и тогда проверка гипотез о значимости коэффициентов регрессии и корреляции равносильна проверке гипотезы о существенности линейного уравнения регрессии.

    2.3. Анализ точности определения оценок коэффициентов регрессии.
    Несмещенной оценкой дисперсии возмущений является величина:

    S 2 y = 94.6484 – необъясненная дисперсия (мера разброса зависимой переменной вокруг линии регрессии).
    Sy = 9.7287 – стандартная ошибка оценки (стандартная ошибка регрессии).
    S a – стандартное отклонение случайной величины a.

    Sb – стандартное отклонение случайной величины b.

    2.4. Доверительные интервалы для зависимой переменной.
    Экономическое прогнозирование на основе построенной модели предполагает, что сохраняются ранее существовавшие взаимосвязи переменных и на период упреждения.
    Для прогнозирования зависимой переменной результативного признака необходимо знать прогнозные значения всех входящих в модель факторов.
    Прогнозные значения факторов подставляют в модель и получают точечные прогнозные оценки изучаемого показателя. (a + bxp ± ε)
    где

    Рассчитаем границы интервала, в котором будет сосредоточено 95% возможных значений Y при неограниченно большом числе наблюдений и X p = 1 (-11.17 + 68.16*1 ± 6.4554)
    (50.53;63.44)
    С вероятностью 95% можно гарантировать, что значения Y при неограниченно большом числе наблюдений не выйдет за пределы найденных интервалов.

    Индивидуальные доверительные интервалы для Y при данном значении X.
    (a + bx i ± ε)
    где

    xi y = -11.17 + 68.16xi εi ymin ymax
    0.371 14.11 19.91 -5.8 34.02
    0.399 16.02 19.85 -3.83 35.87
    0.502 23.04 19.67 3.38 42.71
    0.572 27.81 19.57 8.24 47.38
    0.607 30.2 19.53 10.67 49.73
    0.655 33.47 19.49 13.98 52.96
    0.763 40.83 19.44 21.4 60.27
    0.873 48.33 19.45 28.88 67.78
    2.48 158.07 25.72 132.36 183.79

    С вероятностью 95% можно гарантировать, что значения Y при неограниченно большом числе наблюдений не выйдет за пределы найденных интервалов.

    2.5. Проверка гипотез относительно коэффициентов линейного уравнения регрессии.
    1) t-статистика. Критерий Стьюдента.
    Проверим гипотезу H о равенстве отдельных коэффициентов регрессии нулю (при альтернативе H1 не равно) на уровне значимости α=0.05.
    tкрит = (7;0.05) = 1.895

    Поскольку 12.8866 > 1.895, то статистическая значимость коэффициента регрессии b подтверждается (отвергаем гипотезу о равенстве нулю этого коэффициента).

    Поскольку 2.0914 > 1.895, то статистическая значимость коэффициента регрессии a подтверждается (отвергаем гипотезу о равенстве нулю этого коэффициента).

    Доверительный интервал для коэффициентов уравнения регрессии.
    Определим доверительные интервалы коэффициентов регрессии, которые с надежность 95% будут следующими:
    (b – tкрит Sb; b + tкрит Sb)
    (68.1618 – 1.895 • 5.2894; 68.1618 + 1.895 • 5.2894)
    (58.1385;78.1852)
    С вероятностью 95% можно утверждать, что значение данного параметра будут лежать в найденном интервале.
    (a – ta)
    (-11.1744 – 1.895 • 5.3429; -11.1744 + 1.895 • 5.3429)
    (-21.2992;-1.0496)
    С вероятностью 95% можно утверждать, что значение данного параметра будут лежать в найденном интервале.

    2) F-статистики. Критерий Фишера.
    Проверка значимости модели регрессии проводится с использованием F-критерия Фишера, расчетное значение которого находится как отношение дисперсии исходного ряда наблюдений изучаемого показателя и несмещенной оценки дисперсии остаточной последовательности для данной модели.
    Если расчетное значение с lang=EN-US>n-m-1) степенями свободы больше табличного при заданном уровне значимости, то модель считается значимой.

    где m – число факторов в модели.
    Оценка статистической значимости парной линейной регрессии производится по следующему алгоритму:
    1. Выдвигается нулевая гипотеза о том, что уравнение в целом статистически незначимо: H: R 2 =0 на уровне значимости α.
    2. Далее определяют фактическое значение F-критерия:

    где m=1 для парной регрессии.
    3. Табличное значение определяется по таблицам распределения Фишера для заданного уровня значимости, принимая во внимание, что число степеней свободы для общей суммы квадратов (большей дисперсии) равно 1 и число степеней свободы остаточной суммы квадратов (меньшей дисперсии) при линейной регрессии равно n-2.
    4. Если фактическое значение F-критерия меньше табличного, то говорят, что нет основания отклонять нулевую гипотезу.
    В противном случае, нулевая гипотеза отклоняется и с вероятностью (1-α) принимается альтернативная гипотеза о статистической значимости уравнения в целом.
    Табличное значение критерия со степенями свободы k1=1 и k2=7, Fkp = 5.59
    Поскольку фактическое значение F > Fkp, то коэффициент детерминации статистически значим (Найденная оценка уравнения регрессии статистически надежна).

    Обнаружение автокорреляции

    1. Графический метод
    Есть ряд вариантов графического определения автокорреляции. Один из них увязывает отклонения ei с моментами их получения i. При этом по оси абсцисс откладывают либо время получения статистических данных, либо порядковый номер наблюдения, а по оси ординат – отклонения ei (либо оценки отклонений).
    Естественно предположить, что если имеется определенная связь между отклонениями, то автокорреляция имеет место. Отсутствие зависимости скоре всего будет свидетельствовать об отсутствии автокорреляции.
    Автокорреляция становится более наглядной, если построить график зависимости ei от ei-1.

    Автор статьи: Татьяна Ефимова

    Позвольте представиться. Меня зовут Татьяна. Я уже более 8 лет занимаюсь психологией. Считая себя профессионалом, хочу научить всех посетителей сайта решать разнообразные задачи. Все данные для сайта собраны и тщательно переработаны для того чтобы донести как можно доступнее всю необходимую информацию. Перед применением описанного на сайте всегда необходима ОБЯЗАТЕЛЬНАЯ консультация с профессионалами.

    Обо мнеОбратная связь
  • Оценка 5 проголосовавших: 3
    ПОДЕЛИТЬСЯ

    ОСТАВЬТЕ ОТВЕТ

    Please enter your comment!
    Please enter your name here