Пример регресионен анализ

Цели и задачи на регресионен анализ

Основната цел регресионен анализ е да се определи аналитичен форма на комуникация, в която промяната в ефективно характеристика поради влиянието на един или повече фактора променливи и множество други фактори, също така засяга резултат атрибут се приема като постоянни и средните стойности.






Задачи регресионен анализ.
а) създава форми на зависимост. Естеството и формата на връзката между явленията разграничи положителен линейни и нелинейни и отрицателна линейна и нелинейна регресия.
б) Определяне на регресионна функция под формата на математически уравнения от определен тип и да се установи влиянието на обяснителни променливи върху зависимата променлива.
в) измерване на неизвестни стойности на зависимата променлива. С помощта на функция регресия може да възпроизвежда стойности на зависимата променлива в рамките на зададените стойности на обяснителни променливи (т.е.. Е. решаване на проблема с интерполация) или оценява по време на процеса е предварително определен интервал (т. Е. екстраполация реши проблема). Резултатът е стойност оценка на зависимата променлива.

Парна регресия - уравнението на връзка между две променливи у и х. Когато Y - зависимата променлива (симптом резултат); х - независим, обяснителна променлива (черта-фактор).

Разграничаване между линейни и нелинейна регресия.
Линейна регресия: у = а + BX + ε
Нелинейна регресия разделени в два класа: регресия, нелинейни по отношение на включени в анализа на обяснителни променливи, но линейни в очакваните параметри и регресия нелинейна в определените параметри.
Регресия, нелинейна в обяснителните променливи:
  • полиноми на различни степени
  • равностранен хипербола.
Регресия, нелинейна в очакваните параметри:
  • на захранване
  • показателен
  • показателен
Изграждане на регресионното уравнение се свежда до оценка на параметрите му. За оценка на параметрите на регресия, линейни параметри чрез използване на метода на най-малките квадрати (OLS). OLS позволява да се получат такива параметри за оценка, за които сумата от квадратите на отклоненията на действителните стойности на ефективно характеристика на теоретичния минимум, т.е.
.
За линейни и нелинейни уравнения редуцируеми до линейна, следната система се решава по отношение на А и В:

Можете да използвате готови формули, които са получени от тази система:

Стягане комуникационни явления, които се проучват оценява коефициентът на линейна корелация за двойката линейна регресия:

и индекса на корелация - за нелинейна регресия:

Оценка на качеството на конструираната модел ще фактор (индекс) определяне, както и средната грешка приближение.
Средната приближение грешка - средният отклонение на изчислените стойности от действителните:
.
допустимата гранична стойност - не повече от 8-10%.






Средната коефициент на еластичност показва процента на средните съвкупни промяната в резултат от тяхната средна аритметична стойност по време на смяна на х коефициент на 1% от нейната средна стойност:
.

ANOVA анализ задача е зависима променлива дисперсията:
,
където - общата сумата от квадратите на отклоненията;
- сумата от квадратите на отклоненията, дължащи се на регресия ( "обяснение" или "Фактор");
- остатъчната сума от квадратите на отклоненията.
Фракцията на дисперсията, обяснената регресия, общо дисперсия Получената променлива Y характеризира определяне съотношение (индекс) на R 2.

Коефициентът на определяне - квадрата на коефициента на корелация или индекс.

F-тест - оценката на качеството на регресионното уравнение - е да се тества хипотезата, но статистически значимо регресия уравнение, а индексът на близостта на връзката. За тази сравнява действителната и критична Ffakt (таблици) Ftabl стойности Фишер F-тест. Ffakt определя от съотношението на стойностите на фактор и остатъчни отклонения изчислени за една степен на свобода:
,
където п - брой на единици заедно; m - брой параметри в променлива х.
Ftabl - е максималната възможна стойност на критерия под влиянието на случайни фактори в тези степени на свобода и ниво на значимост а. Степента на значимост а - вероятността за отхвърляне на правилната хипотеза, при условие, че тя е вярна. Обикновено се приема равна на 0,05 или 0,01.
Ако Ftabl Ffakt. Но хипотезата не е отхвърлена и призната статистическа незначимост, ненадеждността на уравнението на регресия.
За да се оцени статистическата значимост на регресионните коефициенти и т-критерий корелация изчислява Студентски и доверителните интервали за всеки от показателите. Но една хипотеза за случаен характер на показатели, т.е. незначителен разлика от нула. Оценка на значимостта на регресионни коефициенти и корелация, използвайки т-тест на Student се извършва чрез сравняване на техните стойности със стойността на случайната грешка:
; ; ,
Случайни грешки линейни регресионни параметри и коефициента на корелация се определят от формулите:



Чрез сравняване на действителните и критични (таблица) стойности на Т-статистика - ttabl и tfakt - ние приеме или отхвърли хипотезата Хо.
Комуникацията между критерий F-Fisher и т-статистика на Student се изразява с уравнението

Ако ttabl Но tfakt хипотезата не е отхвърлена и призна случаен характер на образуването на а, б, или.
За изчисляване на доверителни интервали се определи границата на грешка за D на всеки индекс:
, .
Формула за изчисляване на доверителни интервали са както следва:
; ;
; ;
Ако границите на доверителния интервал е сигнализирано нула, т.е. долната граница е отрицателен, а горната е положителен, оценява параметър е нула, тъй като не могат едновременно да получат и положителни и отрицателни стойности.
Прогнозна стойност се определя чрез заместване в уравнението на регресия съответстваща (очакваните стойности). Изчислява се средната стандартна грешка на прогноза:
,
където
и изгражда доверителен интервал на прогнозите:
; ;
къде.

например разтвори

Задача №1. Седем територии на област Урал за 199H на стойностите на двата знака.
Таблица 1.

Разходи за закупуване на храна в общите разходи,%, при

Средният дневен заплата на един служител, RUR. х

Стойностите на регресионни параметри А и В са както следва:

Уравнението:
индекс корелация.

Съгласно уравнение равностранен хипербола най-висок резултат, получен ограниченост на комуникация (в сравнение с линеен, експоненциална и експоненциални регресии). остава на приемливо ниво: 8,1%


където F = Таблица 6.6> F Всъщност, когато а = 0,05.
Ето защо, на хипотезата, но статистически незначими параметрите на уравнението. Този резултат може да се обясни с относително ниска плътност, определени зависимости и малък брой наблюдения.