Шпора з економетрики
– загальна сума квадратів,
– пояснена сума квадратів, або сума квадратів регресії
–сума квадратів залишків.
Загальна сума квадратів пропорційна до вибіркової дисперсії залежної змінної. Пояснена сума квадратів пропорційна до вибіркової дисперсії незалежної змінної. Отже, дисперсія залежної змінної складається з двох частин. Перша виникає завдяки розкиду значень незалежної змінної. Тобто, ця частина пояснюється за рахунок моделі (звідси і назва – пояснена сума квадратів). Друга частина – сума квадратів залишків – виникає внаслідок збурень і не пояснюється за рахунок моделі. Записавши співвідношення (1.15) з урахуванням уведених позначень, одержимо формулу розкладу дисперсії:
(1.16).
Коефіціент детермінаціїї визначається як частка поясненої і загальної сум квадратів
(1.17).
Для обчислення коефіціента детермінації можна користуватись такими формулами
. (1.17а)
Коефіціент детермінації є частиною дисперсії залежної змінної , яка пояснюється за рахунок моделі, або, іншими словами, завдяки мінливості незалежної змінної. Коефіціент детермінації є мірою тісноти саме лінійного звязку між x та y. Коефіціент детермінації завжди знаходиться в межах від нуля до одиниці. Чим ближче до 1, тим точніше x пояснює y. Якщо = 1, це означає, що всі значення x та y лежать на одній прямій. Якщо = 0 ,то лінія регресії – горизонтальна пряма; це означає відсутність (лінійного) звязку між змінними. Коефіціент детермінації є мірою згоди регресії. Проілюструємо сказане графічно. На Рис. 1.2 зображено три набори даних по 100 спостережень в кожному, утворені за допомогою датчика випадкових чисел, разом з вибірковими регресійними прямими, знайденими за домогою методу найменших квадратів. В кожному випадку розраховано коефіцієнт детермінації.
7. Статистичні в-ті оцінок МНК
Оцінки методу найменших квадратів є незміщеними :
Eb = , Ea = .
Дисперсії та коваріація оцінок методу найменших квадратів обчислюються за наступними формулами:
(1.18)
Наведені формули не можна використовувати для перевірки гіпотез та інтервального оцінювання, оскільки до них входить невідомий параметр – дисперсія збурень 2 . Отже, нам потрібно вміти знаходити її оцінку. Має місце наступний результат: статистика
є незміщеною оцінкою 2. Якщо збурення нормально розподілені, то a та b також нормально розподілені. Величина
має 2 - розподіл з n - 2 ступенями свободи. Більше того, випадкова величина RSS не залежить від a та b.
Далі ми будемо припускати, що збурення нормально розподілені. Як відомо, якщо випадкові величини 1~N(0,1), 2~ незалежні) , то
має розподіл Стьюдента з p ступенями свободи.