Home Икономика СТАТИСТИЧЕСКО ОЦЕНЯВАНЕ ЧРЕЗ ИЗВАДКИ

SMS Login

За да използвате ПЪЛНОТО съдържание на сайта изпратете SMS с текст STG на номер 1092 (обща стойност 2.40лв.)


SMS e валиден 1 час
СТАТИСТИЧЕСКО ОЦЕНЯВАНЕ ЧРЕЗ ИЗВАДКИ ПДФ Печат Е-мейл

СТАТИСТИЧЕСКО ОЦЕНЯВАНЕ ЧРЕЗ ИЗВАДКИ

6.1. Извадки

Извадката играе ролята на представител на основната съвкупност. За да бъде представителна тя трябва да е съставена чрез случаен подбор на единиците, които се включват в нея, като се даде равна възможност (шанс) на всяка единица от основната съвкупност да попадне в извадката. Представителността на извадките зависи и от броя на обхванатите случаи - нейният обем, който трябва да бъде достатъчно голям.

Случайният подбор на единиците в· извадката може да бъде извършен по различен начин. В някои случаи се използват таблици за случайни числа, съдържащи колони от числа записани в случайна последователност (приложение 8).  Започвайки от случайно избрани страница, колона в страницата и начален ред, през случайно определен интервал, се избират n на брой числа, колкото е обемът на извадката. Единиците на съвкупността, от която се прави извадката, предварително се номерират. В извадката попадат тези единици, чиито номера съвпадат с избраните случайни числа. Когато единиците на основната съвкупност са групирани в подмножества се прилага т. нар. гнездо в подбор. От случайно избрани гнезда в извадката се включват всички или само част, случайно избрани, единици. Прилагат се дву-­ или повече степен ни гнездови извадки. Като случайни числа се ползват и т.нар. псевдослучайни числа, получени от компютър при определен закон за вероятностите. Често използвано е равномерно разпределение, при което всички стойности имат еднаква вероятност за поява.

Разграничават се два начина на случаен подбор на единиците в извадката. Единият е, когато единицата от основната съвкупност, попаднала веднъж в извадката, не може да попадне в нея втори път, наречен подбор без връщане, или безповторен подбор. При втория начин всяка единица може да попадне в извадката повече от един пъти, поради което е наречен подбор с връщане или повторен подбор.

В практиката се различават още механичен и типов подбор. При механичния извадката се образува като от основната съвкупност, през определен интервал, се подбират единиците, които се включват в нея. Типовият подбор се прилага, когато основната съвкупност се състои от постоянни групи, k на брой, с обем  Mi,           i = 1, 2 ,…, k, като  . При обем на извадката n единици, от всяка група се избират mi единици, т. е.  .

6.2. Оценки на параметрите на разпределението

Задачата за оценяване на параметрите се формулира по следния начин. Разглежда се случайната величина Х, със закон на разпределение f(X, ), където  параметър на разпределението. Числовата стойност на е за основната съвкупност е неизвестна. Търси се оценка за нея по извадка от съвкупността. Прието е числовите описателни характеристики на извадките да се наричат извадкови статистики, а тези на основната съвкупност параметри. Разграничават се три вида оценки: точечни, интервални и оценки на хипотези.

За качеството на оценките се съди по това дали задоволяват изискванията за състоятелност, неизместеност, ефективност и достатъчност, разглеждани като свойства, които те притежават или не притежават.

Свойства:

1) Състоятелност на оценката. Оценката на параметъра на генералната съвкупност  e състоятелна, ако при неограничено нарастване на обема на извадката, стойността на оценката клони към стойността на оценявания параметър, т. е.  , където  е произволно малко число. Същото се представя с условието  , когато n ,  т.е. математическото очакване на квадрата от разликата между стойността на оценката и стойността на оценявания параметър клони към нула, когато n.

2) Неизместеност (безпристрастност).

Величинатае неизместена (безпристрастна) оценка на , когато нейното математическо очакване е равно на стойността на оценявания параметър, т. е. когато  .

Средната стойност на извадката е безпристрастна оценка на средната на генералната съвкупност µ, тъй като E(X) = µ.

Дисперсията на извадката, изчислена по формулата

е изместена оценка на дисперсията на генералната съвкупност 2. Доказва се, че , от където .

Величината  изчислена при степени на свобода n -1 е безпристрастна оценка на 2, тъй като Е(S2) = 2.

3) Ефективност. Неизместената оценка  е ефективна (или ефикасна) оценка на параметъра , ако нейната дисперсия от стойността на оценявания параметър е най-малка в сравнение с дисперсията на други оценки, т.е. ефективна е тази оценка, която задоволява условието

,   i=1, 2, … .

От две неизместени оценки  и  ефективна е тази, която има най-малка дисперсия, т.е. неизместена оценка е  ако

. Отношението  се нарича относителна ефективност.

 

4) Достатъчност (изчерпателност). Нека е направена извадка от n елемента със стойности на Х равни на x1, x2 ,…, хn. Оценката , получена от извадката, е достатъчна (изчерпваща), ако с нея се изчерпва цялата информация за оценявания параметър е, която извадката може да даде или, по определението на Р. Фишер, статистиката  изчерпва цялата информация за , която се съдържа в извадката. Това означава, че всички данни за параметъра  се съдържат в , и че допълнителни сведения за стойностите на x1, x2 ,…, хn, за които       (x1, x2 ,…, хn) = , във вид на други статистики, изразени чрез тези стойности, не могат да допълнят сведенията за е. Изборът на достатъчна оценка се предпочита, тъй като в общия случай такава оценка е ефективна.

6.3. Извадкови разпределения

Чрез извадките се получават числови стойности за оценяваните параметри на основната съвкупност. Разпределението            на вероятностите на извадковите статистики, представено        с относителните им честоти (честоти), се нарича извадково разпределение. Ако от k извадки са получени извадкови средни X1, X2, … , Xk с относителни честоти         w1, w2, ..., wk, множеството от тези величини представлява разпределението на извадковата средна.

Извадковите разпределения имат свойства, върху които се основават извадковите изследвания. Нека Х е нормално разпределена случайна величина със средна µ и дисперсия 2. От основната съвкупност се правят множество извадки, по които се определя разпределението на вероятностите на извадковите средни (Xj за j-тa извадка). За извадковото разпределение на X, получено от k независими извадки, се доказват следните свойства:

1) Средната  на извадковото разпределение на средните Xj е неизместена оценка на средната на основната съвкупност,     т.е.

2) Средната аритметична , изчислена от средните на     k независими наблюдения на случайната величина Х, имаща математическо очакване µ и дисперсия 2, е състоятелна оценка на µ, т. е. за нея важи

3) Дисперсията на случайната величина X, получена от k независими случайни извадки, се определя като

(6.2)

където k е броят на извадките.

За основна съвкупност с неограничен размер, при извадки с повторен подбор, съставени от n единици

(6.3)

където n е размерът на извадката. Стандартното отклонение на извадковата средна X се нарича стандартна грешка на извадковото разпределение и е равно на

Когато извадката е направена от съвкупност с краен брой единици и с безповторен подбор, дисперсията на извадковата средна X се определя като

От формулата се вижда, че ако n = N, тогава, т.е. средните на извадките съвпадат със средната на основната съвкупност. При голямо N множителят  има стойност близка до 1 и може да бъде пренебрегнат.

4) Разпределението на извадковата статистика X е приблизително нормално, когато обемът на извадката е голям. Това свойство се доказва с централната гранична (пределна) теорема, която гласи: за извадки с голям обем средната X на извадка от основна съвкупност със средна µ и дисперсия 2 има извадково разпределение, което е близко до нормалното, независимо от вероятностното разпределение на съвкупността, от която е направена извадката. По-големият обем на извадката дава по-добро приближение на извадковото разпределение на X до нормалното.

6.4. Оценяване средната на генерална съвкупност

Доверителен интервал

Нека се разглежда случайната величина Х с математическо очакване µ и дисперсия 2. В резултат на извадка е получена оценка X на средната на основната съвкупност. Ако бъдат осъществени повече от една извадки ще се получат, в общия случай, различни стойности на X. Всичките те са точкови оценки на средната на генералната съвкупност µ.

Интервалната оценка е формула, която показва как по данните от извадката да се определи интервал, който оценява параметъра на основната съвкупност. По тази формула се определят числовите стойности на интервала, в който, с определена вероятност, може да се твърди, че се намира стойността на оценявания параметър. Съгласно централната гранична теорема, при голям обем на извадката (n  30), извадковата средна има разпределение близко до нормалното, което позволява да се използват неговите свойства. За параметъра µ може да бъдат определени интервал ни оценки от вида   , , , … .

Графично, за стойности  разпределението на площта под нормалната крива е показано на фигypата.

Вероятност, определена като (1 - ), за дадена стойност на , се нарича коефициент на доверителност (увереност). Коефициентът на доверителност, измерен в процент като       100(1-)%, се нарича равнище на доверителност (увереност). Числото , наричано равнище на значимост, показва частта от общата площ под нормалната крива, която е извън площта, съответстваща на интервала, определен от коефициента на доверителност. Тъй като разпределението е симетрично, от двете страни на тази площ е разположена площ равна на /2 .

За нормираната величина , която има нормално разпределение с математическо очакване µ=0 и дисперсия 2 = 1, при дадено , площта под нормалната крива се представя както на фигура

За случайната величина Х, при дадена стойност на , вероятността математическото очакване Е(Х) = µ да попадне в интервала          Х ± Z се определя като

, където стойността на Z се определя по таблицата в приложение 1.

Вероятността Z да попадне в интервала      E(Z) ± Z/2 се определя за стойност на Z/2, получена от приложение 2, като

P{-Z/2 < µz < Z/2 }.

Вероятността математическото очакване µ на случайната величина Х да попадне в интервала X ± Z/2, при голям брой изпитания, т.е.

, съответно

е равна на    (l-).

Интервалът

(6.4)

съответно е доверителен интервал, в който с вероятност, съответстваща на , може да се твърди, че се намира средната стойност на параметъра Х на основната съвкупност. Тук Z, респективно Z/2, е стойността на Z, за която съответно от ляво и от дясно е отграничена област с площ под нормалната крива равна на /2.

При големи извадки (n  30), когато не се разполага със стойностите на  и 2, доверителният интервал се определя като

(6.5)

съответно,

, където

е неизместена оценка на , получена от извадка. Така определеният доверителен интервал с равнище на увереност 100(1-)%, респективно коефициент на увереност (1-), дава основание да се твърди с вероятност (1-), че стойността на µx се намира в границите на интервала. Величината  се нарича средна стохастична грешка, а - максимална стохастична грешка.

6.5. Определяне размера на извадката

Размерът на извадката зависи от ширината на интервала, в който попада стойността на µ, и равнището на увереност, че тя ще попадне в него. Нас ни интересува вероятността µ да попадне в интервала X ± Z/2 с равнище на увереност 100(1-)%. Приема се максималната стохастична грешка да се означи с .  От тук при зададени стойности на ,   и  Z/2 и  величината на n се определя от съотношението

(6.5)

Стойността на максималната грешка се задава по предварително приети съображения.

Когато вместо със  се разполага с изчислената по данни от извадка величина S, се изчислява . Ако , тогава и съответно .

 

 

WWW.POCHIVKA.ORG