Най-четените учебни материали
Най-новите учебни материали
SMS Login
За да използвате ПЪЛНОТО съдържание на сайта изпратете SMS с текст STG на номер 1092 (обща стойност 2.40лв.)СТАТИСТИЧЕСКО ОЦЕНЯВАНЕ ЧРЕЗ ИЗВАДКИ |
![]() |
![]() |
![]() |
СТАТИСТИЧЕСКО ОЦЕНЯВАНЕ ЧРЕЗ ИЗВАДКИ 6.1. Извадки Извадката играе ролята на представител на основната съвкупност. За да бъде представителна тя трябва да е съставена чрез случаен подбор на единиците, които се включват в нея, като се даде равна възможност (шанс) на всяка единица от основната съвкупност да попадне в извадката. Представителността на извадките зависи и от броя на обхванатите случаи - нейният обем, който трябва да бъде достатъчно голям. Случайният подбор на единиците в· извадката може да бъде извършен по различен начин. В някои случаи се използват таблици за случайни числа, съдържащи колони от числа записани в случайна последователност (приложение 8). Започвайки от случайно избрани страница, колона в страницата и начален ред, през случайно определен интервал, се избират n на брой числа, колкото е обемът на извадката. Единиците на съвкупността, от която се прави извадката, предварително се номерират. В извадката попадат тези единици, чиито номера съвпадат с избраните случайни числа. Когато единиците на основната съвкупност са групирани в подмножества се прилага т. нар. гнездо в подбор. От случайно избрани гнезда в извадката се включват всички или само част, случайно избрани, единици. Прилагат се дву- или повече степен ни гнездови извадки. Като случайни числа се ползват и т.нар. псевдослучайни числа, получени от компютър при определен закон за вероятностите. Често използвано е равномерно разпределение, при което всички стойности имат еднаква вероятност за поява. Разграничават се два начина на случаен подбор на единиците в извадката. Единият е, когато единицата от основната съвкупност, попаднала веднъж в извадката, не може да попадне в нея втори път, наречен подбор без връщане, или безповторен подбор. При втория начин всяка единица може да попадне в извадката повече от един пъти, поради което е наречен подбор с връщане или повторен подбор. В практиката се различават още механичен и типов подбор. При механичния извадката се образува като от основната съвкупност, през определен интервал, се подбират единиците, които се включват в нея. Типовият подбор се прилага, когато основната съвкупност се състои от постоянни групи, k на брой, с обем Mi, i = 1, 2 ,…, k, като . При обем на извадката n единици, от всяка група се избират mi единици, т. е. . 6.2. Оценки на параметрите на разпределението Задачата за оценяване на параметрите се формулира по следния начин. Разглежда се случайната величина Х, със закон на разпределение f(X, ), където параметър на разпределението. Числовата стойност на е за основната съвкупност е неизвестна. Търси се оценка за нея по извадка от съвкупността. Прието е числовите описателни характеристики на извадките да се наричат извадкови статистики, а тези на основната съвкупност параметри. Разграничават се три вида оценки: точечни, интервални и оценки на хипотези. За качеството на оценките се съди по това дали задоволяват изискванията за състоятелност, неизместеност, ефективност и достатъчност, разглеждани като свойства, които те притежават или не притежават. Свойства: 1) Състоятелност на оценката. Оценката на параметъра на генералната съвкупност e състоятелна, ако при неограничено нарастване на обема на извадката, стойността на оценката клони към стойността на оценявания параметър, т. е. , където е произволно малко число. Същото се представя с условието , когато n , т.е. математическото очакване на квадрата от разликата между стойността на оценката и стойността на оценявания параметър клони към нула, когато n. 2) Неизместеност (безпристрастност). Величинатае неизместена (безпристрастна) оценка на , когато нейното математическо очакване е равно на стойността на оценявания параметър, т. е. когато . Средната стойност на извадката е безпристрастна оценка на средната на генералната съвкупност µ, тъй като E(X) = µ. Дисперсията на извадката, изчислена по формулата е изместена оценка на дисперсията на генералната съвкупност 2. Доказва се, че , от където . Величината изчислена при степени на свобода n -1 е безпристрастна оценка на 2, тъй като Е(S2) = 2. 3) Ефективност. Неизместената оценка е ефективна (или ефикасна) оценка на параметъра , ако нейната дисперсия от стойността на оценявания параметър е най-малка в сравнение с дисперсията на други оценки, т.е. ефективна е тази оценка, която задоволява условието , i=1, 2, … . От две неизместени оценки и ефективна е тази, която има най-малка дисперсия, т.е. неизместена оценка е ако . Отношението се нарича относителна ефективност.
4) Достатъчност (изчерпателност). Нека е направена извадка от n елемента със стойности на Х равни на x1, x2 ,…, хn. Оценката , получена от извадката, е достатъчна (изчерпваща), ако с нея се изчерпва цялата информация за оценявания параметър е, която извадката може да даде или, по определението на Р. Фишер, статистиката изчерпва цялата информация за , която се съдържа в извадката. Това означава, че всички данни за параметъра се съдържат в , и че допълнителни сведения за стойностите на x1, x2 ,…, хn, за които (x1, x2 ,…, хn) = , във вид на други статистики, изразени чрез тези стойности, не могат да допълнят сведенията за е. Изборът на достатъчна оценка се предпочита, тъй като в общия случай такава оценка е ефективна. 6.3. Извадкови разпределения Чрез извадките се получават числови стойности за оценяваните параметри на основната съвкупност. Разпределението на вероятностите на извадковите статистики, представено с относителните им честоти (честоти), се нарича извадково разпределение. Ако от k извадки са получени извадкови средни X1, X2, … , Xk с относителни честоти w1, w2, ..., wk, множеството от тези величини представлява разпределението на извадковата средна. Извадковите разпределения имат свойства, върху които се основават извадковите изследвания. Нека Х е нормално разпределена случайна величина със средна µ и дисперсия 2. От основната съвкупност се правят множество извадки, по които се определя разпределението на вероятностите на извадковите средни (Xj за j-тa извадка). За извадковото разпределение на X, получено от k независими извадки, се доказват следните свойства: 1) Средната на извадковото разпределение на средните Xj е неизместена оценка на средната на основната съвкупност, т.е. 2) Средната аритметична , изчислена от средните на k независими наблюдения на случайната величина Х, имаща математическо очакване µ и дисперсия 2, е състоятелна оценка на µ, т. е. за нея важи 3) Дисперсията на случайната величина X, получена от k независими случайни извадки, се определя като (6.2) където k е броят на извадките. За основна съвкупност с неограничен размер, при извадки с повторен подбор, съставени от n единици (6.3) където n е размерът на извадката. Стандартното отклонение на извадковата средна X се нарича стандартна грешка на извадковото разпределение и е равно на Когато извадката е направена от съвкупност с краен брой единици и с безповторен подбор, дисперсията на извадковата средна X се определя като От формулата се вижда, че ако n = N, тогава, т.е. средните на извадките съвпадат със средната на основната съвкупност. При голямо N множителят има стойност близка до 1 и може да бъде пренебрегнат. 4) Разпределението на извадковата статистика X е приблизително нормално, когато обемът на извадката е голям. Това свойство се доказва с централната гранична (пределна) теорема, която гласи: за извадки с голям обем средната X на извадка от основна съвкупност със средна µ и дисперсия 2 има извадково разпределение, което е близко до нормалното, независимо от вероятностното разпределение на съвкупността, от която е направена извадката. По-големият обем на извадката дава по-добро приближение на извадковото разпределение на X до нормалното. 6.4. Оценяване средната на генерална съвкупност Доверителен интервал Нека се разглежда случайната величина Х с математическо очакване µ и дисперсия 2. В резултат на извадка е получена оценка X на средната на основната съвкупност. Ако бъдат осъществени повече от една извадки ще се получат, в общия случай, различни стойности на X. Всичките те са точкови оценки на средната на генералната съвкупност µ. Интервалната оценка е формула, която показва как по данните от извадката да се определи интервал, който оценява параметъра на основната съвкупност. По тази формула се определят числовите стойности на интервала, в който, с определена вероятност, може да се твърди, че се намира стойността на оценявания параметър. Съгласно централната гранична теорема, при голям обем на извадката (n 30), извадковата средна има разпределение близко до нормалното, което позволява да се използват неговите свойства. За параметъра µ може да бъдат определени интервал ни оценки от вида , , , … . Графично, за стойности разпределението на площта под нормалната крива е показано на фигypата. Вероятност, определена като (1 - ), за дадена стойност на , се нарича коефициент на доверителност (увереност). Коефициентът на доверителност, измерен в процент като 100(1-)%, се нарича равнище на доверителност (увереност). Числото , наричано равнище на значимост, показва частта от общата площ под нормалната крива, която е извън площта, съответстваща на интервала, определен от коефициента на доверителност. Тъй като разпределението е симетрично, от двете страни на тази площ е разположена площ равна на /2 . За нормираната величина , която има нормално разпределение с математическо очакване µ=0 и дисперсия 2 = 1, при дадено , площта под нормалната крива се представя както на фигура За случайната величина Х, при дадена стойност на , вероятността математическото очакване Е(Х) = µ да попадне в интервала Х ± Z се определя като , където стойността на Z се определя по таблицата в приложение 1. Вероятността Z да попадне в интервала E(Z) ± Z/2 се определя за стойност на Z/2, получена от приложение 2, като P{-Z/2 < µz < Z/2 }. Вероятността математическото очакване µ на случайната величина Х да попадне в интервала X ± Z/2, при голям брой изпитания, т.е. , съответно е равна на (l-). Интервалът (6.4) съответно е доверителен интервал, в който с вероятност, съответстваща на , може да се твърди, че се намира средната стойност на параметъра Х на основната съвкупност. Тук Z, респективно Z/2, е стойността на Z, за която съответно от ляво и от дясно е отграничена област с площ под нормалната крива равна на /2. При големи извадки (n 30), когато не се разполага със стойностите на и 2, доверителният интервал се определя като (6.5) съответно, , където е неизместена оценка на , получена от извадка. Така определеният доверителен интервал с равнище на увереност 100(1-)%, респективно коефициент на увереност (1-), дава основание да се твърди с вероятност (1-), че стойността на µx се намира в границите на интервала. Величината се нарича средна стохастична грешка, а - максимална стохастична грешка. 6.5. Определяне размера на извадката Размерът на извадката зависи от ширината на интервала, в който попада стойността на µ, и равнището на увереност, че тя ще попадне в него. Нас ни интересува вероятността µ да попадне в интервала X ± Z/2 с равнище на увереност 100(1-)%. Приема се максималната стохастична грешка да се означи с . От тук при зададени стойности на , и Z/2 и величината на n се определя от съотношението (6.5) Стойността на максималната грешка се задава по предварително приети съображения. Когато вместо със се разполага с изчислената по данни от извадка величина S, се изчислява . Ако , тогава и съответно .
|