Probabilitatea de încredere. Interval de încredere

INTERVALE DE ÎNCREDERE PENTRU FRECVENȚE ȘI FRACȚII

© 2008

Institutul Național de Sănătate Publică, Oslo, Norvegia

Articolul descrie și discută calculul intervalelor de încredere pentru frecvențe și proporții folosind metodele Wald, Wilson, Clopper - Pearson, folosind transformarea unghiulară și metoda Wald cu corecția Agresti - Coull. Materialul prezentat dă Informații generale despre metode de calculare a intervalelor de încredere pentru frecvențe și proporții și are scopul de a trezi interesul cititorilor de reviste nu numai pentru utilizarea intervalelor de încredere în prezentarea rezultatelor propriilor cercetări, ci și pentru citirea literaturii de specialitate înainte de a începe lucrul la viitoarele publicații.

Cuvinte cheie : interval de încredere, frecvență, proporție

Una dintre publicațiile anterioare a menționat pe scurt descrierea datelor calitative și a raportat că estimarea intervalului acestora este de preferat unei estimări punctuale pentru descrierea frecvenței de apariție a caracteristicii studiate în populatie. Într-adevăr, întrucât cercetarea este efectuată folosind date eșantionate, proiecția rezultatelor asupra populației trebuie să conțină un element de imprecizie a eșantionării. Intervalul de încredere este o măsură a acurateței parametrului estimat. Este interesant că unele cărți despre statistici de bază pentru medici ignoră complet subiectul intervalelor de încredere pentru frecvențe. În acest articol vom analiza mai multe moduri de a calcula intervalele de încredere pentru frecvențe, implicând astfel de caracteristici ale eșantionului precum nerepetiția și reprezentativitatea, precum și independența observațiilor unele față de altele. În acest articol, frecvența nu înseamnă număr absolut, arătând de câte ori aceasta sau acea valoare apare în agregat și valoarea relativă, care determină proporția de participanți la studiu la care apare caracteristica studiată.

În cercetarea biomedicală, intervalele de încredere de 95% sunt cel mai frecvent utilizate. Acest interval de încredere este zona în care proporția reală se încadrează în 95% din timp. Cu alte cuvinte, putem spune cu o fiabilitate de 95% că adevărata valoare a frecvenței de apariție a unei trăsături în populație va fi în intervalul de încredere de 95%.

Majoritatea manualelor de statistică pentru cercetătorii medicali raportează că eroarea de frecvență este calculată folosind formula

unde p este frecvența de apariție a caracteristicii în eșantion (valoare de la 0 la 1). Majoritatea articolelor științifice interne indică frecvența de apariție a unei trăsături într-un eșantion (p), precum și eroarea (e) acesteia sub forma p ± s. Este mai indicat, însă, să se prezinte un interval de încredere de 95% pentru frecvența de apariție a unei trăsături în populație, care va include valori de la

inainte de.

Unele manuale recomandă ca pentru eșantioane mici să înlocuiți valoarea de 1,96 cu valoarea lui t pentru N – 1 grade de libertate, unde N este numărul de observații din eșantion. Valoarea t este găsită din tabelele pentru distribuția t, disponibile în aproape toate manualele de statistică. Utilizarea distribuției t pentru metoda Wald nu oferă avantaje vizibile în comparație cu alte metode discutate mai jos și, prin urmare, nu este recomandată de unii autori.

Metoda prezentată mai sus pentru calcularea intervalelor de încredere pentru frecvențe sau proporții este numită Wald în onoarea lui Abraham Wald (1902–1950), deoarece utilizarea sa pe scară largă a început după publicarea lui Wald și Wolfowitz în 1939. Cu toate acestea, metoda în sine a fost propusă de Pierre Simon Laplace (1749–1827) încă din 1812.

Metoda Wald este foarte populară, dar aplicarea ei este asociată cu probleme semnificative. Metoda nu este recomandată pentru eșantioane de dimensiuni mici, precum și în cazurile în care frecvența de apariție a unei caracteristici tinde spre 0 sau 1 (0% sau 100%) și este pur și simplu imposibilă pentru frecvențele de 0 și 1. În plus, aproximarea distribuției normale, care este utilizată la calcularea erorii, „nu funcționează” în cazurile în care n · p< 5 или n · (1 – p) < 5 . Более консервативные статистики считают, что n · p и n · (1 – p) должны быть не менее 10 . Более детальное рассмотрение метода Вальда показало, что полученные с его помощью доверительные интервалы в большинстве случаев слишком узки, то есть их применение ошибочно создает слишком оптимистичную картину, особенно при удалении частоты встречаемости признака от 0,5, или 50 % . К тому же при приближении частоты к 0 или 1 доверительный интревал может принимать отрицательные значения или превышать 1, что выглядит абсурдно для частот. Многие авторы совершенно справедливо не рекомендуют применять данный метод не только в уже упомянутых случаях, но и тогда, когда частота встречаемости признака менее 25 % или более 75 % . Таким образом, несмотря на простоту расчетов, метод Вальда может применяться лишь в очень ограниченном числе случаев. Зарубежные исследователи более категоричны в своих выводах и однозначно рекомендуют не применять этот метод для небольших выборок , а ведь именно с такими выборками часто приходится иметь дело исследователям-медикам.

Deoarece noua variabilă este distribuită în mod normal, limitele inferioare și superioare ale intervalului de încredere de 95% pentru variabila φ vor fi φ-1,96 și φ+1,96 stânga">

În loc de 1,96 pentru probele mici, se recomandă înlocuirea valorii t cu N – 1 grade de libertate. Această metodă nu dă valori negativeși permite estimări mai precise ale intervalelor de încredere pentru frecvențe decât metoda Wald. În plus, este descris în multe cărți interne de referință privind statistica medicală, ceea ce, totuși, nu a condus la utilizarea sa pe scară largă în cercetarea medicală. Calcularea intervalelor de încredere folosind transformarea unghiulară nu este recomandată pentru frecvențele care se apropie de 0 sau 1.

Aici se termină de obicei descrierea metodelor de estimare a intervalelor de încredere în majoritatea cărților despre bazele statisticii pentru cercetătorii medicali, iar această problemă este tipică nu numai pentru literatura națională, ci și pentru literatura străină. Ambele metode se bazează pe teorema limită centrală, care implică un eșantion mare.

Ținând cont de neajunsurile estimării intervalelor de încredere folosind metodele de mai sus, Clopper și Pearson au propus în 1934 o metodă de calcul a așa-numitului interval de încredere exact, având în vedere distribuția binomială a trăsăturii studiate. Această metodă este disponibilă în multe calculatoare online, dar intervalele de încredere obținute astfel sunt în majoritatea cazurilor prea largi. În același timp, această metodă este recomandată pentru utilizare în cazurile în care este necesară o evaluare conservatoare. Gradul de conservativitate al metodei crește pe măsură ce dimensiunea eșantionului scade, mai ales când N< 15 . описывает применение функции биномиального распределения для анализа качественных данных с использованием MS Excel, в том числе и для определения доверительных интервалов, однако расчет последних для частот в foi de calcul nu este „tabulat” într-o formă ușor de utilizat și, prin urmare, probabil că nu este folosit de majoritatea cercetătorilor.

Potrivit multor statisticieni, cea mai optimă evaluare a intervalelor de încredere pentru frecvențe este realizată prin metoda Wilson, propusă încă din 1927, dar practic neutilizată în cercetarea biomedicală internă. Această metodă nu numai că permite estimarea intervalelor de încredere atât pentru frecvențe foarte mici, cât și pentru frecvențe foarte mari, dar este și aplicabilă pentru un număr mic de observații. ÎN vedere generala Intervalul de încredere conform formulei lui Wilson are forma



unde ia valoarea 1,96 la calcularea intervalului de încredere de 95%, N este numărul de observații, iar p este frecvența de apariție a caracteristicii în eșantion. Această metodă este disponibilă în calculatoarele online, astfel încât utilizarea sa nu este problematică. și nu recomandăm utilizarea acestei metode pentru n p< 4 или n · (1 – p) < 4 по причине слишком грубого приближения распределения р к нормальному в такой ситуации, однако зарубежные статистики считают метод Уилсона применимым и для малых выборок .

Pe lângă metoda Wilson, se crede că metoda Wald cu corecție Agresti-Coll oferă o estimare optimă a intervalului de încredere pentru frecvențe. Corecția Agresti-Coll este o înlocuire în formula Wald a frecvenței de apariție a unei caracteristici într-un eșantion (p) cu p`, la calculul care 2 se adaugă la numărător și 4 se adaugă la numitor, adică p` = (X + 2) / (N + 4), unde X este numărul de participanți la studiu care au caracteristica studiată și N este dimensiunea eșantionului. Această modificare produce rezultate foarte asemănătoare cu formula lui Wilson, cu excepția cazului în care frecvența evenimentelor se apropie de 0% sau 100% și eșantionul este mic. Pe lângă metodele de mai sus pentru calcularea intervalelor de încredere pentru frecvențe, au fost propuse corecții de continuitate atât pentru metodele Wald, cât și pentru cele Wilson pentru eșantioane mici, dar studiile au arătat că utilizarea lor este inadecvată.

Să luăm în considerare aplicarea metodelor de mai sus pentru calcularea intervalelor de încredere folosind două exemple. În primul caz, studiem un eșantion mare de 1.000 de participanți la studiu selectați aleatoriu, dintre care 450 au trăsătura studiată (aceasta ar putea fi un factor de risc, un rezultat sau orice altă trăsătură), reprezentând o frecvență de 0,45 sau 45. %. În al doilea caz, studiul se desfășoară folosind un eșantion mic, să zicem, doar 20 de persoane și doar 1 participant la studiu (5%) are trăsătura studiată. Intervale de încredere conform metodei Wald, conform metodei Wald cu corectie Agresti-Coll, conform metodei Wilson au fost calculate folosind un calculator online dezvoltat de Jeff Sauro (http://www. /wald. htm). Intervalele de încredere corectate ale lui Wilson au fost calculate utilizând calculatorul furnizat de Wassar Stats: Web Site for Statistical Computation (http://faculty.vassar.edu/lowry/prop1.html). Calculele folosind Transformarea Angular Fisher au fost efectuate „manual” folosind valoare critica t pentru 19 și, respectiv, 999 de grade de libertate. Rezultatele calculului sunt prezentate în tabel pentru ambele exemple.

Intervalele de încredere calculate în șase moduri diferite pentru două exemple descrise în text

Metoda de calcul a intervalului de încredere

P=0,0500 sau 5%

95% CI pentru X=450, N=1000, P=0,4500 sau 45%

–0,0455–0,2541

Wald cu corectie Agresti–Coll

<,0001–0,2541

Wilson cu corecție de continuitate

„metoda exactă” Clopper-Pearson

Transformare unghiulară

<0,0001–0,1967

După cum se poate observa din tabel, pentru primul exemplu intervalul de încredere calculat folosind metoda Wald „general acceptată” intră în regiunea negativă, ceea ce nu poate fi cazul frecvențelor. Din păcate, astfel de incidente nu sunt neobișnuite în literatura rusă. Modul tradițional de prezentare a datelor în termeni de frecvență și eroarea acesteia maschează parțial această problemă. De exemplu, dacă frecvența de apariție a unei trăsături (în procente) este prezentată ca 2,1 ± 1,4, atunci aceasta nu este la fel de „ofensivă pentru ochi” ca 2,1% (IC 95%: -0,7; 4,9), deși și înseamnă același lucru. Metoda Wald cu corecția Agresti–Coll și calculul folosind transformarea unghiulară oferă o limită inferioară care tinde spre zero. Metoda lui Wilson corectată în funcție de continuitate și „metoda exactă” produc intervale de încredere mai largi decât metoda lui Wilson. Pentru al doilea exemplu, toate metodele dau aproximativ aceleași intervale de încredere (diferențele apar numai în miimi), ceea ce nu este surprinzător, deoarece frecvența de apariție a evenimentului din acest exemplu nu este mult diferită de 50%, iar dimensiunea eșantionului este destul de mare.

Pentru cititorii interesați de această problemă, le putem recomanda lucrările lui R. G. Newcombe și Brown, Cai și Dasgupta, care oferă avantajele și dezavantajele utilizării a 7 și, respectiv, 10 metode diferite pentru calcularea intervalelor de încredere. Dintre manualele interne, recomandăm cartea și, care, pe lângă o descriere detaliată a teoriei, prezintă metodele lui Wald și Wilson, precum și o metodă de calcul a intervalelor de încredere ținând cont de distribuția binomială a frecvenței. Pe lângă calculatoarele online gratuite (http://www. /wald. htm și http://faculty. vassar. edu/lowry/prop1.html), intervalele de încredere pentru frecvențe (și nu numai!) pot fi calculate folosind Programul CIA (Confidence Intervals Analysis), care poate fi descărcat de pe http://www. scoala medicala. soton. ac. uk/cia/ .

Următorul articol va analiza modalități univariate de a compara datele calitative.

Bibliografie

Banerji A. Statistica medicală în limbaj clar: un curs introductiv / A. Banerjee. – M.: Medicină practică, 2007. – 287 p. Statistici medicale / . – M.: Agenția de Informații Medicale, 2007. – 475 p. Glanz S. Statistică medicală şi biologică / S. Glanz. – M.: Praktika, 1998. Tipuri de date, testare de distribuție și statistică descriptivă // Ecologie umană – 2008. – Nr. 1. – P. 52–58. Zhizhin K. S.. Statistici medicale: manual / . – Rostov n/d: Phoenix, 2007. – 160 p. Statistici medicale aplicate / , . - St.Petersburg. : Foliot, 2003. – 428 p. Lakin G. F. Biometrie / . – M.: Şcoala superioară, 1990. – 350 p. Medicul V.A. Statistica matematică în medicină / , . – M.: Finanțe și Statistică, 2007. – 798 p. Statistica matematică în cercetarea clinică / , . – M.: GEOTAR-MED, 2001. – 256 p. Junkerov V. ȘI. Prelucrarea medicala si statistica a datelor de cercetare medicala / , . - St.Petersburg. : VmedA, 2002. – 266 p. Agresti A. Aproximat este mai bine decât exact pentru estimarea pe intervale a proporțiilor binomiale / A. Agresti, B. Coull // Statistician american. – 1998. – N 52. – P. 119–126. Altman D. Statistici cu încredere // D. Altman, D. Machin, T. Bryant, M. J. Gardner. – Londra: BMJ Books, 2000. – 240 p. Brown L.D. Estimarea intervalului pentru o proporție binomială / L. D. Brown, T. T. Cai, A. Dasgupta // Statistical science. – 2001. – N 2. – P. 101–133. Clopper C.J. Utilizarea limitelor de încredere sau fiduciale ilustrate în cazul binomului / C. J. Clopper, E. S. Pearson // Biometrika. – 1934. – N 26. – P. 404–413. Garcia-Perez M.A. Despre intervalul de încredere pentru parametrul binom / M. A. Garcia-Perez // Calitate și cantitate. – 2005. – N 39. – P. 467–481. Motulsky H. Biostatistică intuitivă // H. Motulsky. – Oxford: Oxford University Press, 1995. – 386 p. Newcombe R. G. Intervale de încredere pe două părți pentru o singură proporție: comparație a șapte metode / R. G. Newcombe // Statistics in Medicine. – 1998. – N. 17. – P. 857–872. Sauro J. Estimarea ratelor de finalizare din eșantioane mici folosind intervale de încredere binomiale: comparații și recomandări / J. Sauro, J. R. Lewis // Proceedings of the human factors and ergonomics society annual meeting. – Orlando, FL, 2005. Wald A. Limite de încredere pentru funcțiile de distribuție continuă // A. Wald, J. Wolfovitz // Annals of Mathematical Statistics. – 1939. – N 10. – P. 105–118. Wilson E.B. Inferență probabilă, legea succesiunii și inferență statistică / E. B. Wilson // Journal of American Statistical Association. – 1927. – N 22. – P. 209–212.

INTERVALE DE ÎNCREDERE PENTRU PROPORȚII

A. M. Grjibovski

Institutul Național de Sănătate Publică, Oslo, Norvegia

Articolul prezintă mai multe metode de calcul a intervalelor de încredere pentru proporții binomiale, și anume, metodele Wald, Wilson, arcsinus, Agresti-Coull și exacte Clopper-Pearson. Lucrarea oferă doar o introducere generală a problemei estimării intervalului de încredere a unei proporții binomiale și scopul său este nu numai de a stimula cititorii să folosească intervalele de încredere atunci când prezintă rezultatele propriilor cercetări empirice, ci și de a-i încuraja să consulte cărți de statistică. înainte de a analiza propriile date și de a pregăti manuscrise.

Cuvinte cheie: interval de încredere, proporție

Informații de contact:

Consilier principal, Institutul Național de Sănătate Publică, Oslo, Norvegia

Intervale de încredere.

Calculul intervalului de încredere se bazează pe eroarea medie a parametrului corespunzător. Interval de încredere arată în ce limite cu probabilitate (1-a) se află adevărata valoare a parametrului estimat. Aici a este nivelul de semnificație, (1-a) se mai numește și probabilitate de încredere.

În primul capitol am arătat că, de exemplu, pentru media aritmetică, media reală a populației în aproximativ 95% din cazuri se află în 2 erori standard ale mediei. Astfel, limitele intervalului de încredere de 95% pentru medie vor fi separate de media eșantionului de două ori eroarea medie a mediei, i.e. înmulțim eroarea medie a mediei cu un anumit coeficient în funcție de nivelul de încredere. Pentru media și diferența de medii se ia coeficientul Student (valoarea critică a testului Student), pentru ponderea și diferența de cote, valoarea critică a criteriului z. Produsul dintre coeficient și eroarea medie poate fi numit eroarea maximă a unui parametru dat, adică maximul pe care îl putem obţine la evaluarea acestuia.

Interval de încredere pentru medie aritmetică : .

Iată media eșantionului;

Eroarea medie a mediei aritmetice;

s – abaterea standard a probei;

n

f = n-1 (Coeficientul elevului).

Interval de încredere pentru diferențe de medii aritmetice :

Iată diferența dintre mediile eșantionului;

- eroarea medie a diferenţei dintre mediile aritmetice;

s 1 , s 2 – abateri standard ale probei;

n1,n2

Valoarea critică a testului Student pentru un anumit nivel de semnificație a și numărul de grade de libertate f=n 1 + n 2-2 (Coeficientul elevului).

Interval de încredere pentru acțiuni :

.

Aici d este fracția eșantionului;

– eroare medie de fracție;

n– dimensiunea eșantionului (mărimea grupului);

Interval de încredere pentru diferenta de actiuni :

Iată diferența dintre acțiunile eșantionului;

– eroarea medie a diferenței dintre mediile aritmetice;

n1,n2– volume de probe (număr de grupuri);

Valoarea critică a criteriului z la un nivel de semnificație dat a ( , , ).

Prin calcularea intervalelor de încredere pentru diferența dintre indicatori, în primul rând, vedem direct valorile posibile ale efectului, și nu doar estimarea punctuală a acestuia. În al doilea rând, putem trage o concluzie despre acceptarea sau respingerea ipotezei nule și, în al treilea rând, putem trage o concluzie despre puterea testului.

Când testați ipoteze folosind intervale de încredere, trebuie să respectați următoarea regulă:

Dacă intervalul de încredere de 100(1-a) procente al diferenței de medii nu conține zero, atunci diferențele sunt semnificative statistic la nivelul de semnificație a; dimpotrivă, dacă acest interval conține zero, atunci diferențele nu sunt semnificative statistic.

Într-adevăr, dacă acest interval conține zero, înseamnă că indicatorul comparat poate fi fie mai mare, fie mai mic într-unul dintre grupuri comparativ cu celălalt, adică. diferenţele observate se datorează întâmplării.

Puterea testului poate fi judecată după locația lui zero în intervalul de încredere. Dacă zero este aproape de limita inferioară sau superioară a intervalului, atunci este posibil ca, cu un număr mai mare de grupuri comparate, diferențele să ajungă la semnificație statistică. Dacă zero este aproape de mijlocul intervalului, înseamnă că atât o creștere, cât și o scădere a indicatorului în grupul experimental sunt la fel de probabile și, probabil, chiar nu există diferențe.

Exemple:

Pentru a compara mortalitatea chirurgicală la utilizarea a două tipuri diferite de anestezie: 61 de persoane au fost operate cu primul tip de anestezie, 8 au murit, cu al doilea tip – 67 de persoane, 10 au murit.

d 1 = 8/61 = 0,131; d2 = 10/67 = 0,149; d1-d2 = - 0,018.

Diferența de letalitate a metodelor comparate va fi în intervalul (-0,018 - 0,122; -0,018 + 0,122) sau (-0,14; 0,104) cu o probabilitate de 100(1-a) = 95%. Intervalul conține zero, adică. ipoteza mortalităţii egale cu două tipuri diferite de anestezie nu poate fi respinsă.

Astfel, rata mortalității poate și va scădea la 14% și crește la 10,4% cu o probabilitate de 95%, adică. zero este aproximativ la mijlocul intervalului, așa că se poate susține că, cel mai probabil, aceste două metode nu diferă într-adevăr în ceea ce privește letalitatea.

În exemplul discutat mai devreme, timpul mediu de apăsare în timpul testului de atingere a fost comparat în patru grupuri de studenți care au fost diferite în ceea ce privește scorurile la examen. Să calculăm intervalele de încredere pentru timpul mediu de presare pentru elevii care au promovat examenul cu clasele 2 și 5 și intervalul de încredere pentru diferența dintre aceste medii.

Coeficienții lui Student se găsesc folosind tabelele de distribuție a lui Student (vezi anexa): pentru prima grupă: = t(0,05;48) = 2,011; pentru a doua grupă: = t(0,05;61) = 2,000. Astfel, intervale de încredere pentru primul grup: = (162,19-2,011*2,18; 162,19+2,011*2,18) = (157,8; 166,6), pentru al doilea grup (156,55- 2.000*1,88 ; 156,805*1,88 ; =+1,805*1,805) ; 160,3). Deci, pentru cei care au promovat examenul cu 2, timpul mediu de apăsare variază de la 157,8 ms la 166,6 ms cu o probabilitate de 95%, pentru cei care au promovat examenul cu 5 – de la 152,8 ms la 160,3 ms cu o probabilitate de 95% .

De asemenea, puteți testa ipoteza nulă folosind intervale de încredere pentru medii și nu doar pentru diferența de medii. De exemplu, ca și în cazul nostru, dacă intervalele de încredere pentru medii se suprapun, atunci ipoteza nulă nu poate fi respinsă. Pentru a respinge o ipoteză la un nivel de semnificație ales, intervalele de încredere corespunzătoare nu trebuie să se suprapună.

Să aflăm intervalul de încredere pentru diferența în timpul mediu de presare la loturile care au promovat examenul cu note 2 și 5. Diferența de medii: 162,19 – 156,55 = 5,64. Coeficientul studentului: = t(0,05;49+62-2) = t(0,05;109) = 1,982. Abaterile standard de grup vor fi egale cu: ; . Se calculează eroarea medie a diferenței dintre medii: . Interval de încredere: =(5,64-1,982*2,87; 5,64+1,982*2,87) = (-0,044; 11,33).

Așadar, diferența de timp mediu de presare în grupele care au promovat examenul cu 2 și 5 va fi în intervalul de la -0,044 ms la 11,33 ms. Acest interval include zero, adică Timpul mediu de presare pentru cei care au promovat bine examenul poate fie să crească, fie să scadă în comparație cu cei care au promovat examenul nesatisfăcător, adică. ipoteza nulă nu poate fi respinsă. Dar zero este foarte aproape de limita inferioară, iar timpul de presare este mult mai probabil să scadă pentru cei care au trecut bine. Astfel, putem concluziona că există încă diferențe în timpul mediu de presare între cei care au trecut de 2 și 5, pur și simplu nu le-am putut detecta având în vedere modificarea timpului mediu, răspândirea timpului mediu și dimensiunile eșantionului.



Puterea unui test este probabilitatea de a respinge o ipoteză nulă incorectă, i.e. găsiți diferențele acolo unde acestea există de fapt.

Puterea testului este determinată pe baza nivelului de semnificație, a mărimii diferențelor dintre grupuri, a răspândirii valorilor în grupuri și a mărimii eșantioanelor.

Pentru testul t Student și analiza varianței, pot fi utilizate diagrame de sensibilitate.

Puterea criteriului poate fi utilizată pentru a determina preliminar numărul necesar de grupuri.

Intervalul de încredere arată în ce limite se află valoarea adevărată a parametrului estimat cu o probabilitate dată.

Folosind intervale de încredere, puteți testa ipoteze statistice și puteți trage concluzii despre sensibilitatea criteriilor.

LITERATURĂ.

Glanz S. – Capitolul 6,7.

Rebrova O.Yu. – p.112-114, p.171-173, p.234-238.

Sidorenko E.V – p.32-33.

Întrebări pentru autotestarea elevilor.

1. Care este puterea criteriului?

2. În ce cazuri este necesară evaluarea puterii criteriilor?

3. Metode de calcul al puterii.

6. Cum se testează o ipoteză statistică folosind un interval de încredere?

7. Ce se poate spune despre puterea criteriului la calcularea intervalului de încredere?

Sarcini.

Să construim un interval de încredere în MS EXCEL pentru a estima valoarea medie a distribuției în cazul unei valori de dispersie cunoscute.

Desigur, alegerea nivelul de încredere depinde complet de problema rezolvată. Astfel, gradul de încredere al unui pasager aerian în fiabilitatea unui avion ar trebui să fie, fără îndoială, mai mare decât gradul de încredere al unui cumpărător în fiabilitatea unui bec electric.

Formularea problemei

Să presupunem că de la populatie fiind luate probă marimea n. Se presupune că deviație standard această distribuţie este cunoscută. Este necesar pe baza acestui lucru mostre evalua necunoscutul mijloc de distribuție(μ, ) și construiți corespunzătoare cu două fețe interval de încredere.

Estimarea punctuala

După cum se știe din statistici(să o notăm medie X) este estimare imparțială a mediei acest populatieși are o distribuție N(μ;σ 2 /n).

Notă: Ce să faci dacă trebuie să construiești interval de încredereîn cazul unei distribuţii care nu este normal?În acest caz, vine în ajutor, care afirmă că cu o dimensiune suficient de mare mostre n din distribuție a nu fi normal, distribuția eșantionului de statistici X avg voi aproximativ corespund distributie normala cu parametrii N(μ;σ 2 /n).

Asa de, estimare punctuală in medie valorile de distribuție avem - asta eșantion mediu, adică medie X. Acum să începem interval de încredere.

Construirea unui interval de încredere

De obicei, cunoscând distribuția și parametrii acesteia, putem calcula probabilitatea ca variabila aleatoare să ia o valoare din intervalul pe care îl specificăm. Acum să facem invers: găsiți intervalul în care variabila aleatoare va cădea cu o probabilitate dată. De exemplu, din proprietăți distributie normala se știe că, cu o probabilitate de 95%, o variabilă aleatorie distribuită peste legea normală, se va încadra în intervalul de aproximativ +/- 2 de la valoarea medie(vezi articolul despre). Acest interval ne va servi drept prototip interval de încredere.

Acum să vedem dacă știm distribuția , pentru a calcula acest interval? Pentru a răspunde la întrebare, trebuie să indicăm forma distribuției și parametrii acesteia.

Cunoaștem forma de distribuție - aceasta este distributie normala(rețineți că vorbim despre distribuția eșantionului statistici medie X).

Parametrul μ ne este necunoscut (trebuie doar estimat folosind interval de încredere), dar avem o estimare a acesteia medie X, calculat pe baza mostre, care poate fi folosit.

Al doilea parametru - abaterea standard a mediei eșantionului îl vom considera cunoscut, este egal cu σ/√n.

Deoarece nu știm μ, atunci vom construi intervalul +/- 2 abateri standard nu de la valoarea medie, și din estimarea sa cunoscută medie X. Acestea. la calcul interval de încredere NU vom presupune că medie X se încadrează în intervalul +/- 2 abateri standard de la μ cu o probabilitate de 95% și vom presupune că intervalul este +/- 2 abateri standard din medie X cu o probabilitate de 95% va acoperi μ – media populației generale, din care se ia probă. Aceste două afirmații sunt echivalente, dar a doua declarație ne permite să construim interval de încredere.

În plus, să clarificăm intervalul: o variabilă aleatoare distribuită peste legea normală, cu o probabilitate de 95% se încadrează în intervalul +/- 1.960 abateri standard, nu +/- 2 abateri standard. Aceasta poate fi calculată folosind formula =NORM.ST.REV((1+0,95)/2), cm. fișier exemplu Sheet Interval.

Acum putem formula o afirmație probabilistică care ne va servi să formăm interval de încredere:
„Probabilitatea ca media populatiei situat din medie a probeiîn termen de 1.960" abaterile standard ale mediei eșantionului", egal cu 95%”.

Valoarea probabilității menționată în declarație are o denumire specială , care este asociat cu nivelul de semnificație α (alfa) printr-o expresie simplă nivel de încredere =1 . În cazul nostru nivelul de semnificație α =1-0,95=0,05 .

Acum, pe baza acestei afirmații probabilistice, scriem o expresie pentru calcul interval de încredere:

unde Z α/2 standard distributie normala(această valoare a variabilei aleatoare z, Ce P(z>=Z α/2 )=α/2).

Notă: α/2-quantila superioară definește lățimea interval de încredere V abateri standard eșantion mediu. α/2-quantila superioară standard distributie normalaîntotdeauna mai mare decât 0, ceea ce este foarte convenabil.

În cazul nostru, cu α=0,05, α/2-quantila superioară este egal cu 1.960. Pentru alte niveluri de semnificație α (10%; 1%) α/2-quantila superioară Z α/2 poate fi calculat folosind formula =NORM.ST.REV(1-α/2) sau, dacă este cunoscută nivel de încredere, =NORM.ST.OBR((1+nivel de încredere)/2).

De obicei, la construirea intervale de încredere pentru estimarea mediei utilizați numai α superioară/2-cuantilă si nu folositi mai mic α/2-cuantilă. Acest lucru este posibil pentru că standard distributie normala simetric fata de axa x ( densitatea sa de distribuție simetric despre medie, adică). Prin urmare, nu este nevoie să se calculeze α/2-cuantilă mai mică(se numește pur și simplu α /2-quantila), deoarece este egal α superioară/2-cuantilă cu semnul minus.

Să ne amintim că, în ciuda formei distribuției valorii x, variabila aleatoare corespunzătoare medie X distribuite aproximativ Amenda N(μ;σ 2 /n) (vezi articolul despre). Prin urmare, în general, expresia de mai sus pentru interval de încredere este doar o aproximare. Dacă valoarea x este distribuită peste legea normală N(μ;σ 2 /n), apoi expresia pentru interval de încredere este exactă.

Calcul intervalului de încredere în MS EXCEL

Să rezolvăm problema.
Timpul de răspuns al unei componente electronice la un semnal de intrare este o caracteristică importantă a dispozitivului. Un inginer dorește să construiască un interval de încredere pentru timpul mediu de răspuns la un nivel de încredere de 95%. Din experiența anterioară, inginerul știe că abaterea standard a timpului de răspuns este de 8 ms. Se știe că pentru a evalua timpul de răspuns, inginerul a făcut 25 de măsurători, valoarea medie a fost de 78 ms.

Soluţie: Un inginer vrea să cunoască timpul de răspuns al unui dispozitiv electronic, dar înțelege că timpul de răspuns nu este o valoare fixă, ci o variabilă aleatorie care are propria sa distribuție. Deci, cel mai bun lucru la care poate spera este să determine parametrii și forma acestei distribuții.

Din păcate, din condițiile problemei nu cunoaștem forma distribuției timpului de răspuns (nu trebuie să fie normal). , această distribuție este de asemenea necunoscută. Numai el este cunoscut deviație standardσ=8. Prin urmare, în timp ce nu putem calcula probabilitățile și construi interval de încredere.

Cu toate acestea, în ciuda faptului că nu cunoaștem distribuția timp răspuns separat, știm că conform CPT, distribuția eșantionării timpul mediu de răspuns este de aproximativ normal(vom presupune că condițiile CPT sunt efectuate, deoarece mărimea mostre destul de mare (n=25)) .

În plus, in medie această distribuţie este egală cu valoarea medie distribuția unui singur răspuns, de ex. μ. A deviație standard a acestei distribuții (σ/√n) poate fi calculată folosind formula =8/ROOT(25) .

De asemenea, se știe că inginerul a primit estimare punctuală parametrul μ egal cu 78 ms (X avg). Prin urmare, acum putem calcula probabilități, deoarece cunoaștem forma de distribuție ( normal) și parametrii săi (X avg și σ/√n).

Inginerul vrea să știe valorea estimataμ distribuțiile timpului de răspuns. După cum sa menționat mai sus, acest μ este egal cu așteptarea matematică a distribuției eșantionului a timpului mediu de răspuns. Dacă folosim distributie normala N(X avg; σ/√n), atunci μ dorit va fi în intervalul +/-2*σ/√n cu o probabilitate de aproximativ 95%.

Nivel de semnificație este egal cu 1-0,95=0,05.

În cele din urmă, să găsim marginile din stânga și din dreapta interval de încredere.
Chenarul din stânga: =78-NORM.ST.REV(1-0,05/2)*8/ROOT(25) = 74,864
Chenarul din dreapta: =78+NORM.ST.INV(1-0,05/2)*8/ROOT(25)=81,136

Chenarul din stânga: =NORM.REV(0,05/2; 78; 8/ROOT(25))
Chenarul din dreapta: =NORM.REV(1-0,05/2; 78; 8/ROOT(25))

Răspuns: interval de încredere la Nivel de încredere de 95% și σ=8msec egală 78+/-3,136 ms.

ÎN exemplu de fișier pe foaia Sigma cunoscut, a creat o formă de calcul și construcție cu două fețe interval de încredere pentru arbitrar mostre cu σ dat și nivelul de semnificație.

Funcția CONFIDENCE.NORM().

Dacă valorile mostre sunt în gamă B20:B79 , A nivelul de semnificație egal cu 0,05; apoi formula MS EXCEL:
=MEDIE(B20:B79)-ÎNCREDERE.NORMĂ(0,05;σ; NUMĂRĂ(B20:B79))
va întoarce marginea stângă interval de încredere.

Aceeași limită poate fi calculată folosind formula:
=AVERAGE(B20:B79)-NORM.ST.REV(1-0,05/2)*σ/ROOT(COUNT(B20:B79))

Notă: Funcția CONFIDENCE.NORM() a apărut în MS EXCEL 2010. În versiunile anterioare ale MS EXCEL, a fost folosită funcția TRUST().

Din acest articol veți învăța:

    Ce s-a întâmplat interval de încredere?

    Care e ideea regulile 3 sigma?

    Cum poți aplica aceste cunoștințe în practică?

În prezent, datorită unei supraabundențe de informații asociate cu o gamă largă de produse, direcții de vânzare, angajați, domenii de activitate etc., poate fi dificil să evidențiezi principalul lucru, care, în primul rând, merită să-i acordăm atenție și să depunem eforturi pentru a-l gestiona. Definiție interval de încredereși analiza valorilor reale care depășesc limitele sale - o tehnică care vă va ajuta să evidențiați situațiile, influențând tendințele în schimbare. Veți putea dezvolta factori pozitivi și reduce influența celor negativi. Această tehnologie este utilizată în multe companii mondiale bine-cunoscute.

Există așa-numitele " alerte", care informează managerii că următoarea valoare este într-o anumită direcție a trecut dincolo interval de încredere. Ce înseamnă acest lucru? Acesta este un semnal că a avut loc un eveniment neobișnuit, care poate schimba tendința existentă în această direcție. Acesta este un semnal la asta pentru a-l da seamaîn situație și înțelegeți ce a influențat-o.

De exemplu, luați în considerare mai multe situații. Am calculat prognoza vânzărilor cu limite estimate pentru 100 de articole de produs pentru 2011 pe lună și vânzările reale în martie:

  1. Pentru „Uleiul de floarea soarelui” au depășit limita superioară a prognozei și nu au intrat în intervalul de încredere.
  2. Pentru „Drojdie uscată” am depășit limita inferioară a prognozei.
  3. „Teci de ovăz” a depășit limita superioară.

Pentru alte produse, vânzările efective s-au încadrat în limitele prognozate date. Acestea. vânzările lor au fost în limitele așteptărilor. Așadar, am identificat 3 produse care au depășit granițele și am început să ne dăm seama ce le-a influențat să treacă dincolo de granițe:

  1. Pentru uleiul de floarea soarelui am intrat într-o nouă rețea de distribuție, care ne-a oferit un volum suplimentar de vânzări, ceea ce ne-a determinat să depășim limita superioară. Pentru acest produs, merită să recalculăm prognoza până la sfârșitul anului, ținând cont de prognoza de vânzări pentru această rețea.
  2. Pentru „Drojdie uscată”, mașina s-a blocat la vamă și a existat un deficit în 5 zile, ceea ce a afectat scăderea vânzărilor și a depășit limita inferioară. Ar putea fi util să vă dați seama ce a cauzat-o și să încercați să nu repetați această situație.
  3. A fost lansat un eveniment de promovare a vânzărilor pentru Terci de ovăz, care a dat o creștere semnificativă a vânzărilor și a făcut ca compania să depășească prognoza.

Am identificat 3 factori care au influențat depășirea limitelor prognozate. Pot fi mult mai mulți în viață Pentru a crește acuratețea prognozei și a planificării, factori care duc la faptul că vânzările reale pot depăși previziunile, merită să evidențiezi și să construiești previziuni și planuri separat. Și apoi luați în considerare impactul lor asupra prognozei principale de vânzări. De asemenea, puteți evalua în mod regulat impactul acestor factori și puteți schimba situația în bine. prin reducerea influenței factorilor negativi și creșterea influenței factorilor pozitivi.

Cu un interval de încredere putem:

  1. Selectați indicațiile de orientare, cărora merită să le acordați atenție, pentru că s-au produs evenimente în aceste direcţii care pot afecta schimbare de tendință.
  2. Identificați factorii, care influențează cu adevărat schimbarea situației.
  3. Accept decizie informată(de exemplu, despre cumpărare, planificare etc.).

Acum să ne uităm la ce este un interval de încredere și cum să-l calculăm în Excel folosind un exemplu.

Ce este un interval de încredere?

Intervalul de încredere reprezintă limitele de prognoză (superioare și inferioare), în interiorul cărora cu o probabilitate dată (sigma) vor apărea valorile reale.

Acestea. Calculăm prognoza - acesta este ghidul nostru principal, dar înțelegem că este puțin probabil ca valorile reale să fie 100% egale cu prognoza noastră. Și se pune întrebarea, în ce limite valorile reale pot scădea, dacă tendința actuală continuă? Și această întrebare ne va ajuta să răspundem calculul intervalului de încredere, adică - limitele superioare și inferioare ale prognozei.

Ce este o probabilitate sigma dată?

La calcul interval de încredere putem probabilitate stabilită lovituri valori reale în limitele de prognoză date. Cum să o facă? Pentru a face acest lucru, setăm valoarea lui sigma și, dacă sigma este egal cu:

    3 sigma- atunci, probabilitatea ca următoarea valoare reală să cadă în intervalul de încredere va fi de 99,7%, sau 300 la 1, sau există o probabilitate de 0,3% de a depăși granițele.

    2 sigma- atunci, probabilitatea ca următoarea valoare să se încadreze în limite este ≈ 95,5%, i.e. șansele sunt de aproximativ 20 la 1 sau există o șansă de 4,5% să treci peste bord.

    1 sigma- atunci probabilitatea este ≈ 68,3%, i.e. șansele sunt de aproximativ 2 la 1 sau există o șansă de 31,7% ca următoarea valoare să cadă în afara intervalului de încredere.

Noi am formulat regula 3 sigma,care spune că probabilitatea de lovire o altă valoare aleatorie în intervalul de încredere cu o valoare dată trei sigma este 99,7%.

Marele matematician rus Cebyshev a demonstrat teorema că există o probabilitate de 10% de a depăși limitele prognozate cu o valoare dată de trei sigma. Acestea. probabilitatea de a se încadra în intervalul de încredere de 3 sigma va fi de cel puțin 90%, în timp ce o încercare de a calcula prognoza și limitele acesteia „cu ochi” este plină de erori mult mai semnificative.

Cum să calculezi singur un interval de încredere în Excel?

Să ne uităm la calculul intervalului de încredere în Excel (adică, limitele superioare și inferioare ale prognozei) folosind un exemplu. Avem o serie de timp - vânzări pe lună timp de 5 ani. Vezi fisierul atasat.

Pentru a calcula limitele de prognoză, calculăm:

  1. Prognoza de vânzări().
  2. Sigma - abatere standard modele de prognoză din valori reale.
  3. Trei sigma.
  4. Interval de încredere.

1. Prognoza vânzărilor.

=(RC[-14] (date de serie temporală)- RC[-1] (valoarea modelului))^2(pătrat)


3. Pentru fiecare lună, să însumăm valorile abaterii de la etapa 8 Sum((Xi-Ximod)^2), adică Să rezumam ianuarie, februarie... pentru fiecare an.

Pentru a face acest lucru, utilizați formula =SUMIF()

SUMIF(matrice cu numerele perioadei din interiorul ciclului (pentru luni de la 1 la 12); link la numărul perioadei din ciclu; link la o matrice cu pătrate ale diferenței dintre datele sursă și valorile perioadei)


4. Calculați abaterea standard pentru fiecare perioadă din ciclu de la 1 la 12 (etapa 10 in fisierul atasat).

Pentru a face acest lucru, extragem rădăcina din valoarea calculată la etapa 9 și împărțim la numărul de perioade din acest ciclu minus 1 = SQRT((Sum(Xi-Ximod)^2/(n-1))

Să folosim formulele din Excel =ROOT(R8 (link către (Sum(Xi-Ximod)^2)/(COUNTIF($O$8:$O$67 (link la matrice cu numere de ciclu); O8 (link la un anumit număr de ciclu pe care îl numărăm în matrice))-1))

Folosind formula Excel = COUNTIF numărăm numărul n


După ce am calculat abaterea standard a datelor reale de la modelul de prognoză, am obținut valoarea sigma pentru fiecare lună - etapa 10 in fisierul atasat.

3. Să calculăm 3 sigma.

La etapa 11 setăm numărul de sigma - în exemplul nostru „3” (etapa 11 in fisierul atasat):

De asemenea, convenabil pentru exersarea valorilor sigma:

1,64 sigma - 10% sanse de depasire a limitei (1 sansa din 10);

1,96 sigma - 5% șansă de a depăși limitele (1 șansă din 20);

2,6 sigma - 1% șansă de a depăși limitele (1 șansă la 100).

5) Calcularea trei sigma, pentru aceasta înmulțim valorile „sigma” pentru fiecare lună cu „3”.

3. Determinați intervalul de încredere.

  1. Limită superioară de prognoză- prognoza vânzărilor ținând cont de creștere și sezonalitate + (plus) 3 sigma;
  2. Limită inferioară de prognoză- prognoza vânzărilor ținând cont de creștere și sezonalitate – (minus) 3 sigma;

Pentru comoditatea calculării intervalului de încredere pentru o perioadă lungă (vezi fișierul atașat), vom folosi formula Excel =Y8+CĂUTARE V(W8, 8 USD: 19 USD, 2,0 USD), Unde

Y8- Prognoza de vânzări;

W8- numarul lunii pentru care vom lua valoarea 3-sigma;

Acestea. Limită superioară de prognoză= „prognoza vânzărilor” + „3 sigma” (în exemplu, CĂUTARE V (numărul lunii; tabel cu valori 3 sigma; coloană din care extragem valoarea sigma egală cu numărul lunii din rândul corespunzător; 0)).

Limită inferioară de prognoză= „prognoza vânzărilor” minus „3 sigma”.

Deci, am calculat intervalul de încredere în Excel.

Acum avem o prognoză și un interval cu limite în care valorile reale vor cădea cu o probabilitate sigma dată.

În acest articol, am analizat ce sunt sigma și regula trei sigma, cum să determinați un interval de încredere și de ce puteți utiliza această tehnică în practică.

Vă dorim prognoze corecte și succes!

Cum Forecast4AC PRO vă poate ajutala calcularea intervalului de încredere?:

    Forecast4AC PRO va calcula automat limitele superioare sau inferioare ale prognozei pentru mai mult de 1000 de serii temporale simultan;

    Capacitatea de a analiza limitele prognozei în comparație cu prognoza, tendința și vânzările reale pe diagramă cu o singură apăsare de tastă;

În programul Forcast4AC PRO este posibil să setați valoarea sigma de la 1 la 3.

Alăturaţi-ne!

Descărcați aplicații gratuite de prognoză și analiză de afaceri:


  • Novo Forecast Lite- automată calculul prognozei V excela.
  • 4analitica - Analiza ABC-XYZși analiza emisiilor Excela.
  • Qlik Sense Desktop și QlikViewPersonal Edition - sisteme BI pentru analiza și vizualizarea datelor.

Testați capacitățile soluțiilor plătite:

  • Novo Forecast PRO- prognoza in Excel pentru seturi mari de date.

Să presupunem că avem un număr mare de articole cu o distribuție normală a unor caracteristici (de exemplu, un depozit complet de legume de același tip, a căror dimensiune și greutate variază). Vrei să știi caracteristicile medii ale întregului lot de mărfuri, dar nu ai nici timp, nici dorința de a măsura și cântări fiecare legumă. Înțelegi că acest lucru nu este necesar. Dar câte piese ar trebui luate pentru o verificare la fața locului?

Înainte de a oferi mai multe formule utile pentru această situație, să ne amintim câteva notații.

În primul rând, dacă am măsura întregul depozit de legume (acest set de elemente se numește populația generală), atunci am ști cu toată exactitatea disponibilă greutatea medie a întregului lot. Să numim această medie medie X .g en . - media generală. Știm deja ce este complet determinat dacă valoarea medie și abaterea s sunt cunoscute . Adevărat, în timp ce nu suntem nici X medie gen s Nu cunoaștem populația generală. Putem lua doar o anumită probă, să măsurăm valorile de care avem nevoie și să calculăm pentru această probă atât valoarea medie X, cât și abaterea standard S selectată.

Se știe că dacă verificarea noastră eșantion conține un număr mare de elemente (de obicei n este mai mare de 30), și acestea sunt luate într-adevăr aleatoriu, apoi s populația generală nu va diferi cu greu de selecția S ..

În plus, pentru cazul distribuției normale putem folosi următoarele formule:

Cu o probabilitate de 95%


Cu o probabilitate de 99%



În general, cu probabilitatea P (t)


Relația dintre valoarea t și valoarea probabilității P (t), cu care dorim să cunoaștem intervalul de încredere, poate fi luată din următorul tabel:


Astfel, am determinat în ce interval se află valoarea medie a populației (cu o probabilitate dată).

Dacă nu avem un eșantion suficient de mare, nu putem spune că populația are s = S selectează În plus, în acest caz, apropierea eșantionului de distribuția normală este problematică. În acest caz, folosim și S select în schimb s în formula:




dar valoarea lui t pentru o probabilitate fixă ​​P(t) va depinde de numărul de elemente din eșantionul n. Cu cât n este mai mare, cu atât intervalul de încredere rezultat va fi mai apropiat de valoarea dată de formula (1). Valorile t în acest caz sunt preluate dintr-un alt tabel (testul t al studentului), pe care îl prezentăm mai jos:

Valorile testului t al lui Student pentru probabilitatea 0,95 și 0,99


Exemplul 3. 30 de persoane au fost alese aleatoriu dintre angajații companiei. Potrivit eșantionului, s-a dovedit că salariul mediu (pe lună) este de 30 de mii de ruble, cu o abatere standard de 5 mii de ruble. Determinați salariul mediu în companie cu o probabilitate de 0,99.

Soluţie: Prin condiție avem n = 30, X avg. =30000, S=5000, P = 0,99. Pentru a găsi intervalul de încredere, vom folosi formula corespunzătoare testului t Student. Din tabelul pentru n = 30 și P = 0,99 găsim t = 2,756, prin urmare,


acestea. mandatar căutat interval 27484< Х ср.ген < 32516.

Deci, cu o probabilitate de 0,99 putem spune că intervalul (27484; 32516) conține în sine salariul mediu în firmă.

Sperăm că veți folosi această metodă și nu este necesar să aveți o masă cu dvs. de fiecare dată. Calculele pot fi efectuate automat în Excel. În timp ce vă aflați în fișierul Excel, faceți clic pe butonul fx din meniul de sus. Apoi, selectați tipul „statistic” dintre funcții, iar din lista propusă în fereastra - STUDAR DISCOVER. Apoi, la prompt, plasând cursorul în câmpul „probabilitate”, introduceți valoarea probabilității inverse (adică, în cazul nostru, în loc de probabilitatea de 0,95, trebuie să introduceți probabilitatea de 0,05). Aparent, foaia de calcul este concepută în așa fel încât rezultatul să răspundă la întrebarea cât de probabil avem să greșim. În mod similar, în câmpul Grad de libertate, introduceți o valoare (n-1) pentru eșantionul dvs.


Top