Valoarea absolută a testului t student. Când și cum se utilizează Testul Student (test t), verificând normalitatea datelor în mediul R

În ce cazuri poate fi folosit testul t al Studentului?

Pentru a aplica testul t Student, este necesar ca datele originale să aibă distributie normala. În cazul aplicării unui criteriu de două eșantioane pentru probe independente, este, de asemenea, necesară îndeplinirea condiției egalitatea (homoscedasticitatea) varianţelor.

Dacă aceste condiții nu sunt îndeplinite, ar trebui utilizate metode similare atunci când se compară mediile eșantionului. statistici neparametrice, printre care cele mai cunoscute sunt Testul U Mann-Whitney(ca test cu două eșantioane pentru probe independente) și criteriul semnuluiȘi testul Wilcoxon(utilizat în cazul probelor dependente).

Pentru a compara valorile medii, testul t al lui Student este calculat folosind următoarea formulă:

Unde M 1- media aritmetică a primei populații (grup) comparate; M 2- media aritmetică a celei de-a doua populații (grup) comparate; m 1 - eroare medie prima medie aritmetica, m 2- eroarea medie a celei de-a doua medii aritmetice.

Cum se interpretează valoarea testului t a Studentului?

Valoarea testului t Student rezultată trebuie interpretată corect. Pentru a face acest lucru, trebuie să cunoaștem numărul de subiecți din fiecare grupă (n 1 și n 2). Aflarea numărului de grade de libertate f după următoarea formulă:

f = (n 1 + n 2) - 2

După aceasta stabilim valoare critica Testul t al lui Student pentru nivelul necesar de semnificație (de exemplu, p=0,05) și pentru un număr dat de grade de libertate f conform tabelului ( vezi mai jos).

Comparăm valorile critice și calculate ale criteriului:

· Dacă valoarea calculată a testului t Student egală sau mai mare critice, constatate din tabel, concluzionăm că diferențele dintre valorile comparate sunt semnificative statistic.

· Dacă valoarea testului t Student calculat Mai puțin tabelar, ceea ce înseamnă că diferențele dintre valorile comparate nu sunt semnificative statistic.

Exemplu de calcul al testului t al lui Student

Pentru a studia eficacitatea unui nou preparat de fier, au fost selectate două grupuri de pacienți cu anemie. În primul grup, pacienții au primit un nou medicament timp de două săptămâni, iar în al doilea grup au primit un placebo. După aceasta, au fost măsurate nivelurile de hemoglobină din sângele periferic. În primul grup nivel mediu hemoglobina a fost de 115,4±1,2 g/l, iar în al doilea - 103,7±2,3 g/l (datele sunt prezentate în format M±m), populațiile comparate au o distribuție normală. Numărul primului grup a fost de 34, iar al doilea - 40 de pacienți. Este necesar să se tragă o concluzie despre semnificația statistică a diferențelor obținute și eficacitatea noului preparat de fier.

Soluţie: Pentru a evalua semnificația diferențelor, folosim testul t al lui Student, calculat ca diferența de valori medii împărțită la suma erorilor pătrate:

După efectuarea calculelor, valoarea t-test s-a dovedit a fi 4,51. Găsim numărul de grade de libertate ca (34 + 40) - 2 = 72. Comparăm valoarea testului t Student rezultată de 4,51 cu valoarea critică la p = 0,05 indicată în tabel: 1,993. Deoarece valoarea calculată a criteriului este mai mare decât valoarea critică, concluzionăm că diferențele observate sunt semnificative statistic (nivel de semnificație p<0,05).

Distribuția Fisher este distribuția unei variabile aleatoare

unde sunt variabilele aleatoare X 1Și X 2 sunt independente și au distribuții chi-pătrat cu numărul de grade de libertate k 1Și k 2 respectiv. În același timp, cuplul (k 1 , k 2)– o pereche de „grade de libertate” ale distribuției Fisher și anume, k 1 este numărul de grade de libertate ale numărătorului și k 2– numărul de grade de libertate al numitorului. Distribuția unei variabile aleatoare F numit după marele statistician englez R. Fisher (1890-1962), care l-a folosit activ în lucrările sale.

Distribuția Fisher este utilizată atunci când se testează ipoteze despre adecvarea modelului în analiza de regresie, egalitatea varianțelor și în alte probleme de statistică aplicată.

Tabelul valorilor critice ale Studentului.

Începutul formei

Numărul de grade de libertate, f Valoarea testului t a lui Student la p=0,05
12.706
4.303
3.182
2.776
2.571
2.447
2.365
2.306
2.262
2.228
2.201
2.179
2.160
2.145
2.131
2.120
2.110
2.101
2.093
2.086
2.080
2.074
2.069
2.064
2.060
2.056
2.052
2.048
2.045
2.042
2.040
2.037
2.035
2.032
2.030
2.028
2.026
2.024
40-41 2.021
42-43 2.018
44-45 2.015
46-47 2.013
48-49 2.011
50-51 2.009
52-53 2.007
54-55 2.005
56-57 2.003
58-59 2.002
60-61 2.000
62-63 1.999
64-65 1.998
66-67 1.997
68-69 1.995
70-71 1.994
72-73 1.993
74-75 1.993
76-77 1.992
78-79 1.991
80-89 1.990
90-99 1.987
100-119 1.984
120-139 1.980
140-159 1.977
160-179 1.975
180-199 1.973
1.972
1.960

A sosit toamna, ceea ce înseamnă că este timpul să lansăm un nou proiect tematic „Analiza statistică cu R”. În el vom analiza metodele statistice din punctul de vedere al aplicării lor în practică: vom afla ce metode există, în ce cazuri și cum să le realizăm. În opinia mea, Testul Studentului sau testul t este ideal ca introducere în lumea analizei statistice. Testul t al Studentului este destul de simplu și orientativ și necesită, de asemenea, un minim de cunoștințe de bază în statistică, cu care cititorul se poate familiariza în timp ce citește acest articol.

Nota 1: aici și în alte articole nu veți vedea formule și explicații matematice, pentru că... Informația este destinată studenților de științe naturale și umaniste care fac doar primii pași în statistică. analiză.

Ce este un test t și în ce cazuri ar trebui utilizat?

La început, trebuie spus că în statistică se aplică adesea principiul briciului lui Occam, care spune că nu are rost să faci analize statistice complexe dacă poți folosi una mai simplă (nu ar trebui să tai pâinea cu drujba dacă ai un cuțit). De aceea, în ciuda simplității sale, testul t este un instrument serios dacă știi ce este și în ce cazuri ar trebui folosit.

Este curios că această metodă a fost creată de William Gosset, un chimist invitat să lucreze la fabrica Guinness. Testul pe care l-a dezvoltat inițial a servit pentru a evalua calitatea berii. Cu toate acestea, chimiștilor fabricii li s-a interzis să publice în mod independent lucrări științifice sub propriul lor nume. Prin urmare, în 1908, William și-a publicat articolul în revista Biometrika sub pseudonimul „Student”. Mai târziu, remarcabilul matematician și statistician Ronald Fisher a rafinat metoda, care a devenit apoi larg răspândită sub denumirea de test t al lui Student.

Testul elevului (test t) este o metodă statistică care vă permite să comparați valorile medii a două eșantioane și, pe baza rezultatelor testelor, să trageți o concluzie dacă sunt diferite statistic unele de altele sau nu. Dacă doriți să aflați dacă speranța medie de viață în regiunea dumneavoastră diferă de media națională; comparați producția de cartofi în diferite zone; sau dacă tensiunea arterială se modifică înainte și după administrarea unui nou medicament, atunci testul tîți poate fi de folos. De ce poate? Pentru că pentru a o duce la îndeplinire, Este necesar ca datele eșantionului să aibă o distribuție apropiată de normală.În acest scop, există metode de evaluare care vă permit să spuneți dacă într-un caz dat este acceptabil să presupunem că datele sunt distribuite în mod normal sau nu. Să vorbim despre asta mai detaliat.

Distribuția normală a datelor și metodele de estimare a acestora qqplot și shapiro.test

Distribuția normală a datelor este tipică pentru datele cantitative, a căror distribuție este influențată de mulți factori sau este aleatorie. Distribuția normală este caracterizată de mai multe caracteristici:

  • Este întotdeauna simetric și în formă de clopot.
  • Valorile medii și mediane sunt aceleași.
  • 68,2% din toate datele se află la o abatere standard în ambele direcții, în două - 95,5%, în trei - 99,7%

Să creăm un eșantion aleatoriu cu o distribuție normală pe , unde numărul total de măsurători = 100, media aritmetică = 5 și deviație standard= 1. Apoi îl afișăm pe grafic sub forma unei histograme:

datele mele<- rnorm(100, mean = 5, sd = 1) hist(mydata, col = "light green")

Graficul dvs. poate diferi ușor de al meu, deoarece numerele sunt generate aleatoriu. După cum puteți vedea, datele nu sunt perfect simetrice, dar par să mențină forma unei distribuții normale. Cu toate acestea, vom folosi metode mai obiective pentru a determina normalitatea datelor.

Una dintre cele mai simple teste de normalitate este diagramă cuantilă (qqplot). Esența testului este simplă: dacă datele au o distribuție normală, atunci acestea nu ar trebui să se abate foarte mult de la linia cuantilelor teoretice și să depășească intervalele de încredere. Să facem acest test în R.

pachet „mașină” în mediul R qqPlot(mydata) #run the test

După cum se poate observa din grafic, datele noastre nu au abateri serioase de la distribuția normală teoretică. Dar uneori cu ajutorul qqplot Este imposibil să dai un răspuns cert. În acest caz, ar trebui să utilizați Testul Shapiro-Wilk , care se bazează pe ipoteza nulă că datele noastre sunt distribuite în mod normal. Dacă valoarea P este mai mică de 0,05 ( valoarea p < 0.05), то мы вынуждены отклонить нулевую гипотезу. P-значение в этом случае будет говорить о том, что вероятность ошибки при отклонении нулевой гипотезы будет равна менее 5%.

Rularea testului Shapiro-Wilk în R este ușoară. Pentru a face acest lucru, trebuie doar să apelați funcția shapiro.test și să introduceți numele datelor dvs. între paranteze. În cazul nostru, valoarea p ar trebui să fie semnificativ mai mare decât 0,05, ceea ce nu ne permite să respingem ipoteza nulă că datele noastre sunt distribuite în mod normal.

Rularea testului t Student în mediul R

Deci, dacă datele din eșantioane au o distribuție normală, puteți începe în siguranță să comparați mediile acestor eșantioane. Există trei tipuri principale de test t, care sunt utilizate în diferite situații. Să ne uităm la fiecare dintre ele folosind exemple ilustrative.

Test t cu o singură probă

Trebuie ales testul t cu o singură probă dacă compari un eșantion cu o medie cunoscută. De exemplu, vârsta medie a locuitorilor din Districtul Federal Caucaz de Nord diferă de vârsta generală din Rusia? Există opinia că clima din Caucaz și caracteristicile culturale ale popoarelor care îl locuiesc contribuie la prelungirea vieții. Pentru a testa această ipoteză, vom lua date de la RosStat (tabelele cu speranța medie de viață pe regiuni din Rusia) și vom aplica testul t pentru un singur eșantion. Deoarece testul t al lui Student se bazează pe testarea ipotezelor statistice, vom accepta ca ipoteză nulă că nu există diferențe între nivelul mediu de durată așteptat pentru Rusia și republicile Caucazului de Nord. Dacă există diferențe, atunci pentru a le considera semnificative statistic valoarea p ar trebui să fie mai mic de 0,05 (logica este aceeași ca în testul Shapiro-Wilk descris mai sus).

Să încărcăm datele în R. Pentru a face acest lucru, vom crea un vector cu valori medii pentru republicile din Caucaz (inclusiv Adygea). Apoi, să rulăm un test t cu un eșantion, specificând în parametru mu Speranța medie de viață în Rusia este de 70,93.

rosstat<-c(79.42, 75.83, 74.16, 73.91, 73.82, 73.06, 72.01) qqPlot(rosstat) shapiro.test(rosstat) t.test(rosstat, mu = 70,93)

Chiar dacă avem doar 7 puncte în eșantion, acestea trec în general testele de normalitate și ne putem baza pe ele, deoarece aceste date au fost deja mediate pe regiune.

Rezultatele testului t indică faptul că speranța medie de viață a locuitorilor din Caucazul de Nord (74,6 ani) este într-adevăr mai mare decât media Rusiei (70,93 ani), iar rezultatele testelor sunt semnificative statistic (p.< 0.05).

Test t independent cu două probe

Se folosește un test t cu două eșantioane, când comparați două mostre independente. Să presupunem că vrem să aflăm dacă producția de cartofi diferă în nordul și sudul unei regiuni. Pentru a face acest lucru, am colectat date de la 40 de ferme: dintre care 20 au fost situate în nord și au format eșantionul „Nord”, iar restul de 20 au fost situate în sud, formând eșantionul „Sud”.

Să încărcăm datele în mediul R În plus față de verificarea normalității datelor, va fi util să creați un „grafic de mustăți” în care puteți vedea medianele și răspândirea datelor pentru ambele eșantioane.

Nord<- c(122, 150, 136, 129, 169, 158, 132, 162, 143, 179, 139, 193, 155, 160, 165, 149, 173, 173, 141, 166) qqPlot(Nord) shapiro.test(Nord) Sud<- c(170, 163, 178, 150, 166, 142, 157, 149, 151, 164, 163, 161, 159, 139, 180, 155, 144, 139, 151, 160) qqPlot(North) shapiro.test(North) boxplot(North, South)

După cum se poate observa din grafic, medianele eșantionului nu sunt foarte diferite unele de altele, dar răspândirea datelor este mult mai mare în nord. Să verificăm dacă valorile medii sunt diferite statistic folosind funcția t.test. Cu toate acestea, de data aceasta în locul parametrului mu punem numele celui de-al doilea eșantion. Rezultatele testului, pe care le vedeți în figura de mai jos, indică faptul că randamentul mediu de cartofi în nord nu este diferit din punct de vedere statistic de randamentul din sud ( p = 0.6339).

Două probe pentru probe dependente ( dependent de două eșantioane t-Test)

Al treilea tip de test t este folosit când dacă elementele probelor depind unele de altele. Este ideal pentru verificarea repetabilitatii rezultatelor experiment: dacă datele repetate nu sunt diferite din punct de vedere statistic de cele originale, atunci repetabilitatea datelor este mare. De asemenea, testul t cu două eșantioane pentru probele dependente este utilizat pe scară largă în cercetarea medicală când se studiază efectul unui medicament asupra organismului înainte și după administrare.

Pentru a-l rula în R, ar trebui să introduceți aceeași funcție t.test. Totuși, între paranteze, după tabelele de date, trebuie să introduceți argumentul suplimentar paired = TRUE. Acest argument spune că datele dvs. depind unele de altele. De exemplu:

t.test(experiment, povtor.experimenta, paired = TRUE) t.test(davlenie.do.priema, davlenie.posle.priema, pereche = TRUE)

Există, de asemenea, două argumente suplimentare la funcția t.test care pot îmbunătăți calitatea rezultatelor testului: var.equal și alternative . Dacă știți că variația dintre eșantioane este egală, introduceți argumentul var.equal = TRUE . Dacă doriți să testați ipoteza că diferența dintre mediile din eșantioane este semnificativ mai mică sau mai mare decât 0, atunci introduceți argumentul alternative="less" sau alternative="greater" (în mod implicit, ipoteza alternativă spune că eșantioanele sunt pur și simplu diferiți unul de celălalt prieten: alternative="two.sided" ).

Concluzie

Articolul s-a dovedit a fi destul de lung, dar acum știți: care sunt testul Student și distribuția normală; modul de utilizare a funcțiilor qqplotȘi shapiro.test verificați normalitatea datelor în R; și, de asemenea, a analizat trei tipuri de teste t și le-a efectuat în mediul R.

Subiectul nu este ușor pentru cei care abia încep să se familiarizeze cu analiza statistică. Prin urmare, nu ezitați să puneți întrebări, le voi răspunde cu plăcere. Guru al statisticilor, te rog corectează-mă dacă am greșit undeva. În general, scrieți-vă comentariile, prieteni!

/-Criteriul studentului este parametric, prin urmare, utilizarea lui este posibilă numai atunci când rezultatele experimentului sunt prezentate sub formă de măsurători pe ultimele două scale - interval și raport. Să ilustrăm capabilitățile testului Student folosind un exemplu specific.

Să presupunem că trebuie să aflați eficiența antrenamentului de tragere folosind o anumită tehnică. În acest scop, se realizează un experiment pedagogic comparativ, în care un grup (experimental), format din 8 persoane, studiază după metodologia experimentală propusă, iar celălalt (de control) urmează pe cea tradițională, general acceptată. Ipoteza de lucru este că noua tehnică pe care o propui va fi mai eficientă. Rezultatul experimentului este o fotografiere de control a cinci lovituri, pe baza rezultatelor cărora (Tabelul 6) este necesar să se calculeze fiabilitatea diferențelor și să se verifice corectitudinea ipotezei prezentate.

Tabelul 6

Ce trebuie făcut pentru a calcula semnificația diferențelor folosind testul t Student?

1. Calculați valorile medii aritmetice ale lui X pentru fiecare grup separat folosind următoarea formulă:

Unde Xt -- valoarea unei singure măsurători; i este numărul total de dimensiuni din grup.

Introducerea valorilor reale din tabel în formulă. 6, obținem:

O comparație a valorilor medii aritmetice demonstrează că în grupul experimental această valoare (X = 35) este mai mare decât în ​​grupul de control (Hk= 27). Totuși, pentru o afirmație finală că participanții din grupul experimental au învățat să tragă mai bine, trebuie să fim convinși de semnificația statistică a diferențelor (/) dintre valorile medii aritmetice calculate.

2. În ambele grupuri, calculați abaterea standard (5) folosind următoarea formulă:

:de Ximax-- cel mai înalt indicator; Ximm-- cel mai mic indicator; LA-- coeficient de tabel. Cum se calculează abaterea standard (5): -- determinați Xitraxîn ambele grupuri; -- defini Ximiaîn aceste grupuri; -- determina numarul de masuratori in fiecare grupa (l); -- găsiți valoarea coeficientului folosind un tabel special (Anexa 12) LA, care corespunde numărului de măsurători din grupul (8). Pentru a face acest lucru, în coloana din stânga sub indexul (i) găsim numărul 0, deoarece numărul de dimensiuni din exemplul nostru este mai mic de 10, iar în linia de sus - numărul 8; la intersecția acestor linii - 2,85, care corespunde valorii coeficientului.AGat 8 teste --- înlocuiți valorile obținute în formulă și faceți calculele necesare:

3. Calculați eroarea standard a mediei aritmetice (t) folosind formula:

Pentru exemplul nostru, prima formulă este potrivită, deoarece P< 30. Вычислим для каждой группы значения:

4. Calculați eroarea medie a diferenței folosind formula:

5. Folosind un tabel special (Anexa 13), determinați fiabilitatea diferențelor. Pentru aceasta, valoarea rezultată (t) este comparată cu valoarea limită la un nivel de semnificație de 5%. (t0fi5) CU număr de grade de libertate/= pe + pc- 2, unde pachet pc~ numărul total de rezultate individuale în grupul experimental și respectiv de control. Dacă se dovedește că ceea ce s-a obținut în experiment t mai mare decât valoarea limită (/0)o5)> t0 se consideră diferențele dintre mediile aritmetice a două grupe de încredere la un nivel de semnificație de 50% și invers, în cazul în care se obține t mai putin valoare limită t0<05, se crede că diferenţele nesigure iar diferența dintre indicatorii medii aritmetice ai grupurilor este aleatorie. Valoarea limită la un nivel de semnificație de 5% (Г0>05) se determină după cum urmează:

calculați numărul de grade de libertate/= 8 + 8 - 2 = 14;

găsiți valoarea limită din tabel (Anexa 13) tofi5 la/= 14.

În exemplul nostru, valoarea tabelului tQ<05 = 2.15, comparați-l cu cel calculat G, care este egal cu 1,7, i.e. mai mică decât valoarea limită (2.15). În consecință, sunt luate în considerare diferențele dintre valorile medii aritmetice obținute în experiment nesigur, ceea ce înseamnă că nu există suficiente dovezi pentru a spune că o metodă de antrenament de tragere a fost mai eficientă decât alta. În acest caz, putem scrie: / = 1,7 cu /» > 0,05, asta înseamnă că în cazul a 100 de experimente similare, probabilitatea (R) obținându-se rezultate similare atunci când mediile aritmetice ale grupelor experimentale sunt mai mari decât cele de control, peste nivelul de semnificație de 5% sau mai puțin de 95 de cazuri din 100. Proiectarea finală a tabelului, ținând cont de calculele obținute și citând parametrii corespunzători, pot arăta astfel.

Cu un număr relativ mare de măsurători, se acceptă convențional că dacă diferența dintre mediile aritmetice este egală cu sau mai mult de trei dintre erorile sale, diferențele sunt considerate fiabile. În acest caz, fiabilitatea diferențelor este determinată de următoarea ecuație:

După cum sa menționat la începutul acestei secțiuni, testul t al lui Student poate fi utilizat numai în cazurile în care măsurătorile sunt efectuate pe o scară de interval și raport. Cu toate acestea, în cercetarea educațională apare adesea necesitatea de a determina fiabilitatea diferențelor dintre rezultatele obținute la Scala de Numire sau Ordine. În astfel de cazuri, utilizați neparametric criterii. Spre deosebire de cele parametrice, criteriile neparametrice nu necesită calcularea anumitor parametri ai rezultatelor obținute (media aritmetică, abaterea standard etc.), lucru cu care sunt asociate în principal denumirile lor. Să luăm acum în considerare două teste neparametrice pentru a determina semnificația diferențelor dintre rezultatele independente obținute la scara de ordine și denumire.

Cea mai comună sarcină în cercetarea psihologică este identificarea diferențelor între două sau mai multe grupuri de caracteristici. Identificarea unor astfel de diferențe la nivelul mediilor aritmetice este luată în considerare în procedura de analiză a statisticilor primare. Cu toate acestea, se pune întrebarea cât de fiabile sunt aceste diferențe și dacă pot fi extinse (extrapolate) la întreaga populație. Pentru a rezolva această problemă, ei folosesc cel mai adesea (presupunând o distribuție normală sau apropiată de normal) testul t (testul Student), care are scopul de a afla cât de fiabil diferă indicatorii unui eșantion de subiecți de altul (de exemplu, când subiecţii primesc în urma testării unui grup scoruri mai mari decât reprezentanţii celuilalt). Acesta este un criteriu parametric și are două forme principale:

1) fără legătură (impar) t - un test conceput pentru a afla dacă există diferențe între scorurile obținute la utilizarea aceluiași test pentru a testa două grupuri formate din persoane diferite. De exemplu, aceasta ar putea fi o comparație a nivelului de inteligență sau a stabilității neuropsihice, anxietatea elevilor de succes și nereușiți sau o comparație a elevilor de diferite clase, vârste, niveluri sociale și altele asemenea cu privire la aceste caracteristici. Pot exista eșantioane de sexe diferite, naționalități diferite, precum și subeșantioane în eșantioanele studiate, identificate în funcție de o anumită caracteristică. Criteriul se numește „neînrudit” deoarece grupurile comparate sunt formate din persoane diferite;

2) conectat (pereche) t - test utilizat pentru a compara indicatorii a două grupuri, între elementele cărora există o legătură specifică. Aceasta înseamnă că fiecărui element din primul grup îi corespunde un element al celui de-al doilea grup, similar acestuia în funcție de un anumit parametru de interes pentru cercetător. Cel mai adesea, parametrii acelorași indivizi sunt comparați înainte și după un anumit eveniment sau acțiune (de exemplu, în timpul unui studiu longitudinal sau al unui experiment formativ). Prin urmare, acest criteriu este utilizat pentru a compara performanța acelorași indivizi înainte și după un sondaj, experiment sau după un anumit timp.

Dacă datele nu sunt supuse distribuției normale, utilizați teste neparametrice echivalente cu testul t: testul Mann-Whitney, echivalent cu testul t impar, și testul Wilcoxon cu două eșantioane, echivalent cu testul t pereche.

Folosind testele t și echivalentele lor neparametrice, puteți compara doar rezultatele a două grupuri obținute folosind același test. Cu toate acestea, în unele cazuri devine necesară compararea mai multor grupuri sau evaluări de mai multe tipuri. Acest lucru se poate face în etape, împărțind sarcina în mai multe perechi de comparații (de exemplu, dacă trebuie să comparați grupurile A, B și Y în funcție de rezultatele testelor X și Y, atunci folosind testul t puteți compara mai întâi grupele A și B conform rezultatelor testului X, apoi A și B pe baza rezultatelor testului C, A și C pe baza rezultatelor testului X etc.). Cu toate acestea, aceasta este o metodă foarte intensivă în muncă, așa că recurg la metoda mai complexă de analiză a varianței.

Metoda de evaluare a fiabilității diferențelor de medii aritmetice folosind un test Student parametric destul de eficient are scopul de a rezolva una dintre problemele cel mai des observate în timpul procesării datelor - identificarea fiabilității diferențelor dintre două sau mai multe serii de valori. O astfel de evaluare este adesea necesară în analiza comparativă a grupurilor polare. ele se deosebesc pe baza diferitelor expresii ale unui anumit semn țintă (caracteristici) ale fenomenului studiat. De regulă, analiza începe cu calcularea statisticilor primare ale grupurilor selectate, apoi se evaluează semnificația diferențelor cu ajutorul formulei:

Valoarea testului Student pentru trei niveluri de încredere (statistică) semnificație (p) este dată în cărțile de referință despre statistica matematică. Numărul de grade de libertate este determinat de formula:

Cu dimensiunea eșantionului în scădere (n<10) критерий Стьюдента становится чувствительным к форме распределения исследуемого признака в генеральной совокупности. Поэтому в сомнительных случаях рекомендуют использовать непараметрические методы или сравнивать полученные значения с критическими (табл. 2.17) для высшего уровня значимости.

Decizia privind fiabilitatea diferențelor se ia dacă valoarea t calculată depășește valoarea tabelului pentru un anumit număr de grade de libertate (d (v)). Publicațiile sau rapoartele științifice indică un nivel ridicat de semnificație din trei: p<0,05; р <0,01; р <0,001.

Pentru orice valoare numerică a criteriului de fiabilitate a diferenței dintre medii, acest indicator nu evaluează gradul diferenței identificate (este evaluat prin diferența dintre medii în sine), ci doar fiabilitatea sa statistică, adică dreptul de a extinde concluzia obținută pe baza comparării mostrelor despre prezența unei diferențe la întregul fenomen (întregul proces) în ansamblu. Un criteriu de diferență calculată scăzut nu poate servi ca dovadă a absenței unei diferențe între două caracteristici (fenomene), deoarece semnificația sa (gradul de fiabilitate) depinde nu numai de mărimea mediilor, ci și de numărul de eșantioane comparate. Nu indică absența unei diferențe, ci faptul că, cu o astfel de dimensiune a eșantionului, este nesigur din punct de vedere statistic: există o șansă foarte mare ca diferența în aceste condiții să fie aleatorie, probabilitatea fiabilității sale este foarte mică.

Tabelul 2.17. Limite de încredere pentru testul Student (test t) pentru f grade de libertate

Modificarea timpului mediu de finalizare a sarcinii în a doua încercare (comparativ cu prima încercare) nu este de încredere.

Această expresie nu este echivalentă cu o afirmație despre omogenitatea statistică a celor două eșantioane comparate. În plus, aplicarea criteriului Studentului în cazul unor astfel de eșantioane inegale nu este în întregime corectă din punct de vedere matematic și, desigur, afectează nesiguranța finală a diferențelor dintre Хср = 9,1 și Хср = 8,5. Folosind acest criteriu, nu se evaluează gradul de apropiere a două medii, ci se ia în considerare atribuirea sau seinea aleatoriei (la un anumit nivel de semnificație). .

Testul t al elevuluipentru mostre independente

testul t al elevului ( t-testul elevului sau pur și simplu " t-test") este folosit dacă trebuie să comparați doar două grupuri caracteristici cantitative cu distribuție normală (un caz special de analiză a varianței). Notă: acest criteriu nu poate fi utilizat la compararea mai multor grupuri în perechi, în acest caz, trebuie utilizată analiza varianței. Utilizarea eronată a testului t Student crește probabilitatea de a „dezvălui” diferențe care nu există. De exemplu, în loc să recunoască mai multe tratamente ca fiind la fel de eficiente (sau ineficiente), unul dintre ele este declarat mai bun.

Două evenimente sunt numite independente dacă apariția unuia dintre ele nu afectează în niciun fel apariția celuilalt. În mod similar, două colecții pot fi numite independente dacă proprietățile uneia dintre ele nu sunt în niciun fel legate de proprietățile celeilalte.

Exemplu de execuție t-test in programul STATISTICA.

Femeile sunt în medie mai scunde decât bărbații, cu toate acestea, acest lucru nu este rezultatul faptului că bărbații au vreo influență asupra femeilor - este o chestiune de caracteristici genetice ale sexului. Prin utilizarea t- Testul trebuie să verifice dacă există o diferență semnificativă statistic între valorile medii de înălțime în grupurile de bărbați și femei. (În scopuri educaționale, presupunem că datele de înălțime urmează o distribuție normală și, prin urmare t- testul este aplicabil).

Figura 1. Exemplu de formatare a datelor pentru execuție t-

Acordați atenție modului în care datele sunt formatate în Figura 1. La fel ca atunci când construiți grafice, cum ar fiWhisker plot sau Intreg cutie-muștați, există două variabile în tabel: una dintre ele este gruparea (Variabila de grupare) („Sex”) - conține coduri (soț și soție) care permit programului să determine care dintre datele de înălțime aparține cărei grupe; al doilea – așa-numitul variabilă dependentă (Variabilă dependentă) („Creștere”) - conține datele reale care sunt analizate. Cu toate acestea, la executaret-test pentru mostre independente în programul STATISTICA, este posibilă o altă opțiune de proiectare - datele pentru fiecare dintre grupuri („Bărbați” și „Femei”) pot fi introduse în coloane separate (Figura 2).

Figura 2. O altă opțiune pentru formatarea datelor pentru execuție t- test de probe independente

Pentru executare t-Pentru un test independent de mostre, trebuie să faceți următoarele:

1-a. Lansați modulul t- aluatul din meniu Statistici > Statistici de bază/Tabele > t-Test, independent, pe grupuri(dacă există o variabilă de grupare în tabelul de date, vezi Figura 3)​

SAU

1-b. Lansați modulul t- aluatul din meniu Statistici > Statistici de bază/Tabele > t-test, independent, prin variabile(dacă datele sunt introduse în coloane independente, vezi Figura 4).

Mai jos este o versiune a testului în care există o variabilă de grupare în tabelul de date.

2. În fereastra care se deschide, faceți clic pe butonul Variabileși spuneți programului care dintre variabilele tabelului Foaie de calcul este grupare și care este dependentă (Figurile 5-6).

Figura 5. Selectarea variabilelor pentru a le include t-Test

Figura 6. Fereastra cu in variabile selectate pentru conducere t-Test

3. Apăsați butonulRezumat: teste T.

Figura 7. Rezultate t-test pentru probe independente

Ca rezultat, programul va produce un registru de lucruCaiet de lucru, care conține un tabel cu rezultatelet-test (Figura 7 ). Acest tabel are mai multe coloane:

  • Rău(masculin) - înălțime medie în grupa „Bărbați”;
  • Rău(femeie) - înălțime medie în grupul „Femei”;
  • t- valoare: valoare calculată de program t-testul elevului;
  • df- numărul de grade de libertate;
  • P- probabilitatea de validitate a ipotezei că valorile medii comparate nu diferă. De fapt, acesta este cel mai important rezultat al analizei, deoarece este valoarea P spune dacă ipoteza testată este adevărată. În exemplul nostru, P > 0,05, din care putem concluziona că nu există diferențe semnificative statistic între înălțimile bărbaților și femeilor.
  • N valabil(bărbați) - dimensiunea eșantionului „Bărbați”;
  • N valabil(femeie) - dimensiunea eșantionului „Femei”;
  • Std. dev. (masculin) - abaterea standard a eșantionului „Bărbați”;
  • Std. dev. (feminin) - abaterea standard a eșantionului „Femei”;
  • Raportul F, variațiile- valoarea testului F Fisher, cu ajutorul căruia se testează ipoteza despre egalitatea varianţelor în probele comparate;
  • P, Variante- probabilitatea de validitate a ipotezei că varianţele eşantioanelor comparate nu diferă.

Top