छात्र के टी परीक्षण का पूर्ण मूल्य। आर वातावरण में डेटा की सामान्यता की जाँच करते हुए स्टूडेंट टेस्ट (टी-टेस्ट) का उपयोग कब और कैसे करें

विद्यार्थी के टी-टेस्ट का उपयोग किन मामलों में किया जा सकता है?

स्टूडेंट टी-टेस्ट लागू करने के लिए मूल डेटा का होना जरूरी है सामान्य वितरण. स्वतंत्र नमूनों के लिए दो-नमूना मानदंड लागू करने के मामले में, शर्त को पूरा करना भी आवश्यक है भिन्नताओं की समानता (समरूपता)।.

यदि ये शर्तें पूरी नहीं होती हैं, तो नमूना साधनों की तुलना करते समय समान तरीकों का उपयोग किया जाना चाहिए। गैर-पैरामीट्रिक आँकड़ेजिनमें से सबसे प्रसिद्ध हैं मान-व्हिटनी यू परीक्षण(स्वतंत्र नमूनों के लिए दो-नमूना परीक्षण के रूप में), और साइन मानदंडऔर विलकॉक्सन परीक्षण(आश्रित नमूनों के मामलों में प्रयुक्त)।

औसत मूल्यों की तुलना करने के लिए, छात्र के टी-टेस्ट की गणना निम्नलिखित सूत्र का उपयोग करके की जाती है:

कहाँ एम 1- पहली तुलना की गई जनसंख्या (समूह) का अंकगणितीय माध्य, एम 2- दूसरी तुलना की गई जनसंख्या (समूह) का अंकगणितीय माध्य, मी 1 - औसत त्रुटिप्रथम अंकगणितीय माध्य, मी 2- दूसरे अंकगणितीय माध्य की औसत त्रुटि।

विद्यार्थी के टी-परीक्षण मान की व्याख्या कैसे करें?

परिणामी छात्र के टी-टेस्ट मान की सही व्याख्या की जानी चाहिए। ऐसा करने के लिए, हमें प्रत्येक समूह में विषयों की संख्या (n 1 और n 2) जानने की आवश्यकता है। स्वतंत्रता की कोटि की संख्या ज्ञात करना एफनिम्नलिखित सूत्र के अनुसार:

एफ = (एन 1 + एन 2) - 2

इसके बाद हम तय करते हैं महत्वपूर्ण मानमहत्व के आवश्यक स्तर (उदाहरण के लिए, पी = 0.05) और स्वतंत्रता की दी गई डिग्री के लिए छात्र का टी-टेस्ट एफतालिका के अनुसार ( नीचे देखें).

हम मानदंड के महत्वपूर्ण और परिकलित मूल्यों की तुलना करते हैं:

· यदि छात्र के टी-टेस्ट का परिकलित मान बराबर या अधिकमहत्वपूर्ण, तालिका से पाया गया, हम निष्कर्ष निकालते हैं कि तुलना किए गए मूल्यों के बीच अंतर सांख्यिकीय रूप से महत्वपूर्ण हैं।

· यदि छात्र के टी-टेस्ट के मान की गणना की जाती है कमसारणीबद्ध, जिसका अर्थ है कि तुलना किए गए मूल्यों के बीच अंतर सांख्यिकीय रूप से महत्वपूर्ण नहीं है।

विद्यार्थी के टी-टेस्ट की गणना का उदाहरण

एक नई आयरन तैयारी की प्रभावशीलता का अध्ययन करने के लिए, एनीमिया से पीड़ित रोगियों के दो समूहों का चयन किया गया। पहले समूह में, रोगियों को दो सप्ताह के लिए एक नई दवा दी गई, और दूसरे समूह में उन्हें प्लेसबो दिया गया। इसके बाद, परिधीय रक्त में हीमोग्लोबिन का स्तर मापा गया। पहले ग्रुप में औसत स्तरहीमोग्लोबिन 115.4±1.2 ग्राम/लीटर था, और दूसरे में - 103.7±2.3 ग्राम/लीटर (डेटा प्रारूप में प्रस्तुत किया गया है) म±म), तुलना की जा रही आबादी का वितरण सामान्य है। पहले समूह की संख्या 34 थी, और दूसरे - 40 मरीज़। प्राप्त अंतरों के सांख्यिकीय महत्व और नई लौह तैयारी की प्रभावशीलता के बारे में निष्कर्ष निकालना आवश्यक है।

समाधान:मतभेदों के महत्व का आकलन करने के लिए, हम छात्र के टी-टेस्ट का उपयोग करते हैं, जिसकी गणना वर्ग त्रुटियों के योग से विभाजित औसत मूल्यों में अंतर के रूप में की जाती है:

गणना करने के बाद, टी-परीक्षण मान 4.51 निकला। हम स्वतंत्रता की डिग्री की संख्या (34 + 40) - 2 = 72 के रूप में पाते हैं। हम परिणामी छात्र के टी-टेस्ट मान 4.51 की तुलना तालिका में दर्शाए गए पी = 0.05 पर महत्वपूर्ण मान से करते हैं: 1.993। चूँकि मानदंड का परिकलित मान महत्वपूर्ण मान से अधिक है, हम यह निष्कर्ष निकालते हैं कि देखे गए अंतर सांख्यिकीय रूप से महत्वपूर्ण हैं (महत्व स्तर पी<0,05).

फिशर वितरण एक यादृच्छिक चर का वितरण है

यादृच्छिक चर कहाँ हैं एक्स 1और एक्स 2स्वतंत्र हैं और स्वतंत्रता की डिग्री की संख्या के साथ काई-वर्ग वितरण हैं क 1और क 2क्रमश। उसी समय, युगल (के 1 , के 2)- फिशर वितरण की "स्वतंत्रता की डिग्री" की एक जोड़ी, अर्थात्, क 1अंश की स्वतंत्रता की डिग्री की संख्या है, और क 2– हर की स्वतंत्रता की डिग्री की संख्या. एक यादृच्छिक चर का वितरण एफइसका नाम महान अंग्रेजी सांख्यिकीविद् आर. फिशर (1890-1962) के नाम पर रखा गया, जिन्होंने अपने कार्यों में इसका सक्रिय रूप से उपयोग किया।

फिशर वितरण का उपयोग प्रतिगमन विश्लेषण, भिन्नताओं की समानता और लागू आंकड़ों की अन्य समस्याओं में मॉडल की पर्याप्तता के बारे में परिकल्पना का परीक्षण करते समय किया जाता है।

विद्यार्थी के महत्वपूर्ण मूल्यों की तालिका।

फॉर्म की शुरुआत

स्वतंत्रता की डिग्री की संख्या, एफ विद्यार्थी का t-परीक्षण मान p=0.05 पर
12.706
4.303
3.182
2.776
2.571
2.447
2.365
2.306
2.262
2.228
2.201
2.179
2.160
2.145
2.131
2.120
2.110
2.101
2.093
2.086
2.080
2.074
2.069
2.064
2.060
2.056
2.052
2.048
2.045
2.042
2.040
2.037
2.035
2.032
2.030
2.028
2.026
2.024
40-41 2.021
42-43 2.018
44-45 2.015
46-47 2.013
48-49 2.011
50-51 2.009
52-53 2.007
54-55 2.005
56-57 2.003
58-59 2.002
60-61 2.000
62-63 1.999
64-65 1.998
66-67 1.997
68-69 1.995
70-71 1.994
72-73 1.993
74-75 1.993
76-77 1.992
78-79 1.991
80-89 1.990
90-99 1.987
100-119 1.984
120-139 1.980
140-159 1.977
160-179 1.975
180-199 1.973
1.972
1.960

शरद ऋतु आ गई है, जिसका अर्थ है कि यह एक नई विषयगत परियोजना "आर के साथ सांख्यिकीय विश्लेषण" लॉन्च करने का समय है। इसमें हम सांख्यिकीय विधियों को व्यवहार में उनके अनुप्रयोग के दृष्टिकोण से देखेंगे: हम पता लगाएंगे कि कौन सी विधियाँ मौजूद हैं, किन मामलों में और उन्हें कैसे लागू किया जाए। मेरी राय में, स्टूडेंट टेस्ट या टी-टेस्ट सांख्यिकीय विश्लेषण की दुनिया के परिचय के रूप में आदर्श है। विद्यार्थी का टी-टेस्ट काफी सरल और संकेतात्मक है, और इसके लिए सांख्यिकी में न्यूनतम बुनियादी ज्ञान की भी आवश्यकता होती है, जिससे पाठक इस लेख को पढ़ते समय परिचित हो सकते हैं।

नोट 1:यहां और अन्य लेखों में आपको सूत्र और गणितीय स्पष्टीकरण नहीं दिखेंगे, क्योंकि... यह जानकारी प्राकृतिक विज्ञान और मानविकी के उन छात्रों के लिए है जो सांख्यिकी में अपना पहला कदम उठा रहे हैं। विश्लेषण।

टी-टेस्ट क्या है और इसका उपयोग किन मामलों में किया जाना चाहिए?

शुरुआत में, यह कहा जाना चाहिए कि आंकड़ों में, ओकाम का रेजर सिद्धांत अक्सर लागू होता है, जो बताता है कि जटिल सांख्यिकीय विश्लेषण करने का कोई मतलब नहीं है यदि आप एक सरल विश्लेषण का उपयोग कर सकते हैं (यदि आपके पास चेनसॉ है तो आपको चेनसॉ से रोटी नहीं काटनी चाहिए) चाकू)। इसीलिए, अपनी सरलता के बावजूद, t- परीक्षणयदि आप जानते हैं कि यह क्या है और किन मामलों में इसका उपयोग किया जाना चाहिए तो यह एक गंभीर उपकरण है।

यह उत्सुक है कि यह विधि गिनीज फैक्ट्री में काम करने के लिए आमंत्रित रसायनज्ञ विलियम गॉसेट द्वारा बनाई गई थी। उनके द्वारा विकसित परीक्षण शुरू में बीयर की गुणवत्ता का आकलन करने के लिए काम करता था। हालाँकि, कारखाने के रसायनज्ञों को अपने नाम के तहत स्वतंत्र रूप से वैज्ञानिक कार्य प्रकाशित करने से प्रतिबंधित किया गया था। इसलिए, 1908 में, विलियम ने छद्म नाम "स्टूडेंट" के तहत बायोमेट्रिक पत्रिका में अपना लेख प्रकाशित किया। बाद में, उत्कृष्ट गणितज्ञ और सांख्यिकीविद् रोनाल्ड फिशर ने इस पद्धति को परिष्कृत किया, जो तब स्टूडेंट के टी-टेस्ट के नाम से व्यापक हो गई।

विद्यार्थी का परीक्षण (टी-टेस्ट)एक सांख्यिकीय पद्धति है जो आपको दो नमूनों के औसत मूल्यों की तुलना करने और परीक्षण परिणामों के आधार पर यह निष्कर्ष निकालने की अनुमति देती है कि वे सांख्यिकीय रूप से एक दूसरे से भिन्न हैं या नहीं। यदि आप जानना चाहते हैं कि क्या आपके क्षेत्र में औसत जीवन प्रत्याशा राष्ट्रीय औसत से भिन्न है; विभिन्न क्षेत्रों में आलू की पैदावार की तुलना कर सकेंगे; या फिर नई दवा लेने से पहले और बाद में आपका रक्तचाप बदलता है या नहीं t- परीक्षणआपके लिए उपयोगी हो सकता है. शायद क्यों? क्योंकि इसे पूरा करने के लिए, यह आवश्यक है कि नमूना डेटा का वितरण सामान्य के करीब हो।इस प्रयोजन के लिए, ऐसी मूल्यांकन विधियाँ हैं जो आपको यह कहने की अनुमति देती हैं कि किसी दिए गए मामले में यह मान लेना स्वीकार्य है कि डेटा सामान्य रूप से वितरित है या नहीं। आइये इसके बारे में अधिक विस्तार से बात करते हैं।

डेटा का सामान्य वितरण और उसका अनुमान लगाने की विधियाँ qqplot और shapiro.test

डेटा का सामान्य वितरण मात्रात्मक डेटा के लिए विशिष्ट है, जिसका वितरण कई कारकों से प्रभावित होता है या यादृच्छिक होता है। सामान्य वितरण की विशेषता कई विशेषताएं हैं:

  • यह सदैव सममित एवं घंटी के आकार का होता है।
  • माध्य और माध्य मान समान हैं।
  • सभी डेटा का 68.2% दोनों दिशाओं में एक मानक विचलन के भीतर है, दो के भीतर - 95.5%, तीन के भीतर - 99.7%

आइए सामान्य वितरण के साथ एक यादृच्छिक नमूना बनाएं, जहां माप की कुल संख्या = 100, अंकगणितीय माध्य = 5, और मानक विचलन= 1. फिर हम इसे हिस्टोग्राम के रूप में ग्राफ़ पर प्रदर्शित करते हैं:

मेरी जानकारी<- rnorm(100, mean = 5, sd = 1) hist(mydata, col = "light green")

आपका ग्राफ़ मेरे ग्राफ़ से थोड़ा भिन्न हो सकता है क्योंकि संख्याएँ यादृच्छिक रूप से उत्पन्न होती हैं। जैसा कि आप देख सकते हैं, डेटा पूरी तरह से सममित नहीं है, लेकिन सामान्य वितरण के आकार को बनाए रखता है। हालाँकि, हम डेटा की सामान्यता निर्धारित करने के लिए अधिक वस्तुनिष्ठ तरीकों का उपयोग करेंगे।

सामान्यता का सबसे सरल परीक्षणों में से एक है क्वांटाइल प्लॉट (qqplot). परीक्षण का सार सरल है: यदि डेटा का सामान्य वितरण है, तो उन्हें सैद्धांतिक मात्राओं की रेखा से बहुत अधिक विचलन नहीं करना चाहिए और विश्वास अंतराल से परे जाना चाहिए। आइए इस परीक्षण को आर में करें।

आर वातावरण में पैकेज "कार"। qqPlot(mydata) #परीक्षण चलाएँ

जैसा कि ग्राफ़ से देखा जा सकता है, हमारे डेटा में सैद्धांतिक सामान्य वितरण से गंभीर विचलन नहीं है। लेकिन कभी-कभी मदद से qqplotइसका निश्चित उत्तर देना असंभव है। ऐसे में आपको इसका इस्तेमाल करना चाहिए शापिरो-विल्क परीक्षण , जो शून्य परिकल्पना पर आधारित है कि हमारा डेटा सामान्य रूप से वितरित होता है। यदि पी-मान 0.05 से कम है ( पी-मूल्य < 0.05), то мы вынуждены отклонить нулевую гипотезу. P-значение в этом случае будет говорить о том, что вероятность ошибки при отклонении нулевой гипотезы будет равна менее 5%.

आर में शापिरो-विल्क परीक्षण चलाना आसान है। ऐसा करने के लिए, आपको बस shapiro.test फ़ंक्शन को कॉल करना होगा, और कोष्ठक में अपने डेटा का नाम डालना होगा। हमारे मामले में, पी-मान 0.05 से काफी अधिक होना चाहिए, जो हमें शून्य परिकल्पना को अस्वीकार करने की अनुमति नहीं देता है कि हमारा डेटा सामान्य रूप से वितरित किया जाता है।

आर वातावरण में विद्यार्थी का टी-टेस्ट चलाना

इसलिए, यदि नमूनों के डेटा का वितरण सामान्य है, तो आप सुरक्षित रूप से इन नमूनों के औसत की तुलना करना शुरू कर सकते हैं। टी-परीक्षण के तीन मुख्य प्रकार हैं, जिनका उपयोग विभिन्न स्थितियों में किया जाता है। आइए उनमें से प्रत्येक को उदाहरणात्मक उदाहरणों का उपयोग करके देखें।

एक-नमूना टी-परीक्षण

एक-नमूना टी-परीक्षण चुना जाना चाहिए यदि आप किसी नमूने की तुलना किसी प्रसिद्ध औसत से करते हैं।उदाहरण के लिए, क्या उत्तरी काकेशस संघीय जिले के निवासियों की औसत आयु रूस में सामान्य आयु से भिन्न है? एक राय है कि काकेशस की जलवायु और इसमें रहने वाले लोगों की सांस्कृतिक विशेषताएं जीवन को लम्बा करने में योगदान करती हैं। इस परिकल्पना का परीक्षण करने के लिए, हम रोसस्टैट (रूस के क्षेत्रों द्वारा औसत जीवन प्रत्याशा की तालिका) से डेटा लेंगे और एक-नमूना टी-परीक्षण लागू करेंगे। चूंकि छात्र का टी-टेस्ट सांख्यिकीय परिकल्पनाओं के परीक्षण पर आधारित है, इसलिए हम शून्य परिकल्पना के रूप में स्वीकार करेंगे कि रूस और उत्तरी काकेशस गणराज्यों के लिए औसत अपेक्षित अवधि स्तर के बीच कोई अंतर नहीं है। यदि मतभेद मौजूद हैं, तो उन्हें सांख्यिकीय रूप से महत्वपूर्ण मानने के लिए पी-मूल्य 0.05 से कम होना चाहिए (तर्क ऊपर वर्णित शापिरो-विल्क परीक्षण के समान है)।

आइए डेटा को आर में लोड करें। ऐसा करने के लिए, हम काकेशस गणराज्यों (एडीगिया सहित) के लिए औसत मूल्यों के साथ एक वेक्टर बनाएंगे। फिर, आइए पैरामीटर में निर्दिष्ट करते हुए एक-नमूना टी-परीक्षण चलाएं म्यूरूस में औसत जीवन प्रत्याशा 70.93 है।

रोसस्टैट<-c(79.42, 75.83, 74.16, 73.91, 73.82, 73.06, 72.01) qqPlot(rosstat) shapiro.test(rosstat) t.test(rosstat, mu = 70.93)

भले ही हमारे पास नमूने में केवल 7 अंक हैं, वे आम तौर पर सामान्यता परीक्षण पास करते हैं और हम उन पर भरोसा कर सकते हैं क्योंकि यह डेटा पहले ही क्षेत्र में औसत हो चुका है।

टी-परीक्षण के नतीजे बताते हैं कि उत्तरी काकेशस (74.6 वर्ष) के निवासियों के लिए औसत जीवन प्रत्याशा वास्तव में रूसी औसत (70.93 वर्ष) से ​​अधिक है, और परीक्षण के परिणाम सांख्यिकीय रूप से महत्वपूर्ण हैं (पी)< 0.05).

स्वतंत्र दो-नमूना टी-परीक्षण

दो-नमूना टी-परीक्षण का उपयोग किया जाता है, जब आप दो स्वतंत्र नमूनों की तुलना करते हैं. मान लीजिए कि हम यह पता लगाना चाहते हैं कि क्या किसी क्षेत्र के उत्तर और दक्षिण में आलू की पैदावार अलग-अलग है। ऐसा करने के लिए, हमने 40 खेतों से डेटा एकत्र किया: जिनमें से 20 उत्तर में स्थित थे और "उत्तर" नमूना बनाते थे, और शेष 20 दक्षिण में स्थित थे, जो "दक्षिण" नमूना बनाते थे।

आइए डेटा को आर वातावरण में लोड करें। डेटा की सामान्यता की जांच करने के अलावा, एक "व्हिस्कर प्लॉट" बनाना उपयोगी होगा जिसमें आप दोनों नमूनों के लिए माध्यिका और डेटा का प्रसार देख सकते हैं।

उत्तर<- c(122, 150, 136, 129, 169, 158, 132, 162, 143, 179, 139, 193, 155, 160, 165, 149, 173, 173, 141, 166) qqप्लॉट(उत्तर) shapiro.test(उत्तर) दक्षिण<- c(170, 163, 178, 150, 166, 142, 157, 149, 151, 164, 163, 161, 159, 139, 180, 155, 144, 139, 151, 160) qqप्लॉट(उत्तर) shapiro.test(उत्तर) बॉक्सप्लॉट(उत्तर, दक्षिण)

जैसा कि ग्राफ़ से देखा जा सकता है, नमूना माध्यिकाएँ एक दूसरे से बहुत भिन्न नहीं हैं, लेकिन डेटा का प्रसार उत्तर में बहुत अधिक है। आइए t.test फ़ंक्शन का उपयोग करके जांचें कि औसत मान सांख्यिकीय रूप से भिन्न हैं या नहीं। हालाँकि, इस बार पैरामीटर के स्थान पर म्यूहमने दूसरे नमूने का नाम रखा। परीक्षण के परिणाम, जो आप नीचे दिए गए चित्र में देख रहे हैं, संकेत करते हैं कि उत्तर में आलू की औसत उपज दक्षिण में उपज से सांख्यिकीय रूप से भिन्न नहीं है ( पी = 0.6339).

आश्रित नमूनों के लिए दो-नमूना ( आश्रित दो-नमूना टी-परीक्षा)

तीसरे प्रकार के t-परीक्षण का प्रयोग कब किया जाता है? यदि नमूनों के तत्व एक दूसरे पर निर्भर हैं. यह के लिए आदर्श है परिणामों की पुनरावृत्ति की जाँच करनाप्रयोग: यदि दोहराया गया डेटा मूल से सांख्यिकीय रूप से भिन्न नहीं है, तो डेटा की दोहराव क्षमता अधिक है। इसके अलावा, आश्रित नमूनों के लिए दो-नमूना टी-परीक्षण का व्यापक रूप से उपयोग किया जाता है चिकित्सा अनुसंधान मेंप्रशासन से पहले और बाद में शरीर पर किसी दवा के प्रभाव का अध्ययन करते समय।

इसे R में चलाने के लिए, आपको वही t.test फ़ंक्शन दर्ज करना चाहिए। हालाँकि, कोष्ठक में, डेटा तालिकाओं के बाद, आपको अतिरिक्त तर्क जोड़ा = TRUE दर्ज करना होगा। यह तर्क कहता है कि आपका डेटा एक-दूसरे पर निर्भर करता है। उदाहरण के लिए:

t.परीक्षण(प्रयोग, povtor.experimenta, युग्मित = सत्य) t.test(davlenie.do.priema, davlenie.posle.priema, युग्मित = सत्य)

T.test फ़ंक्शन में दो अतिरिक्त तर्क भी हैं जो परीक्षण परिणामों की गुणवत्ता में सुधार कर सकते हैं: var.equal और वैकल्पिक। यदि आप जानते हैं कि नमूनों के बीच भिन्नता समान है, तो तर्क var.equal = TRUE डालें। यदि आप इस परिकल्पना का परीक्षण करना चाहते हैं कि नमूनों में माध्यों के बीच का अंतर 0 से काफी कम या अधिक है, तो तर्क वैकल्पिक = "कम" या वैकल्पिक = "अधिक" दर्ज करें (डिफ़ॉल्ट रूप से, वैकल्पिक परिकल्पना कहती है कि नमूने बस एक दूसरे से अलग हैं दोस्त: वैकल्पिक = "दो तरफा" )।

निष्कर्ष

लेख काफी लंबा हो गया, लेकिन अब आप जानते हैं: छात्र परीक्षण और सामान्य वितरण क्या हैं; फ़ंक्शंस का उपयोग कैसे करें qqplotऔर shapiro.testआर में डेटा सामान्यता की जाँच करें; और तीन प्रकार के टी-परीक्षणों का भी विश्लेषण किया और उन्हें आर वातावरण में संचालित किया।

यह विषय उन लोगों के लिए आसान नहीं है जो अभी-अभी सांख्यिकीय विश्लेषण से परिचित होना शुरू कर रहे हैं। इसलिए, प्रश्न पूछने में संकोच न करें, मुझे उनका उत्तर देने में खुशी होगी। सांख्यिकी गुरु, अगर मुझसे कहीं कोई गलती हुई हो तो कृपया मुझे सुधारें। सामान्य तौर पर, अपनी टिप्पणियाँ लिखें, दोस्तों!

/-विद्यार्थी की कसौटी पैरामीट्रिक है, अत: इसका उपयोग तभी संभव है जब प्रयोग के परिणाम अंतिम दो पैमानों - अंतराल और अनुपात - पर माप के रूप में प्रस्तुत किये जायें। आइए हम एक विशिष्ट उदाहरण का उपयोग करके छात्र परीक्षण की क्षमताओं को स्पष्ट करें।

मान लीजिए कि आपको एक निश्चित तकनीक का उपयोग करके शूटिंग प्रशिक्षण की प्रभावशीलता का पता लगाने की आवश्यकता है। इस उद्देश्य के लिए, एक तुलनात्मक शैक्षणिक प्रयोग किया जाता है, जहां एक समूह (प्रयोगात्मक), जिसमें 8 लोग शामिल होते हैं, प्रस्तावित प्रयोगात्मक पद्धति के अनुसार अध्ययन करते हैं, और दूसरा (नियंत्रण) पारंपरिक, आम तौर पर स्वीकृत पद्धति का पालन करता है। कामकाजी परिकल्पना यह है कि आपके द्वारा प्रस्तावित नई तकनीक अधिक प्रभावी होगी। प्रयोग का परिणाम पांच शॉट्स की एक नियंत्रण शूटिंग है, जिसके परिणामों (तालिका 6) के आधार पर मतभेदों की विश्वसनीयता की गणना करना और सामने रखी गई परिकल्पना की शुद्धता की जांच करना आवश्यक है।

तालिका 6

विद्यार्थी के टी-परीक्षण का उपयोग करके अंतरों के महत्व की गणना करने के लिए क्या करने की आवश्यकता है?

1. निम्नलिखित सूत्र का उपयोग करके प्रत्येक समूह के लिए अलग से X के अंकगणितीय औसत की गणना करें:

कहाँ एक्सटी --एकल माप का मूल्य; i समूह में आयामों की कुल संख्या है।

तालिका से वास्तविक मानों को सूत्र में डालना। 6, हमें मिलता है:

अंकगणितीय माध्य मानों की तुलना से सिद्ध होता है कि प्रायोगिक समूह में यह मान (X = 35) नियंत्रण समूह की तुलना में अधिक है (एच.के= 27). हालाँकि, अंतिम कथन के लिए कि प्रायोगिक समूह के प्रतिभागियों ने बेहतर शूटिंग करना सीख लिया है, किसी को गणना किए गए अंकगणितीय औसत मूल्यों के बीच अंतर (/) के सांख्यिकीय महत्व के बारे में आश्वस्त होना चाहिए।

2. दोनों समूहों में, निम्न सूत्र का उपयोग करके मानक विचलन (5) की गणना करें:

:डे ज़ीमैक्स- उच्चतम सूचक; Ximm- सबसे कम सूचक; को-- तालिका गुणांक. मानक विचलन (5) की गणना कैसे करें: -- निर्धारित करें ज़िट्रैक्सदोनों समूहों में; -- परिभाषित करना ज़िमियाइन समूहों में; - प्रत्येक समूह (एल) में माप की संख्या निर्धारित करें; -- एक विशेष तालिका का उपयोग करके गुणांक का मान ज्ञात करें (परिशिष्ट 12) को,जो समूह (8) में मापों की संख्या से मेल खाता है। ऐसा करने के लिए, सूचकांक (i) के तहत सबसे बाएं कॉलम में हमें संख्या 0 मिलती है, क्योंकि हमारे उदाहरण में आयामों की संख्या 10 से कम है, और शीर्ष पंक्ति में - संख्या 8; इन पंक्तियों के प्रतिच्छेदन पर - 2.85, जो गुणांक के मान से मेल खाता है। 8 परीक्षणों पर --- प्राप्त मानों को सूत्र में प्रतिस्थापित करें और आवश्यक गणना करें:

3. सूत्र का उपयोग करके अंकगणितीय माध्य (टी) की मानक त्रुटि की गणना करें:

हमारे उदाहरण के लिए, पहला सूत्र उपयुक्त है पी< 30. Вычислим для каждой группы значения:

4. सूत्र का उपयोग करके औसत अंतर त्रुटि की गणना करें:

5. एक विशेष तालिका (परिशिष्ट 13) का उपयोग करके, मतभेदों की विश्वसनीयता निर्धारित करें। इसके लिए, परिणामी मूल्य (टी) 5% महत्व स्तर पर सीमा मूल्य के साथ तुलना की जाती है (t0fi5)स्वतंत्रता की डिग्री की संख्या के साथ/= पीई + पीसी- 2, कहाँ पीसी पैक करें~प्रयोगात्मक और नियंत्रण समूहों में क्रमशः व्यक्तिगत परिणामों की कुल संख्या। यदि यह पता चले कि प्रयोग में क्या प्राप्त हुआ टीसीमा मान से अधिक (/0)o5)> t0 दो समूहों के अंकगणितीय साधनों के बीच अंतर पर विचार किया जाता है भरोसेमंद 50% महत्व स्तर पर, और इसके विपरीत, उस स्थिति में जब प्राप्त किया गया हो टी कमसीमा मूल्य टी0<05, ऐसा माना जाता है कि मतभेद अविश्वसनीयऔर समूहों के अंकगणितीय माध्य संकेतकों में अंतर यादृच्छिक है। 5% महत्व स्तर (जी0>05) पर सीमा मान निम्नानुसार निर्धारित किया जाता है:

स्वतंत्रता की कोटियों की संख्या की गणना करें/= 8 + 8 - 2 = 14;

तालिका से सीमा मान ज्ञात करें (परिशिष्ट 13) tofi5पर/=14.

हमारे उदाहरण में, तालिका मान tQ<05 = 2.15, इसकी तुलना गणना से करें जी,जो 1.7 के बराबर है, अर्थात। सीमा मान (2.15) से कम। परिणामस्वरूप, प्रयोग में प्राप्त अंकगणितीय माध्य मानों के बीच अंतर पर विचार किया जाता है अविश्वसनीय,जिसका मतलब है कि यह कहने के लिए पर्याप्त सबूत नहीं हैं कि एक शूटिंग प्रशिक्षण पद्धति दूसरी की तुलना में अधिक प्रभावी थी। इस मामले में, हम लिख सकते हैं: / = 1.7 साथ में /» > 0.05, इसका मतलब है कि 100 समान प्रयोगों के मामले में, संभावना (आर)समान परिणाम प्राप्त करना जब प्रयोगात्मक समूहों का अंकगणितीय औसत नियंत्रण समूहों से अधिक हो, 5% महत्व स्तर से अधिक हो या 100 में से 95 मामलों से कम हो। तालिका का अंतिम डिज़ाइन, प्राप्त गणनाओं को ध्यान में रखते हुए और उद्धृत करते हुए प्रासंगिक पैरामीटर, इस तरह दिख सकते हैं।

अपेक्षाकृत बड़ी संख्या में मापों के साथ, यह पारंपरिक रूप से स्वीकार किया जाता है कि यदि अंकगणितीय औसत के बीच का अंतर इसकी तीन त्रुटियों के बराबर या उससे अधिक है, तो अंतर को विश्वसनीय माना जाता है। इस मामले में, मतभेदों की विश्वसनीयता निम्नलिखित समीकरण द्वारा निर्धारित की जाती है:

जैसा कि इस खंड की शुरुआत में बताया गया है, छात्र के टी-टेस्ट का उपयोग केवल उन मामलों में किया जा सकता है जहां माप अंतराल और अनुपात पैमाने पर किए जाते हैं। हालाँकि, शैक्षिक अनुसंधान में अक्सर नामकरण या क्रम पैमाने पर प्राप्त परिणामों के बीच अंतर की विश्वसनीयता निर्धारित करने की आवश्यकता होती है। ऐसे मामलों में, उपयोग करें अपैरामीट्रिकमानदंड। पैरामीट्रिक मानदंडों के विपरीत, गैर-पैरामीट्रिक मानदंडों को प्राप्त परिणामों (अंकगणित माध्य, मानक विचलन, आदि) के कुछ मापदंडों की गणना की आवश्यकता नहीं होती है, जिससे उनके नाम मुख्य रूप से जुड़े होते हैं। आइए अब क्रम और नामकरण पैमाने पर प्राप्त स्वतंत्र परिणामों के बीच अंतर के महत्व को निर्धारित करने के लिए दो गैर-पैरामीट्रिक परीक्षणों पर विचार करें।

मनोवैज्ञानिक अनुसंधान में सबसे आम कार्य दो या दो से अधिक समूहों की विशेषताओं के बीच अंतर की पहचान करना है। प्राथमिक सांख्यिकी के विश्लेषण की प्रक्रिया में अंकगणितीय माध्य के स्तर पर ऐसे अंतरों की पहचान पर विचार किया जाता है। हालाँकि, सवाल यह उठता है कि ये अंतर कितने विश्वसनीय हैं और क्या इन्हें पूरी आबादी तक बढ़ाया जा सकता है। इस समस्या को हल करने के लिए, वे अक्सर (सामान्य या सामान्य वितरण के करीब मानते हुए) टी-टेस्ट (छात्र परीक्षण) का उपयोग करते हैं, जिसका उद्देश्य यह पता लगाना है कि विषयों के एक नमूने के संकेतक दूसरे से कितने विश्वसनीय रूप से भिन्न हैं (उदाहरण के लिए, जब विषयों को एक समूह के परीक्षण के परिणामस्वरूप दूसरे के प्रतिनिधियों की तुलना में अधिक अंक प्राप्त होते हैं)। यह एक पैरामीट्रिक मानदंड है और इसके दो मुख्य रूप हैं:

1) असंबंधित (विषम) टी - यह पता लगाने के लिए डिज़ाइन किया गया एक परीक्षण कि क्या अलग-अलग लोगों से बने दो समूहों का परीक्षण करने के लिए एक ही परीक्षण का उपयोग करने पर प्राप्त अंकों के बीच अंतर है। उदाहरण के लिए, यह बुद्धि के स्तर या न्यूरोसाइकिक स्थिरता, सफल और असफल छात्रों की चिंता, या इन विशेषताओं पर विभिन्न वर्गों, उम्र, सामाजिक स्तर और इसी तरह के छात्रों की तुलना हो सकती है। अध्ययन के तहत नमूनों में विभिन्न लिंगों, विभिन्न राष्ट्रीयताओं के साथ-साथ उप-नमूने भी हो सकते हैं, जिन्हें एक निश्चित विशेषता के अनुसार पहचाना जाता है। मानदंड को "असंबंधित" कहा जाता है क्योंकि जिन समूहों की तुलना की जा रही है वे अलग-अलग लोगों से बने होते हैं;

2) कनेक्टेड (युग्मित) टी - परीक्षण का उपयोग दो समूहों के संकेतकों की तुलना करने के लिए किया जाता है, जिनके तत्वों के बीच एक विशिष्ट कनेक्शन होता है। इसका मतलब यह है कि पहले समूह का प्रत्येक तत्व दूसरे समूह के एक तत्व से मेल खाता है, जो शोधकर्ता की रुचि के एक निश्चित पैरामीटर के अनुसार उसके समान है। अक्सर, समान व्यक्तियों के मापदंडों की तुलना किसी निश्चित घटना या क्रिया से पहले और बाद में की जाती है (उदाहरण के लिए, एक अनुदैर्ध्य अध्ययन या एक रचनात्मक प्रयोग के दौरान)। इसलिए, इस मानदंड का उपयोग सर्वेक्षण, प्रयोग से पहले और बाद में या एक निश्चित समय के बाद उन्हीं व्यक्तियों के प्रदर्शन की तुलना करने के लिए किया जाता है।

यदि डेटा सामान्य वितरण के अधीन नहीं है, तो टी-परीक्षण के समतुल्य गैर-पैरामीट्रिक परीक्षणों का उपयोग करें: मैन-व्हिटनी परीक्षण, विषम टी-परीक्षण के बराबर, और दो-नमूना विलकॉक्सन परीक्षण, युग्मित टी-परीक्षण के बराबर।

टी-परीक्षणों और उनके गैर-पैरामीट्रिक समकक्षों का उपयोग करके, आप केवल एक ही परीक्षण का उपयोग करके प्राप्त दो समूहों के परिणामों की तुलना कर सकते हैं। हालाँकि, कुछ मामलों में कई समूहों या कई प्रकार के आकलन की तुलना करना आवश्यक हो जाता है। यह चरणों में किया जा सकता है, कार्य को तुलनाओं के कई जोड़े में विभाजित किया जा सकता है (उदाहरण के लिए, यदि आपको परीक्षण एक्स और वाई के परिणामों के अनुसार समूह ए, बी और वाई की तुलना करने की आवश्यकता है, तो टी-टेस्ट का उपयोग करके आप पहले तुलना कर सकते हैं परीक्षण X के परिणामों के आधार पर समूह A और B, फिर परीक्षण C के परिणामों के आधार पर A और B, परीक्षण X के परिणामों के आधार पर A और C, आदि)। हालाँकि, यह एक बहुत ही श्रम-गहन विधि है, इसलिए वे विचरण के विश्लेषण की अधिक जटिल विधि का सहारा लेते हैं।

काफी प्रभावी पैरामीट्रिक छात्र परीक्षण का उपयोग करके अंकगणित में अंतर की विश्वसनीयता का आकलन करने की विधि का उद्देश्य डेटा प्रोसेसिंग के दौरान अक्सर देखी जाने वाली समस्याओं में से एक को हल करना है - मूल्यों की दो या दो से अधिक श्रृंखलाओं के बीच अंतर की विश्वसनीयता की पहचान करना। ध्रुवीय समूहों के तुलनात्मक विश्लेषण में ऐसा मूल्यांकन अक्सर आवश्यक होता है। उन्हें अध्ययन की जा रही घटना के एक निश्चित लक्ष्य संकेत (विशेषताओं) की विभिन्न अभिव्यक्तियों के आधार पर अलग किया जाता है। एक नियम के रूप में, विश्लेषण चयनित समूहों के प्राथमिक आंकड़ों की गणना के साथ शुरू होता है, फिर अंतर के महत्व का आकलन सूत्र का उपयोग करके किया जाता है:

आत्मविश्वास के तीन स्तरों (सांख्यिकीय) महत्व (पी) के लिए छात्र के परीक्षण का मूल्य गणितीय आंकड़ों पर संदर्भ पुस्तकों में दिया गया है। स्वतंत्रता की कोटि की संख्या सूत्र द्वारा निर्धारित की जाती है:

घटते नमूना आकार के साथ (एन<10) критерий Стьюдента становится чувствительным к форме распределения исследуемого признака в генеральной совокупности. Поэтому в сомнительных случаях рекомендуют использовать непараметрические методы или сравнивать полученные значения с критическими (табл. 2.17) для высшего уровня значимости.

मतभेदों की विश्वसनीयता पर निर्णय तब किया जाता है जब गणना की गई टी मान स्वतंत्रता की डिग्री की एक निश्चित संख्या (डी (वी)) के लिए तालिका मूल्य से अधिक हो जाती है। प्रकाशन या वैज्ञानिक रिपोर्ट तीन में से उच्च स्तर के महत्व का संकेत देते हैं: पी<0,05; р <0,01; р <0,001.

साधनों के बीच अंतर की विश्वसनीयता के लिए मानदंड के किसी भी संख्यात्मक मान के लिए, यह संकेतक पहचाने गए अंतर की डिग्री का मूल्यांकन नहीं करता है (यह स्वयं साधनों के बीच के अंतर से मूल्यांकन किया जाता है), लेकिन केवल इसकी सांख्यिकीय विश्वसनीयता, अर्थात, संपूर्ण घटना (संपूर्ण प्रक्रिया) में अंतर की उपस्थिति के बारे में नमूनों की तुलना के आधार पर प्राप्त निष्कर्ष को समग्र रूप से विस्तारित करने का अधिकार। कम गणना वाला अंतर मानदंड दो विशेषताओं (घटना) के बीच अंतर की अनुपस्थिति के प्रमाण के रूप में काम नहीं कर सकता है, क्योंकि इसका महत्व (विश्वसनीयता की डिग्री) न केवल औसत के आकार पर निर्भर करता है, बल्कि तुलना किए जा रहे नमूनों की संख्या पर भी निर्भर करता है। यह अंतर की अनुपस्थिति को इंगित नहीं करता है, लेकिन तथ्य यह है कि इस तरह के नमूना आकार के साथ यह सांख्यिकीय रूप से अविश्वसनीय है: इस बात की बहुत अधिक संभावना है कि इन स्थितियों में अंतर यादृच्छिक है, इसकी विश्वसनीयता की संभावना बहुत कम है।

तालिका 2.17. स्वतंत्रता की एफ डिग्री के लिए छात्र के परीक्षण (टी-टेस्ट) के लिए आत्मविश्वास सीमा

दूसरे परीक्षण में कार्य पूरा करने के औसत समय में परिवर्तन (पहले परीक्षण की तुलना में) विश्वसनीय नहीं है।

यह अभिव्यक्ति तुलना किए जा रहे दो नमूनों की सांख्यिकीय एकरूपता के बारे में एक बयान के बराबर नहीं है। इसके अलावा, ऐसे असमान नमूनों के मामले में छात्र के मानदंड का अनुप्रयोग गणितीय रूप से पूरी तरह से सही नहीं है और निश्चित रूप से, Хср = 9.1 और Хср = 8.5 के बीच अंतर की अंतिम अविश्वसनीयता को प्रभावित करता है। इस मानदंड का उपयोग करते हुए, कोई दो औसतों की निकटता की डिग्री का मूल्यांकन नहीं करता है, बल्कि यादृच्छिकता के असाइनमेंट या सीन (महत्व के किसी दिए गए स्तर पर) पर विचार करता है। .

विद्यार्थी का टी टेस्टस्वतंत्र नमूनों के लिए

विद्यार्थी का टी टेस्ट ( टी-छात्र का परीक्षण या बस " टीयदि आपको तुलना करने की आवश्यकता है तो -test") का उपयोग किया जाता है केवल दो समूहसामान्य वितरण के साथ मात्रात्मक विशेषताएँ (विचरण के विश्लेषण का एक विशेष मामला)। ध्यान दें: जोड़े में कई समूहों की तुलना करते समय इस मानदंड का उपयोग नहीं किया जा सकता है, इस मामले में विचरण के विश्लेषण का उपयोग किया जाना चाहिए। विद्यार्थी के टी-टेस्ट के ग़लत उपयोग से उन मतभेदों को "प्रकट" होने की संभावना बढ़ जाती है जो मौजूद नहीं हैं। उदाहरण के लिए, कई उपचारों को समान रूप से प्रभावी (या अप्रभावी) मानने के बजाय, उनमें से एक को बेहतर घोषित कर दिया जाता है।

दो घटनाओं को स्वतंत्र कहा जाता है यदि उनमें से एक की घटना किसी भी तरह से दूसरे की घटना को प्रभावित नहीं करती है। इसी प्रकार, दो संग्रहों को स्वतंत्र कहा जा सकता है यदि उनमें से एक के गुण किसी भी तरह से दूसरे के गुणों से संबंधित नहीं हैं।

निष्पादन उदाहरण टी-स्टेटिस्टिका कार्यक्रम में परीक्षण।

महिलाएं पुरुषों की तुलना में औसतन छोटी होती हैं, हालांकि, यह पुरुषों के महिलाओं पर किसी प्रभाव का परिणाम नहीं है - यह लिंग की आनुवंशिक विशेषताओं का मामला है। का उपयोग करके टी-परीक्षण में यह जांचने की आवश्यकता है कि क्या पुरुषों और महिलाओं के समूहों में औसत ऊंचाई मूल्यों के बीच सांख्यिकीय रूप से महत्वपूर्ण अंतर है। (शैक्षिक उद्देश्यों के लिए, हम मानते हैं कि ऊंचाई डेटा सामान्य वितरण का अनुसरण करता है और इसलिए टी-परीक्षण लागू है)।

चित्र 1. निष्पादन के लिए डेटा स्वरूपण का उदाहरण टी-

इस बात पर ध्यान दें कि चित्र 1 में डेटा को किस प्रकार स्वरूपित किया गया है। जैसे ग्राफ़ बनाते समयमूंछ की साजिशया बॉक्स-व्हिस्कर प्लॉट, तालिका में दो चर हैं: उनमें से एक समूहीकरण है (समूहीकरण चर) ("लिंग") - इसमें कोड (पति और पत्नी) शामिल हैं जो प्रोग्राम को यह निर्धारित करने की अनुमति देते हैं कि ऊंचाई का कौन सा डेटा किस समूह से संबंधित है; दूसरा - तथाकथित निर्भर चर (निर्भर चर) ("विकास") - इसमें विश्लेषण किया जा रहा वास्तविक डेटा शामिल है। हालाँकि, निष्पादित करते समयटी-STATISTICA कार्यक्रम में स्वतंत्र नमूनों के लिए परीक्षण, एक और डिज़ाइन विकल्प संभव है - प्रत्येक समूह ("पुरुष" और "महिला") के लिए डेटा अलग-अलग कॉलम (चित्र 2) में दर्ज किया जा सकता है।

चित्र 2. निष्पादन के लिए डेटा को फ़ॉर्मेट करने का एक अन्य विकल्प टी-स्वतंत्र नमूने परीक्षण

क्रियान्वयन के लिए टी-स्वतंत्र नमूने परीक्षण के लिए, आपको निम्नलिखित कार्य करना होगा:

1-ए. मॉड्यूल लॉन्च करें टी-मेनू से आटा आंकड़े > बुनियादी आँकड़े/सारणीयाँ > टी-परीक्षा, स्वतंत्र, समूहों द्वारा(यदि डेटा तालिका में कोई समूहीकरण चर है, तो चित्र 3 देखें)​

या

1-बी. मॉड्यूल लॉन्च करें टी-मेनू से आटा आंकड़े > बुनियादी आँकड़े/सारणीयाँ > टी-परीक्षण, स्वतंत्र, चर द्वारा(यदि डेटा स्वतंत्र कॉलम में दर्ज किया गया है, तो चित्र 4 देखें)।

नीचे परीक्षण का एक संस्करण है जिसमें डेटा तालिका में एक समूहीकरण चर है।

2. खुलने वाली विंडो में बटन पर क्लिक करें चरऔर प्रोग्राम को बताएं कि तालिका में कौन सा वेरिएबल है स्रेडशीटसमूहीकरण है, और जो निर्भर है (चित्र 5-6)।

चित्र 5. शामिल करने के लिए वेरिएबल का चयन करना टी-परीक्षा

चित्र 6. अंदर के साथ खिड़की संचालन के लिए चयनित चर टी-परीक्षा

3. बटन दबाएँसारांश: टी-परीक्षण.

चित्र 7. परिणाम टीस्वतंत्र नमूनों के लिए परीक्षण

परिणामस्वरूप, प्रोग्राम एक कार्यपुस्तिका तैयार करेगावर्कबुक, जिसमें परिणामों के साथ एक तालिका शामिल हैटी-परीक्षण (चित्र 7 ). इस तालिका में कई कॉलम हैं:

  • अर्थ(पुरुष) - "पुरुष" समूह में औसत ऊंचाई;
  • अर्थ(महिला) - "महिला" समूह में औसत ऊंचाई;
  • टी- कीमत: प्रोग्राम द्वारा परिकलित मान टी-छात्र का परीक्षण;
  • डीएफ- स्वतंत्रता की डिग्री की संख्या;
  • पी- परिकल्पना की वैधता की संभावना कि तुलनात्मक औसत मूल्य भिन्न नहीं हैं। वास्तव में, यह विश्लेषण का सबसे महत्वपूर्ण परिणाम है, क्योंकि यह मूल्य है पीबताता है कि परीक्षण की जा रही परिकल्पना सत्य है या नहीं। हमारे उदाहरण में, पी > 0.05, जिससे हम यह निष्कर्ष निकाल सकते हैं कि पुरुषों और महिलाओं की ऊंचाई के बीच सांख्यिकीय रूप से कोई महत्वपूर्ण अंतर नहीं है।
  • वैध एन(पुरुष) - नमूना आकार "पुरुष";
  • वैध एन(महिला) - नमूना आकार "महिला";
  • एसटीडी. देव. (पुरुष) - "पुरुष" नमूने का मानक विचलन;
  • एसटीडी. देव. (महिला) - "महिला" नमूने का मानक विचलन;
  • एफ-अनुपात, भिन्नताएं- फिशर के एफ-परीक्षण का मूल्य, जिसकी सहायता से तुलना किए गए नमूनों में भिन्नताओं की समानता के बारे में परिकल्पना का परीक्षण किया जाता है;
  • पी, भिन्नताएं- परिकल्पना की वैधता की संभावना कि तुलना किए गए नमूनों के भिन्नताएं भिन्न नहीं हैं।

शीर्ष