अंतराल भिन्नता श्रृंखला का निर्माण। अंतराल वितरण श्रृंखला के निर्माण की प्रक्रिया

स्थिति:

श्रमिकों की आयु संरचना (वर्ष) पर डेटा है: 18, 38, 28, 29, 26, 38, 34, 22, 28, 30, 22, 23, 35, 33, 27, 24, 30, 32, 28 , 25, 29, 26, 31, 24, 29, 27, 32, 25, 29, 29।

    1. एक अंतराल वितरण श्रृंखला का निर्माण करें।
    2. श्रृंखला का एक चित्रमय प्रतिनिधित्व बनाएँ।
    3. ग्राफ़िक रूप से मोड और माध्यिका निर्धारित करें।

समाधान:

1) स्टर्गेस सूत्र के अनुसार, जनसंख्या को 1 + 3.322 एलजी 30 = 6 समूहों में विभाजित किया जाना चाहिए।

अधिकतम आयु- 38, न्यूनतम- 18 वर्ष.

अंतराल की चौड़ाई चूंकि अंतराल के सिरे पूर्णांक होने चाहिए, इसलिए हम जनसंख्या को 5 समूहों में विभाजित करते हैं। अंतराल की चौड़ाई - 4.

गणना को आसान बनाने के लिए, हम डेटा को आरोही क्रम में व्यवस्थित करेंगे: 18, 22, 22, 23, 24, 24, 25, 25, 26, 26, 27, 27, 28, 28, 28, 29, 29, 29, 29, 29, 30 , 30, 31, 32, 32, 33, 34, 35, 38, 38.

श्रमिकों का आयु वितरण

ग्राफिक रूप से, एक श्रृंखला को हिस्टोग्राम या बहुभुज के रूप में दर्शाया जा सकता है। हिस्टोग्राम - बार चार्ट। स्तंभ का आधार अंतराल की चौड़ाई है। स्तम्भ की ऊँचाई आवृत्ति के बराबर होती है।

बहुभुज (या वितरण बहुभुज) - आवृत्ति ग्राफ। हिस्टोग्राम का उपयोग करके इसे बनाने के लिए, हम आयतों के ऊपरी किनारों के मध्य बिंदुओं को जोड़ते हैं। हम ऑक्स अक्ष पर बहुभुज को चरम x मानों से आधे अंतराल के बराबर दूरी पर बंद करते हैं।

मोड (एमओ) अध्ययन की जा रही विशेषता का मूल्य है, जो किसी दी गई आबादी में सबसे अधिक बार होता है।

हिस्टोग्राम से मोड निर्धारित करने के लिए, आपको उच्चतम आयत का चयन करना होगा, इस आयत के दाहिने शीर्ष से पिछले आयत के ऊपरी दाएं कोने तक एक रेखा खींचनी होगी, और मोडल आयत के बाएं शीर्ष से एक रेखा खींचनी होगी। अगले आयत का बायां शीर्ष। इन रेखाओं के प्रतिच्छेदन बिंदु से x-अक्ष पर एक लंब खींचिए। एब्सिस्सा फैशन होगा. मो ≈ 27.5. इसका मतलब है कि इस आबादी में सबसे आम उम्र 27-28 साल है।

माध्यिका (मी) अध्ययन की जा रही विशेषता का मान है, जो क्रम के मध्य में है विविधता श्रृंखला.

हम संचयी का उपयोग करके माध्यिका ज्ञात करते हैं। संचयी - संचित आवृत्तियों का एक ग्राफ। एब्सिस्सा एक श्रृंखला के भिन्न रूप हैं। ऑर्डिनेट संचित आवृत्तियाँ हैं।

संचयी पर माध्यिका निर्धारित करने के लिए, हम संचित आवृत्तियों के 50% (हमारे मामले में, 15) के अनुरूप कोटि अक्ष के साथ एक बिंदु पाते हैं, इसके माध्यम से एक सीधी रेखा खींचते हैं, ऑक्स अक्ष के समानांतर, और बिंदु से संचयी के साथ इसका प्रतिच्छेदन, x अक्ष पर एक लंबवत खींचें। भुजमध्यमाध्यिका है। मैं ≈ 25.9. इसका मतलब यह है कि इस आबादी में आधे कर्मचारी 26 साल से कम उम्र के हैं।

निर्माण करते समय अंतराल श्रृंखलावितरण तीन मुद्दों को संबोधित करता है:

  • 1. मुझे कितने अंतराल लेने चाहिए?
  • 2. अंतराल की लंबाई क्या है?
  • 3. जनसंख्या इकाइयों को अंतराल की सीमाओं के भीतर शामिल करने की प्रक्रिया क्या है?
  • 1. अंतरालों की संख्याद्वारा निर्धारित किया जा सकता है स्टर्गेस सूत्र:

2. अंतराल की लंबाई, या अंतराल चरण, आमतौर पर सूत्र द्वारा निर्धारित किया जाता है

कहाँ आर-भिन्नता की सीमा.

3. अंतराल की सीमाओं के भीतर जनसंख्या इकाइयों को शामिल करने का क्रम

भिन्न हो सकते हैं, लेकिन अंतराल श्रृंखला का निर्माण करते समय, वितरण को सख्ती से परिभाषित किया जाना चाहिए।

उदाहरण के लिए, यह: [), जिसमें जनसंख्या इकाइयों को निचली सीमाओं में शामिल किया जाता है, लेकिन ऊपरी सीमाओं में शामिल नहीं किया जाता है, बल्कि अगले अंतराल में स्थानांतरित कर दिया जाता है। इस नियम का अपवाद अंतिम अंतराल है, जिसकी ऊपरी सीमा में रैंक की गई श्रृंखला की अंतिम संख्या शामिल है।

अंतराल सीमाएँ हैं:

  • बंद - विशेषता के दो चरम मूल्यों के साथ;
  • खुला - विशेषता के एक चरम मूल्य के साथ (कोऐसी और ऐसी संख्या या ऊपरऐसी और ऐसी संख्या)।

सैद्धांतिक सामग्री को आत्मसात करने के लिए, हम परिचय देते हैं पृष्ठभूमि की जानकारीसमाधान करना अंत-से-अंत कार्य.

बिक्री प्रबंधकों की औसत संख्या, उनके द्वारा बेचे गए समान सामानों की मात्रा, इस उत्पाद के लिए व्यक्तिगत बाजार मूल्य, साथ ही पहले रूसी संघ के क्षेत्रों में से एक में 30 कंपनियों की बिक्री की मात्रा पर सशर्त डेटा हैं। रिपोर्टिंग वर्ष की तिमाही (तालिका 2.1)।

तालिका 2.1

क्रॉस-कटिंग कार्य के लिए प्रारंभिक जानकारी

संख्या

प्रबंधक,

कीमत, हजार रूबल

बिक्री की मात्रा, मिलियन रूबल।

संख्या

प्रबंधक,

बेचे गए माल की मात्रा, पीसी।

कीमत, हजार रूबल

बिक्री की मात्रा, मिलियन रूबल।

प्रारंभिक जानकारी के साथ-साथ अतिरिक्त जानकारी के आधार पर, हम अलग-अलग कार्य निर्धारित करेंगे। फिर हम उन्हें हल करने की पद्धति और स्वयं समाधान प्रस्तुत करेंगे।

क्रॉस-कटिंग कार्य. कार्य 2.1

तालिका से प्रारंभिक डेटा का उपयोग करना। 2.1 आवश्यकबेची गई वस्तुओं की मात्रा के आधार पर फर्मों के वितरण की एक अलग श्रृंखला बनाएं (तालिका 2.2)।

समाधान:

तालिका 2.2

पृथक शृंखलारिपोर्टिंग वर्ष की पहली तिमाही में रूसी संघ के किसी एक क्षेत्र में बेची गई वस्तुओं की मात्रा के आधार पर फर्मों का वितरण

क्रॉस-कटिंग कार्य. कार्य 2.2

आवश्यकप्रबंधकों की औसत संख्या के अनुसार 30 फर्मों की एक रैंक श्रृंखला बनाएं।

समाधान:

15; 17; 18; 20; 20; 20; 22; 22; 24; 25; 25; 25; 27; 27; 27; 28; 29; 30; 32; 32; 33; 33; 33; 34; 35; 35; 38; 39; 39; 45.

क्रॉस-कटिंग कार्य. कार्य 2.3

तालिका से प्रारंभिक डेटा का उपयोग करना। 2.1, आवश्यक:

  • 1. प्रबंधकों की संख्या के आधार पर फर्मों के वितरण की एक अंतराल श्रृंखला बनाएं।
  • 2. फर्मों की वितरण श्रृंखला की आवृत्तियों की गणना करें।
  • 3. निष्कर्ष निकालें.

समाधान:

आइए स्टर्गेस सूत्र (2.5) का उपयोग करके गणना करें अंतरालों की संख्या:

इस प्रकार, हम 6 अंतराल (समूह) लेते हैं।

अंतराल की लंबाई, या अंतराल चरण, सूत्र का उपयोग करके गणना करें

टिप्पणी।अंतराल की सीमाओं में जनसंख्या इकाइयों को शामिल करने का क्रम इस प्रकार है: I), जिसमें जनसंख्या इकाइयों को निचली सीमाओं में शामिल किया जाता है, लेकिन ऊपरी सीमाओं में शामिल नहीं किया जाता है, बल्कि अगले अंतराल में स्थानांतरित कर दिया जाता है। इस नियम का अपवाद अंतिम अंतराल I] है, जिसकी ऊपरी सीमा में रैंक की गई श्रृंखला की अंतिम संख्या शामिल है।

हम एक अंतराल श्रृंखला बनाते हैं (तालिका 2.3)।

रिपोर्टिंग वर्ष की पहली तिमाही में रूसी संघ के क्षेत्रों में से एक में फर्मों के वितरण की अंतराल श्रृंखला और प्रबंधकों की औसत संख्या

निष्कर्ष।अधिकांश बड़ा समूहफर्मों का एक समूह है औसत संख्याप्रबंधक 25-30 लोग, जिनमें 8 कंपनियाँ (27%) शामिल हैं; 40-45 लोगों के प्रबंधकों की औसत संख्या वाले सबसे छोटे समूह में केवल एक कंपनी (3%) शामिल है।

तालिका से प्रारंभिक डेटा का उपयोग करना। 2.1, साथ ही प्रबंधकों की संख्या के आधार पर फर्मों के वितरण की एक अंतराल श्रृंखला (तालिका 2.3), आवश्यकप्रबंधकों की संख्या और फर्मों की बिक्री की मात्रा के बीच संबंधों का एक विश्लेषणात्मक समूह बनाएं और इसके आधार पर, इन विशेषताओं के बीच संबंध की उपस्थिति (या अनुपस्थिति) के बारे में निष्कर्ष निकालें।

समाधान:

विश्लेषणात्मक समूहन कारक विशेषताओं पर आधारित है। हमारी समस्या में, कारक विशेषता (x) प्रबंधकों की संख्या है, और परिणामी विशेषता (y) बिक्री की मात्रा है (तालिका 2.4)।

आइए अब निर्माण करें विश्लेषणात्मक समूहन(सारणी 2.5).

निष्कर्ष।निर्मित विश्लेषणात्मक समूह के आंकड़ों के आधार पर, हम कह सकते हैं कि बिक्री प्रबंधकों की संख्या में वृद्धि के साथ, समूह में कंपनी की औसत बिक्री मात्रा भी बढ़ जाती है, जो इन विशेषताओं के बीच सीधा संबंध की उपस्थिति को इंगित करता है।

तालिका 2.4

विश्लेषणात्मक समूहन के निर्माण के लिए सहायक तालिका

प्रबंधकों, लोगों की संख्या,

कंपनी संख्या

बिक्री की मात्रा, मिलियन रूबल, वाई

" = 59 एफ = 9.97

मैं-™ 4 -यू.22

74 '25 1पीवाई1

उ4 = 7 = 10,61

पर = ’ =10,31 30

तालिका 2.5

रिपोर्टिंग वर्ष की पहली तिमाही में रूसी संघ के किसी एक क्षेत्र में कंपनी प्रबंधकों की संख्या पर बिक्री की मात्रा की निर्भरता

परीक्षण प्रश्न
  • 1. सांख्यिकीय अवलोकन का सार क्या है?
  • 2. सांख्यिकीय अवलोकन के चरणों का नाम बताइए।
  • 3. क्या हैं संगठनात्मक रूपसांख्यिकीय अवलोकन?
  • 4. सांख्यिकीय अवलोकन के प्रकारों के नाम बताइए।
  • 5. सांख्यिकीय सारांश क्या है?
  • 6. सांख्यिकीय रिपोर्टों के प्रकारों के नाम बताइए।
  • 7. सांख्यिकीय समूहन क्या है?
  • 8. सांख्यिकीय समूहों के प्रकारों के नाम बताइए।
  • 9. वितरण श्रृंखला क्या है?
  • 10. वितरण पंक्ति के संरचनात्मक तत्वों के नाम बताइए।
  • 11. वितरण श्रृंखला के निर्माण की प्रक्रिया क्या है?

किसी विशेष घटना की विशेषता बताने वाले सांख्यिकीय अवलोकन डेटा उपलब्ध होने पर, सबसे पहले उन्हें व्यवस्थित करना आवश्यक है, अर्थात। एक व्यवस्थित चरित्र दें

अंग्रेजी सांख्यिकीविद्. UJReichman ने अव्यवस्थित संग्रहों के बारे में आलंकारिक रूप से कहा कि असामान्यीकृत डेटा के एक समूह का सामना करना उस स्थिति के बराबर है जहां एक व्यक्ति को बिना कंपास के झाड़ियों में फेंक दिया जाता है। वितरण श्रृंखला के रूप में सांख्यिकीय डेटा का व्यवस्थितकरण क्या है?

वितरण की सांख्यिकीय श्रृंखला को सांख्यिकीय समुच्चय का आदेश दिया गया है (तालिका 17)। सांख्यिकीय वितरण श्रृंखला का सबसे सरल प्रकार एक रैंक श्रृंखला है, अर्थात। आरोही या अवरोही क्रम में संख्याओं की एक श्रृंखला, अलग-अलग विशेषताएँ। ऐसी श्रृंखला हमें वितरित डेटा में निहित पैटर्न का न्याय करने की अनुमति नहीं देती है: अधिकांश संकेतक किस मूल्य पर समूहीकृत हैं, इस मूल्य से क्या विचलन हैं; साथ ही सामान्य वितरण चित्र भी। इस प्रयोजन के लिए, डेटा को समूहीकृत किया जाता है, यह दिखाते हुए कि उनकी कुल संख्या में व्यक्तिगत अवलोकन कितनी बार होते हैं (योजना 1ए 1)।

. तालिका 17

. सामान्य रूप से देखेंसांख्यिकीय वितरण श्रृंखला

. योजना 1. सांख्यिकीय योजनावितरण श्रृंखला

जिन विशेषताओं के अनुसार मात्रात्मक अभिव्यक्ति नहीं होती, उनके अनुसार जनसंख्या इकाइयों का वितरण कहलाता है गुणवाचक शृंखला(उदाहरण के लिए, उद्यमों का उनके उत्पादन क्षेत्र के आधार पर वितरण)

विशेषताओं के अनुसार जनसंख्या इकाइयों के वितरण की श्रृंखला, जिसकी मात्रात्मक अभिव्यक्ति होती है, कहलाती है विविधता श्रृंखला. ऐसी श्रृंखला में, विशेषता (विकल्प) का मान आरोही या अवरोही क्रम में होता है

परिवर्तनशील वितरण श्रृंखला में, दो तत्व प्रतिष्ठित हैं: वैरिएंट और आवृत्ति . विकल्प- यह समूहीकरण विशेषताओं का एक अलग अर्थ है आवृत्ति- एक संख्या जो दर्शाती है कि प्रत्येक विकल्प कितनी बार आता है

गणितीय सांख्यिकी में भिन्नता श्रृंखला के एक और तत्व की गणना की जाती है - आंशिक रूप में. उत्तरार्द्ध को किसी दिए गए अंतराल के मामलों की आवृत्ति और आवृत्तियों के कुल योग के अनुपात के रूप में परिभाषित किया गया है, भाग एक इकाई के अंशों में निर्धारित किया जाता है, पीपीएम में प्रतिशत (%) (%o)

इस प्रकार, भिन्नता वितरण श्रृंखला एक श्रृंखला है जिसमें विकल्पों को आरोही या अवरोही क्रम में व्यवस्थित किया जाता है, और उनकी आवृत्तियों या आवृत्तियों को दर्शाया जाता है। भिन्नता श्रृंखला असतत (अंतराल) और अन्य अंतराल (निरंतर) हैं।

. असतत भिन्नता श्रृंखला- ये वितरण श्रृंखलाएं हैं जिनमें मात्रात्मक विशेषता के मूल्य के रूप में भिन्नता केवल एक निश्चित मान ले सकती है। विकल्प एक या अधिक इकाइयों द्वारा एक दूसरे से भिन्न होते हैं

इस प्रकार, एक विशिष्ट कार्यकर्ता द्वारा प्रति शिफ्ट में उत्पादित भागों की संख्या केवल एक विशिष्ट संख्या (6, 10, 12, आदि) द्वारा व्यक्त की जा सकती है। असतत भिन्नता श्रृंखला का एक उदाहरण उत्पादित भागों की संख्या के आधार पर श्रमिकों का वितरण हो सकता है (तालिका 18 18)।

. तालिका 18

. असतत श्रृंखला वितरण _

. अंतराल (निरंतर) भिन्नता श्रृंखला- ऐसी वितरण श्रृंखला जिसमें विकल्पों का मान अंतराल के रूप में दिया जाता है, अर्थात। सुविधाओं के मान मनमाने ढंग से छोटी मात्रा में एक दूसरे से भिन्न हो सकते हैं। एनईपी पेरी-वेरिएंट विशेषताओं की भिन्नता श्रृंखला का निर्माण करते समय, वेरिएंट के प्रत्येक मान को इंगित करना असंभव है, इसलिए जनसंख्या को अंतराल पर वितरित किया जाता है। उत्तरार्द्ध बराबर या असमान हो सकता है। उनमें से प्रत्येक के लिए, आवृत्तियों या आवृत्तियों को दर्शाया गया है (तालिका 1 9 19 19)।

असमान अंतराल वाली अंतराल वितरण श्रृंखला में, किसी दिए गए अंतराल पर वितरण घनत्व और सापेक्ष वितरण घनत्व जैसी गणितीय विशेषताओं की गणना की जाती है। पहली विशेषता समान अंतराल के मान की आवृत्ति के अनुपात से निर्धारित होती है, दूसरी - समान अंतराल के मान की आवृत्ति के अनुपात से निर्धारित होती है। उपरोक्त उदाहरण के लिए, पहले अंतराल में वितरण घनत्व 3:5 = 0.6 होगा, और इस अंतराल में सापेक्ष घनत्व 7.5:5 = 1.55% है।

. तालिका 19

. अंतराल वितरण श्रृंखला _

बड़ी मात्रा में जानकारी संसाधित करते समय, जो आधुनिक वैज्ञानिक विकास करते समय विशेष रूप से महत्वपूर्ण है, शोधकर्ता को स्रोत डेटा को सही ढंग से समूहीकृत करने के गंभीर कार्य का सामना करना पड़ता है। यदि डेटा प्रकृति में अलग है, तो, जैसा कि हमने देखा है, कोई समस्या उत्पन्न नहीं होती है - आपको बस प्रत्येक सुविधा की आवृत्ति की गणना करने की आवश्यकता है। यदि अध्ययनाधीन विशेषता है निरंतरचरित्र (जो व्यवहार में अधिक सामान्य है), तो फीचर समूहीकरण अंतराल की इष्टतम संख्या चुनना किसी भी तरह से कोई मामूली काम नहीं है।

निरंतर यादृच्छिक चरों को समूहीकृत करने के लिए, विशेषता की संपूर्ण परिवर्तनीय सीमा को एक निश्चित संख्या में अंतरालों में विभाजित किया जाता है को।

समूहीकृत अंतराल (निरंतर) विविधता श्रृंखला विशेषता () के मान द्वारा रैंक किए गए अंतराल कहलाते हैं, जहां i"वें अंतराल, या सापेक्ष आवृत्तियों () में आने वाले अवलोकनों की संख्या को संबंधित आवृत्तियों () के साथ दर्शाया जाता है:

विशेषता मान अंतराल

मील आवृत्ति

हिस्टोग्रामऔर संचयी (ओगिवा),हमारे द्वारा पहले ही विस्तार से चर्चा की जा चुकी है, डेटा विज़ुअलाइज़ेशन का एक उत्कृष्ट साधन है, जो आपको डेटा की संरचना का प्राथमिक विचार प्राप्त करने की अनुमति देता है। ऐसे ग्राफ़ (चित्र 1.15) निरंतर डेटा के लिए उसी तरह बनाए जाते हैं जैसे असतत डेटा के लिए, केवल इस तथ्य को ध्यान में रखते हुए कि निरंतर डेटा किसी भी मान को लेते हुए, उनके संभावित मूल्यों के क्षेत्र को पूरी तरह से भर देता है।

चावल। 1.15.

इसीलिए हिस्टोग्राम और कम्युलेट पर कॉलम एक-दूसरे को छूना चाहिए और ऐसा कोई क्षेत्र नहीं होना चाहिए जहां विशेषता मान सभी संभव के अंतर्गत न आएं(यानी, हिस्टोग्राम और क्यूम्युलेट्स में एब्सिस्सा अक्ष के साथ "छेद" नहीं होना चाहिए, जिसमें अध्ययन किए जा रहे चर के मान शामिल नहीं हैं, जैसा कि चित्र 1.16 में है)। बार की ऊंचाई आवृत्ति से मेल खाती है - किसी दिए गए अंतराल के भीतर आने वाले अवलोकनों की संख्या, या सापेक्ष आवृत्ति - अवलोकनों का अनुपात। अंतराल प्रतिच्छेद नहीं करना चाहिएऔर आमतौर पर एक ही चौड़ाई के होते हैं।

चावल। 1.16.

हिस्टोग्राम और बहुभुज संभाव्यता घनत्व वक्र के सन्निकटन हैं ( विभेदक कार्य) एफ(एक्स)सैद्धांतिक वितरण, संभाव्यता सिद्धांत के पाठ्यक्रम में माना जाता है। इसलिए, मात्रात्मक निरंतर डेटा के प्राथमिक सांख्यिकीय प्रसंस्करण में उनका निर्माण बहुत महत्वपूर्ण है - उनकी उपस्थिति से कोई भी काल्पनिक वितरण कानून का न्याय कर सकता है।

संचयी - अंतराल भिन्नता श्रृंखला की संचित आवृत्तियों (आवृत्तियों) का एक वक्र। संचयी वितरण फ़ंक्शन के ग्राफ़ की तुलना संचयी से की जाती है एफ(एक्स), संभाव्यता सिद्धांत पाठ्यक्रम में भी चर्चा की गई।

मूल रूप से, हिस्टोग्राम और क्यूम्युलेट की अवधारणाएं विशेष रूप से निरंतर डेटा और उनकी अंतराल भिन्नता श्रृंखला से जुड़ी हुई हैं, क्योंकि उनके ग्राफ़ क्रमशः संभाव्यता घनत्व फ़ंक्शन और वितरण फ़ंक्शन के अनुभवजन्य अनुमान हैं।

अंतराल भिन्नता श्रृंखला का निर्माण अंतरालों की संख्या निर्धारित करने से शुरू होता है के.और यह कार्य संभवतः अध्ययनाधीन मुद्दे में सबसे कठिन, महत्वपूर्ण और विवादास्पद है।

अंतरालों की संख्या बहुत छोटी नहीं होनी चाहिए, क्योंकि इससे हिस्टोग्राम बहुत सुचारू हो जाएगा ( अधिक चिकना),मूल डेटा की परिवर्तनशीलता की सभी विशेषताएं खो जाती हैं - चित्र में। 1.17 आप देख सकते हैं कि कैसे वही डेटा जिस पर चित्र में ग्राफ़ हैं। 1.15, कम संख्या में अंतराल (बाएं ग्राफ) के साथ एक हिस्टोग्राम बनाने के लिए उपयोग किया जाता है।

साथ ही, अंतरालों की संख्या बहुत बड़ी नहीं होनी चाहिए - अन्यथा हम संख्यात्मक अक्ष के साथ अध्ययन किए गए डेटा के वितरण घनत्व का अनुमान लगाने में सक्षम नहीं होंगे: हिस्टोग्राम कम-सुचारू हो जाएगा (कमजोर),खाली अंतरालों के साथ, असमान (चित्र 1.17, दायां ग्राफ देखें)।

चावल। 1.17.

अंतरालों की सबसे पसंदीदा संख्या कैसे निर्धारित करें?

1926 में, हर्बर्ट स्टर्गेस ने अंतरालों की संख्या की गणना के लिए एक सूत्र प्रस्तावित किया जिसमें अध्ययन की जा रही विशेषता के मूल्यों के मूल सेट को विभाजित करना आवश्यक है। यह सूत्र वास्तव में बेहद लोकप्रिय हो गया है - अधिकांश सांख्यिकीय पाठ्यपुस्तकें इसे पेश करती हैं, और कई सांख्यिकीय पैकेज डिफ़ॉल्ट रूप से इसका उपयोग करते हैं। यह कितना उचित है और सभी मामलों में यह बहुत गंभीर प्रश्न है।

तो, स्टर्जेस फॉर्मूला किस पर आधारित है?

द्विपद वितरण पर विचार करें.

उदाहरण।शोधकर्ता आवेदकों के गणित ज्ञान में रुचि रखता है। 10 आवेदकों का चयन किया जाता है और इस विषय में उनके स्कूल ग्रेड दर्ज किए जाते हैं। निम्नलिखित नमूना प्राप्त किया गया था: 5;4;4;3;2;5;4;3;4;5।

क) नमूने को विविधता श्रृंखला के रूप में प्रस्तुत करें;

बी) आवृत्तियों और सापेक्ष आवृत्तियों की एक सांख्यिकीय श्रृंखला का निर्माण;

ग) परिणामी श्रृंखला के लिए सापेक्ष आवृत्तियों का एक बहुभुज बनाएं।

ए) आइए नमूने को रैंक करें, यानी। आइए नमूना सदस्यों को गैर-घटते क्रम में व्यवस्थित करें। हमें एक भिन्नता श्रृंखला मिलती है: 2; 3; 3; 4; 4; 4; 4; 5; 5;5.

बी) आइए आवृत्तियों की एक सांख्यिकीय श्रृंखला (नमूना विकल्पों और उनकी आवृत्तियों के बीच पत्राचार) और सापेक्ष आवृत्तियों की एक सांख्यिकीय श्रृंखला (नमूना विकल्पों और उनकी सापेक्ष आवृत्तियों के बीच पत्राचार) का निर्माण करें।

0,1 0,2 0,4 0,3

सांख्यिकीय आवृत्ति श्रृंखला सांख्यिकीय श्रृंखला संबंध। आवृत्तियों

1+2+4+3=10=n 0.1+0.2+0.4+0.3=1.

सापेक्ष आवृत्ति बहुभुज.





शीर्ष