कोलमोगोरोव-स्मिरनोव अच्छाई-की-फिट परीक्षण जनसंख्या के वितरण का आकलन करने की एक विधि है। मनोविज्ञान और सामाजिक विज्ञान में एसपीएसएस सामान्य नमूने से संबंधित कोलमोगोरोव मानदंड

मानदंड का उद्देश्य. λ मानदंड का उद्देश्य दो वितरणों की तुलना करना है: ए)। सैद्धांतिक के साथ अनुभवजन्य, उदाहरण के लिए, समान या सामान्य; बी)। एक अनुभवजन्य वितरण के साथ दूसरा अनुभवजन्य वितरण।

मानदंड की सीमाएँ.मानदंड के लिए आवश्यक है कि नमूना पर्याप्त बड़ा हो, ≥50।

परिकल्पनाएँ:

: दोनों वितरणों के बीच अंतर महत्वपूर्ण नहीं हैं।

: दोनों वितरणों के बीच अंतर महत्वपूर्ण हैं।

λ की गणना के लिए एल्गोरिदम - मानदंड।

आइए आसान गणनाओं के लिए एक तालिका बनाएं:

1. पहले कॉलम में विशेषता के अनुभवजन्य मूल्य शामिल हैं, जो आरोही क्रम में क्रमबद्ध हैं।

2. दूसरे कॉलम में प्रत्येक मान के लिए अनुभवजन्य आवृत्तियाँ होती हैं, और तीसरे कॉलम में प्रत्येक मान के लिए सापेक्ष अनुभवजन्य आवृत्तियाँ होती हैं, जिनकी गणना सूत्र द्वारा की जाती है: f* emp j = f emp j / n, जहाँ f emp j अनुभवजन्य आवृत्ति है दूसरा कॉलम, एन - नमूना आकार।

3. हम सूत्र का उपयोग करके "संचित" अनुभवजन्य आवृत्तियों की गणना करते हैं:

∑ एफ* एम्प जे = ∑ एफ* एम्प जे -1 + एफ* एम्प जे ,

जहां ∑ f* emp j -1 – विशेषता के पिछले मानों पर संचित आवृत्ति;

जे - विशेषता मान की क्रम संख्या; एफ* एम्प जे - किसी दिए गए जे डिस्चार्ज की अनुभवजन्य आवृत्ति। परिणाम कॉलम 4 में रखे गए हैं।

4. ज्ञात सैद्धांतिक वितरण के साथ तुलना करने पर कॉलम 5 में संचित सैद्धांतिक आवृत्तियाँ शामिल हैं; यदि 2 अनुभवजन्य वितरणों की तुलना की जाती है, तो नमूना 2 के लिए संचित अनुभवजन्य आवृत्तियों को कॉलम 5 में रखा गया है।

5. संचित आवृत्तियों के बीच अंतर की गणना की जाती है और उनके निरपेक्ष मानों को कॉलम 6 में रखा जाता है। आइए उन्हें निरूपित करें d j .

6. कॉलम 6 का उपयोग करके अधिकतम मान d j → d max निर्धारित करें।

7. सूत्र का उपयोग करके λ emp की गणना करें:

,

जहाँ n 1 - नमूना आकार 1, n 2 - नमूना आकार 2, यदि = = n, तो .

8. दिए गए महत्व स्तर के आधार पर, परिशिष्ट की तालिका VII से सीमा बिंदु λ cr पाया जाता है।

9. यदि λ उन्हें< λ кр, то различия между распределениями признака незначимы; если λ эмп >λ करोड़, तो विशेषता के वितरण के बीच अंतर महत्वपूर्ण हैं।

उदाहरण. किराने की दुकान ने बेचे गए सॉसेज का नियंत्रण वजन किया। नमूना आकार n = 100। प्राप्त डेटा तालिका में दिखाया गया है।

कम वजन, जी
आवृत्ति

महत्व स्तर α = 0.05 पर λ - कोलमोगोरोव-स्मिरनोव परीक्षण का उपयोग करके निर्धारित करें कि नमूना डेटा खंड पर एक समान वितरण के अनुरूप है या नहीं।

समाधान।: अनुभवजन्य और अनुमानित सैद्धांतिक वितरण के बीच अंतर महत्वपूर्ण नहीं हैं।

: अनुभवजन्य और अनुमानित सैद्धांतिक वितरण के बीच अंतर महत्वपूर्ण हैं।

एक खंड पर समान रूप से वितरित यादृच्छिक चर का वितरण फ़ंक्शन निम्नलिखित रूप में होता है:

आइए तालिका भरें:

एक्स जे एफ एम जे एफईएम जे /एन ∑ एफ* एम्प जे ∑ एफ* सिद्धांत जे डी जे
0,10 0,10 0,1
0,11 0,21 0,2 0,01
0,08 0,29 0,3 0,01
0,09 0,38 0,4 0,02
0,12 0,50 0,5
0,10 0,60 0,6
0,13 0,73 0,7 0,03
0,15 0,88 0,8 0,08
0,12 1,00 0,9 0,1

आइए हम बताते हैं कि तालिका कैसे भरी जाती है। पहले दो कॉलम के मान शर्त से लिए गए हैं। हम दूसरे कॉलम में प्रत्येक संख्या को n = 100 से विभाजित करते हैं और परिणाम को तीसरे कॉलम में लिखते हैं। कॉलम 4 में प्रत्येक संख्या कॉलम 3 में उसी पंक्ति की संख्या और कॉलम 4 में पिछली संख्या के योग के बराबर है। हम कॉलम 1 में प्रत्येक संख्या को सूत्र f * theor = x j /10 में प्रतिस्थापित करते हैं और परिणाम को कॉलम 5 में लिखते हैं। कॉलम 6 - 4 और 5 कॉलम के बीच अंतर का मॉड्यूल। कॉलम 6 डी मैक्स में सबसे बड़ी संख्या =0.1; λ उन्हें =0.1 = 1.

परिशिष्ट तालिका VI से महत्व स्तर α = 0.05 का उपयोग करते हुए, हम सीमा बिंदु λ cr = 1.358 पाते हैं। चूँकि λ उन्हें< λ кр (1 < 1,358), то принимаем гипотезу на уровне значимости α = 0,05. Данные выборки согласуются с равномерным распределением на отрезке .

पहले, उन परिकल्पनाओं पर विचार किया जाता था जिनमें जनसंख्या के वितरण कानून को ज्ञात माना जाता था। अब हम अज्ञात वितरण के कथित कानून के बारे में परिकल्पनाओं का परीक्षण शुरू करेंगे, यानी, हम शून्य परिकल्पना का परीक्षण करेंगे कि जनसंख्या कुछ ज्ञात कानून के अनुसार वितरित की जाती है। आमतौर पर, ऐसी परिकल्पनाओं के परीक्षण के लिए सांख्यिकीय परीक्षण कहा जाता है सहमति मानदंड.

समझौते की कसौटीकिसी अज्ञात वितरण के कल्पित नियम के बारे में एक परिकल्पना के परीक्षण के लिए एक मानदंड कहा जाता है। यह अनुभवजन्य और सैद्धांतिक वितरण के बीच विसंगति का एक संख्यात्मक माप है।

मुख्य कार्य.अनुभवजन्य वितरण (नमूना) दिया गया है। सैद्धांतिक वितरण के प्रकार के बारे में एक धारणा बनाएं (एक परिकल्पना सामने रखें) और किसी दिए गए महत्व स्तर α पर परिकल्पना का परीक्षण करें।

मुख्य समस्या के समाधान में दो भाग होते हैं:

1. एक परिकल्पना का प्रस्ताव करना.

2. किसी दिए गए महत्व स्तर पर परिकल्पना का परीक्षण करना।

आइए इन हिस्सों पर विस्तार से नजर डालें।

1. परिकल्पना चयनबहुभुज या आवृत्ति हिस्टोग्राम का उपयोग करके सैद्धांतिक वितरण के प्रकार को निर्धारित करना सुविधाजनक है। ज्ञात वितरण कानूनों के साथ अनुभवजन्य बहुभुज (या हिस्टोग्राम) की तुलना करें और सबसे उपयुक्त का चयन करें।

यहां सबसे महत्वपूर्ण वितरण कानूनों के ग्राफ़ दिए गए हैं:

अनुभवजन्य वितरण कानूनों के उदाहरण आंकड़ों में दिखाए गए हैं:



मामले (ए) में सामान्य वितरण की परिकल्पना सामने रखी गई है, मामले (बी) में - समान वितरण की परिकल्पना, मामले (सी) में - पॉइसन वितरण की परिकल्पना।

सैद्धांतिक वितरण के बारे में एक परिकल्पना को आगे बढ़ाने का आधार विशेषता में परिवर्तन की प्रकृति के बारे में सैद्धांतिक आधार हो सकता है। उदाहरण के लिए, ल्यपुनोव के प्रमेय की शर्तों को पूरा करने से हमें सामान्य वितरण के बारे में एक परिकल्पना बनाने की अनुमति मिलती है। माध्य और विचरण की समानता पॉइसन वितरण का सुझाव देती है।

व्यवहार में, हम अक्सर सामान्य वितरण का सामना करते हैं, इसलिए अपने कार्यों में हमें केवल सामान्य वितरण की परिकल्पना का परीक्षण करने की आवश्यकता होती है।

परिकल्पना परीक्षणसैद्धांतिक वितरण के बारे में प्रश्न का उत्तर देता है: क्या कथित सैद्धांतिक और अनुभवजन्य वितरणों के बीच विसंगति को यादृच्छिक, महत्वहीन माना जा सकता है, जिसे नमूने में शामिल कुछ वस्तुओं की यादृच्छिकता द्वारा समझाया गया है, या क्या यह विसंगति वितरण के बीच एक महत्वपूर्ण विसंगति का संकेत देती है। सत्यापन के लिए विभिन्न विधियाँ हैं (अच्छाई-की-फिट मानदंड) - सी 2 (ची-स्क्वायर), कोलमोगोरोव, रोमानोव्स्की, आदि।

पियर्सन कसौटी.

पियर्सन मानदंड का लाभ इसकी सार्वभौमिकता है: इसका उपयोग विभिन्न वितरण कानूनों के बारे में परिकल्पनाओं का परीक्षण करने के लिए किया जा सकता है।

1. सामान्य वितरण की परिकल्पना का परीक्षण करना।पर्याप्त रूप से बड़ा नमूना प्राप्त होने दें पीबहुत सारे अलग-अलग अर्थ वाले विकल्प के साथ। इसे संसाधित करने की सुविधा के लिए, हम विकल्प के सबसे छोटे से सबसे बड़े मान तक के अंतराल को विभाजित करते हैं एससमान भाग और हम मान लेंगे कि प्रत्येक अंतराल में आने वाले विकल्पों का मान लगभग उस संख्या के बराबर है जो अंतराल के मध्य को निर्दिष्ट करता है। प्रत्येक अंतराल में आने वाले विकल्पों की संख्या की गणना करके, हम एक तथाकथित समूहीकृत नमूना बनाएंगे:

विकल्प……….. एक्स 1 एक्स 2 … एक्स एस

आवृत्तियाँ…………. पी 1 पी 2 … एन एस ,

कहाँ एक्स मैंअंतरालों के मध्यबिंदुओं के मान हैं, और एन मैं- शामिल विकल्पों की संख्या मैं-अंतराल (अनुभवजन्य आवृत्तियाँ)। प्राप्त आंकड़ों से, आप नमूना माध्य और नमूना मानक विचलन की गणना कर सकते हैं σ बी. आइए इस धारणा की जाँच करें कि जनसंख्या को मापदंडों के साथ एक सामान्य कानून के अनुसार वितरित किया जाता है एम(एक्स) = , डी(एक्स) = . फिर आप नमूना आकार से संख्याओं की संख्या ज्ञात कर सकते हैं पी, जो इस धारणा के तहत प्रत्येक अंतराल में दिखाई देनी चाहिए (अर्थात, सैद्धांतिक आवृत्तियाँ)। ऐसा करने के लिए, लाप्लास फ़ंक्शन के मानों की तालिका का उपयोग करके, हम इसमें शामिल होने की संभावना पाते हैं मैंवां अंतराल:

,

कहाँ और मैंऔर बी मैं- सीमाएँ मैं-वें अंतराल. प्राप्त संभावनाओं को नमूना आकार n से गुणा करके, हम सैद्धांतिक आवृत्तियाँ पाते हैं: पी आई =एन·पी आईहमारा लक्ष्य अनुभवजन्य और सैद्धांतिक आवृत्तियों की तुलना करना है, जो निश्चित रूप से एक-दूसरे से भिन्न हैं, और यह पता लगाना है कि क्या ये अंतर महत्वहीन हैं और अध्ययन के तहत यादृच्छिक चर के सामान्य वितरण की परिकल्पना का खंडन नहीं करते हैं, या क्या वे हैं इतने बड़े कि वे इस परिकल्पना का खंडन करते हैं। इस प्रयोजन के लिए, यादृच्छिक चर के रूप में एक मानदंड का उपयोग किया जाता है

. (7)

इसका अर्थ स्पष्ट है: सैद्धांतिक से अनुभवजन्य आवृत्तियों के विचलन के वर्गों को संबंधित सैद्धांतिक आवृत्तियों से बनाने वाले भागों को संक्षेप में प्रस्तुत किया गया है। यह सिद्ध किया जा सकता है कि, सामान्य जनसंख्या के वास्तविक वितरण कानून की परवाह किए बिना, यादृच्छिक चर (7) का वितरण कानून स्वतंत्रता की डिग्री की संख्या के साथ वितरण कानून की ओर जाता है के = एस - 1 – आर, कहाँ आर- नमूना डेटा से अनुमानित वितरण के मापदंडों की संख्या। इसलिए, सामान्य वितरण की विशेषता दो पैरामीटर हैं के = एस - 3. चयनित मानदंड के लिए, एक दाहिनी ओर का महत्वपूर्ण क्षेत्र बनाया जाता है, जो स्थिति द्वारा निर्धारित होता है

(8)

कहाँ α - महत्वपूर्ण स्तर। नतीजतन, महत्वपूर्ण क्षेत्र असमानता द्वारा दिया जाता है और परिकल्पना की स्वीकृति का क्षेत्र है .

तो, शून्य परिकल्पना का परीक्षण करने के लिए एन 0: जनसंख्या सामान्य रूप से वितरित है - आपको नमूने से मानदंड के देखे गए मान की गणना करने की आवश्यकता है:

, (7`)

और वितरण χ 2 के महत्वपूर्ण बिंदुओं की तालिका का उपयोग करके, α और के ज्ञात मानों का उपयोग करके महत्वपूर्ण बिंदु खोजें के = एस - 3. यदि - शून्य परिकल्पना स्वीकृत हो, यदि अस्वीकृत हो।

उदाहरण।उत्पाद की मांग के अध्ययन के परिणाम तालिका में प्रस्तुत किए गए हैं:

वितरण के प्रकार के बारे में एक परिकल्पना प्रस्तुत करें और इसे a=0.01 के महत्व स्तर पर परीक्षण करें।

I. एक परिकल्पना का प्रस्ताव करना।

अनुभवजन्य वितरण के प्रकार को इंगित करने के लिए, हम एक हिस्टोग्राम का निर्माण करेंगे


120 160 180 200 220 280

हिस्टोग्राम की उपस्थिति के आधार पर, सामान्य जनसंख्या में अध्ययन की जा रही विशेषता के सामान्य वितरण के बारे में एक अनुमान लगाया जा सकता है।

द्वितीय. आइए पियर्सन गुडनेस-ऑफ़-फ़िट परीक्षण का उपयोग करके सामान्य वितरण के बारे में परिकल्पना की जाँच करें।

1. गणना करें, एस बी। एक विकल्प के रूप में, अंतराल के सिरों का अंकगणितीय माध्य लें:

2. अंतराल ज्ञात करें (Z i ; Z i+1): ; .

आइए हम (-¥) को पहले अंतराल के बाएं छोर के रूप में लें, और (+¥) को अंतिम अंतराल के दाएं छोर के रूप में लें। परिणाम तालिका में प्रस्तुत किये गये हैं। 4.

3. आइए सैद्धांतिक संभावनाएं Р i और सैद्धांतिक आवृत्तियाँ खोजें (तालिका 4 देखें)।

तालिका 4

मैं अंतराल सीमा एफ(जी) एफ(जेड आई+1) पी आई = Ф(जेड आई+1)-एफ(जेड आई)
एक्स मैं एक्स मैं+1 जेड मैं जेड आई+1
-1,14 -0,5 -0,3729 0,1271 6,36
-1,14 -0,52 -0,3729 -0,1985 0,1744 8,72
-0,52 0,11 -0,1985 0,0438 0,2423 12,12
0,11 0,73 0,0438 0,2673 0,2235 11,18
0,73 0,2673 0,5 0,2327 11,64

4. आइए अनुभवजन्य और सैद्धांतिक आवृत्तियों की तुलना करें। इसके लिए:

ए) पियर्सन मानदंड के देखे गए मान की गणना करें।

गणनाएँ तालिका 5 में प्रस्तुत की गई हैं।

तालिका 5

मैं
6,36 -1,36 1,8496 0,291
8,72 1,28 1,6384 0,188
12,12 1,88 3,5344 0,292
11,18 0,82 0,6724 0,060
11,64 -2,64 6,9696 0,599
एस

बी) दिए गए महत्व स्तर a=0.01 और स्वतंत्रता की डिग्री की संख्या k=m–3=5–3=2 पर वितरण c 2 के महत्वपूर्ण बिंदुओं की तालिका का उपयोग करके, हम महत्वपूर्ण बिंदु पाते हैं; हमारे पास है .

तुलना करें सी. . नतीजतन, सामान्य जनसंख्या की अध्ययन की गई विशेषता के सामान्य वितरण कानून के बारे में परिकल्पना को अस्वीकार करने का कोई कारण नहीं है। वे। अनुभवजन्य और सैद्धांतिक आवृत्तियों के बीच विसंगति नगण्य (यादृच्छिक) है। ◄

टिप्पणी।छोटे अनुभवजन्य आवृत्तियों वाले अंतराल (n i<5), следует объединить, а частоты этих интервалов сложить. Если производилось объединение интервалов, то при определении числа степеней свободы по формуле K=m-3 следует в качестве m принять число оставшихся после объединения интервалов.

2. समान वितरण की परिकल्पना का परीक्षण. इस परिकल्पना का परीक्षण करने के लिए पियर्सन परीक्षण का उपयोग करते समय कि जनसंख्या अनुमानित संभाव्यता घनत्व के साथ समान रूप से वितरित है

मापदंडों का अनुमान लगाने के लिए, उपलब्ध नमूने से मूल्य की गणना करना आवश्यक है और बीसूत्रों के अनुसार:

कहाँ ए*और बी*- आकलन और बी. दरअसल, समान वितरण के लिए एम(एक्स) = , , जहां आप निर्धारण के लिए एक प्रणाली प्राप्त कर सकते हैं ए*और बी*: , जिसका समाधान भाव (9) है।

फिर, ऐसा मानकर , आप सूत्रों का उपयोग करके सैद्धांतिक आवृत्तियाँ पा सकते हैं

यहाँ एस- अंतरालों की संख्या जिसमें नमूना विभाजित है।

पियर्सन मानदंड के देखे गए मूल्य की गणना सूत्र (7`) का उपयोग करके की जाती है, और महत्वपूर्ण मूल्य की गणना तालिका का उपयोग करके की जाती है, इस तथ्य को ध्यान में रखते हुए कि स्वतंत्रता की डिग्री की संख्या के = एस - 3. इसके बाद क्रांतिक क्षेत्र की सीमाएं उसी प्रकार निर्धारित की जाती हैं जैसे सामान्य वितरण की परिकल्पना के परीक्षण के लिए।

3. घातीय वितरण के बारे में परिकल्पना का परीक्षण करना।इस मामले में, मौजूदा नमूने को समान लंबाई के अंतरालों में विभाजित करके, हम विकल्पों के अनुक्रम पर विचार करते हैं, एक दूसरे से समान दूरी पर (हम मानते हैं कि सभी विकल्प जो इसमें आते हैं) मैं- वें अंतराल, इसके मध्य से मेल खाने वाला मान लें), और उनकी संगत आवृत्तियाँ एन मैं(इसमें शामिल नमूना विकल्पों की संख्या मैं-वें अंतराल). आइए इन आंकड़ों से गणना करें और पैरामीटर के अनुमान के रूप में लें λ आकार। फिर सैद्धांतिक आवृत्तियों की गणना सूत्र का उपयोग करके की जाती है

फिर पियर्सन मानदंड के देखे गए और महत्वपूर्ण मूल्य की तुलना की जाती है, इस तथ्य को ध्यान में रखते हुए कि स्वतंत्रता की डिग्री की संख्या के = एस - 2.

उदाहरण. एक नमूने के लिए जिसकी अंतराल सांख्यिकीय श्रृंखला का रूप है

महत्व स्तर पर जाँच करें α = 0.05 परिकल्पना ओ.

कोलमोगोरोव मानदंड।

व्यवहार में, मानदंड के अलावा, कोलमोगोरोव मानदंड का अक्सर उपयोग किया जाता है, जिसमें अनुभवजन्य वितरण फ़ंक्शन के बीच अंतर का अधिकतम निरपेक्ष मूल्य सैद्धांतिक और अनुभवजन्य वितरण के बीच विसंगति के माप के रूप में माना जाता है।
और संबंधित सैद्धांतिक वितरण फ़ंक्शन

, (1)

बुलाया कोलमोगोरोव परीक्षण आँकड़े .

यह सिद्ध हो चुका है कि वितरण कार्य चाहे जो भी हो
निरंतर यादृच्छिक चर
, अवलोकनों की संख्या में असीमित वृद्धि के साथ, असमानता की संभावना
सीमा तक जाता है

महत्व स्तर निर्धारित करना
, रिश्ते से

(3)

कोई संबंधित महत्वपूर्ण मान पा सकता है .

कोलमोगोरोव मानदंड लागू करने की योजना इस प्रकार है:

. (4)

टिप्पणी

यह ध्यान दिया जा सकता है कि ऐसी समस्याओं का समाधान मानदंड का उपयोग करके पाया जा सकता है। कोलमोगोरोव मानदंड का एक संभावित लाभ यह है कि इसमें डेटा के समूहीकरण की आवश्यकता नहीं होती है (सूचना के अपरिहार्य नुकसान के साथ), बल्कि यह व्यक्तिगत देखे गए मूल्यों पर विचार करना संभव बनाता है। इस मानदंड को छोटे नमूनों के लिए सफलतापूर्वक लागू किया जा सकता है। ऐसा माना जाता है कि इसकी शक्ति, आम तौर पर, कसौटी की तुलना में अधिक होती है।

उदाहरण आयतन का एक यादृच्छिक नमूना प्राप्त किया जाता है
. आइए एक विविधता श्रृंखला और एक अनुभवजन्य वितरण फ़ंक्शन का निर्माण करें:

आइए इस परिकल्पना का परीक्षण करें कि ये अवलोकन वितरण से एक यादृच्छिक नमूना बनाते हैं
महत्व स्तर के साथ
. तब हम निर्धारित कर सकते हैं
रेखांकन या विश्लेषणात्मक रूप से, और ये मान बिंदु पर प्रकट होने चाहिए , प्रेक्षित मात्राओं में से एक के अनुरूप। इस प्रयोजन के लिए, मात्राओं के जोड़े की गणना करना आवश्यक है और (चित्र 1 देखें) प्रत्येक नमूना मूल्य के लिए।

गणना करने के लिए, याद रखें: मानक सामान्य वितरण फ़ंक्शन कहां है। हम सभी गणनाओं के परिणाम एक तालिका के रूप में प्रस्तुत करते हैं:

परिणाम तालिका से यह इस प्रकार है: . सांख्यिकीय तालिकाओं से हमें प्राप्त होता है
. क्योंकि
, तो परिकल्पना स्वीकृत की जाती है
, अर्थात। डेटा को वितरण का अनुसरण करने वाला माना जा सकता है।

नमूना समरूपता के बारे में परिकल्पनाओं का परीक्षण

नमूना समरूपता परिकल्पनाएँ ऐसी परिकल्पनाएँ हैं कि विचाराधीन नमूने एक ही जनसंख्या से लिए गए हैं।

मान लीजिए कि अज्ञात सैद्धांतिक वितरण कार्यों वाली आबादी से दो स्वतंत्र नमूने लिए गए हैं
और
.

परीक्षण की जा रही शून्य परिकल्पना का स्वरूप है
एक प्रतिस्पर्धी के खिलाफ
. हम मान लेंगे कि कार्य निरंतर हैं।

कोलमोगोरोव-स्मिरनोव मानदंडकोलमोगोरोव परीक्षण के समान विचार का उपयोग करता है, लेकिन केवल कोलमोगोरोव परीक्षण एक अनुभवजन्य वितरण फ़ंक्शन की तुलना सैद्धांतिक के साथ करता है, जबकि कोलमोगोरोव-स्मिरनोव परीक्षण दो अनुभवजन्य वितरण कार्यों की तुलना करता है।

कोलमोगोरोव-स्मिरनोव परीक्षण के आँकड़े इस प्रकार हैं:

,

कहाँ
और
- मात्रा के साथ दो नमूनों से निर्मित अनुभवजन्य वितरण कार्य और . यदि वास्तविक प्रेक्षित मान है तो महत्व स्तर पर अस्वीकार कर दिया जाता है अधिक महत्वपूर्ण, यानी
, और अन्यथा स्वीकार किया जाता है।

कार्यक्रम में कोलमोगोरोव-स्मिरनोव मानदंडसांख्यिकी पर्यावरण मेंखिड़कियाँ

यह उदाहरण चार साल के लड़के और लड़कियों की आक्रामकता के अध्ययन पर आधारित है (सीगल, एस. (1956) व्यवहार विज्ञान के लिए गैर-पैरामीट्रिक सांख्यिकी (2रा.) न्यूयॉर्क: मैकग्रा-हिल)। डेटा Aggressn.sta फ़ाइल में समाहित है।

15 मिनट के खेल के दौरान बारह लड़कों और बारह लड़कियों को देखा गया; प्रत्येक बच्चे की आक्रामकता को स्कोर किया गया (आक्रामकता की आवृत्ति और डिग्री के संदर्भ में) और एक एकल आक्रामकता सूचकांक में संक्षेपित किया गया जिसकी गणना प्रत्येक बच्चे के लिए की गई थी।

व्यायामविश्लेषण. चुनना गैर-पैरामीट्रिक्समेनू से सांख्यिकी.उसके बाद चुनो दो स्वतंत्र नमूनों (समूहों) की तुलना करना।एक डायलॉग बॉक्स दिखाई देगा दो समूहों की तुलना करना. बटन पर क्लिक करें चर. यहां वेरिएबल वेरिएबल का चयन करें आक्रामकतावी आश्रित चर सूचीऔर एक चर लिंगवी स्वतंत्र. (समूहन) चर. प्रत्येक अवलोकन को एक विशिष्ट लिंग के लिए स्पष्ट रूप से निर्दिष्ट करने के लिए कोड प्रोग्राम द्वारा स्वचालित रूप से चुने जाएंगे।

जैसा कि परिणाम तालिका से देखा जा सकता है, इस अध्ययन में लड़कों और लड़कियों की आक्रामकता के बीच अंतर अत्यधिक महत्वपूर्ण है।

व्यवहार में, χ 2 मानदंड के अलावा, कोलमोगोरोव मानदंड का अक्सर उपयोग किया जाता है, जिसमें अनुभवजन्य वितरण फ़ंक्शन और संबंधित सैद्धांतिक वितरण फ़ंक्शन के बीच अंतर का अधिकतम पूर्ण मूल्य सैद्धांतिक और के बीच विसंगति के माप के रूप में माना जाता है। अनुभवजन्य वितरण

कोलमोगोरोव परीक्षण आँकड़ा कहा जाता है।

महत्व स्तर α सेट करके, आप संबंधित महत्वपूर्ण मान पा सकते हैं

तालिका कुछ α के लिए कोलमोगोरोव मानदंड के महत्वपूर्ण मान दिखाती है।

तालिका 4.2.

कोलमोगोरोव मानदंड लागू करने की योजना

1. एक अनुभवजन्य वितरण फ़ंक्शन और एक अनुमानित सैद्धांतिक वितरण फ़ंक्शन का निर्माण किया जाता है एफ(एक्स).

2. कोलमोगोरोव सांख्यिकी डी निर्धारित किया जाता है - सैद्धांतिक और अनुभवजन्य वितरण के बीच विसंगति का एक उपाय और मूल्य की गणना की जाती है

3. यदि परिकलित मान λ महत्वपूर्ण मान से अधिक है, तो शून्य परिकल्पना H 0 कि यादृच्छिक चर X में एक दिया गया वितरण कानून है, खारिज कर दिया जाता है।

यदि , तो उनका मानना ​​है कि परिकल्पना H 0 प्रयोगात्मक डेटा का खंडन नहीं करती है।

उदाहरण।महत्व स्तर α = 0.05 पर कोलमोगोरोव परीक्षण का उपयोग करते हुए, परिकल्पना एच 0 का परीक्षण करें कि यादृच्छिक चर एक्स - उद्यम के श्रमिकों का आउटपुट - एक सामान्य वितरण कानून है।

समाधान. 1. आइए अनुभवजन्य और सैद्धांतिक वितरण कार्यों का निर्माण करें।

अनुभवजन्य वितरण फ़ंक्शन का निर्माण सापेक्ष संचित आवृत्तियों का उपयोग करके किया जाता है।

हम सूत्र के अनुसार सैद्धांतिक वितरण फ़ंक्शन का निर्माण करेंगे

कहाँ

आइए गणना परिणामों को एक तालिका में संक्षेपित करें:

तालिका 4.3.

कोलमोगोरोव-स्मिरनोव मानदंड। नमूना समरूपता की परिकल्पना का परीक्षण करना

नमूना समरूपता परिकल्पनाएँ ऐसी परिकल्पनाएँ हैं कि विचाराधीन नमूने एक ही जनसंख्या से लिए गए हैं।

मान लीजिए कि अज्ञात सैद्धांतिक वितरण कार्यों वाली आबादी से दो स्वतंत्र नमूने लिए गए हैं।

परीक्षण की जा रही शून्य परिकल्पना प्रतिस्पर्धी परिकल्पना के विरुद्ध है। हम मान लेंगे कि फ़ंक्शन निरंतर हैं और अनुमान लगाने के लिए आंकड़ों का उपयोग करेंगे कोलमोगोरोव - स्मिरनोवा.

कोलमोगोरोव-स्मिरनोव मानदंडकोलमोगोरोव मानदंड के समान विचार का उपयोग करता है। हालाँकि, अंतर यह है कि कोलमोगोरोव परीक्षण एक अनुभवजन्य वितरण फ़ंक्शन की तुलना सैद्धांतिक से करता है, जबकि कोलमोगोरोव-स्मिरनोव परीक्षण दो अनुभवजन्य वितरण कार्यों की तुलना करता है।

कोलमोगोरोव-स्मिरनोव परीक्षण के आँकड़े इस प्रकार हैं:

, (9.1)

जहां और मात्रा के साथ दो नमूनों से निर्मित अनुभवजन्य वितरण कार्य हैं।

यदि आँकड़ों का वास्तविक प्रेक्षित मान क्रांतिक मान से अधिक है, तो परिकल्पना अस्वीकार कर दी जाती है, अर्थात। , और अन्यथा स्वीकार किया जाता है।

छोटे नमूना आकारों के लिए, दिए गए परीक्षण महत्व स्तरों के लिए महत्वपूर्ण मान विशेष तालिकाओं में पाए जा सकते हैं। कब (और व्यावहारिक रूप से कब) ​​आंकड़ों का वितरण आंकड़ों के लिए कोलमोगोरोव वितरण में कम हो जाता है। इस मामले में, परिकल्पना को महत्व स्तर पर खारिज कर दिया जाता है यदि वास्तविक मनाया गया मूल्य महत्वपूर्ण मूल्य से अधिक है, यानी। , और अन्यथा स्वीकार किया जाता है।

उदाहरण 1।^ दो नमूनों की एकरूपता की जाँच करना

कम वजन की पहचान करने के लिए खुदरा दुकानों के दो निरीक्षण किए गए। प्राप्त परिणामों को तालिका में संक्षेपित किया गया है:


^ अंतराल संख्या

कम वजन का अंतराल, जी

आवृत्तियों

नमूना 1

नमूना 2

1

0 – 10

3

5

2

10 – 20

10

12

3

20 – 30

15

8

4

30 – 40

20

25

5

40 – 50

12

10

6

50 – 60

5

8

7

60 – 70

25

20

8

70 – 80

15

7

9

80 – 90

5

5

पहले नमूने का आयतन बराबर था, और दूसरे का -।

समाधान:

आइए निरूपित करें तथा - नमूने 1 और 2 की संचित आवृत्तियाँ;
, क्रमशः उनके अनुभवजन्य वितरण कार्यों के मूल्य हैं। हम संसाधित परिणामों को एक तालिका में सारांशित करते हैं:














10

3

5

0.027

0.050

0.023

20

13

17

0.118

0.170

0.052

30

28

25

0.254

0.250

0.004

40

48

50

0.436

0.500

0.064

50

60

60

0.545

0.600

0.055

60

65

68

0.591

0.680

0.089

70

90

88

0.818

0.880

0.072

80

105

95

0.955

0.950

0.005

90

110

100

1.000

1.000

0.000

तालिका के अंतिम कॉलम से यह स्पष्ट है कि. सूत्र (9.1) का उपयोग करके हम प्राप्त करते हैं . सांख्यिकीय तालिकाओं से यह ज्ञात होता है। चूँकि, तब शून्य परिकल्पना स्वीकृत हो जाती है, अर्थात्। खरीदारों को कम वजन का विवरण उसी वितरण फ़ंक्शन द्वारा दिया जाता है।

^

सांख्यिकीय स्वतंत्रता और प्रवृत्ति का पता लगाना


यादृच्छिक डेटा का विश्लेषण करते समय, अक्सर ऐसी स्थितियाँ उत्पन्न होती हैं जब आप यह निर्धारित करना चाहते हैं कि क्या अवलोकन या पैरामीटर अनुमान सांख्यिकीय रूप से स्वतंत्र हैं या किसी प्रवृत्ति के अधीन हैं। विश्लेषण करते समय यह विशेष रूप से महत्वपूर्ण है गैर-स्थिर डेटा.

इस तरह के अध्ययन आमतौर पर आधार पर किए जाते हैं वितरण से मुक्तया गैर-पैरामीट्रिक तरीके, जिसमें अध्ययन के तहत डेटा के वितरण फ़ंक्शन के संबंध में कोई धारणा नहीं बनाई गई है।
^

शृंखला मानदंड


एक यादृच्छिक चर के देखे गए मानों के अनुक्रम पर विचार करें, प्रत्येक अवलोकन को दो परस्पर अनन्य वर्गों में से एक को सौंपा गया है, जिसे केवल (+) या दर्शाया जा सकता है
(-). आइए कई उदाहरण देखें:

इनमें से प्रत्येक उदाहरण में, प्रपत्र का एक क्रम बनता है:

^ एक श्रृंखला एक ही प्रकार के अवलोकनों का एक क्रम है, जिसके पहले और बाद में विपरीत प्रकार के अवलोकन होते हैं, या कोई अवलोकन नहीं होता है।

दिए गए क्रम में, प्रेक्षणों की संख्या बराबर है; और एपिसोड की संख्या बराबर है.

यदि प्रेक्षणों के अनुक्रम में समान यादृच्छिक चर के स्वतंत्र परिणाम शामिल हों, अर्थात यदि व्यक्तिगत परिणामों की संभावना [(+) या (-)] अवलोकन से अवलोकन में नहीं बदलती है, तो अनुक्रम में श्रृंखला की संख्या का नमूना वितरण माध्य और भिन्नता के साथ एक यादृच्छिक चर है:

(9.2)

(9.3)

यहां परिणामों की संख्या स्वाभाविक रूप से (+) है, और परिणामों की संख्या (-) है। विशेष मामले में यदि , तो:

. (9.4)

आइए मान लें कि अवलोकनों के अनुक्रम में एक प्रवृत्ति की उपस्थिति पर संदेह करने का कारण है, यानी। यह मानने का कारण है कि (+) या (-) घटित होने की संभावना अवलोकन से अवलोकन में भिन्न होती है। किसी प्रवृत्ति के अस्तित्व को निम्नानुसार सत्यापित किया जा सकता है। आइए हम शून्य परिकल्पना के रूप में स्वीकार करें कि कोई प्रवृत्ति नहीं है, अर्थात। आइए मान लें कि अवलोकन एक ही यादृच्छिक चर के स्वतंत्र परिणाम हैं। फिर, महत्व के किसी भी आवश्यक स्तर के साथ परिकल्पना का परीक्षण करने के लिए, श्रृंखला की देखी गई संख्या की परिकल्पना स्वीकृति क्षेत्र की सीमाओं के बराबर और, जहां के साथ तुलना करना आवश्यक है।

यदि रनों की देखी गई संख्या परिकल्पना की स्वीकृति की सीमा से बाहर है, तो शून्य परिकल्पना को महत्व स्तर के साथ खारिज कर दिया जाना चाहिए। अन्यथा शून्य परिकल्पना स्वीकार की जा सकती है।

उदाहरण 2.^ श्रृंखला मानदंड का अनुप्रयोग

स्वतंत्र अवलोकनों का एक क्रम है:


5.5

5.1

5.7

5.2

4.8

5.7

5.0

6.5

5.4

5.8

6.8

6.6

4.9

5.4

5.9

5.4

6.8

5.8

6.9

5.5

आइए माध्यिका के साथ प्रेक्षणों की तुलना करके प्राप्त अनुक्रम में श्रृंखलाओं की संख्या की गणना करके प्रेक्षणों की स्वतंत्रता की जाँच करें। आइए महत्व स्तर के साथ एक मानदंड लागू करें।

डेटा विश्लेषण से हम पाते हैं कि मान माध्यिका है। फिर हम के लिए (+), के लिए (-) संकेतन प्रस्तुत करते हैं। तो, हमें मिलता है:

हमारे उदाहरण में, और परिकल्पना की स्वीकृति के क्षेत्र का रूप है:

.

हम सांख्यिकीय तालिकाओं से पाते हैं। क्योंकि