पियर्सन की अच्छाई-की-फिट परीक्षण। सहमति मानदंड की अवधारणा सहमति मानदंड क्या हैं?

पियर्सन की अच्छाई-की-फिट परीक्षण। सहमति मानदंड की अवधारणा सहमति मानदंड क्या हैं?

परीक्षण की जा रही परिकल्पना को आमतौर पर शून्य परिकल्पना कहा जाता है। एच 0, वह नियम जिसके द्वारा किसी परिकल्पना को स्वीकार या अस्वीकार किया जाता है, सांख्यिकीय मानदंड कहलाता है। वितरण कानूनों के प्रकार के बारे में परिकल्पनाओं का परीक्षण करने के लिए उपयोग किए जाने वाले सांख्यिकीय मानदंडों को अच्छाई-की-फिट मानदंड कहा जाता है। वे। समझौते के मानदंड तब स्थापित होते हैं जब कल्पित सैद्धांतिक और प्रयोगात्मक वितरणों के बीच वास्तव में प्राप्त विसंगतियां होती हैं: महत्वहीन - यादृच्छिक और जब महत्वपूर्ण - गैर-यादृच्छिक।

आइए एक यादृच्छिक चर पर विचार करें जो विशेषता के अपेक्षित सैद्धांतिक और प्रयोगात्मक वितरण के बीच विसंगति के प्रकार या कार्य को दर्शाता है, फिर मौजूदा प्रयोगात्मक वितरण से, हम मूल्य निर्धारित कर सकते हैं , जो यादृच्छिक चर ने लिया है, यदि उसका वितरण नियम ज्ञात हो, तो यह संभावना ज्ञात करना कठिन नहीं है कि यादृच्छिक चर इससे कम मान नहीं लेगा . यदि मान एक यादृच्छिक चर के अवलोकन के परिणामस्वरूप प्राप्त किया गया एक्स, अर्थात। जब विचाराधीन विशेषता को कल्पित सैद्धांतिक कानून के अनुसार वितरित किया जाता है, तो संभावना छोटी नहीं होनी चाहिए। यदि संभावना छोटी हो जाती है, तो इसे इस तथ्य से समझाया जाता है कि प्राप्त वास्तविक मान एक यादृच्छिक चर नहीं है एक्स, और कुछ अन्य एक अलग वितरण कानून के साथ, यानी। अध्ययन की जा रही विशेषता अपेक्षित कानून के अनुसार वितरित नहीं है। इस प्रकार, ऐसे मामले में जब अनुभवजन्य और सैद्धांतिक वितरण के बीच विसंगति छोटी नहीं है, इसे महत्वपूर्ण नहीं माना जाना चाहिए - यादृच्छिक, और प्रयोगात्मक और सैद्धांतिक वितरण विरोधाभासी नहीं हैं, यानी। एक दूसरे के अनुरूप.

यदि संभावना कम है, तो प्रयोगात्मक और सैद्धांतिक वितरण के बीच विसंगतियां महत्वपूर्ण हैं, उन्हें संयोग से नहीं समझाया जा सकता है, और अनुमानित सैद्धांतिक कानून के अनुसार विशेषता के वितरण के बारे में परिकल्पना को पुष्टि नहीं माना जाना चाहिए, यह सहमत नहीं है प्रायोगिक डेटा के साथ. प्रायोगिक डेटा का सावधानीपूर्वक अध्ययन करने के बाद, प्रस्तावित विशेषता की गुणवत्ता पर एक नया कानून खोजने का प्रयास करना आवश्यक है, जो प्रयोगात्मक वितरण की विशेषताओं को बेहतर और पूरी तरह से प्रतिबिंबित करेगा; ऐसी संभावनाओं को छोटा माना जाता है और ऐसा नहीं किया जाता है 0.1 से अधिक.

पियर्सन की अच्छाई-की-फिट परीक्षण या मानदंडसी 2 .

मान लीजिए कि प्रयोगात्मक डेटा के विश्लेषण से एक निश्चित वितरण कानून का चयन होता है जैसा कि विचाराधीन विशेषता के लिए माना जाता है, और एन-अवलोकन के परिणामस्वरूप प्रयोगात्मक डेटा के अनुसार, पैरामीटर पाए गए (यदि वे पहले से ज्ञात नहीं थे)। आइए हम इसे निरूपित करें एन मैं- एक यादृच्छिक चर की अनुभवजन्य आवृत्तियाँ एक्स।

एन×पी मैं- अवलोकनों की संख्या के उत्पाद का प्रतिनिधित्व करने वाली सैद्धांतिक आवृत्तियाँ एनसंभाव्यता पर पी मैं- अनुमानित सैद्धांतिक वितरण के अनुसार गणना की गई। सहमति मानदंड सी 2सैद्धांतिक और अनुभवजन्य आवृत्ति श्रृंखला के बीच विसंगति का माप लिया जाता है


सी 2- बुलायी गयी मात्रा सी 2वितरण या पियर्सन वितरण. यह केवल तभी 0 के बराबर होता है जब सभी अनुभवजन्य और सैद्धांतिक आवृत्तियाँ मेल खाती हैं; अन्य मामलों में यह 0 से भिन्न होता है और संकेतित आवृत्तियों के बीच विसंगति जितनी अधिक होगी, अंतर उतना ही अधिक होगा। यह सिद्ध हो चुका है कि चयनित विशेषता सी 2या n®¥ के आँकड़ों में स्वतंत्रता की डिग्री के साथ पियर्सन वितरण है

k=m-s- 1.

कहाँ एम-विविधता श्रृंखला के अनुभवजन्य वितरण के अंतरालों की संख्या या समूहों की संख्या।

एस-प्रायोगिक डेटा से निर्धारित सैद्धांतिक वितरण के मापदंडों की संख्या (उदाहरण के लिए, सामान्य वितरण के मामले में, नमूने से अनुमानित मापदंडों की संख्या 2 है)।

मानदंड लागू करने की योजना इस प्रकार है:

1. प्रयोगात्मक डेटा के आधार पर, अपेक्षित के रूप में विशेषता के वितरण कानून का चयन करें और इसके पैरामीटर ढूंढें।

2. परिणामी वितरण का उपयोग करके, प्रयोगात्मक आवृत्तियों के अनुरूप सैद्धांतिक आवृत्तियाँ निर्धारित की जाती हैं।

3. छोटी प्रयोगात्मक आवृत्तियों, यदि कोई हो, को पड़ोसी आवृत्तियों के साथ जोड़ा जाता है, तो मान सूत्र का उपयोग करके निर्धारित किया जाता है सी 2 .

4. स्वतंत्रता की कोटियों की संख्या निर्धारित करें .

5. चयनित महत्व स्तर के लिए आवेदन तालिकाओं से जब स्वतंत्रता की कोटियों की संख्या बराबर हो तो क्रांतिक मान ज्ञात कीजिए .

6. हम सहमति मानदंड लागू करने के सामान्य सिद्धांत द्वारा निर्देशित एक निष्कर्ष तैयार करते हैं, अर्थात्, यदि संभावना> 0.01 है, तो सैद्धांतिक और प्रयोगात्मक आवृत्तियों के बीच मौजूदा विसंगतियों को महत्वहीन माना जाता है।

यदि वास्तविक अवलोकित मान क्रांतिक मान से अधिक है, तो एच 0यदि परिकल्पना प्रयोगात्मक डेटा का खंडन नहीं करती है तो खारिज कर दिया जाता है। मापदंड सी 2यदि प्रत्येक समूह अंतराल में पर्याप्त संख्या में अवलोकन हों तो संतोषजनक परिणाम देता है एन मैं .

नोट: यदि किसी अंतराल में प्रेक्षणों की संख्या<5, то имеет смысл объединить соседние интервалы с тем, чтобы в объединенных интервалах एन मैं 5 से कम नहीं था। इसके अलावा, स्वतंत्रता की डिग्री की संख्या की गणना करते समय जैसा एम- अंतरालों की तदनुसार कम संख्या ली जाती है।

रिपोर्टिंग वर्ष में उत्पादन के अनुसार 100 कार्यशाला श्रमिकों का निम्नलिखित वितरण प्राप्त किया गया था

(पिछले वर्ष के % में).

कनेक्शन की निकटता का आकलन करने के लिए भिन्नता संकेतक का उपयोग किया जाता है:

1. कुल विचरण प्रभावी गुण - कारकों के संचयी प्रभाव को दर्शाता है:

2. कारक विचरण प्रभावी विशेषता - केवल अध्ययन किए जा रहे कारक के प्रभाव से भिन्नता दर्शाती है एक्स:

समतुल्य मूल्यों के उतार-चढ़ाव को दर्शाता है वाई एक्सकुल औसत से.

3. अवशिष्ट विचरण परिणामी विशेषता की भिन्नता प्रदर्शित करता है परसिवाय अन्य सभी से एक्सकारक:

कारक और सामान्य के बीच का संबंध, बीच संबंध की निकटता की डिग्री को दर्शाता है एक्सऔर यू

निर्धारण सूचकांक - कुल विचरण में कारक विचरण का हिस्सा। यदि इस अभिव्यक्ति को, के रूप में दर्शाया जाता है आरयह सहसंबंध सूचकांक .

भिन्नताओं को जोड़ने के नियम के आधार पर (=+, सहसंबंध सूचकांक को इस प्रकार दर्शाया जा सकता है: या। सहसंबंध सूचकांक का उपयोग संचार के सभी रूपों के लिए कनेक्शन की निकटता का आकलन करने के लिए किया जाता है।

इसका उपयोग रैखिक कनेक्शन की जकड़न को मापने के लिए किया जाता है रैखिक सहसंबंध गुणांक:

चैडॉक पैमाने का उपयोग करके संकेतकों के बीच संबंधों की निकटता का गुणात्मक मूल्यांकन दिया गया है:

आइए, एक सशर्त उदाहरण का उपयोग करते हुए, जोड़ीवार सहसंबंध के प्रतिगमन-सहसंबंध विश्लेषण के उपयोग पर विचार करें। 8 होटलों के काम के बारे में चुनिंदा जानकारी है, जिनमें होटल के कमरों की औसत वार्षिक अधिभोग और उनकी गतिविधियों की अलग-अलग लाभप्रदता है। प्रतिगमन-सहसंबंध विश्लेषण के परिणामस्वरूप, यह निर्धारित करना बेहद महत्वपूर्ण है कि क्या होटल के कमरों के अधिभोग के बीच कोई सीधा संबंध है और यदि हां, तो यह कितना करीब है:

एन पीपी भरने की क्षमता (%% में) x लाभप्रदता (%% में) एक्स 2 दो पर xy समतल (सैद्धांतिक) y x
8,2 7,0 9,3 8,1 9,5 10,5 7,5 6,3 67,24 49,00 86,49 65,61 90,25 110,25 56,25 39,69 492,0 364,0 669,6 526,5 712,5 840,0 420,0 315,0 7,61 6,65 9,05 8,21 9,41 10,01 7,13 6,41
66,4 564,78 4339,6 64,48

आइए रैखिक जोड़ी प्रतिगमन समीकरण के पैरामीटर निर्धारित करें:

हमारा जोड़ीवार प्रतिगमन समीकरण इस प्रकार दिखेगा:. आइए इस समीकरण में x के अनुभवजन्य मानों को प्रतिस्थापित करें और सैद्धांतिक मानों 7.61, आदि की गणना करें।

आइए अब होटल अधिभोग और उनकी गतिविधियों की लाभप्रदता के बीच घनिष्ठ संबंध निर्धारित करें:

विश्लेषण के परिणामस्वरूप, यह स्थापित किया गया कि होटलों के अधिभोग और उनकी गतिविधियों की लाभप्रदता के बीच सीधा, बहुत उच्च संबंध है।

व्यवहार में, अनुभवजन्य आवृत्तियों की सैद्धांतिक आवृत्तियों से निकटता का आकलन करना अक्सर बेहद महत्वपूर्ण होता है। यह मूल्यांकन निकटता मानदंड का उपयोग करके किया जा सकता है जिसे कहा जाता है सहमति मानदंड. अक्सर इन उद्देश्यों के लिए उपयोग किया जाता है - पियर्सन अच्छाई-की-फिट परीक्षण (ʼʼhiʼʼ - वर्ग), जिसकी गणना सूत्र द्वारा की जाती है:

कहाँ एफ -अनुभवजन्य आवृत्तियाँ,

सैद्धांतिक आवृत्तियाँ।

सैद्धांतिक आवृत्तियों के साथ अनुभवजन्य आवृत्तियों की निकटता का आकलन प्राप्त करने की संभावना से निर्धारित होता है दिया गया मूल्य आर( ) यादृच्छिक आवृत्ति विचलन के लिए. यदि संभावना आर( ) शून्य (0.05 से अधिक) से काफी भिन्न है, तो सैद्धांतिक आवृत्तियों से अनुभवजन्य आवृत्तियों के विचलन को यादृच्छिक माना जा सकता है। अगर आर( )< 0.05, तो विचलन को यादृच्छिक नहीं माना जा सकता है, और अनुभवजन्य और सैद्धांतिक वितरण एक दूसरे से मौलिक रूप से भिन्न।

परिमाण यह न केवल सैद्धांतिक आवृत्तियों से वास्तविक आवृत्तियों के विचलन पर निर्भर करता है, बल्कि उन समूहों की संख्या पर भी निर्भर करता है जिनमें जनसंख्या विभाजित है, इसके संबंध में, महत्वपूर्ण मूल्यों की तालिकाएँ अनुभवजन्य आवृत्तियों (परिशिष्ट) की भिन्नता की स्वतंत्रता की विभिन्न डिग्री के लिए गणना की गई। यह कहने लायक है कि सामान्य वितरण के लिए स्वतंत्रता की डिग्री की संख्या K=n-3, कहाँ एन– समूहों की संख्या.P( , जो कि 0.05 से काफी अधिक है। इसका मतलब यह है कि अनुभवजन्य से वास्तविक आवृत्तियों के विचलन को यादृच्छिक माना जा सकता है, और टिकट बिक्री का वितरण स्वयं सामान्य वितरण के करीब है।

परिशिष्ट 1

सहमति मानदंड - अवधारणा और प्रकार। "सहमति मानदंड" 2017, 2018 श्रेणी का वर्गीकरण और विशेषताएं।

समझौते के लिए मानदंड (अनुपालन)

सैद्धांतिक वितरण कानून के अनुभवजन्य वितरण के पत्राचार के बारे में परिकल्पना का परीक्षण करने के लिए, विशेष सांख्यिकीय संकेतकों का उपयोग किया जाता है - उपयुक्तता मानदंड (या अनुपालन मानदंड)। इनमें पियर्सन, कोलमोगोरोव, रोमानोव्स्की, यास्त्रेम्स्की आदि के मानदंड शामिल हैं। अधिकांश समझौते मानदंड सैद्धांतिक से अनुभवजन्य आवृत्तियों के विचलन के उपयोग पर आधारित हैं। जाहिर है, ये विचलन जितने छोटे होंगे, सैद्धांतिक वितरण उतना ही बेहतर अनुभवजन्य से मेल खाता है (या इसका वर्णन करता है)।

सहमति मानदंड -ये सैद्धांतिक संभाव्यता वितरण के अनुभवजन्य वितरण के पत्राचार के बारे में परिकल्पनाओं का परीक्षण करने के मानदंड हैं। ऐसे मानदंड दो वर्गों में विभाजित हैं: सामान्य और विशेष। सामान्य अच्छाई-की-फिट परीक्षण एक परिकल्पना के सबसे सामान्य सूत्रीकरण पर लागू होते हैं, अर्थात् वह परिकल्पना जिसके देखे गए परिणाम किसी पूर्व-कल्पित संभाव्यता वितरण से सहमत होते हैं। विशेष अच्छाई-की-फिट परीक्षणों में विशेष अशक्त परिकल्पनाएं शामिल होती हैं जो संभाव्यता वितरण के एक विशेष रूप के साथ समझौते को बताती हैं।

स्थापित वितरण कानून के आधार पर समझौते के मानदंड, यह स्थापित करना संभव बनाते हैं कि सैद्धांतिक और अनुभवजन्य आवृत्तियों के बीच विसंगतियों को कब महत्वहीन (यादृच्छिक) माना जाना चाहिए, और कब - महत्वपूर्ण (गैर-यादृच्छिक)। इससे यह पता चलता है कि समझौते के मानदंड अनुभवजन्य श्रृंखला में वितरण की प्रकृति के बारे में श्रृंखला को संरेखित करते समय सामने रखी गई परिकल्पना की शुद्धता को अस्वीकार या पुष्टि करना संभव बनाते हैं और यह उत्तर देते हैं कि क्या किसी दिए गए अनुभवजन्य वितरण को स्वीकार करना संभव है कुछ सैद्धांतिक वितरण कानून द्वारा व्यक्त एक मॉडल।

पियर्सन का χ 2 (ची-स्क्वायर) फिट-ऑफ-फिट परीक्षण मुख्य फिट-ऑफ-फिट परीक्षणों में से एक है। अनुभवजन्य और सैद्धांतिक वितरण की आवृत्तियों के बीच विसंगतियों की यादृच्छिकता (महत्व) का आकलन करने के लिए अंग्रेजी गणितज्ञ कार्ल पियर्सन (1857-1936) द्वारा प्रस्तावित:

कहाँ क-उन समूहों की संख्या जिनमें अनुभवजन्य वितरण विभाजित है; फाईकिसी विशेषता की अनुभवजन्य आवृत्ति मैं-वां समूह; / ts °р - साइन इन की सैद्धांतिक आवृत्ति i-वेंसमूह।

मानदंड लागू करने की योजना य)सैद्धांतिक और अनुभवजन्य वितरण की स्थिरता का आकलन करने के लिए निम्नलिखित आता है।

  • 1. विसंगति% 2 एएससी का परिकलित माप निर्धारित किया जाता है।
  • 2. स्वतंत्रता की कोटि की संख्या निर्धारित की जाती है।
  • 3. स्वतंत्रता की डिग्री की संख्या के आधार पर, %^bl एक विशेष तालिका का उपयोग करके निर्धारित किया जाता है
  • 4. यदि % 2 asch >x 2 abl, तो दिए गए महत्व के स्तर a और स्वतंत्रता की डिग्री की संख्या v के लिए, विसंगतियों की महत्वहीनता (यादृच्छिकता) के बारे में परिकल्पना खारिज कर दी जाती है। अन्यथा, परिकल्पना को प्राप्त प्रयोगात्मक डेटा का खंडन नहीं करने के रूप में पहचाना जा सकता है और संभाव्यता (1 - ए) के साथ यह तर्क दिया जा सकता है कि सैद्धांतिक और अनुभवजन्य आवृत्तियों के बीच विसंगतियां यादृच्छिक हैं।

महत्वपूर्ण स्तर -यह आगे रखी गई परिकल्पना को ग़लती से अस्वीकार करने की संभावना है, अर्थात। संभावना है कि एक सही परिकल्पना खारिज कर दी जाएगी। सांख्यिकीय अध्ययनों में, हल की जा रही समस्याओं के महत्व और जिम्मेदारी के आधार पर, महत्व के निम्नलिखित तीन स्तरों का उपयोग किया जाता है:

  • 1) ए = 0.1, फिर पी = 0,9;
  • 2) ए = 0.05, फिर पी = 0,95;
  • 3) ए = 0.01, फिर पी = 0,99.

उपयुक्तता की कसौटी का उपयोग करना य),निम्नलिखित शर्तें पूरी होनी चाहिए.

  • 1. अध्ययनाधीन जनसंख्या की मात्रा को शर्त को पूरा करना चाहिए पी> 50, जबकि आवृत्ति या समूह का आकार कम से कम 5 होना चाहिए। यदि इस शर्त का उल्लंघन किया जाता है, तो पहले छोटी आवृत्तियों (5 से कम) को संयोजित करना आवश्यक है।
  • 2. अनुभवजन्य वितरण में यादृच्छिक नमूने के परिणामस्वरूप प्राप्त डेटा शामिल होना चाहिए, अर्थात। उन्हें स्वतंत्र होना चाहिए.

पियर्सन की अच्छाई-की-फिट कसौटी का नुकसान अवलोकन परिणामों को अंतरालों में समूहित करने और व्यक्तिगत अंतरालों को कम संख्या में अवलोकनों के साथ संयोजित करने की आवश्यकता से जुड़ी कुछ मूल जानकारी का नुकसान है। इस संबंध में, वितरण अनुपालन की जाँच को मानदंड के साथ पूरक करने की अनुशंसा की जाती है य)अन्य मानदंड. नमूना आकार होने पर यह विशेष रूप से आवश्यक है पी ~ 100.

आंकड़ों में, कोलमोगोरोव अच्छाई-की-फिट परीक्षण (कोलमोगोरोव-स्मिरनोव अच्छाई-की-फिट परीक्षण के रूप में भी जाना जाता है) का उपयोग यह निर्धारित करने के लिए किया जाता है कि क्या दो अनुभवजन्य वितरण एक ही कानून का पालन करते हैं, या यह निर्धारित करने के लिए कि परिणामी वितरण एक कल्पित मॉडल का पालन करता है या नहीं . कोलमोगोरोव मानदंड संचित आवृत्तियों या अनुभवजन्य या सैद्धांतिक वितरण की आवृत्तियों के बीच अधिकतम विसंगति का निर्धारण करने पर आधारित है। कोलमोगोरोव मानदंड की गणना निम्नलिखित सूत्रों का उपयोग करके की जाती है:

कहाँ डीऔर डी-तदनुसार, संचित आवृत्तियों (/-/") और संचित आवृत्तियों के बीच अधिकतम अंतर ( आरआर") वितरण की अनुभवजन्य और सैद्धांतिक श्रृंखला; एन-कुल में इकाइयों की संख्या.

मूल्य की गणना करने के बाद एक्स,संभाव्यता निर्धारित करने के लिए एक विशेष तालिका का उपयोग किया जाता है जिसके साथ यह कहा जा सकता है कि सैद्धांतिक आवृत्तियों से अनुभवजन्य आवृत्तियों का विचलन यादृच्छिक है। यदि चिह्न 0.3 तक मान लेता है, तो इसका मतलब है कि आवृत्तियों का पूर्ण संयोग है। बड़ी संख्या में अवलोकनों के साथ, कोलमोगोरोव परीक्षण परिकल्पना से किसी भी विचलन का पता लगाने में सक्षम है। इसका मतलब यह है कि पर्याप्त संख्या में अवलोकन होने पर सैद्धांतिक वितरण से नमूना वितरण में किसी भी अंतर का पता इसकी मदद से लगाया जाएगा। इस संपत्ति का व्यावहारिक महत्व नगण्य है, क्योंकि ज्यादातर मामलों में निरंतर परिस्थितियों में बड़ी संख्या में अवलोकन प्राप्त करने पर भरोसा करना मुश्किल है, वितरण कानून का सैद्धांतिक विचार जिसके लिए नमूना का पालन करना चाहिए वह हमेशा अनुमानित होता है, और सांख्यिकीय परीक्षणों की सटीकता चयनित मॉडल की सटीकता से अधिक नहीं होनी चाहिए।

रोमानोव्स्की अच्छाई-की-फिट परीक्षण पियर्सन मानदंड के उपयोग पर आधारित है, अर्थात। पहले से ही पाए गए मान x 2 > और स्वतंत्रता की डिग्री की संख्या:

जहां v भिन्नता की स्वतंत्रता की डिग्री की संख्या है।

x2 के लिए तालिकाओं की अनुपस्थिति में रोमानोव्स्की मानदंड सुविधाजनक है। अगर के आरको? >3, तो वे गैर-यादृच्छिक हैं और सैद्धांतिक वितरण अध्ययन किए जा रहे अनुभवजन्य वितरण के लिए एक मॉडल के रूप में काम नहीं कर सकता है।

बी.एस. यास्त्रेम्स्की ने समझौते की कसौटी में स्वतंत्रता की डिग्री की संख्या का नहीं, बल्कि समूहों की संख्या का उपयोग किया ( ), एक विशेष मान 0, समूहों की संख्या और एक ची-स्क्वायर मान पर निर्भर करता है। यस्त्रेम्स्की समझौता मानदंड का रोमनोव्स्की मानदंड के समान अर्थ है और सूत्र द्वारा व्यक्त किया गया है

जहां x 2 पियर्सन की अच्छाई-की-फिट परीक्षण है; /ई जीआर - समूहों की संख्या; 0 - गुणांक, 20 से कम समूहों की संख्या के लिए 0.6 के बराबर।

यदि 1ph अधिनियम > 3, सैद्धांतिक और अनुभवजन्य वितरण के बीच विसंगतियां यादृच्छिक नहीं हैं, यानी। अनुभवजन्य वितरण सामान्य वितरण की आवश्यकताओं को पूरा नहीं करता है। यदि 1f अधिनियम

इस खंड में, हम परिकल्पनाओं की संभाव्यता के परीक्षण से संबंधित मुद्दों में से एक पर विचार करेंगे, अर्थात् सैद्धांतिक और सांख्यिकीय वितरण की स्थिरता का मुद्दा।

आइए मान लें कि यह सांख्यिकीय वितरण किसी सैद्धांतिक वक्र का उपयोग करके संरेखित किया गया है एफ(एक्स)(चित्र 7.6.1)। कोई फर्क नहीं पड़ता कि सैद्धांतिक वक्र कितनी अच्छी तरह चुना गया है, इसके और सांख्यिकीय वितरण के बीच कुछ विसंगतियां अपरिहार्य हैं। सवाल स्वाभाविक रूप से उठता है: क्या इन विसंगतियों को केवल सीमित संख्या में टिप्पणियों से जुड़ी यादृच्छिक परिस्थितियों द्वारा समझाया गया है, या वे महत्वपूर्ण हैं और इस तथ्य से जुड़े हैं कि हमारे द्वारा चुना गया वक्र दिए गए सांख्यिकीय वितरण को अच्छी तरह से संरेखित नहीं करता है। इस प्रश्न का उत्तर देने के लिए, तथाकथित "सहमति मानदंड" का उपयोग किया जाता है।

यादृच्छिक चर के वितरण के नियम



सहमति मानदंड लागू करने के पीछे का विचार इस प्रकार है।

इस सांख्यिकीय सामग्री के आधार पर हमें परिकल्पना का परीक्षण करना होगा एन,इस तथ्य में शामिल है कि यादृच्छिक चर एक्सकुछ विशिष्ट वितरण कानून का पालन करता है। इस कानून को एक या दूसरे रूप में निर्दिष्ट किया जा सकता है: उदाहरण के लिए, वितरण फ़ंक्शन के रूप में एफ(एक्स)या वितरण घनत्व के रूप में एफ(एक्स),या संभावनाओं के एक सेट के रूप में पीटी,कहाँ पी टी- संभावना है कि मूल्य एक्सभीतर गिर जाएगा मैं कुछस्राव होना।

चूँकि इनमें से वितरण फलन बनता है एफ(एक्स)सबसे सामान्य है और किसी अन्य को निर्धारित करता है, हम एक परिकल्पना तैयार करेंगे एन,इस तथ्य में शामिल है कि मात्रा एक्सएक वितरण फलन ^(q:) है।

किसी परिकल्पना को स्वीकार या अस्वीकार करना एन,कुछ मात्रा पर विचार करें यू,सैद्धांतिक और सांख्यिकीय वितरण के बीच विसंगति की डिग्री को चिह्नित करना। परिमाण यूविभिन्न तरीकों से चुना जा सकता है; उदाहरण के लिए, जैसे यूआप सैद्धांतिक संभावनाओं के वर्ग विचलनों का योग ले सकते हैं पी टीसंगत आवृत्तियों से आर*या कुछ गुणांक ("वजन") के साथ समान वर्गों का योग, या सांख्यिकीय वितरण फ़ंक्शन का अधिकतम विचलन एफ*(एक्स)सैद्धांतिक से एफ(एक्स)आदि। आइए मान लें कि मूल्य यूकिसी न किसी रूप में चुना गया। जाहिर है कुछ तो है यादृच्छिक मूल्य.इस यादृच्छिक चर का वितरण नियम यादृच्छिक चर के वितरण नियम पर निर्भर करता है एक्स,किस पर प्रयोग किए गए, और प्रयोगों की संख्या पर पी।यदि परिकल्पना एनसत्य है, तो मात्रा के वितरण का नियम यूमात्रा के वितरण के नियम द्वारा निर्धारित किया जाता है एक्स(समारोह एफ(एक्स))और संख्या पी।

आइए मान लें कि हम इस वितरण नियम को जानते हैं। प्रयोगों की इस श्रृंखला के परिणामस्वरूप, यह पता चला कि हमने जो माप चुना है



सहमति मानदंड


विसंगतियों यूकुछ अर्थ ग्रहण किया एक।सवाल यह है कि क्या इसे यादृच्छिक कारणों से समझाया जा सकता है या क्या यह विसंगति बहुत बड़ी है और सैद्धांतिक और सांख्यिकीय वितरण के बीच एक महत्वपूर्ण अंतर की उपस्थिति को इंगित करती है और इसलिए, परिकल्पना की अनुपयुक्तता एन?इस प्रश्न का उत्तर देने के लिए, परिकल्पना मान लीजिए एनसही है, और इस धारणा के तहत हम इस संभावना की गणना करते हैं कि, प्रयोगात्मक सामग्री की अपर्याप्त मात्रा से जुड़े यादृच्छिक कारणों के कारण, विसंगति का माप यूप्रयोगात्मक रूप से देखे गए मूल्य से कम नहीं होगा और,यानी, हम घटना की संभावना की गणना करते हैं:

यदि यह संभावना बहुत छोटी है, तो परिकल्पना एनकम प्रशंसनीय के रूप में खारिज कर दिया जाना चाहिए; यदि यह संभावना महत्वपूर्ण है, तो यह माना जाना चाहिए कि प्रयोगात्मक डेटा परिकल्पना का खंडन नहीं करता है एन।

सवाल उठता है: विचलन का माप £/ कैसे चुना जाना चाहिए? यह पता चला है कि इसे चुनने के कुछ तरीकों से, मात्रा के वितरण का नियम लागू होता है यूइसमें बहुत ही सरल गुण हैं और पर्याप्त रूप से बड़े हैं पीव्यावहारिक रूप से कार्य से स्वतंत्र एफ(एक्स).विसंगति के ये उपाय सटीक रूप से गणितीय आंकड़ों में समझौते के मानदंड के रूप में उपयोग किए जाते हैं।

आइए समझौते के सबसे अधिक उपयोग किए जाने वाले मानदंडों में से एक पर विचार करें - तथाकथित "मानदंड"। आप?"पियर्सन.

आइए मान लें कि कई हेक्टेयर स्वतंत्र प्रयोग किए गए हैं, जिनमें से प्रत्येक में एक यादृच्छिक चर शामिल है एक्सएक निश्चित अर्थ ग्रहण कर लिया। प्रयोगात्मक परिणामों को संक्षेप में प्रस्तुत किया गया है श्रेणियाँ और एक सांख्यिकीय श्रृंखला के रूप में प्रस्तुत किया गया।

यूक्रेन के शिक्षा और विज्ञान मंत्रालय

आज़ोव क्षेत्रीय प्रबंधन संस्थान

ज़ापोरिझी राष्ट्रीय तकनीकी विश्वविद्यालय

गणित विभाग

पाठ्यक्रम कार्य

3 विषय "सांख्यिकी"

विषय पर: "सहमति का मानदंड"

द्वितीय वर्ष के छात्र

समूह 207 प्रबंधन संकाय

बटुरा तात्याना ओलेगोवना

वैज्ञानिक निदेशक

एसोसिएट प्रोफेसर कोसेनकोव ओ.आई.

बर्डियांस्क - 2009


परिचय

1.2 एक सरल परिकल्पना के लिए पियर्सन के χ 2 अच्छाई-की-फिट परीक्षण

1.3 एक जटिल परिकल्पना के लिए उपयुक्त मानदंड की अच्छाई

1.4 फिशर के χ 2 एक जटिल परिकल्पना के लिए उपयुक्तता परीक्षण

1.5 अन्य सहमति मानदंड। पॉइसन वितरण के लिए फिट-ऑफ-फिट परीक्षण

खंड II. समझौते के मानदंड का व्यावहारिक अनुप्रयोग

अनुप्रयोग

प्रयुक्त संदर्भों की सूची


परिचय

यह पाठ्यक्रम कार्य सबसे आम अच्छाई-की-फिट परीक्षणों का वर्णन करता है - ओमेगा-स्क्वायर, ची-स्क्वायर, कोलमोगोरोव और कोलमोगोरोव-स्मिरनोव। उस मामले पर विशेष ध्यान दिया जाता है जब यह जांचना आवश्यक होता है कि डेटा वितरण एक निश्चित पैरामीट्रिक परिवार से संबंधित है या नहीं, उदाहरण के लिए, सामान्य। इसकी जटिलता के कारण, यह स्थिति, जो व्यवहार में बहुत आम है, का पूरी तरह से अध्ययन नहीं किया गया है और शैक्षिक और संदर्भ साहित्य में पूरी तरह से प्रतिबिंबित नहीं किया गया है।

फिट-ऑफ-फिट मानदंड सांख्यिकीय मानदंड हैं जो प्रयोगात्मक डेटा और सैद्धांतिक मॉडल के बीच समझौते का परीक्षण करने के लिए डिज़ाइन किए गए हैं। यह प्रश्न सबसे अच्छा विकसित होता है यदि अवलोकन एक यादृच्छिक नमूने का प्रतिनिधित्व करते हैं। इस मामले में सैद्धांतिक मॉडल वितरण कानून का वर्णन करता है।

सैद्धांतिक वितरण संभाव्यता वितरण है जो यादृच्छिक चयन को नियंत्रित करता है। न केवल सिद्धांत इसके बारे में विचार दे सकता है। यहां ज्ञान के स्रोत परंपरा, पिछले अनुभव और पिछले अवलोकन हो सकते हैं। हमें बस इस बात पर जोर देने की जरूरत है कि इस वितरण को उस डेटा की परवाह किए बिना चुना जाना चाहिए जिसके खिलाफ हम इसकी जांच करने जा रहे हैं। दूसरे शब्दों में, पहले एक नमूने का उपयोग करके एक निश्चित वितरण कानून को "फिट" करना और फिर उसी नमूने का उपयोग करके प्राप्त कानून के साथ समझौते की जांच करने का प्रयास करना अस्वीकार्य है।

सरल और जटिल परिकल्पनाएँ. सैद्धांतिक वितरण कानून के बारे में बोलते हुए, जिसका किसी दिए गए नमूने के तत्वों को काल्पनिक रूप से पालन करना चाहिए, हमें इस कानून के बारे में सरल और जटिल परिकल्पनाओं के बीच अंतर करना चाहिए:

· एक साधारण परिकल्पना सीधे एक निश्चित संभाव्यता कानून (संभावना वितरण) को इंगित करती है जिसके अनुसार नमूना मूल्य उत्पन्न हुए;

· एक जटिल परिकल्पना एकल वितरण को इंगित करती है, लेकिन उनमें से कुछ सेट (उदाहरण के लिए, एक पैरामीट्रिक परिवार)।

अच्छाई-की-फिट मानदंड विश्लेषण किए गए अनुभवजन्य वितरण और जनसंख्या में विशेषता के वितरण कार्य के बीच दूरी के विभिन्न उपायों के उपयोग पर आधारित हैं।

गैर-पैरामीट्रिक अच्छाई-की-फिट परीक्षण कोलमोगोरोव, स्मिरनोव और ओमेगा स्क्वायर का व्यापक रूप से उपयोग किया जाता है। हालाँकि, वे सांख्यिकीय विधियों के अनुप्रयोग में व्यापक त्रुटियों से भी जुड़े हैं।

तथ्य यह है कि सूचीबद्ध मानदंड पूरी तरह से ज्ञात सैद्धांतिक वितरण के साथ समझौते का परीक्षण करने के लिए विकसित किए गए थे। गणना सूत्र, वितरण तालिकाएँ और महत्वपूर्ण मान व्यापक रूप से उपयोग किए जाते हैं। कोलमोगोरोव, ओमेगा स्क्वायर और इसी तरह के परीक्षणों का मुख्य विचार अनुभवजन्य वितरण फ़ंक्शन और सैद्धांतिक वितरण फ़ंक्शन के बीच की दूरी को मापना है। ये मानदंड वितरण कार्यों के स्थान में दूरियों के प्रकार में भिन्न होते हैं।

इस पाठ्यक्रम कार्य को पूरा करना शुरू करते समय, मैंने यह पता लगाने का लक्ष्य निर्धारित किया कि सहमति मानदंड क्या मौजूद हैं और यह समझना कि उनकी आवश्यकता क्यों है। इस लक्ष्य को प्राप्त करने के लिए, आपको निम्नलिखित कार्य पूरे करने होंगे:

1. "सहमति मानदंड" की अवधारणा का सार प्रकट करें;

2. निर्धारित करें कि कौन से सहमति मानदंड मौजूद हैं और उनका अलग से अध्ययन करें;

3. किए गए कार्य पर निष्कर्ष निकालें।


खंड I. सहमति मानदंड की सैद्धांतिक पृष्ठभूमि

1.1 एक साधारण परिकल्पना के मामले में कोलमोगोरोव अच्छाई-की-फिट परीक्षण और ओमेगा-स्क्वायर

एक सरल परिकल्पना. आइए ऐसी स्थिति पर विचार करें जहां मापा गया डेटा संख्याएं हैं, दूसरे शब्दों में, एक-आयामी यादृच्छिक चर। एक-आयामी यादृच्छिक चर के वितरण को उनके वितरण कार्यों को निर्दिष्ट करके पूरी तरह से वर्णित किया जा सकता है। और कई अच्छाई-की-फिट परीक्षण सैद्धांतिक और अनुभवजन्य (नमूना) वितरण कार्यों की निकटता की जांच पर आधारित हैं।

आइए मान लें कि हमारे पास n का एक नमूना है। आइए हम उस वास्तविक वितरण फ़ंक्शन को निरूपित करें जिसके अवलोकन विषय हैं, G(x), अनुभवजन्य (नमूना) वितरण फ़ंक्शन, Fn(x), और काल्पनिक वितरण फ़ंक्शन, F(x)। फिर परिकल्पना H कि वास्तविक वितरण फलन F(x) है, H: G(·) = F(·) के रूप में लिखा गया है।

परिकल्पना एच का परीक्षण कैसे करें? यदि H सत्य है, तो F n और F को एक निश्चित समानता प्रदर्शित करनी चाहिए, और n बढ़ने पर उनके बीच का अंतर कम होना चाहिए। बर्नौली के प्रमेय के कारण, F n (x) → F(x) n → ∞ के रूप में। फ़ंक्शंस F n और F की समानता को मापने के लिए, विभिन्न तरीकों का उपयोग किया जाता है।

कार्यों की समानता को व्यक्त करने के लिए, इन कार्यों के बीच एक या दूसरी दूरी का उपयोग किया जा सकता है। उदाहरण के लिए, आप एक समान मीट्रिक में F n और F की तुलना कर सकते हैं, अर्थात। मूल्य पर विचार करें:

(1.1)

डी एन सांख्यिकी को कोलमोगोरोव सांख्यिकी कहा जाता है।

जाहिर है, D n एक यादृच्छिक चर है, क्योंकि इसका मान यादृच्छिक वस्तु F n पर निर्भर करता है। यदि परिकल्पना H 0 सत्य है और n → ∞ है, तो किसी भी x के लिए F n (x) → F(x) है। इसलिए, यह स्वाभाविक है कि इन शर्तों के तहत डी एन → 0. यदि परिकल्पना एच 0 गलत है, तो एफ एन → जी और जी ≠ एफ, और इसलिए -∞

हमेशा की तरह किसी परिकल्पना का परीक्षण करते समय, हम ऐसे तर्क करते हैं मानो परिकल्पना सत्य हो। यह स्पष्ट है कि यदि आँकड़ा D n का प्रयोगात्मक रूप से प्राप्त मूल्य अविश्वसनीय रूप से बड़ा लगता है तो H 0 को अस्वीकार कर दिया जाना चाहिए। लेकिन ऐसा करने के लिए, आपको यह जानना होगा कि दिए गए n और G के लिए परिकल्पना H: F = G के तहत आँकड़े D n कैसे वितरित किए जाते हैं।

D n का एक उल्लेखनीय गुण यह है कि यदि G = F, अर्थात्। यदि काल्पनिक वितरण सही ढंग से निर्दिष्ट किया गया है, तो सांख्यिकी डी एन का वितरण कानून सभी निरंतर कार्यों जी के लिए समान हो जाता है। यह केवल नमूना आकार एन पर निर्भर करता है।

इस तथ्य का प्रमाण इस तथ्य पर आधारित है कि आँकड़े एक्स-अक्ष के मोनोटोनिक परिवर्तनों के तहत अपना मूल्य नहीं बदलते हैं। इस परिवर्तन के साथ, किसी भी निरंतर वितरण G को अंतराल पर एक समान वितरण में बदला जा सकता है। इस स्थिति में, F n (x) इस समान वितरण से नमूने के वितरण फ़ंक्शन में बदल जाएगा।

छोटे n के लिए, परिकल्पना H 0 के अंतर्गत आँकड़ों D n के लिए प्रतिशत अंकों की तालिकाएँ संकलित की गई हैं। बड़े n के लिए, D n का वितरण (परिकल्पना H 0 के तहत) 1933 में ए.एन. कोलमोगोरोव द्वारा पाए गए सीमा प्रमेय द्वारा दर्शाया गया है। वह आंकड़ों की बात करती हैं

(चूँकि H 0 पर मान स्वयं D n → 0 है, वितरण को स्थिर करने के लिए इसे असीमित रूप से बढ़ते मान से गुणा करना आवश्यक है)। कोलमोगोरोव के प्रमेय में कहा गया है कि यदि H 0 सत्य है और यदि G सतत है:
(1.2)

मेपल में इस राशि की गणना करना बहुत आसान है। एक सरल परिकल्पना एच 0: जी = एफ का परीक्षण करने के लिए, मूल नमूने से आंकड़ों डी एन के मूल्य की गणना करना आवश्यक है। इसके लिए एक सरल सूत्र काम करता है:

(1.3)

यहां, x k मूल नमूने से निर्मित भिन्नता श्रृंखला के तत्व हैं। डीएन के परिणामी मूल्य की तुलना तालिकाओं से निकाले गए महत्वपूर्ण मूल्यों से की जानी चाहिए या एक एसिम्प्टोटिक सूत्र का उपयोग करके गणना की जानी चाहिए। यदि डी एन का प्रयोगात्मक रूप से प्राप्त मूल्य स्वीकृत महत्व स्तर के अनुरूप चयनित महत्वपूर्ण मूल्य से अधिक है, तो परिकल्पना एच 0 को अस्वीकार कर दिया जाना चाहिए (चयनित महत्व स्तर पर)।

हम अभिन्न मीट्रिक में एफ एन और एफ के बीच की दूरी को मापकर समझौते का एक और लोकप्रिय मानदंड प्राप्त करते हैं। यह तथाकथित ओमेगा-वर्ग आँकड़ा पर आधारित है:

(1.4)

वास्तविक डेटा का उपयोग करके इसकी गणना करने के लिए, आप सूत्र का उपयोग कर सकते हैं:

(1.5)

यदि परिकल्पना H 0 सत्य है और फ़ंक्शन G निरंतर है, तो ओमेगा-स्क्वायर सांख्यिकी का वितरण, D n सांख्यिकी के वितरण की तरह, केवल n पर निर्भर करता है और G पर निर्भर नहीं करता है।

डी एन के समान, के लिए

छोटे n के लिए प्रतिशत अंकों की तालिकाएँ हैं, और n के बड़े मानों के लिए n आँकड़ों के सीमांत (n → ∞ के रूप में) वितरण का उपयोग किया जाना चाहिए। यहां फिर से हमें एक अनंत रूप से बढ़ते कारक से गुणा करना होगा। सीमित वितरण की खोज एन.वी. स्मिरनोव ने 1939 में की थी। इसके लिए विस्तृत तालिकाएँ और कम्प्यूटेशनल कार्यक्रम संकलित किए गए थे। डी एन पर आधारित और सैद्धांतिक दृष्टिकोण से मानदंड की एक महत्वपूर्ण संपत्ति: वे किसी भी विकल्प जी ≠ एफ के अनुरूप हैं।

© 2024 फेरम-स्टोर.ru - बिजनेस पोर्टल - फेरमस्टोर