शी वितरण। परीक्षण: ची-वर्ग वितरण और उसका अनुप्रयोग

  • गणित
  • इस लेख में, हम सुविधाओं के बीच संबंधों के अध्ययन के बारे में बात करेंगे, या, जैसा आप चाहें, यादृच्छिक चर, चर। विशेष रूप से, हम विश्लेषण करेंगे कि ची-स्क्वायर परीक्षण का उपयोग करके सुविधाओं के बीच निर्भरता के माप को कैसे पेश किया जाए और इसकी तुलना सहसंबंध गुणांक से की जाए।

    इसकी आवश्यकता क्यों पड़ सकती है? उदाहरण के लिए, यह समझने के लिए कि क्रेडिट स्कोरिंग का निर्माण करते समय कौन सी विशेषताएँ लक्ष्य चर पर अधिक निर्भर हैं - एक ग्राहक के डिफ़ॉल्ट की संभावना का निर्धारण। या, जैसा कि मेरे मामले में है, यह समझने के लिए कि ट्रेडिंग रोबोट को प्रोग्राम करने के लिए किन संकेतकों का उपयोग किया जाना चाहिए।

    अलग-अलग, मैं ध्यान देता हूं कि डेटा विश्लेषण के लिए मैं सी # भाषा का उपयोग करता हूं। शायद यह सब पहले से ही आर या पायथन में लागू किया गया है, लेकिन मेरे लिए सी # का उपयोग करने से मुझे विषय को विस्तार से समझने की अनुमति मिलती है, इसके अलावा, यह मेरी पसंदीदा प्रोग्रामिंग भाषा है।

    आइए बिल्कुल से शुरू करते हैं एक साधारण उदाहरण, यादृच्छिक संख्या जनरेटर का उपयोग करके एक्सेल में चार कॉलम बनाएं:
    एक्स= रैंडमबेटवेन (-100,100)
    यू =एक्स*10+20
    जेड =एक्स*एक्स
    टी= रैंडमबेटवेन (-100,100)

    जैसा कि आप देख सकते हैं, चर यूरैखिक रूप से निर्भर एक्स; चर जेडद्विघात रूप से निर्भर एक्स; चर एक्सतथा टीस्वतंत्र। मैंने यह चुनाव उद्देश्य पर किया है, क्योंकि हम निर्भरता के अपने माप की तुलना सहसंबंध गुणांक से करेंगे। जैसा कि आप जानते हैं, दो यादृच्छिक चरों के बीच यह मोडुलो 1 है यदि उनके बीच सबसे अधिक "कठोर" प्रकार की निर्भरता रैखिक है। दो स्वतंत्र यादृच्छिक चर के बीच शून्य सहसंबंध है, लेकिन सहसंबंध गुणांक की स्वतंत्रता सहसंबंध गुणांक की समानता का पालन नहीं करती है. हम इसे बाद में चरों के उदाहरण पर देखेंगे। एक्सतथा जेड.

    हम फ़ाइल को data.csv के रूप में सहेजते हैं और पहले अनुमान शुरू करते हैं। सबसे पहले, आइए मानों के बीच सहसंबंध गुणांक की गणना करें। मैंने लेख में कोड नहीं डाला, यह मेरे जीथब पर है। हम सभी संभावित युग्मों के लिए सहसंबंध प्राप्त करते हैं:

    यह देखा जा सकता है कि रैखिक रूप से निर्भर के लिए एक्सतथा यूसहसंबंध गुणांक 1 है। लेकिन के लिए एक्सतथा जेडयह 0.01 के बराबर है, हालांकि हम निर्भरता को स्पष्ट रूप से निर्धारित करते हैं जेड=एक्स*एक्स. स्पष्ट रूप से, हमें एक ऐसे उपाय की आवश्यकता है जो निर्भरता को बेहतर "महसूस" करे। लेकिन ची-स्क्वायर परीक्षण पर आगे बढ़ने से पहले, आइए देखें कि आकस्मिकता मैट्रिक्स क्या है।

    एक आकस्मिक मैट्रिक्स बनाने के लिए, हम चर मानों की श्रेणी को अंतराल (या श्रेणीबद्ध) में तोड़ते हैं। इस तरह के विभाजन के कई तरीके हैं, जबकि कोई सार्वभौमिक नहीं है। उनमें से कुछ को अंतराल में विभाजित किया जाता है ताकि समान संख्या में चर उनमें आ जाएं, अन्य समान लंबाई के अंतराल में विभाजित हो जाएं। मैं व्यक्तिगत रूप से इन दृष्टिकोणों को जोड़ना पसंद करता हूं। मैंने इस पद्धति का उपयोग करने का निर्णय लिया: मैं चर से स्कोर घटाता हूं। उम्मीदों, फिर मैं मूल्यांकन द्वारा प्राप्त को विभाजित करता हूं मानक विचलन. दूसरे शब्दों में, मैं यादृच्छिक चर को केंद्र और सामान्य करता हूं। परिणामी मान को एक कारक से गुणा किया जाता है (इस उदाहरण में यह 1 के बराबर है), जिसके बाद सब कुछ एक पूर्णांक तक गोल किया जाता है। आउटपुट प्रकार int का एक चर है, जो वर्ग पहचानकर्ता है।

    तो आइए लेते हैं हमारे संकेत एक्सतथा जेड, हम इसे ऊपर वर्णित तरीके से वर्गीकृत करते हैं, जिसके बाद हम प्रत्येक वर्ग की संख्या और संभावनाओं की गणना करते हैं और सुविधाओं के जोड़े की संभावना की गणना करते हैं:

    यह मात्रा के हिसाब से एक मैट्रिक्स है। यहाँ पंक्तियों में - चर वर्गों की घटनाओं की संख्या एक्स, कॉलम में - चर वर्गों की घटनाओं की संख्या जेड, कोशिकाओं में - एक ही समय में वर्गों के जोड़े की घटनाओं की संख्या। उदाहरण के लिए, कक्षा 0 एक चर के लिए 865 बार आता है एक्स, चर के लिए 823 बार जेडऔर कभी भी एक जोड़ी (0,0) नहीं थी। आइए सभी मानों को 3000 से विभाजित करके प्रायिकता की ओर बढ़ते हैं ( कुल गणनाअवलोकन):

    सुविधाओं को वर्गीकृत करने के बाद प्राप्त एक आकस्मिक मैट्रिक्स प्राप्त किया। अब मानदंड के बारे में सोचने का समय है। परिभाषा के अनुसार, यादृच्छिक चर स्वतंत्र हैं यदि इन यादृच्छिक चर द्वारा उत्पन्न सिग्मा-बीजगणित स्वतंत्र हैं। सिग्मा-बीजगणित की स्वतंत्रता का तात्पर्य उनसे घटनाओं की जोड़ीदार स्वतंत्रता से है। दो घटनाओं को स्वतंत्र कहा जाता है यदि उनकी संयुक्त घटना की संभावना इन घटनाओं की संभावनाओं के उत्पाद के बराबर होती है: पिज = पाई*पीजे. यह वह सूत्र है जिसका उपयोग हम कसौटी के निर्माण के लिए करेंगे।

    शून्य परिकल्पना: वर्गीकृत विशेषताएं एक्सतथा जेडस्वतंत्र। इसके बराबर: आकस्मिक मैट्रिक्स का वितरण पूरी तरह से चर के वर्गों (पंक्तियों और स्तंभों की संभावनाओं) की घटनाओं की संभावनाओं द्वारा दिया जाता है। या तो: मैट्रिक्स की कोशिकाएं पंक्तियों और स्तंभों की संबंधित संभावनाओं का उत्पाद हैं। हम शून्य परिकल्पना के इस सूत्रीकरण का उपयोग निर्माण करने के लिए करेंगे निर्णायक नियम: के बीच महत्वपूर्ण विसंगति पिजूतथा पाई*पीजेशून्य परिकल्पना को अस्वीकार करने का आधार होगा।

    माना - चर में कक्षा 0 के आने की प्रायिकता एक्स. कुल मिलाकर हमारे पास है एनकक्षाओं एक्सतथा एमकक्षाओं जेड. यह पता चला है कि मैट्रिक्स के वितरण को निर्धारित करने के लिए, हमें इन्हें जानना होगा एनतथा एमसंभावनाएं लेकिन वास्तव में, अगर हम जानते हैं एन-1के लिए संभावना एक्स, तो बाद वाला 1 से दूसरों के योग को घटाकर पाया जाता है। इस प्रकार, आकस्मिकता मैट्रिक्स के वितरण को खोजने के लिए, हमें यह जानना होगा एल = (एन -1) + (एम -1)मूल्य। या हमारे पास है मैं-आयामी पैरामीट्रिक स्पेस, वह वेक्टर जिससे हमें हमारा वांछित वितरण मिलता है। ची-स्क्वायर आँकड़ा इस तरह दिखेगा:

    और, फिशर के प्रमेय के अनुसार, ची-वर्ग वितरण के साथ है n*m-l-1=(n-1)(m-1)स्वतंत्रता का दर्जा।

    आइए महत्व स्तर को 0.95 पर सेट करें (या टाइप I त्रुटि की संभावना 0.05 है)। आइए के लिए ची-वर्ग वितरण की मात्रा ज्ञात करें दिया गया स्तरउदाहरण से स्वतंत्रता का महत्व और डिग्री (एन-1)(एम-1)=4*3=12: 21.02606982। चरों के लिए स्वयं ची-स्क्वायर आँकड़ा एक्सतथा जेड 4088.006631 के बराबर है। यह देखा जा सकता है कि स्वतंत्रता की परिकल्पना स्वीकार नहीं की जाती है। ची-स्क्वेर्ड आँकड़ों के थ्रेशोल्ड मान के अनुपात पर विचार करना सुविधाजनक है - इस मामले में यह बराबर है Chi2Coeff=194.4256186. यदि यह अनुपात 1 से कम हो तो स्वतन्त्रता की परिकल्पना स्वीकृत होती है, अधिक हो तो नहीं। आइए सुविधाओं के सभी युग्मों के लिए यह अनुपात ज्ञात करें:

    यहां फैक्टर1तथा कारक 2- फीचर नाम
    src_cnt1तथा src_cnt2- मूल सुविधाओं के अद्वितीय मूल्यों की संख्या
    mod_cnt1तथा mod_cnt2- वर्गीकरण के बाद अद्वितीय विशेषता मूल्यों की संख्या
    ची2- ची-स्क्वायर आँकड़े
    ची2मैक्स- 0.95 . के महत्व स्तर के लिए ची-स्क्वेर्ड आंकड़ों का थ्रेशोल्ड मान
    chi2Coeff- ची-स्क्वायर आँकड़ों का थ्रेशोल्ड मान का अनुपात
    ठीक है- सहसंबंध गुणांक

    यह देखा जा सकता है कि वे स्वतंत्र हैं (chi2coeff .)<1) получились следующие пары признаков - (एक्स, टी), (वाई, टी) तथा ( जेड, टी), जो तार्किक है, क्योंकि चर टीबेतरतीब ढंग से उत्पन्न। चर एक्सतथा जेडनिर्भर, लेकिन रैखिक रूप से निर्भर से कम एक्सतथा यू, जो तार्किक भी है।

    मैंने उपयोगिता का कोड पोस्ट किया है जो इन संकेतकों की गणना जीथब पर करता है, उसी स्थान पर data.csv फ़ाइल। उपयोगिता एक सीएसवी फ़ाइल को इनपुट के रूप में स्वीकार करती है और कॉलम के सभी जोड़े के बीच निर्भरता की गणना करती है: PtProject.Dependency.exe data.csv

    में आवेदन पर विचार करेंएमएसएक्सेलसरल परिकल्पनाओं के परीक्षण के लिए पियर्सन का ची-स्क्वायर परीक्षण।

    प्रयोगात्मक डेटा प्राप्त करने के बाद (अर्थात जब कुछ होता है नमूना) आमतौर पर एक वितरण कानून चुना जाता है जो दिए गए द्वारा दर्शाए गए यादृच्छिक चर का सबसे अच्छा वर्णन करता है नमूना. चुने हुए सैद्धांतिक वितरण कानून द्वारा प्रयोगात्मक डेटा को कितनी अच्छी तरह वर्णित किया गया है, इसकी जाँच का उपयोग करके किया जाता है सहमति मानदंड. शून्य परिकल्पना, आमतौर पर वितरण की समानता की परिकल्पना अनियमित चरकुछ सैद्धांतिक कानून।

    आइए पहले आवेदन देखें पियर्सन की अच्छाई का फिट परीक्षण X 2 (ची-स्क्वायर)सरल परिकल्पनाओं के संबंध में (सैद्धांतिक वितरण के मापदंडों को ज्ञात माना जाता है)। तब - , जब केवल वितरण प्रपत्र निर्दिष्ट किया जाता है, और इस वितरण के पैरामीटर और मान आंकड़े एक्स 2 उसी के आधार पर अनुमानित/गणना की जाती है नमूने.

    टिप्पणी: अंग्रेजी भाषा के साहित्य में, आवेदन प्रक्रिया पियर्सन की अच्छाई-की-फिट परीक्षा एक्स 2 एक नाम है फिट टेस्ट की ची-स्क्वायर अच्छाई.

    परिकल्पना के परीक्षण की प्रक्रिया को याद करें:

    • आधारित नमूनेमूल्य की गणना की जाती है आंकड़े, जो परीक्षण की जा रही परिकल्पना के प्रकार से मेल खाती है। उदाहरण के लिए, उपयोग करने के लिए टी-सांख्यिकी(यदि ज्ञात नहीं है);
    • सच्चाई के अधीन शून्य परिकल्पना, इस का वितरण आंकड़ेज्ञात और संभावनाओं की गणना के लिए इस्तेमाल किया जा सकता है (उदाहरण के लिए, के लिए टी- आँकड़ेये है );
    • गणना के आधार पर नमूनेअर्थ आंकड़ेदिए गए मान () के लिए महत्वपूर्ण मान की तुलना में;
    • शून्य परिकल्पनाअस्वीकृत अगर मूल्य आंकड़ेमहत्वपूर्ण से अधिक (या यदि यह मान प्राप्त करने की प्रायिकता आंकड़े() कम सार्थक तल, जो समकक्ष दृष्टिकोण है)।

    चलो खर्च करें परिकल्पना परीक्षणविभिन्न वितरण के लिए।

    असतत मामला

    मान लीजिए दो व्यक्ति पासे खेल रहे हैं। प्रत्येक खिलाड़ी के पास पासा का अपना सेट होता है। खिलाड़ी बारी-बारी से 3 पासे घुमाते हैं। प्रत्येक राउंड उसी द्वारा जीता जाता है जो एक बार में अधिक छक्के लगाता है। परिणाम दर्ज किए जाते हैं। खिलाड़ियों में से एक, 100 राउंड के बाद, संदेह था कि उसके प्रतिद्वंद्वी की हड्डियां सममित नहीं थीं, क्योंकि। वह अक्सर जीत जाता है (अक्सर छक्के फेंकता है)। उन्होंने विश्लेषण करने का फैसला किया कि इतने सारे प्रतिद्वंद्वी के परिणाम कितने संभावित हैं।

    टिप्पणी: इसलिये 3 पासे, फिर आप एक बार में 0 रोल कर सकते हैं; एक; 2 या 3 छक्के, यानी। यादृच्छिक चर 4 मान ले सकता है।

    संभाव्यता के सिद्धांत से, हम जानते हैं कि यदि घन सममित हैं, तो छक्कों के गिरने की संभावना का पालन होता है। इसलिए, 100 राउंड के बाद, छक्कों की आवृत्तियों की गणना सूत्र का उपयोग करके की जा सकती है
    =BINOM.DIST(A7,3,1/6, FALSE)*100

    सूत्र मानता है कि सेल ए7 एक दौर में गिराए गए छक्कों की इसी संख्या में शामिल है।

    टिप्पणी: गणना में दी गई हैं शीट पर उदाहरण फ़ाइल असतत.

    तुलना के लिए देखा(मनाया गया) और सैद्धांतिक आवृत्तियों(अपेक्षित) उपयोग करने के लिए सुविधाजनक।

    सैद्धांतिक वितरण से प्रेक्षित आवृत्तियों के एक महत्वपूर्ण विचलन के साथ, शून्य परिकल्पनासैद्धांतिक कानून के अनुसार यादृच्छिक चर के वितरण के बारे में अस्वीकार कर दिया जाना चाहिए। अर्थात्, यदि प्रतिद्वंद्वी का पासा सममित नहीं है, तो प्रेक्षित आवृत्तियाँ . से "काफी भिन्न" होंगी द्विपद वितरण.

    हमारे मामले में, पहली नज़र में, आवृत्तियाँ काफी करीब हैं और गणना के बिना एक स्पष्ट निष्कर्ष निकालना मुश्किल है। उपयुक्त पियर्सन की अच्छाई-की-फिट परीक्षा X 2, ताकि व्यक्तिपरक बयान के बजाय "काफी अलग", जिसे तुलना के आधार पर बनाया जा सके आयतचित्र, गणितीय रूप से सही कथन का उपयोग करें।

    आइए इस तथ्य का उपयोग करें कि बड़ी संख्या का नियमबढ़ी हुई मात्रा के साथ प्रेक्षित आवृत्ति (मनाया गया) नमूने n सैद्धांतिक कानून के अनुरूप प्रायिकता की ओर जाता है (हमारे मामले में, द्विपद नियम) हमारे मामले में, नमूना आकार n 100 है।

    आइए परिचय परीक्षण आंकड़े, जिसे हम X 2 से निरूपित करते हैं:

    जहाँ O l घटनाओं की प्रेक्षित आवृत्ति है जहाँ यादृच्छिक चर ने कुछ स्वीकार्य मान लिए हैं, E l संगत सैद्धांतिक आवृत्ति (अपेक्षित) है। एल मूल्यों की संख्या है जो एक यादृच्छिक चर ले सकता है (हमारे मामले में यह 4 के बराबर है)।

    जैसा कि सूत्र से देखा जा सकता है, यह आंकड़ेसैद्धांतिक आवृत्तियों के लिए मनाया आवृत्तियों की निकटता का एक उपाय है, अर्थात। इसका उपयोग इन आवृत्तियों के बीच "दूरी" का अनुमान लगाने के लिए किया जा सकता है। यदि इन "दूरियों" का योग "बहुत बड़ा" है, तो ये आवृत्तियाँ "काफी भिन्न" हैं। यह स्पष्ट है कि यदि हमारा घन सममित है (अर्थात लागू .) द्विपद नियम), तो संभावना है कि "दूरी" का योग "बहुत बड़ा" होगा, छोटा होगा। इस प्रायिकता की गणना करने के लिए, हमें बंटन जानने की आवश्यकता है आंकड़ेएक्स 2 ( आंकड़ेएक्स 2 की गणना यादृच्छिक के आधार पर की जाती है नमूने, इसलिए यह एक यादृच्छिक चर है और इसलिए, इसका अपना है प्रायिकता वितरण).

    एक बहुआयामी एनालॉग से मोइवरे-लाप्लास अभिन्न प्रमेययह ज्ञात है कि n->∞ के लिए हमारा यादृच्छिक चर X 2 स्पर्शोन्मुख रूप से L-1 डिग्री स्वतंत्रता के साथ है।

    तो अगर गणना मूल्य आंकड़ेएक्स 2 (आवृत्तियों के बीच "दूरी" का योग) एक निश्चित सीमा मूल्य से अधिक होगा, तो हमारे पास अस्वीकार करने का कारण होगा शून्य परिकल्पना. जाँच के रूप में पैरामीट्रिक परिकल्पना, सीमा मान के माध्यम से सेट किया गया है सार्थक तल. यदि संभावना है कि आँकड़ा X 2 परिकलित से कम या उसके बराबर मान लेगा ( पी-अर्थ) कम होगा सार्थक तल, फिर शून्य परिकल्पनाखारिज किया जा सकता है।

    हमारे मामले में, सांख्यिकीय मान 22.757 है। संभावना है कि एक्स 2 आंकड़ा 22.757 से अधिक या उसके बराबर मान लेगा, बहुत कम है (0.000045) और सूत्रों का उपयोग करके गणना की जा सकती है
    =XI2.DIST.PX(22,757;4-1)या
    =XI2.TEST (मनाया गया; अपेक्षित)

    टिप्पणी: CH2.TEST() फ़ंक्शन को विशेष रूप से दो श्रेणीगत चरों के बीच संबंध का परीक्षण करने के लिए डिज़ाइन किया गया है (देखें)।

    0.000045 की संभावना सामान्य से काफी कम है सार्थक तल 0.05. तो, खिलाड़ी के पास अपने प्रतिद्वंद्वी पर बेईमानी का संदेह करने का हर कारण है ( शून्य परिकल्पनाउसकी ईमानदारी के बारे में इनकार किया जाता है)।

    लागू होने पर मानदंड एक्स 2यह सुनिश्चित करने के लिए ध्यान रखा जाना चाहिए कि मात्रा नमूने n काफी बड़ा था, अन्यथा वितरण का सन्निकटन अमान्य होगा सांख्यिकी एक्स 2. आमतौर पर यह माना जाता है कि इसके लिए यह पर्याप्त है कि प्रेक्षित आवृत्तियों (अवलोकित) 5 से अधिक हों। यदि ऐसा नहीं है, तो कम आवृत्तियों को एक में जोड़ दिया जाता है या अन्य आवृत्तियों में जोड़ा जाता है, और कुल संभावना को असाइन किया जाता है संयुक्त मूल्य और, तदनुसार, स्वतंत्रता की डिग्री की संख्या घट जाती है एक्स 2-वितरण.

    आवेदन की गुणवत्ता में सुधार के लिए मानदंड एक्स 2(), विभाजन अंतराल को कम करना आवश्यक है (एल बढ़ाएँ और, तदनुसार, संख्या बढ़ाएँ स्वतंत्रता का दर्जा), हालांकि, इसे प्रत्येक अंतराल (d.b.>5) में आने वाले अवलोकनों की संख्या पर प्रतिबंध द्वारा रोका जाता है।

    निरंतर मामला

    पियर्सन अच्छाई-की-फिट परीक्षण एक्स 2 के मामले में उसी तरह लागू किया जा सकता है।

    कुछ पर विचार करें नमूना, 200 मूल्यों से मिलकर। शून्य परिकल्पनाबताता है नमूनासे बना ।

    टिप्पणी: यादृच्छिक चर in शीट पर नमूना फ़ाइल सततसूत्र का उपयोग करके उत्पन्न =NORM.ST.INV (रैंड ()). इसलिए, नए मान नमूनेहर बार शीट की पुनर्गणना होने पर उत्पन्न होते हैं।

    उपलब्ध डेटा सेट पर्याप्त है या नहीं, इसका नेत्रहीन मूल्यांकन किया जा सकता है।

    जैसा कि आप आरेख से देख सकते हैं, नमूना मान सीधी रेखा के साथ बहुत अच्छी तरह से फिट होते हैं। हालाँकि, जैसा कि for परिकल्पना परीक्षणउपयुक्त पियर्सन की अच्छाई का फिट परीक्षण X 2 .

    ऐसा करने के लिए, हम एक यादृच्छिक चर की भिन्नता की सीमा को 0.5 के चरण के साथ अंतराल में विभाजित करते हैं। आइए हम प्रेक्षित और सैद्धांतिक आवृत्तियों की गणना करें। हम फ़्रीक्वेंसी () फ़ंक्शन का उपयोग करके देखी गई आवृत्तियों की गणना करते हैं, और सैद्धांतिक वाले - NORM.ST.DIST () फ़ंक्शन का उपयोग करते हुए।

    टिप्पणी: से संबंधित असतत मामला, यह सुनिश्चित करना आवश्यक है कि नमूनाकाफी बड़ा था, और 5 से अधिक मान अंतराल में गिर गए।

    आँकड़ों X 2 की गणना करें और किसी दिए गए के लिए महत्वपूर्ण मान के साथ इसकी तुलना करें सार्थक तल(0.05)। इसलिये हमने एक यादृच्छिक चर की भिन्नता की सीमा को 10 अंतरालों में विभाजित किया है, फिर स्वतंत्रता की डिग्री की संख्या 9 है। महत्वपूर्ण मूल्य की गणना सूत्र द्वारा की जा सकती है
    \u003d XI2.INV.RH (0.05; 9) या
    \u003d XI2.OBR (1-0.05; 9)

    ऊपर दिए गए चार्ट से पता चलता है कि सांख्यिकीय मान 8.19 है, जो काफी अधिक है नाजुकशून्य परिकल्पनाखारिज नहीं किया जाता है।

    नीचे है जिस पर नमूनाएक असंभावित मूल्य माना जाता है, और के आधार पर मानदंड पियर्सन की सहमति एक्स 2शून्य परिकल्पना को खारिज कर दिया गया था (इस तथ्य के बावजूद कि सूत्र का उपयोग करके यादृच्छिक मान उत्पन्न किए गए थे =NORM.ST.INV (रैंड ())उपलब्ध कराने के नमूनासे मानक सामान्य वितरण).

    शून्य परिकल्पनाखारिज कर दिया गया है, हालांकि नेत्रहीन डेटा एक सीधी रेखा के काफी करीब हैं।

    एक उदाहरण के रूप में, आइए हम भी लेते हैं नमूनायू (-3; 3) से। इस मामले में, ग्राफ से भी यह स्पष्ट है कि शून्य परिकल्पनाखारिज किया जाना चाहिए।

    मापदंड पियर्सन की सहमति एक्स 2यह भी पुष्टि करता है कि शून्य परिकल्पनाखारिज किया जाना चाहिए।

    रूसी संघ के शिक्षा और विज्ञान मंत्रालय

    इरकुत्स्की शहर की शिक्षा के लिए संघीय एजेंसी

    बैकालि स्टेट यूनिवर्सिटीअर्थशास्त्र और कानून

    सूचना विज्ञान और साइबरनेटिक्स विभाग

    ची-वर्ग वितरण और उसका अनुप्रयोग

    कोल्मिकोवा अन्ना एंड्रीवाना

    द्वितीय वर्ष का छात्र

    समूह आईएस-09-1

    प्राप्त डेटा को संसाधित करने के लिए, हम ची-स्क्वायर परीक्षण का उपयोग करते हैं।

    ऐसा करने के लिए, हम अनुभवजन्य आवृत्तियों के वितरण की एक तालिका बनाते हैं, अर्थात। आवृत्तियाँ जो हम देखते हैं:

    सैद्धांतिक रूप से, हम उम्मीद करते हैं कि आवृत्तियों को समान रूप से वितरित किया जाएगा, अर्थात। आवृत्ति लड़कों और लड़कियों के बीच आनुपातिक रूप से वितरित की जाएगी। आइए सैद्धांतिक आवृत्तियों की एक तालिका बनाएं। ऐसा करने के लिए, पंक्ति योग को कॉलम योग से गुणा करें और परिणामी संख्या को विभाजित करें कुल राशि(एस)।


    गणना के लिए परिणामी तालिका इस तरह दिखेगी:

    2 \u003d (ई - टी)² / टी

    n = (R - 1), जहाँ R तालिका में पंक्तियों की संख्या है।

    हमारे मामले में, ची-वर्ग = 4.21; एन = 2.

    मानदंड के महत्वपूर्ण मूल्यों की तालिका के अनुसार, हम पाते हैं: n = 2 और त्रुटि स्तर 0.05 पर, महत्वपूर्ण मान χ2 = 5.99।

    परिणामी मूल्य महत्वपूर्ण मूल्य से कम है, जिसका अर्थ है कि शून्य परिकल्पना स्वीकार की जाती है।

    निष्कर्ष: शिक्षक बच्चे की विशेषताओं को लिखते समय उसके लिंग को महत्व नहीं देते हैं।

    आवेदन पत्र

    महत्वपूर्ण वितरण बिंदु χ2

    तालिका एक

    निष्कर्ष

    लगभग सभी विशिष्टताओं के छात्र उच्च गणित के पाठ्यक्रम के अंत में "संभाव्यता सिद्धांत और गणितीय सांख्यिकी" खंड का अध्ययन करते हैं, वास्तव में वे केवल कुछ बुनियादी अवधारणाओं और परिणामों से परिचित होते हैं, जो स्पष्ट रूप से पर्याप्त नहीं हैं व्यावहारिक कार्य. छात्र विशेष पाठ्यक्रमों में अनुसंधान के कुछ गणितीय तरीकों से मिलते हैं (उदाहरण के लिए, "पूर्वानुमान और व्यवहार्यता योजना", "तकनीकी और आर्थिक विश्लेषण", "उत्पाद गुणवत्ता नियंत्रण", "विपणन", "नियंत्रण", " गणितीय तरीकेपूर्वानुमान", "सांख्यिकी", आदि - आर्थिक विशिष्टताओं के छात्रों के मामले में), हालांकि, ज्यादातर मामलों में प्रस्तुति बहुत संक्षिप्त और प्रकृति में नुस्खे है। नतीजतन, लागू आंकड़ों के विशेषज्ञों के पास पर्याप्त ज्ञान नहीं है।

    इसीलिए बहुत महत्वतकनीकी विश्वविद्यालयों में और आर्थिक विश्वविद्यालयों में "एप्लाइड स्टैटिस्टिक्स" पाठ्यक्रम है - पाठ्यक्रम "अर्थमिति", क्योंकि अर्थमिति है, जैसा कि आप जानते हैं, सांख्यिकीय विश्लेषणविशिष्ट आर्थिक डेटा।

    संभाव्यता सिद्धांत और गणितीय आँकड़े अनुप्रयुक्त सांख्यिकी और अर्थमिति के लिए मौलिक ज्ञान प्रदान करते हैं।

    वे व्यावहारिक कार्य के लिए विशेषज्ञों के लिए आवश्यक हैं।

    मैंने एक सतत संभाव्य मॉडल माना और उदाहरणों के साथ इसकी उपयोगिता दिखाने की कोशिश की।

    ग्रन्थसूची

    1. ओर्लोव ए.आई. एप्लाईड स्टैटस्टिक्स। एम .: पब्लिशिंग हाउस "परीक्षा", 2004।

    2. गमुरमन वी.ई. संभाव्यता और गणितीय सांख्यिकी का सिद्धांत। एम।: ग्रेजुएट स्कूल, 1999. - 479पी।

    3. अयवोज़्यान एस.ए. संभाव्यता सिद्धांत और अनुप्रयुक्त सांख्यिकी, v.1. एम .: एकता, 2001. - 656s।

    4. खमितोव जी.पी., वेडेर्निकोवा टी.आई. संभावनाएँ और आँकड़े। इरकुत्स्क: बीएसयूईपी, 2006 - 272पी।

    5. एज़ोवा एल.एन. अर्थमिति। इरकुत्स्क: बीएसयूईपी, 2002. - 314पी।

    6. मोस्टेलर एफ। समाधान के साथ पचास मनोरंजक संभाव्य समस्याएं। एम.: नौका, 1975. - 111पी।

    7. मोस्टेलर एफ। संभावना। एम.: मीर, 1969. - 428 एस।

    8. याग्लोम ए.एम. संभावना और जानकारी। एम.: नौका, 1973. - 511पी।

    9. चिस्त्यकोव वी.पी. संभाव्यता पाठ्यक्रम। एम.: नौका, 1982. - 256 पी।

    10. क्रेमर एन.एस. संभाव्यता और गणितीय सांख्यिकी का सिद्धांत। एम.: यूनिटी, 2000. - 543 पी।

    11. गणितीय विश्वकोश, v.1। एम।: सोवियत विश्वकोश, 1976. - 655s।

    12. http://psystat.at.ua/ - मनोविज्ञान और शिक्षाशास्त्र में सांख्यिकी। अनुच्छेद ची-स्क्वायर टेस्ट।

    इस मानदंड का उपयोग सैद्धांतिक के बीच विसंगति के ऐसे माप (सांख्यिकी) के उपयोग पर आधारित है एफ(एक्स) और अनुभवजन्य वितरण एफ* पी (एक्स) , जो लगभग वितरण कानून का पालन करता है 2 . परिकल्पना एच 0 इन आँकड़ों के वितरण का विश्लेषण करके वितरण की निरंतरता की जाँच की जाती है। मानदंड के आवेदन के लिए एक सांख्यिकीय श्रृंखला के निर्माण की आवश्यकता होती है।

    तो, मान लीजिए कि नमूने को अंकों की संख्या के साथ एक सांख्यिकीय पंक्ति द्वारा दर्शाया गया है एम. में देखा गया हिट दर मैं- वां रैंक एन मैं. सैद्धांतिक वितरण कानून के अनुसार, हिट की अपेक्षित आवृत्ति मैं-वां अंक है एफ मैं. प्रेक्षित और अपेक्षित आवृत्ति के बीच का अंतर मान होगा ( एन मैंएफ मैं) के बीच विसंगति की समग्र डिग्री का पता लगाने के लिए एफ(एक्स) तथा एफ* पी (एक्स) सांख्यिकीय श्रृंखला के सभी अंकों के लिए वर्ग अंतर के भारित योग की गणना करना आवश्यक है

    मूल्य 2 असीमित आवर्धन के साथ एन एक χ 2 -वितरण है (असमान रूप से χ 2 के रूप में वितरित)। यह वितरण स्वतंत्रता की डिग्री की संख्या पर निर्भर करता है , अर्थात। अभिव्यक्ति (3.7) में शब्दों के स्वतंत्र मूल्यों की संख्या। स्वतंत्रता की डिग्री की संख्या संख्या के बराबर है आपनमूने पर लगाए गए रैखिक लिंक की संख्या घटाएं। एक कनेक्शन इस तथ्य के कारण मौजूद है कि किसी भी आवृत्ति की गणना शेष में आवृत्तियों के सेट से की जा सकती है एम-1 अंक। इसके अलावा, यदि वितरण पैरामीटर पहले से ज्ञात नहीं हैं, तो नमूने के वितरण की फिटिंग के कारण एक और सीमा है। यदि नमूना निर्धारित करता है एस वितरण पैरामीटर, तो स्वतंत्रता की डिग्री की संख्या होगी = एमएस–1.

    परिकल्पना की स्वीकृति का क्षेत्र एच 0 शर्त द्वारा निर्धारित किया जाता है 2 < χ 2 (; एक) , जहां 2 (; एक) महत्व स्तर के साथ χ2-वितरण का महत्वपूर्ण बिंदु है एक. पहली तरह की त्रुटि की संभावना है एक, टाइप II त्रुटि की संभावना को स्पष्ट रूप से परिभाषित नहीं किया जा सकता है, क्योंकि बेमेल वितरण के विभिन्न तरीकों की अनंत संख्या है। परीक्षण की शक्ति अंकों की संख्या और नमूना आकार पर निर्भर करती है। मानदंड की सिफारिश की जाती है एन>200, आवेदन की अनुमति है एन>40, यह ऐसी परिस्थितियों में है कि मानदंड सुसंगत है (एक नियम के रूप में, यह एक गलत शून्य परिकल्पना को अस्वीकार करता है)।

    मानदंड जाँच एल्गोरिथ्म

    1. समसंभाव्य तरीके से हिस्टोग्राम की रचना कीजिए।

    2. हिस्टोग्राम के रूप में, एक परिकल्पना सामने रखें

    एच 0: एफ(एक्स) = एफ 0 (एक्स),

    एच 1: एफ(एक्स) ¹ एफ 0 (एक्स),

    कहाँ पे एफ 0 (एक्स) एक काल्पनिक वितरण कानून की संभावना घनत्व है (उदाहरण के लिए, एक समान, घातीय, सामान्य)।

    टिप्पणी. एक घातीय वितरण कानून की परिकल्पना को आगे रखा जा सकता है यदि नमूने में सभी संख्याएं सकारात्मक हैं।

    3. सूत्र का प्रयोग कर कसौटी का मान परिकलित करें

    ,

    कहाँ पे
    मारने की आवृत्ति मैं-वें अंतराल;

    पी मैं- एक यादृच्छिक चर को हिट करने की सैद्धांतिक संभावना मैं- वें अंतराल बशर्ते कि परिकल्पना एच 0 सही है।

    गणना के लिए सूत्र पी मैंघातीय, वर्दी और . के मामले में सामान्य कानूनक्रमशः बराबर हैं।

    घातीय कानून

    . (3.8)

    जिसमें 1 = 0, बी एम = +¥.

    समान कानून

    सामान्य कानून

    . (3.10)

    जिसमें 1 = -¥, बी एम = +¥।

    टिप्पणियां. सभी संभावनाओं की गणना के बाद पी मैंजाँच करें कि क्या नियंत्रण अनुपात संतुष्ट है

    समारोह एफ( एक्स) अजीब है। (+¥) = 1.

    4. आवेदन की तालिका "ची-स्क्वायर" से, एक मान का चयन किया जाता है
    , जहाँ a दिया गया महत्व स्तर है (a = 0.05 या a = 0.01), और - सूत्र द्वारा निर्धारित स्वतंत्रता की डिग्री की संख्या

    = एम - 1 - एस.

    यहां एस- मापदंडों की संख्या जिस पर चुनी गई परिकल्पना निर्भर करती है एच 0 वितरण कानून। मूल्यों एसएकसमान कानून के लिए यह 2 है, घातांक के लिए - 1, सामान्य के लिए - 2।

    5. अगर
    , फिर परिकल्पना एच 0 खारिज कर दिया गया है। अन्यथा, इसे अस्वीकार करने का कोई कारण नहीं है: संभावना 1 - बी के साथ यह सच है, और संभावना के साथ - बी यह गलत है, लेकिन बी का मूल्य अज्ञात है।

    उदाहरण3 . 1. मानदंड c 2 का उपयोग करते हुए, एक यादृच्छिक चर के वितरण के नियम के बारे में एक परिकल्पना को सामने रखें और परीक्षण करें एक्स, विविधता श्रृंखला, अंतराल सारणी और वितरण हिस्टोग्राम जिनमें से उदाहरण 1.2 में दिए गए हैं। महत्व स्तर a 0.05 है।

    समाधान . हिस्टोग्राम के प्रकार के आधार पर, हम अनुमान लगाते हैं कि यादृच्छिक चर एक्ससामान्य कानून के अनुसार वितरित:

    एच 0: एफ(एक्स) = एन(एम, एस);

    एच 1: एफ(एक्स) ¹ एन(एम, एस)।

    मानदंड मूल्य की गणना सूत्र द्वारा की जाती है:

    (3.11)

    जैसा कि ऊपर उल्लेख किया गया है, एक परिकल्पना का परीक्षण करते समय, एक समरूप हिस्टोग्राम का उपयोग करना बेहतर होता है। इस मामले में

    सैद्धांतिक संभावनाएं पी मैंहम सूत्र (3.10) द्वारा गणना करते हैं। उसी समय, हम मानते हैं कि

    पी 1 = 0.5(एफ((-4.5245+1.7)/1.98)-एफ((-¥+1.7)/1.98)) = 0.5(एफ(-1.427) -Ф(-¥)) =

    0,5(-0,845+1) = 0,078.

    पी 2 = 0.5(एफ((-3.8865+1.7)/1.98)-एफ((-4.5245+1.7)/1.98)) =

    0.5(एफ(-1.104)+0.845) = 0.5(-0.729+0.845) = 0.058।

    पी 3 = 0,094; पी 4 = 0,135; पी 5 = 0,118; पी 6 = 0,097; पी 7 = 0,073; पी 8 = 0,059; पी 9 = 0,174;

    पी 10 \u003d 0.5 (Ф ((+ + 1.7) / 1.98) - ((0.6932 + 1.7) / 1.98)) \u003d 0.114।

    उसके बाद, हम नियंत्रण संबंध की पूर्ति की जांच करते हैं

    100 × (0.0062 + 0.0304 + 0.0004 + 0.0091 + 0.0028 + 0.0001 + 0.0100 +

    0.0285 + 0.0315 + 0.0017) = 100 × 0.1207 = 12.07।

    उसके बाद, "ची-स्क्वायर" तालिका से हम महत्वपूर्ण मान का चयन करते हैं

    .

    इसलिये
    फिर परिकल्पना एच 0 स्वीकार किया जाता है (इसे अस्वीकार करने का कोई कारण नहीं)।

    ची-स्क्वेर्ड वितरण परीक्षण के आंकड़ों में सबसे व्यापक रूप से उपयोग किए जाने वाले में से एक है सांख्यिकीय परिकल्पना. "ची-स्क्वायर" वितरण के आधार पर, सबसे शक्तिशाली अच्छाई-की-फिट परीक्षणों में से एक, पियर्सन के "ची-स्क्वायर" परीक्षण का निर्माण किया गया था।

    अच्छाई-की-फिट परीक्षण अज्ञात वितरण के प्रस्तावित कानून के बारे में परिकल्पना के परीक्षण के लिए एक मानदंड है।

    2 ("ची-स्क्वायर") परीक्षण का उपयोग विभिन्न वितरणों की परिकल्पना का परीक्षण करने के लिए किया जाता है। यही उसकी खूबी है।

    मानदंड की गणना सूत्र के बराबर है

    जहां एम और एम क्रमशः अनुभवजन्य और सैद्धांतिक आवृत्तियां हैं

    विचाराधीन वितरण;

    n स्वतंत्रता की डिग्री की संख्या है।

    सत्यापन के लिए, हमें अनुभवजन्य (देखे गए) और सैद्धांतिक (सामान्य वितरण की धारणा के तहत गणना) आवृत्तियों की तुलना करने की आवश्यकता है।

    यदि अनुभवजन्य आवृत्तियाँ पूरी तरह से गणना या अपेक्षित आवृत्तियों के साथ मेल खाती हैं, तो एस (ई - टी) = 0 और मानदंड χ2 भी शून्य के बराबर होगा। यदि एस (ई - टी) शून्य के बराबर नहीं है, तो यह गणना की गई आवृत्तियों और श्रृंखला की अनुभवजन्य आवृत्तियों के बीच एक विसंगति को इंगित करेगा। ऐसे मामलों में, 2 मानदंड के महत्व का मूल्यांकन करना आवश्यक है, जो सैद्धांतिक रूप से शून्य से अनंत तक भिन्न हो सकता है। यह 2ph के वास्तव में प्राप्त मूल्य की इसके महत्वपूर्ण मूल्य (χ2st) के साथ तुलना करके किया जाता है। शून्य परिकल्पना, यानी, यह धारणा कि अनुभवजन्य और सैद्धांतिक या अपेक्षित आवृत्तियों के बीच विसंगति यादृच्छिक है, का खंडन किया जाता है यदि χ2ph से अधिक या बराबर है स्वीकृत महत्व स्तर (ए) और स्वतंत्रता की डिग्री (एन) की संख्या के लिए 2st।

    यादृच्छिक चर 2 के संभावित मूल्यों का वितरण निरंतर और असममित है। यह स्वतंत्रता की डिग्री (एन) और दृष्टिकोण की संख्या पर निर्भर करता है सामान्य वितरणजैसे-जैसे अवलोकनों की संख्या बढ़ती है। इसलिए, अनुमान के लिए 2 मानदंड का आवेदन असतत वितरणकुछ त्रुटियों से जुड़ा है जो इसके मूल्य को प्रभावित करते हैं, खासकर छोटे नमूनों के लिए। अधिक सटीक अनुमान प्राप्त करने के लिए, भिन्नता श्रृंखला में वितरित नमूने में कम से कम 50 विकल्प होने चाहिए। 2 मानदंड के सही अनुप्रयोग के लिए यह भी आवश्यक है कि चरम वर्गों में वेरिएंट की आवृत्ति 5 से कम नहीं होनी चाहिए; यदि उनमें से 5 से कम हैं, तो उन्हें पड़ोसी वर्गों की आवृत्तियों के साथ जोड़ दिया जाता है ताकि कुल राशि 5 से अधिक या उसके बराबर हो। आवृत्तियों के संयोजन के अनुसार, वर्गों (एन) की संख्या भी घट जाती है। भिन्नता की स्वतंत्रता पर प्रतिबंधों की संख्या को ध्यान में रखते हुए, वर्गों की माध्यमिक संख्या के अनुसार स्वतंत्रता की डिग्री की संख्या निर्धारित की जाती है।



    चूंकि मानदंड 2 निर्धारित करने की सटीकता काफी हद तक सैद्धांतिक आवृत्तियों (टी) की गणना की सटीकता पर निर्भर करती है, अनुभवजन्य और गणना की गई आवृत्तियों के बीच अंतर प्राप्त करने के लिए अनियंत्रित सैद्धांतिक आवृत्तियों का उपयोग किया जाना चाहिए।

    एक उदाहरण के रूप में, आइए मानविकी में सांख्यिकीय विधियों के अनुप्रयोग के लिए समर्पित वेबसाइट पर प्रकाशित एक अध्ययन को लें।

    ची-स्क्वायर परीक्षण आवृत्ति वितरण की तुलना की अनुमति देता है, चाहे वे सामान्य रूप से वितरित हों या नहीं।

    आवृत्ति से तात्पर्य किसी घटना के घटित होने की संख्या से है। आमतौर पर, किसी घटना के घटित होने की आवृत्ति को तब निपटाया जाता है जब चर को नामों के पैमाने में मापा जाता है और आवृत्ति को छोड़कर उनकी अन्य विशेषताओं का चयन करना असंभव या समस्याग्रस्त होता है। दूसरे शब्दों में, जब चर में गुणात्मक विशेषताएं होती हैं। इसके अलावा, कई शोधकर्ता परीक्षण स्कोर को स्तरों (उच्च, मध्यम, निम्न) में अनुवाद करते हैं और इन स्तरों पर लोगों की संख्या का पता लगाने के लिए स्कोर वितरण की तालिका बनाते हैं। यह साबित करने के लिए कि किसी एक स्तर में (किसी एक श्रेणी में) लोगों की संख्या वास्तव में अधिक (कम) है, ची-वर्ग गुणांक का भी उपयोग किया जाता है।

    आइए सबसे सरल उदाहरण देखें।

    युवा किशोरों के बीच एक आत्म-सम्मान परीक्षण आयोजित किया गया था। टेस्ट स्कोर का तीन स्तरों में अनुवाद किया गया: उच्च, मध्यम, निम्न। आवृत्तियों को निम्नानुसार वितरित किया गया था:

    उच्च (एच) 27 प्रति।

    मध्यम (सी) 12 लोग

    कम (एच) 11 प्रति।

    यह स्पष्ट है कि उच्च आत्म-सम्मान वाले अधिकांश बच्चे, हालांकि, इसे सांख्यिकीय रूप से सिद्ध करने की आवश्यकता है। ऐसा करने के लिए, हम ची-स्क्वायर परीक्षण का उपयोग करते हैं।

    हमारा कार्य यह जांचना है कि प्राप्त अनुभवजन्य डेटा सैद्धांतिक रूप से समान रूप से संभावित लोगों से भिन्न है या नहीं। ऐसा करने के लिए, सैद्धांतिक आवृत्तियों को खोजना आवश्यक है। हमारे मामले में, सैद्धांतिक आवृत्तियाँ समसंभाव्य आवृत्तियाँ हैं जो सभी आवृत्तियों को जोड़कर और श्रेणियों की संख्या से विभाजित करके पाई जाती हैं।

    हमारे मामले में:

    (बी + सी + एच) / 3 \u003d (27 + 12 + 11) / 3 \u003d 16.6

    ची-स्क्वायर परीक्षण की गणना का सूत्र है:

    χ2 = (ई - टी)І / टी

    हम एक टेबल बनाते हैं:

    अंतिम कॉलम का योग ज्ञात कीजिए:

    अब आपको महत्वपूर्ण मूल्यों की तालिका (परिशिष्ट में तालिका 1) के अनुसार मानदंड के महत्वपूर्ण मूल्य को खोजने की जरूरत है। ऐसा करने के लिए, हमें स्वतंत्रता की डिग्री (एन) की संख्या की आवश्यकता है।

    एन = (आर -1) * (सी -1)

    जहाँ R तालिका में पंक्तियों की संख्या है, C स्तंभों की संख्या है।

    हमारे मामले में, केवल एक स्तंभ (मूल अनुभवजन्य आवृत्तियों का अर्थ है) और तीन पंक्तियाँ (श्रेणियाँ) हैं, इसलिए सूत्र बदलता है - हम स्तंभों को बाहर करते हैं।

    एन = (आर -1) = 3-1 = 2

    त्रुटि संभावना p≤0.05 और n = 2 के लिए, महत्वपूर्ण मान χ2 = 5.99।

    प्राप्त अनुभवजन्य मूल्य महत्वपूर्ण मूल्य से अधिक है - आवृत्ति अंतर महत्वपूर्ण हैं (χ2= 9.64; पी≤0.05)।

    जैसा कि आप देख सकते हैं, मानदंड की गणना बहुत सरल है और इसमें अधिक समय नहीं लगता है। ची-स्क्वायर टेस्ट का व्यावहारिक मूल्य बहुत बड़ा है। प्रश्नावली के उत्तरों के विश्लेषण में यह विधि सबसे मूल्यवान है।


    आइए एक और अधिक जटिल उदाहरण लें।

    उदाहरण के लिए, एक मनोवैज्ञानिक यह जानना चाहता है कि क्या यह सच है कि शिक्षक लड़कियों की तुलना में लड़कों के प्रति अधिक पक्षपाती होते हैं। वे। लड़कियों की प्रशंसा करने की अधिक संभावना है। ऐसा करने के लिए, मनोवैज्ञानिक ने तीन शब्दों की आवृत्ति के बारे में शिक्षकों द्वारा लिखित छात्रों की विशेषताओं का विश्लेषण किया: "सक्रिय", "मेहनती", "अनुशासित", शब्दों के पर्यायवाची शब्द भी गिने गए। तालिका में शब्दों के आने की आवृत्ति पर डेटा दर्ज किया गया था:

    प्राप्त डेटा को संसाधित करने के लिए, हम ची-स्क्वायर परीक्षण का उपयोग करते हैं।

    ऐसा करने के लिए, हम अनुभवजन्य आवृत्तियों के वितरण की एक तालिका बनाते हैं, अर्थात। आवृत्तियाँ जो हम देखते हैं:

    सैद्धांतिक रूप से, हम उम्मीद करते हैं कि आवृत्तियों को समान रूप से वितरित किया जाएगा, अर्थात। आवृत्ति लड़कों और लड़कियों के बीच आनुपातिक रूप से वितरित की जाएगी। आइए सैद्धांतिक आवृत्तियों की एक तालिका बनाएं। ऐसा करने के लिए, पंक्ति योग को कॉलम योग से गुणा करें और परिणामी संख्या को कुल योग से विभाजित करें।

    गणना के लिए परिणामी तालिका इस तरह दिखेगी:

    χ2 = (ई - टी)І / टी

    n = (R - 1), जहाँ R तालिका में पंक्तियों की संख्या है।

    हमारे मामले में, ची-वर्ग = 4.21; एन = 2.

    मानदंड के महत्वपूर्ण मूल्यों की तालिका के अनुसार, हम पाते हैं: n = 2 और त्रुटि स्तर 0.05 पर, महत्वपूर्ण मान χ2 = 5.99।

    परिणामी मूल्य महत्वपूर्ण मूल्य से कम है, जिसका अर्थ है कि शून्य परिकल्पना स्वीकार की जाती है।

    निष्कर्ष: शिक्षक बच्चे की विशेषताओं को लिखते समय उसके लिंग को महत्व नहीं देते हैं।


    निष्कर्ष।

    के. पियर्सन ने गणितीय आँकड़ों (बड़ी संख्या में मौलिक अवधारणाओं) के विकास में महत्वपूर्ण योगदान दिया। पियर्सन की मुख्य दार्शनिक स्थिति निम्नानुसार तैयार की गई है: विज्ञान की अवधारणाएं कृत्रिम निर्माण हैं, संवेदी अनुभव का वर्णन और आदेश देने के साधन हैं; उन्हें वैज्ञानिक प्रस्तावों में जोड़ने के नियमों को विज्ञान के व्याकरण द्वारा अलग किया गया है, जो विज्ञान का दर्शन है। विषम अवधारणाओं और घटनाओं को जोड़ने के लिए एक सार्वभौमिक अनुशासन की अनुमति देता है - लागू आंकड़े, हालांकि पियर्सन के अनुसार यह व्यक्तिपरक भी है।

    के. पियर्सन के कई निर्माण सीधे तौर पर संबंधित हैं या मानवशास्त्रीय सामग्रियों का उपयोग करके विकसित किए गए हैं। उन्होंने विज्ञान के सभी क्षेत्रों में उपयोग किए जाने वाले संख्यात्मक वर्गीकरण और सांख्यिकीय मानदंड के कई तरीके विकसित किए।


    साहित्य।

    1. ए.एन. बोगोलीबोव, गणित। यांत्रिकी। जीवनी गाइड। - कीव: नौकोवा दुमका, 1983।

    2. कोलमोगोरोव ए.एन., युशकेविच ए.पी. (एड।)। 19वीं सदी का गणित। - एम .: विज्ञान। - टी.आई.

    3. 3. बोरोवकोव ए.ए. गणित के आँकड़े. मॉस्को: नौका, 1994।

    4. 8. फेलर वी. संभाव्यता के सिद्धांत और उसके अनुप्रयोगों का परिचय। - एम.: मीर, टी.2, 1984।

    5. 9. हरमन जी, मॉडर्न कारक विश्लेषण. - एम .: सांख्यिकी, 1972।

    दोस्तों के साथ शेयर करें या अपने लिए सेव करें:

    लोड हो रहा है...