नमूना विचरण के लिए किस सूत्र का उपयोग कब करें?
मुझे पता है कि नमूना विचरण का सूत्र है
$$s^2 = \frac{\sum (x_i - \bar{x})^2}{n - 1}$$
मैं यह भी जानता हूं कि नमूना विचरण का सूत्र है "वर्गों का माध्य घटा माध्य वर्ग"।
किसी दिए गए नमूने के नमूना विचरण की गणना करते समय, मैंने दोनों सूत्रों का उपयोग किया और महसूस किया कि वे दो अलग-अलग उत्तर देते हैं, इसलिए मैं पूछना चाहता था, कब करेंगे मैं पहले का उपयोग करता हूं, और मैं दूसरे का उपयोग कब करूं?
$n-1$ से विभाजित करने का उद्देश्य जनसंख्या भिन्नता का एक निष्पक्ष अनुमानक देना है क्योंकि आप नहीं जानते कि जनसंख्या का मतलब $\mu है $ और इसके बजाय $\bar x$ का उपयोग अन्यथा एक अनुमान दे सकता है जो औसतन बहुत कम है।
निम्नलिखित सही हैं, हालांकि आप शायद ही कभी दूसरा देखते हैं: $$\frac{\sum (x_i - \ छड़ x)^2} } } \frac{n}{n-1}\bar x^2 = \frac{\sum x_i^2}{n-1} - \frac{\left(\sum x_i\right)^2}{n(n -1)} $$
$n$ के बजाय $n-1$ से विभाजित करना केवल तभी किया जाता है जब $s^2$ का उपयोग एक अनुमान के रूप में किया जाता है, जो कि यादृच्छिक नमूने के आधार पर होता है। एक ऐसी जनसंख्या जिसमें से किसी के पास केवल एक है आकार का छोटा यादृच्छिक नमूना $n.$ यदि किसी को $\mu,$ का जनसंख्या माध्य का मान पता हो, न कि केवल $\overline x,$ के नमूना माध्य का, तो वह $\ के बजाय $\mu$ का उपयोग करेगा। ओवरलाइन x$ और एक को $n-1 के बजाय $n$ से विभाजित किया जाएगा।$
जब आप पहले का उपयोग करते हैं तो आप डेटा नमूने (आकलनकर्ता) के लिए एक निष्पक्ष अनुमानक की गणना कर रहे हैं। यद्यपि आप दूसरे की गणना कर सकते हैं, यह पक्षपाती होगा।
दूसरे का उपयोग करते समय आप जनसंख्या के विचरण (वर्णनात्मक आंकड़े) की गणना कर रहे हैं, जिसके लिए पहला एक अच्छी अभिव्यक्ति नहीं है।
br>मैं यह भी जानता हूं कि नमूना विचरण का सूत्र "वर्गों का माध्य" है
माध्य का वर्ग घटाएं"। "MOSSOM" के अनुशंसित संक्षिप्त नाम के साथ इसे यहां देखें। हम देखते हैं:
$$\sigma^2 = \frac{\sum (x_i - \bar{x})^2}{n} = \frac{\sum x_i^2}{n} - \bar{x}^2$$
ओपी को ज्ञात स्मरक सबसे दाहिनी ओर का वर्णन करता है यहां अभिव्यक्ति। इसे "गणना सूत्र" कहा जाता है क्योंकि इसे बनाने में कम परिचालन की आवश्यकता होती है, और यह एक महत्वपूर्ण तकनीक थी जब ऐसी सभी गणनाएं हाथ से की जाती थीं (स्पष्ट होने के लिए, दोनों अभिव्यक्तियाँ अब उपलब्ध तकनीक के साथ नहीं हैं)। उपरोक्त बिल्कुल वही संख्या उत्पन्न करता है â यदि आप दोनों के साथ दोबारा जांच करते हैं, और अलग-अलग परिणाम प्राप्त करते हैं, तो यह कुछ हाथ की गणना में त्रुटि को इंगित करता है।
हालांकि, यह जनसंख्या भिन्नता की परिभाषा को दर्शाता है (इसमें $n$ है) हर), इसलिए यह निश्चित रूप से ओपी द्वारा नोट किए गए नमूना भिन्नता के सूत्र की तुलना में एक अलग मूल्य उत्पन्न करेगा (जिसमें हर में $n - 1$ है, यानी, बेसेल का सुधार)।
ध्यान दें कि नमूना विचरण में एक समान गणना सूत्र भी होता है, लेकिन इसे उसी MOSSUM निमोनिक द्वारा वर्णित नहीं किया जा सकता है:
$$s^2 = \frac{\sum (x_i - \bar{x})^2}{n - 1} = \frac{\sum x_i^2 - (\sum x_i)^2/n}{n - 1}$$