انحراف معیار

انحراف معیار^[۱] (به انگلیسی: standard deviation) (نماد σ) یکی از شاخص های پراکندگی است که نشان می‌دهد به‌طور میانگین داده‌ها چه مقدار از مقدار متوسط فاصله دارند. اگر انحراف معیار مجموعه‌ای از داده‌ها نزدیک به صفر باشد، نشانه آن است که داده‌ها نزدیک به میانگین هستند و پراکندگی اندکی دارند؛ در حالی که انحراف معیار بزرگ بیانگر پراکندگی قابل توجه داده‌ها می‌باشد. انحراف معیار برابر ریشه دوم واریانس است. خوبی آن نسبت به واریانس، این است که هم بعد با داده‌ها می‌باشد.

انحراف معیار برای تعیین ضریب اطمینان در تحلیل‌های آماری نیز به کار می‌رود. در مطالعات علمی، معمولاً داده‌های با اختلاف بیشتر از دو انحراف معیار از مقدار میانگین به عنوان داده‌های پرت در نظر گرفته و از تحلیل، خارج می‌شوند.

تاریخچه

نام انحراف معیار نخستین بار از سوی کارل پیرسون^[۲] در سال ۱۸۹۴ پیشنهاد شد^[۳] پیش از او نام‌های دیگری برای این مفهوم پیشنهاد شده بود برای نمونه، گاوس به آن خطای میانگین می‌گفت.^[۴]

نمونه عددی

انحراف معیار برای یک مجموعه متناهی، برابر است با جذر میانگین مربعات اختلاف داده‌ها با میانگینشان. نمونه عددی زیر می‌تواند نحوه محاسبه انحراف معیار را نشان دهد؛ نمرات یک کلاس به صورت زیر اعلام شده‌است:

۱۲، ۱۶، ۱۸، ۲۰، ۱۵، ۱۸، ۱۴، ۱۷، ۱۳، ۱۷

تعداد داده‌ها (جمعیت) برابر ۱۰ است. نخست، میانگین داده‌ها محاسبه می‌شود:

$.mw-parser-output .sfrac{white-space:nowrap}.mw-parser-output .sfrac.tion,.mw-parser-output .sfrac .tion{display:inline-block;vertical-align:-0.5em;font-size:85%;text-align:center}.mw-parser-output .sfrac .num,.mw-parser-output .sfrac .den{display:block;line-height:1em;margin:0 0.1em}.mw-parser-output .sfrac .den{border-top:1px solid}.mw-parser-output .sr-only{border:0;clip:rect(0,0,0,0);height:1px;margin:-1px;overflow:hidden;padding:0;position:absolute;width:1px}۱۲+۱۶+۱۸+۲۰+۱۵+۱۸+۱۴+۱۷+۱۳+۱۷/۱۰=۱۶$

سپس مربع اختلاف مقدار هر داده با میانگین به دست می‌آید:

‎(۱۲–۱۶)^۲=۱۶	‎(۱۶–۱۶)^۲=۰
‎(۱۸–۱۶)^۲=۴	‎(۲۰–۱۶)^۲=۱۶
‎(۱۵–۱۶)^۲=۱	‎(۱۸–۱۶)^۲=۴
‎(۱۴–۱۶)^۲=۴	‎(۱۷–۱۶)^۲=۱
‎(۱۳–۱۶)^۲=۹	‎(۱۷–۱۶)^۲=۱

در گام بعدی، واریانس داده‌ها که میانگین مربعات اختلاف داده‌ها با میانگینشان است، به دست می‌آید:

$۱۶+۰+۴+۱۶+۱+۴+۴+۱+۹+۱ / 10 =5.6$

در گام نهایی، جذر واریانس به عنوان انحراف معیار داده‌ها در نظر گرفته می‌شود:

$\sqrt 5.6 =2.36$

مقدار انحراف معیار به دست آمده در صورتی درست است که از همه جمعیت موجود استفاده شود. اگر نمونه‌های تصادفی از داده‌ها انتخاب شده و انحراف معیار برای آن نمونه‌ها به دست آید، باید یک واحد از مقدار مخرج در گام پیش از نهایی کم شود. (در این مثال، اگر ۱۰ داده‌ی نمایش داده شده نمونه ای تصادفی از تعداد بیشتری داده بود، باید به جای ۱۰، مقدار ۹ قرار می‌گرفت) این تغییر را اصلاح بِسِل می‌نامند.

معمولاً با افزایش تعداد داده‌ها توزیع آن‌ها به منحنی توزیع نرمال میل پیدا می‌کند. در توزیع نرمال، ۶۸٫۲٪ داده‌ها در فاصله کمتر از یک انحراف معیار نسبت به میانگین قرار دارند. این مقدار برای فاصله‌های دو و سه انحراف معیار، به ترتیب ۹۵٫۴٪ و ۹۹٫۷٪ است. به بیان دیگر، احتمال آن که اختلاف یک داده با میانگین، بیش از سه انحراف معیار باشد، تنها ۰٫۳٪ (تقریباً معادل ۱ در ۳۰۰) است.

تعریف ریاضی

اگر Χ یک متغیر تصادفی با میانگین μ باشد:

\operatorname {E} [X]=\mu

عملگر Ε امید ریاضی متغیر Χ را نشان می‌دهد. به این ترتیب، انحراف معیار را می‌توان با استفاده از ویژگی‌های عملگر امید ریاضی، به صورت زیر تعریف کرد:

{\begin{aligned}\sigma &={\sqrt {\operatorname {E} [(X-\mu )^{2}]}}\\&={\sqrt {\operatorname {E} [X^{2}]+\operatorname {E} [(-2\mu X)]+\operatorname {E} [\mu ^{2}]}}={\sqrt {\operatorname {E} [X^{2}]-2\mu \operatorname {E} [X]+\mu ^{2}}}\\&={\sqrt {\operatorname {E} [X^{2}]-2\mu ^{2}+\mu ^{2}}}={\sqrt {\operatorname {E} [X^{2}]-\mu ^{2}}}\\&={\sqrt {\operatorname {E} [X^{2}]-(\operatorname {E} [X])^{2}}}\end{aligned}}

متغیر تصادفی گسسته

اگر Χ شامل داده‌های تصادفی یک مجموعه متناهی باشد و احتمال وقوع همه مقادیر نیز یکسان باشد؛ در این حالت، انحراف معیار برابر است با:

\sigma ={\sqrt {{\frac {1}{N}}\left[(x_{1}-\mu )^{2}+(x_{2}-\mu )^{2}+\cdots +(x_{N}-\mu )^{2}\right]}},\mu ={\frac {1}{N}}(x_{1}+\cdots +x_{N})

که می‌توان با استفاده از علامت جمع، آن را به صورت زیر نیز نشان داد:

\sigma ={\sqrt {{\frac {1}{N}}\sum _{i=1}^{N}(x_{i}-\mu )^{2}}},\mu ={\frac {1}{N}}\sum _{i=1}^{N}x_{i}

اگر مقدارهای مختلف، دارای احتمالات مختلف باشند؛ یعنی متغیر x_i دارای احتمال وقوع p_i باشد، انحراف معیار به صورت زیر در می‌آید:

\sigma ={\sqrt {\sum _{i=1}^{N}p_{i}(x_{i}-\mu )^{2}}},\mu =\sum _{i=1}^{N}p_{i}x_{i}

متغیر تصادفی پیوسته

انحراف معیار متغیر پیوسته X با تابع احتمال (p(x با بهره گرفتن از رابطه زیر به دست می‌آید:

\sigma ={\sqrt {\int _{\mathbf {X} }(x-\mu )^{2}\,p(x)\,dx}},\mu =\int _{\mathbf {X} }x\,p(x)\,dx

تخمین

اگر نتوان از همه جامعه آماری، برای محاسبه انحراف معیار استفاده کرد، بخشی از آن به عنوان نمونه تصادفی انتخاب می‌شود و انحراف معیار برای آن به دست می‌آید. این مقدار را به عنوان برآوردگر می‌شناسند و با پارامتر s نشان داده می‌شود.

خطای استاندارد

برای محاسبه خطا (error bar) اگر انحراف معیار را بر ریشه دوم تعداد داده‌ها تقسیم کنیم مقدار خطا بدست می‌آید

$S_{e}={\frac {\sigma }{\sqrt {N}}}={\sqrt {{\frac {1}{N(N-1)}}\sum _{i=1}^{N}(x_{i}-{\bar {x}})^{2}}}$

جستارهای وابسته

منابع

↑ «انحراف معیار» [ریاضی] هم‌ارزِ «standard deviation» (انگلیسی)؛ منبع: گروه واژه‌گزینی. جواد میرشکاری، ویراستار. دفتر ششم. فرهنگ واژه‌های مصوب فرهنگستان. تهران: انتشارات فرهنگستان زبان و ادب فارسی. شابک ۹۷۸-۹۶۴-۷۵۳۱-۸۵-۶ (ذیل سرواژهٔ standard deviation)
↑ Dodge, Yadolah (2003). The Oxford Dictionary of Statistical Terms. Oxford University Press. ISBN 0-19-920613-9.
↑ Pearson, Karl (1894). "On the dissection of asymmetrical frequency curves". Philosophical Transactions of the Royal Society A. 185: 71–110. Bibcode:1894RSPTA.185...71P. doi:10.1098/rsta.1894.0003.
↑ Miller, Jeff. "Earliest Known Uses of Some of the Words of Mathematics".

"راهنمای یادگیری و محاسبهٔ انحراف معیار" (به انگلیسی). Archived from the original on 20 April 2010. Retrieved 11 April 2008.
"محاسبهٔ انحراف معیار" (به انگلیسی). Retrieved 14 October 2012.

[1] «انحراف معیار» [ریاضی] هم‌ارزِ «standard deviation» (انگلیسی)؛ منبع: گروه واژه‌گزینی. جواد میرشکاری، ویراستار. دفتر ششم. فرهنگ واژه‌های مصوب فرهنگستان. تهران: انتشارات فرهنگستان زبان و ادب فارسی. شابک ۹۷۸-۹۶۴-۷۵۳۱-۸۵-۶ (ذیل سرواژهٔ standard deviation)

[2] Dodge, Yadolah (2003). The Oxford Dictionary of Statistical Terms. Oxford University Press. ISBN 0-19-920613-9.

[3] Pearson, Karl (1894). "On the dissection of asymmetrical frequency curves". Philosophical Transactions of the Royal Society A. 185: 71–110. Bibcode:1894RSPTA.185...71P. doi:10.1098/rsta.1894.0003.

[4] Miller, Jeff. "Earliest Known Uses of Some of the Words of Mathematics".

[۱]

[۲]

[۳]

[۴]

ن ب و نظریه توزیع‌های احتمال
تابع جرم احتمال (pmf) تابع چگالی احتمال (pdf) تابع توزیع تجمعی (cdf) تابع چندک
گشتاور خام central moment مقدار انتظاری واریانس انحراف معیار چولگی کشیدگی ال-گشتاور
تابع مولد گشتاور (mgf) characteristic function تابع مولد احتمال (pgf) انباشتک combinant