آمار کاربردی، استنباطی و توصیفی هر کدام بخشهای مهمی از علم آمار هستند، اما هر یک کاربرد و هدف خاص خود را دارند. در زیر به توضیح هر یک از این سه نوع آمار میپردازم:
1. آمار توصیفی (Descriptive Statistics)
آمار توصیفی به جمعآوری، سازماندهی، خلاصهسازی و توصیف دادهها میپردازد. هدف اصلی آن ارائه یک تصویر واضح و ساده از دادههاست تا بتوان اطلاعات موجود را به شکلی قابل فهم و قابل استفاده نمایش داد.
کاربردها:
خلاصه کردن دادههای بزرگ به صورت جداول، نمودارها و گرافها.
محاسبه شاخصهای مرکزی مانند میانگین، میانه و نما.
محاسبه شاخصهای پراکندگی مانند واریانس، انحراف معیار و دامنه.
مثالها:
میانگین نمرات دانشآموزان در یک کلاس.
نمودار میلهای نشاندهنده تعداد فروش محصولات مختلف در یک فروشگاه.
2. آمار استنباطی (Inferential Statistics)
آمار استنباطی به استفاده از دادههای نمونه برای انجام استنتاجها و پیشبینیها در مورد جمعیت بزرگتر میپردازد. این شاخه از آمار به روشها و تکنیکهایی برای آزمون فرضیهها، برآورد پارامترها و پیشبینی نتایج براساس دادههای نمونه میپردازد.
کاربردها:
برآورد میانگین جمعیت بر اساس میانگین نمونه.
آزمون فرضیهها مانند آزمون t، آزمون z، ANOVA.
تحلیل همبستگی و رگرسیون برای بررسی روابط بین متغیرها.
مثالها:
برآورد میزان رضایت مشتریان یک شرکت بر اساس نظرسنجی انجامشده بر روی نمونهای از مشتریان.
آزمون فرضیه برای بررسی تفاوت میانگین دو گروه از دادهها.
3. آمار کاربردی (Applied Statistics)
آمار کاربردی به استفاده عملی از روشها و تکنیکهای آماری در مسائل و مشکلات دنیای واقعی میپردازد. این شاخه از آمار شامل استفاده از تکنیکهای توصیفی و استنباطی برای حل مسائل در حوزههای مختلف مانند پزشکی، مهندسی، اقتصاد، روانشناسی و غیره است.
کاربردها:
تحلیل دادههای پزشکی برای تعیین اثر بخشی یک درمان جدید.
استفاده از تحلیل آماری برای بهینهسازی فرآیندهای تولید در مهندسی.
بررسی دادههای اقتصادی برای پیشبینی روندهای بازار.
مثالها:
استفاده از تحلیل رگرسیون برای پیشبینی فروش آینده براساس دادههای تاریخی.
استفاده از آزمونهای آماری برای بررسی تأثیر یک برنامه آموزشی جدید بر عملکرد دانشآموزان.
خلاصه
آمار توصیفی به توصیف و خلاصه کردن دادهها محدود میشود.
آمار استنباطی برای انجام استنتاجها و پیشبینیها در مورد جمعیت بزرگتر براساس دادههای نمونه استفاده میشود.
آمار کاربردی شامل استفاده عملی از تکنیکهای آماری در حل مسائل واقعی در حوزههای مختلف است.
واحد آماری: هر کدام از ماهیها
جامعه آماری: همه ماهیها
داده: وزن هر ماهی
نمونه: وزنهای 10 ماهی انتخابی
سرشماری: دادههای مربوط به همه واحدهای آماری را گردآوری مینماییم.
نمونه گیری: فرآیند انتخاب نمونهای از یک جامعه به منظور تعمیم اطلاعات آن به جامعه است.
انواع نمونه گیری
· احتمالی
o تصادفی ساده
o خوشهای
o طبقهای
o سیستماتیک
· غیراحتمالی
o گلوله برفی - انتخاب نمونههای در دسترس ()
اندازه جامعه N - اندازه نمونه n
نمونه گیری خوشهای: به جای انتخاب سه نفر در هر مدرسه شهر قم – سرشماری در دو مدرسه شهر قم را خواهیم داشت.
نمونه گیری طبقه ای: همه طبقات بین مدارس قوی و متوسط و ضعیف پس از مدارس نمونه غیرانتفاعی، نمونه مردمی و دولتی
نمونه گیری سیستماتیک (سامانمند): در آن اندازه طبقات با هم برابر است. سه عدد از محصولات در دسته اول تا آخر
اریبی در نمونه گیری: اگر یک روش نمونه گیری از ایده آل انحراف پیدا کند. – مثل حاج آقای ادیب
روشهای گردآوری دادهها
مشاهده: شمارش تعداد ماشینهای شاسی بلند عبوری در جادههای تهران قم و تهران شمال
در مشاهده نیازی به پاسخگو وجود ندارد.
پرسشنامه: نظر سنجی از دانش آموزان در مورد کتابهای کمک آموزشی
مصاحبه: مصاحبه با نفرات برتر کنور در مورد روشهای مطالعه
دادگان: ازاطلاعات ثبت شده در بیمارستانها در مورد علائم بیماران مبتلا به کرونا
آمار استنباطی (Inferential Statistics) یکی از شاخههای آمار است که به بررسی و تحلیل دادهها با هدف استخراج نتایج و استنباطها دربارهٔ یک جامعه بزرگتر از دادههای نمونهای که از آن جامعه جمعآوری شده است، میپردازد. به عبارتی، آمار استنباطی تلاش میکند از دادههای نمونه نتیجهگیریهایی کلی دربارهٔ کل جامعه ارائه دهد. برخی از ابزارها و تکنیکهای رایج در آمار استنباطی شامل موارد زیر است:
تخمین پارامترها (Parameter Estimation): برآورد مقادیر مختلف مانند میانگین، واریانس و نسبتها برای کل جامعه از طریق دادههای نمونه.
آزمون فرضیه (Hypothesis Testing): تعیین صحت یا رد یک فرضیه خاص دربارهٔ جامعه با استفاده از دادههای نمونه.
تحلیل رگرسیون (Regression Analysis): بررسی و مدلسازی رابطهٔ بین متغیرهای مختلف.
تحلیل واریانس (ANOVA): مقایسه میانگینهای چندین گروه برای تعیین اینکه آیا تفاوتهای معناداری بین آنها وجود دارد یا خیر.
تحلیل عاملی (Factor Analysis): شناسایی ساختارهای زیرین در دادهها و کاهش ابعاد.
آمار استنباطی شامل موضوعات و مفاهیم گستردهای است که برای تحلیل و تفسیر دادهها به کار میروند. اهم موضوعات آمار استنباطی عبارتند از:
تخمین پارامترها (Parameter Estimation):
آزمون فرضیه (Hypothesis Testing):
تحلیل رگرسیون (Regression Analysis):
تحلیل واریانس (ANOVA):
تحلیل کوواریانس (ANCOVA): ترکیب تحلیل واریانس و رگر
آمار استنباطی به ویژه در زمینههای مختلفی مانند علوم اجتماعی، پزشکی، بازاریابی، اقتصاد، و بسیاری دیگر مورد استفاده قرار میگیرد تا بتواند بر اساس دادههای محدود، نتیجهگیریهایی عمومی و قابل اطمینان ارائه دهد..
آمار استنباطی (Inferential Statistics) شامل موضوعات متعددی است که هر یک به منظور تجزیه و تحلیل دادهها و استنباطهای آماری مورد استفاده قرار میگیرند. اهم این موضوعات عبارتند از:
تخمین پارامترها (Parameter Estimation):
آزمون فرضیه (Hypothesis Testing):
تحلیل رگرسیون (Regression Analysis):
تحلیل واریانس (Analysis of Variance, ANOVA):
آزمونهای غیر پارامتری (Non-parametric Tests):
تحلیل عاملی (Factor Analysis):
تحلیل بقا (Survival Analysis):
این موضوعات به محققان کمک میکنند تا بتوانند از دادههای نمونه، اطلاعات معناداری دربارهٔ کل جامعه استخراج کنند و تصمیمات بهتری بر اساس دادهها بگیرند.
آزمون کولموگروف–اسمیرنف (به انگلیسی: Kolmogorov–Smirnov test) یا (به انگلیسی: test K–S) از نوع آزمونهای آماری ناپارامتری است.
کاربرد آزمون کولموگوروف - اسمیرنف
در انتخاب یک آزمون آماری برای تحقیق، باید تصمیم بگیریم که آیا از آزمونهای پارامتریک استفاده کنیم یا آزمونهای ناپارامتریک. یکی از اصلیترین ملاکها برای این انتخاب، انجام آزمون کولموگروف-اسمیرنوف است. آزمون کولموگروف-اسمیرنوف، نرمال نبودن توزیع دادهها را نشان میدهد. یعنی اینکه توزیع یک صفت در یک نمونه را (مثلا سن در بین ۱۰۰ نفر نمونه پرستاران) با توزیعی که برای جامعه، مفروض است (برای مثال سن تمام پرستاران) مقایسه میکند. اگر تست کولموگروف- اسمیرنوف رد شود، دادهها دارای توزیع نرمال میباشند، و امکان استفاده از آزمونهای آماری پارمتریک برای تحقیق، وجود دارد. بالعکس، اگر تست کولموگروف-اسمیرنوف تأیید شود، یعنی دادهها دارای توزیع نرمال نیستند، بنابراین باید از آزمونهای ناپارمتریک در تحقیق استفاده کنیم.
نکته مهم: در نرمافزار spss، در صفحه نتیجه آزمون کولموگروف – اسمیرنوف، اگر این آزمون معنی دار بود (یعنی p کوچکتر از ۵ صدم بود)، به معنی این است که توزیع دادهها، نرمال نیست و میتوان از آزمونهای ناپارمتریک استفاده کنیم، و بالعکس. چون تأیید شدن این آزمون، نشانه ناپارامتریک بودن دادهها است.
آزمون اسمیرنف یک نمونهای
آزمون اسمیرانف یک نمونهای و برای ارزیابی همقوارگی متغیرهای رتبهای در دو نمونه (مستقل یا غیر مستقل) یا همقوارگی توزیع یک نمونه با توزیعی که برای جامعه فرض شدهاست، به کار میرود.
این آزمون در مواردی به کار میرود که متغیرها رتبهای باشند و توزیع متغیر رتبهای را در جامعه بتوان مشخص نمود. این آزمون از طریق مقایسه توزیع فراوانیهای نسبی مشاهده شده در نمونه با توزیع فراوانیهای نسبی جامعه انجام میگیرد.
خصوصیات
این آزمون ناپارامتری است و بدون توزیع است اما باید توزیع متغیر در جامعه برای هر یک از رتبههای مقیاس رتبهای در جامعه بهطور نسبی در نظر گرفته شود که آن را نسبت مورد انتظار مینامند.
آزمون کولموگروف- اسمیرنف دو نمونهای
آزمون کولموگروف- اسمیرنف دو نمونهای (به انگلیسی: Two- Sample Kolmogorov-Smirnov Test) در مواقعی به کار میرود که دو نمونه داشته باشیم (با شرایط مربوط به این آزمون که قبلاً گفته شد) و بخواهیم همقوارگی بین آن دو نمونه را با هم مقایسه کنیم.
https://kaliboys.com/python-variables/
https://kiaraacademy.com/types-of-statistical-variables/
آمار استنباطی شامل موضوعات و مفاهیم گستردهای است که برای تحلیل و تفسیر دادهها به کار میروند. اهم موضوعات آمار استنباطی عبارتند از:
تخمین پارامترها (Parameter Estimation):
آزمون فرضیه (Hypothesis Testing):
تحلیل رگرسیون (Regression Analysis):
تحلیل واریانس یکطرفه (One-Way ANOVA) یک روش آماری است که برای مقایسه میانگین سه یا بیشتر از سه گروه مستقل استفاده میشود. این روش به ما کمک میکند تا بفهمیم آیا تفاوت معناداری بین میانگینهای این گروهها وجود دارد یا خیر.
محاسبه میانگینها و واریانسها:
محاسبه آماره F: F=بین گروهها واریانسدرون گروهها واریانس=SSB/(k−1)SSW/(N−k)F = \frac{\text{بین گروهها واریانس}}{\text{درون گروهها واریانس}} = \frac{SSB / (k-1)}{SSW / (N-k)} که در آن:
محاسبه p-value:
فرض کنید میخواهیم بررسی کنیم آیا میانگین امتیازات سه کلاس در یک آزمون ریاضی متفاوت است یا خیر. دادهها به صورت زیر است:
ابتدا باید کتابخانههای لازم را وارد کنیم:
import numpy as np
from scipy import stats
# دادهها
class_A = [85, 90, 78, 92, 88]
class_B = [76, 95, 89, 84, 91]
class_C = [78, 82, 85, 87, 90]
# انجام One-Way ANOVA
F, p = stats.f_oneway(class_A, class_B, class_C)
# نمایش نتایج
print("آماره F:", F)
print("p-value:", p)
# تفسیر نتایج
alpha = 0.05
if p < alpha:
print("تفاوت معنیداری میان میانگین گروهها وجود دارد (رد فرض صفر)")
else:
print("تفاوت معنیداری میان میانگین گروهها وجود ندارد (قبول فرض صفر)")
خروجی مثال:
تفسیر نتایج:
این یک مثال ساده از چگونگی استفاده از One-Way ANOVA برای مقایسه میانگینها در سه گروه مختلف است.
ANOVA دوطرفه (Two-Way ANOVA): بررسی تأثیر دو متغیر مستقل و تعامل بین آنها بر روی یک متغیر وابسته.
تحلیل واریانس (ANOVA) به چندین نوع تقسیم میشود که هر کدام برای موقعیتها و شرایط آماری خاص خود مناسب هستند. انواع مهم تحلیل واریانس عبارتند از:
1. One-way ANOVA (تحلیل واریانس یک عاملی)
یکی از رایجترین انواع ANOVA است که برای مقایسه میانگین بین سه یا بیشتر گروه (عامل) مستقل استفاده میشود. به طور معمول، یک عامل دارای سه یا بیشتر سطح (گروه) است که میخواهیم ببینیم آیا میانگین متغیر وابسته بین این گروهها متفاوت است یا خیر.
2. Two-way ANOVA (تحلیل واریانس دو عاملی)
در این نوع از ANOVA، دو عامل مستقل (factor) به عنوان متغیرهای مستقل در نظر گرفته میشوند و بررسی میشود که آیا هر کدام از این عوامل یا ترکیب آنها باعث تغییر در متغیر وابسته میشود یا خیر. این نوع ANOVA میتواند تأثیر تعاملی بین دو عامل را نیز بررسی کند.
3. ANCOVA (Analysis of Covariance)
تحلیل واریانس با کنترل متغیر تکوینی (Covariate) به عنوان یک متغیر تکوینی در ANCOVA در نظر گرفته میشود و بررسی میشود که آیا تفاوتهای میان گروهها در متغیر وابسته پس از کنترل بر متغیر تکوینی باقی میماند یا خیر.
4. MANOVA (Multivariate Analysis of Variance)
MANOVA از ANOVA برای بررسی تفاوتها در بیش از یک متغیر وابسته به یکباره استفاده میکند. به جای مقایسه میانگینها در هر متغیر وابسته به طور جداگانه، MANOVA اجازه میدهد تا همه متغیرهای وابسته را با هم در نظر بگیرد و تفاوتهای همزمان در این متغیرها را بررسی کند.
5. Repeated Measures ANOVA
این نوع از ANOVA برای بررسی تفاوتها در متغیرهای وابسته در طول زمان یا شرایط مختلف در یک گروه افراد استفاده میشود. به عنوان مثال، اثر یک درمان در طول زمان بررسی میشود و چگونگی تغییر در متغیرهای وابسته با توجه به زمان نمایش داده میشود.
6. Mixed-design ANOVA
این نوع ANOVA اجازه میدهد تا تأثیر عاملهای دوعاملی (between-subjects factors) و عامل تکرار (within-subjects factors) را در یک مطالعه بررسی کند. این نوع میتواند ارتباط بین افراد و شرایط مختلف را بررسی کند و تأثیر آنها را بر متغیر وابسته مورد ارزیابی قرار دهد.
هر کدام از این انواع ANOVA برای شرایط آماری خاص و سوالات پژوهشی خاص مناسب است. انتخاب نوع صحیح ANOVA بستگی به طرح پژوهش، تعداد عوامل مورد بررسی و نوع متغیرهای مورد مطالعه دارد.