آموزش آمار: آموزش SPSS و آموزش SAS و آموزش STATA و آموزش نرم افزار R


چگونه نرمال بودن داده هایمان را در spss آزمون کنیم؟

نویسنده: هیئت تحریریه ژورنال آمارآکادمی

در چک کردن نرمالیتی داده ها چندین گام  وجود دارد:

گام اول:

ابتدا چولگی و کشیدگی داده هایتان را آزمون کنید. این کار را می توان از مسیر زیر در SPSS انجام داد:


Analyze> Descriptive Statistics> Descriptives

در کادر محاوره ای که باز می شود متغیر هایی که می خواهید چولگی و کشیدگی آن را آزمون کنید را به کادر سفید انتقال دهید.
سپس روی کلید options  کلیک کنید و در کادر محاوره ی آن گزینه های Skewness و kurtosis را فعال کنید .







 چولگی برابر با گشتاور سوم نرمال شده است. چولگی در حقیقت معیاری از وجود یا عدم تقارن تابع توزیع می باشد. برای یک توزیع کاملاً متقارن چولگی صفر و برای یک توزیع نامتقارن با کشیدگی به سمت مقادیر بالاتر چولگی مثبت و برای توزیع نامتقارن با کشیدگی به سمت مقادیر کوچکتر مقدار چولگی منفی است. در شکل زیر چولگی مثبت و منفی را می بینید.






کشیدگی یا کورتزیس نشان دهنده قله‌مندی یک توزیع است.  مقدار کشیدگی را با گشتاور چهارم نرمال بر آورد کرده اند، به عبارت دیگر کشیدگی معیاری از تیزی منحنی در نقطه ماکزیمم است و مقدار کشیدگی برای توزیع نرمال برابر ۳ می باشد. کشیدگی مثبت یعنی قله ی توزیع مورد نظر از توزیع نرمال بالاتر و کشیدگی منفی نشانه ی پایین تر بودن قله از توزیع نرمال است.
در حالت کلی  معمولا چنان چه چولگی و کشیدگی در بازه ی (2 ، 2-) نباشند داده ها از توزیع نرمال بسیار دور بوده و می بایست قبل از هر گونه آزمونی که برای انجامشان باید فرض نرمال بودن داده ها برقرار باشند؛ اصلاح گردند.( البته ممکن است بعضی از آمار دادنان این بازه را کوچکتر یا بزرگتر در نظر بگیرند. )

مثال زیر را در نظر بگیرید.
از سری داده های آماده ی SPSS فایل adl.sav را از مسیر زیر باز کنید:

Open> data>


 در کادر open data در look in به آدرس زیر رفته و فایل adl.sav را انتخاب کنید:

C:\ > program files> SPSSlnc > SPSS> Samples

می خواهیم نرمال بودن داده های سن(age) و Hopital LOS(los) را چک کنیم: برای این کار  از مسیر *  کادر Descriptive را باز کنید و این دو متغیر را به کادر سفید انتقال دهید و در منوی optins دو گزینه Kurtosis و Skewness را فعال کنید.  و در نهایت دکمه ی ok را بزنید. با این کار خروجی زیر را دریافت می کنید:










مقدار چولگی مشاهده شده برای متغیر سن 1.483 است این می تواند ما را به نرمال بودن توزیع این متغیر امیدوار کند یعنی از لحاظ کجی متغیر سن مانند نرمال بوده و توزیع آن متقارن است اما مقدار کشیدگی آن از 3 بیشتر است و این می رساند که قله ی این توزیع از نرمال بالا تر قرار می گیرد. لذا این متغیر با اینکه دارای توزیع متقارنی است اما نرمال نخواهد بود.
اما مقدار چولگی و کشیدگی برای متغیر los در بازه ی  (2 , 2-) قرار داشته و می توان گفت که این متغیر می تواند نرمال باشد.

گام دوم:


پس از بررسی عادی یا نرمال بودن کشیدگی و یا چولگی توزیع داده هایتان، به سراغ آزمون شاپیرو ویلک بروید تا از نرمال بودن داده هایتان مطمئن گردید. برای این کار از مسیر زیر وارد کادر محاوره ی زیر شود.

Analyze > Descriptive Statistics> Explore






در مثال بالا همان دو متغیر سن age و los را مطابق شکل وارد لیست متغیر های وابسته کنید و سایر جاها را خالی بگذارید. سپس  به منوی plots رفته و گزینه ی  Normality plots with tests را تیک دار کنید.








با این عمل خروجی شما شامل جدولی است تحت عنوان  Tests of Normality که به شما دو مقدار سطح معناداری را برای هر کدام از متغیر ها به طور مجزا می دهد. این مقادیر در تشخیص نرمالیتی داده ها بسیار تعیین کننده است.







معمولا چنانچه سطح معناداری در آزمون Shapiro-Wilk که در این جدول با sig. نمایش داده می شود بیشتر از 0.05  باشد می توان داده ها را با اطمینان بالایی نرمال فرض کرد.  در غیر این صورت نمی توان گفت که داده ها توزیعشان نرمال است. با توجه به جدول فوق و مقادیر سطح معناداری برای متغیرهای age وlos می توان گفت که توزیع متغیر los می تواند با احتمال خوبی نرمال باشد اما همانطور ی که در گام اول هم پیش بینی کرده بودیم متغیر  age نرمال نخواهد بود.
بد نیست نگاهی هم به سطح معناداری بخش Kolmogotov-Smirnov داشته باشیم هرچند این آزمون بیشتر  برای مجموعه داده هایی با حجم بالا  کاربرد دارد.


گام سوم:

اگر در گام دوم به این نتیجه رسیدید که متغیرهای شما که در گام اول چولگی و کشیدگی معمولی داشتند نرمال نبودند، به سراغ نمودارهایی که می توانید از خروجی Explore که در گام دوم معرفی شد بروید. به طور پیش فرض  نمودارهای جعبه ای ، یا Q-Q plot یا نمودار شاخ و برگ ظاهر می شود. با این حال در همان کادر محاوره Plots چک کنید که  گزینه های مربوط به نمودار شاخ و برگ وسایر نمودارها تیک دار باشند.
از طریق این نمودارها می توان به طور جزیی به نحوه ی توزیع داده ها پی برده و علت نرمال نبودن داده ها را با دلیل ببینید:
    نمودار شاخ و برگ برای یک توزیع نرمال شکلی زنگوله وار دارد.
   در نمودار Q-Q داده های یک توزیع نرمال معمولا روی خط قرار می گیرد و داده ها در روی خط مارپیچ یا  S-وار نخواهند بود.
    جعبه ی یک نمودار جعبه ای معمولا برای توزیع نرمال در مرکز نمودار قرار می گیرد. دیدن داده های پرت ( که آنها را با ستاره یا نقطه نشان می دهند) می تواند انحراف یک توزیع را از توزیع نرمال به خوبی تشریح کند.
در مثال بالا نمودار ها را برای متغیر age می بینیم:
مشاهده می کنید که علاوه بر اینکه داده ها S –وار  حول خط نرمال پخش شده اند داده هایی داریم که بسیار از خط دور افتاده اند. این داده ها همان داده های پرت می باشند
در نمودار جعبه ای آن هم مشاهده می کنید که جعبه در مرکز قرار ندارد. و علت آن می تواند وجود داده ی پرتی که در بالا ی جعبه فرار دارد نیز باشد.













همینطور نمودار شاخ و برگ را برای متغیر سن ببینید و آن را با نمودار شاخ و برگ متغیر los مقایسه کنید:


Pt. age Stem-and-Leaf Plot

 Frequency    Stem &  Leaf

     3.00       66 .  000
     6.00       67 .  000000
    14.00       68 .  00000000000000
    13.00       69 .  0000000000000
     6.00       70 .  000000
     8.00       71 .  00000000
     6.00       72 .  000000
    14.00       73 .  00000000000000
    14.00       74 .  00000000000000
     6.00       75 .  000000
     1.00       76 .  0
     2.00       77 .  00
     2.00       78 .  00
     1.00       79 .  0
      .00       80 .
     3.00       81 .  000
     1.00 Extremes    (>=91)

 Stem width:   1
 Each leaf:       1 case(s)




نمودار شاخ و برگ متغیر los:


Hospital LOS Stem-and-Leaf Plot

 Frequency    Stem &  Leaf

     3.00       12 .  000
     4.00       13 .  0000
    12.00       14 .  000000000000
     7.00       15 .  0000000
     8.00       16 .  00000000
    21.00       17 .  000000000000000000000
    14.00       18 .  00000000000000
    11.00       19 .  00000000000
     9.00       20 .  000000000
     7.00       21 .  0000000
     3.00       22 .  000
      .00       23 .
      .00       24 .
     1.00       25 .  0

 Stem width:   1
 Each leaf:       1 case(s)



     























کلمات کليدي:


بازديد:
آموزش spss

نام و نام خانوادگي:

ايميل:
وبسايت:
شماره امنيتي:
پيام شما:


8/4/1392 - ساعت -1173/1/-600 جلال
متشکرم خیلی عالی بود
11/3/1392 - ساعت -78/1/-609 خدیجه مومنی | ايميل
عالی بود
8/3/1392 - ساعت -808/1/-609 رضا سلامت | ايميل
با تشکر از توضیحات بسیار خوب شما در تفهیم مطالب. موفق باشید
6/2/1392 - ساعت -808/1/-609 سارا
ممنون از توضیحات شما. من واقعا استفاده کردم.
19/1/1392 - ساعت -78/1/-613 maral | ايميل
merc ...vaghan khub tozih dadin
19/12/1391 - ساعت -78/1/-613 سيدمرتضي سجادي | ايميل
وقتي چيزي را از كسي ياد مي گيريم يكي از بهترين قدرداني ها طلب رحمت براي اموات معلم هست خدا پدر و مادرت را بعد از 120سال رحمت كند
پاسخ:  
4/11/1391 - ساعت -808/1/-605 حسین جاوید | ايميل
دمت گرم خیلی مفید بود واقعا دستتون درد نکنه
16/9/1391 - ساعت -808/1/-596 بنت الهدی سالارزایی | ايميل
عالی بود
1/6/1391 - ساعت -1173/1/-596 علیرضا | ايميل | وب
آزمون نرمال بودن دادها را برای چه متغییری باید انجام دهیم 0یعنی متغییر وابسته ،مستقل،کنترل،حذف شده برای کدام انجام میدهیم؟با تشکر
پاسخ: آزمون نرمال بودن را بر روی هر متغیری بدون در نظر گرفتن نوع ُآن می توان انجام داد. اما برخی از آزمون ها وجود دارند که برای انجام آنها می بایستی فرض نرمال بودن برقرار باشد. آن گاه نیازمندیم قبل از انجام آزمون مورد نظر، نرمالیتی را انجام داد.
22/4/1391 - ساعت -808/1/-609 مراد علیزاده | ايميل
با سلام\r\nبهترین و ساده ترین راه برای آزمون نرمال درspssاستفاده از مسیر زیر است\r\nspss>analyze>nonparametric tests>1-sample k-s\r\nکه همان آزمون کلموگروف-اسمیرنوف است و میتوان آزمون نیکویی برازش را برای چهار توزیع نرمال،یکنواخت،پواسن و نمایی انجام داد.\r\nبا احترام\r\nمراد علیزاده-دانشجوی دکتری آمار
پاسخ:

سلام

با تشکر از توجه شما.

حتما این نکته را در قالب مطلب جدیدی در آینده به قسمت spss اضافه خواهیم نمود.