آموزش آمار: آموزش SPSS و آموزش SAS و آموزش STATA و آموزش نرم افزار R


محاسبه تحلیل همبستگی بنیادی(Canonical Correlation Analysis) در نرم افزار SAS

نویسنده: هیئت تحریریه ژورنال الکترونیکی آمار آکادمی


در بسیاری از موقعیت های پژوهشی محقق با دو دسته از متغیر های مستقل و وابسته سروکار دارد که در هر دو طرف معادله بیش از دو متغیر وجود دارد. به عبارت دیگر در این نوع تحقیقات گاها بیش از یک متغیر وابسته وجود دارد. به این منظور باید از روش چند متغیره تحلیل بنیادی یا همبستگی کانونی استفاده شود. هدف مقاله حاضر تشریح کد های اساسی محاسبات
CCA در نرم افزار کلیدی SAS است. نکته اصلی که باید مورد توجه باشد این است که عمدتا این روش به عنوان روش تعقیبی برای سایر روش های آماری محسوب می شود لیکن این روش کمتر مورد توجه پژوهشگران کشور قرار گرفته است. رگرسیون چندگانه در صورتیکه فقط یک متغیر وابسته کمی داشته باشد می تواند به عنوان جایگزین این روش وجود دارد.

به عنوان مثال محققی ابعاد صلاحیت های شغلی را در یک طرف معادله دارد و ابعاد شخصیتی را در طرف دیگر قرار داده است. با توجه به تعداد مجموعه های کوچکتر معادله استخراج می شود.

با استفاده از دستور زیر می توان اطلاعات توصیفی از وضعیت متغیر های تحقیق به دست آورد.

PROC means data= مسیر فایل;
run;

برای مشاهده اطلاعات مربوط به سطوح متغیر های مورد مطالعه پروک freq را وارد می کنیم.

PROC freq data= مسیر فایل;
  table نام متغیر مورد نظر;
run;

دستور اصلی محاسبه آن به شرح زیر است. به عبارت دیگر پروک اصلی آن cancorr  است.

proc cancorr data= مسیر فایل;
  Y1 Y2 Y3 … Yn;
  with X1 X2 X3 … Xn;
run;
 

اولین خروجی مربوط به معنی داری اولین ریشه استخراجی است.

Multivariate Statistics and F Approximations
 
S=3    M=0.5    N=295
 
Statistic                        Value    F Value    Num DF    Den DF    Pr > F
 
Wilks' Lambda               0.75436113      11.72        15    1634.7    <.0001
Pillai's Trace              0.25424936      11.00        15      1782    <.0001
Hotelling-Lawley Trace      0.31429738      12.38        15      1113    <.0001
Roy's Greatest Root         0.27449563      32.61         5       594    <.0001

 

 

 

 

با توجه به معنی داری اولین ریشه می توان استفاده از این روش را برای داده پردازی منطقی دانست. اطلاعات ریشه بعدی را می توان به شرح زیر مطالعه نمود.

Likelihood Approximate
          Eigenvalue Difference Proportion Cumulative      Ratio     F Value Num DF Den DF Pr > F
 
        1     0.2745     0.2456     0.8734     0.8734 0.75436113       11.72     15 1634.7 <.0001
        2     0.0289     0.0179     0.0919     0.9652 0.96142996        2.94      8   1186 0.0029
        3     0.0109                0.0348     1.0000 0.98918584        2.16      3    594 0.0911

 

نتایج نشان می دهد سه ریشه استخراج شده است که ریشه دوم نیز اطلاعاتی دارد که در ریشه اول تبیین نشده است. لیکن ریشه سوم به طور کلی ارزش پیش بینی ندارد. به طور کلی ضرایب هر ریشه آمده است که عمدتا بهتر است از ضرایب استاندارد شده به جای ضرایب خام به ویژه هنگامیکه انحراف استاندارد زیاد است استفاده شود تا امکان مقایسه بهتر فراهم شود.

 

 

Raw Canonical Coefficients for the VAR Variables
              V1               V2                V3
                                           
        X1           1.2538339076      0.6214775237      -0.661689607
        X2           -0.35134993      1.1876866562      0.8267209411
        X3           1.2624203286      -2.027264053      2.0002284379
 
Raw Canonical Coefficients for the WITH Variables
                W1                W2                W3
 
       Y1      0.0446205959      0.0049100176      0.0213805581
       Y2      0.0358771125      -0.042071471      0.0913073288
       Y3      0.0234171847      -0.004229472      0.0093982096
       Y4      0.0050251567      0.0851621751      -0.109835018
       Y5      0.6321192387      -1.084642482      -1.794646917

 

Standardized Canonical Coefficients for the VAR Variables
                        V1            V2            V3
 
      X1           0.8404        0.4166       -0.4435
      X2           -0.2479       0.8379        0.5833
      X3           0.4327       -0.6948        0.6855
 
Standardized Canonical Coefficients for the WITH Variables
                    W1            W2            W3
 
     Y1         0.4508        0.0496        0.2160
     Y2         0.3490       -0.4092        0.8881
     Y3         0.2205       -0.0398        0.0885
     Y4         0.0488        0.8266       -1.0661
     Y5         0.3150       -0.5406       -0.8944

 

بر این اساس می توان معادله را برای دو تابع w1 و v1و w2 و v2 نوشت ولیکن ریشه سوم ارزش تخمینی ندارد. ضرایب همبستگی کانونی نیز در خروجی بعدی مشخص است. که طبیعتا اولین ریشه دارای بیشترین ضریب همبستگی است.

Canonical Correlation Analysis
 
                                           Adjusted    Approximate        Squared
                           Canonical      Canonical       Standard      Canonical
                         Correlation    Correlation          Error    Correlation
 
                       1    0.464086       0.455474       0.032059       0.215376
                       2    0.167509        .             0.039712       0.028059
                       3    0.103991        .             0.040417       0.010814

 

این روش نیازمند حجم بالایی از نمونه است و به منظور بررسی پیش فرض های ان باید از روش MANOVA استفاده شود. در این مقاله دستورات محاسبه CCA در نرم افزار SAS آمده است. لیکن مباحث بنیادی آنرا می توان در کتاب تحلیل چند متغیره دکتر نیرومند از انتشارات دانشگاه فردوسی مشهد مطالعه نمود.

 



کلمات کليدي:


بازديد:
آموزش spss

نام و نام خانوادگي:

ايميل:
وبسايت:
شماره امنيتي:
پيام شما:


4/3/1392 - ساعت -78/1/-605 azizi | ايميل
خوب بود ممنون
پاسخ: