آموزش آمار: آموزش SPSS و آموزش SAS و آموزش STATA و آموزش نرم افزار R


نحوه محاسبه پروبیت (Probit Regression) در نرم افزار R

نویسنده: هیئت تحریریه ژورنال الکترونیکی آمار آکادمی

رگرسیون پروبیت که به مدل های پروبیت نیز معروف هستند زمانیکه خروجی یا متغیر وابسته مدل دو وجهی باشد کاربرد دارد. در مدل های پروبیت معکوس توزیع نرمال استاندارد به عنوان ترکیبی خطی از متغیر های پیش بین مدل سازی می شود. در این شرایط کاربرد روش های معمولی رگرسیون کاربرد ندارد زیرا در توزیع در دو سطح رخ داده است.





 به عنوان مثال محققی می خواهد در مورد عضو شدن یا نشدن شهروندان یک شهر به سازمان غیر دولتی حفظ محیط زیست با توجه به ویژگی های فردی و اجتماعی اقدام کند. یا در قبول یا رد یک پیشنهاد تبلیغاتی چه متغیر های پیش بینی دخیل هستند. این تکنیک شباهت زیادی به توابع لجیت دارد و توزیع انها به شرح زیر است و به اعتقاد آمار دانان ترجیحات فردی می تواند در انتخاب کمک کند.




هدف نوشتار حاضر ارائه کد ها و کتابخانه های ضروری برای اجرای این تحلیل در R است که نسخه مورد استفاده برای این تحلیل1-14-2 است.
 از طریق دستور Rcommander فایل داده مورد نظر را وارد نرم افزار کرده و با استفاده از دستورattach() فایل داده را در خط فرمان Rقرار می دهیم. با استفاده از دستورnames() متغیر های وارد شده مورد بازبینی قرار می گیرند. در این تحقیق می خواهیم از سه متغیر GPA، GRE و رتبه موسسه برای پیش بینی ورود یا عدم ورود، استفاده کنیم. روش هایی چون لجستیک دو جمله ای، تحلیل تشخیصی و Hotelling's T2 به عنوان بدیل های این روش مطرح هستند. برای اجرای این تکنیک دستور زیر را وارد می کنیم. as.factor ()  را در مورد متغیر های پیش بین ترتیبی به کار می بریم.

logit<- glm(admit ~ gre + gpa + as.factor(rank), family=binomial(link="probit"), data=mydata, na.action=na.pass)

با دستور summaryمی توان نتایج مدل را به شرح زیر مشاهده نمود.

Call:
glm(formula = admit ~ gre + gpa + as.factor(rank), family = binomial(link = "probit"),
    na.action = na.pass)
Deviance Residuals:
    Min       1Q   Median       3Q      Max 
-1.6163  -0.8710  -0.6389   1.1560   2.1034 
Coefficients:
                  Estimate Std. Error z value Pr(>|z|)   
(Intercept)      -2.386836   0.673946  -3.542 0.000398 ***
gre               0.001376   0.000650   2.116 0.034329 * 
gpa               0.477730   0.197197   2.423 0.015410 * 
as.factor(rank)2 -0.415399   0.194977  -2.131 0.033130 * 
as.factor(rank)3 -0.812138   0.208358  -3.898  9.7e-05 ***
as.factor(rank)4 -0.935899   0.245272  -3.816 0.000136 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for binomial family taken to be 1)
    Null deviance: 499.98  on 399  degrees of freedom
Residual deviance: 458.41  on 394  degrees of freedom
AIC: 470.41

مقدار Z value که معادل آماره والد است برای تمام متغیر های پیش بین معنی دار است. confint() سطح معنی داری را برای این متغیر ها آشکار می سازد.


                         2.5 %       97.5 %
(Intercept)      -3.7201050682 -1.076327713
gre               0.0001104101  0.002655157
gpa               0.0960654793  0.862610221
as.factor(rank)2 -0.7992113929 -0.032995019
as.factor(rank)3 -1.2230955861 -0.405008112
as.factor(rank)4 -1.4234218227 -0.459538829

برای فراخوانی شدت معنی داری سطوح متغیر های رتبه موسسات از دستور زیر استفاده می شود.

library(aod)
wald.test(b=coef(logit), Sigma=vcov(logit), Terms=4:6)


در صورتیکه این تست معنی دار باشد نشان می دهد سطوح متغیر رتبه موسسات معنی دار بوده است یا خیر. این روش آماری به حجم نمونه بالایی نیاز دارد زیرا که به روش حداکثر درستنمایی کار می کند. به طور کلی این روش برای تفسیر باید به صورت شانس رخداد هر یک از سطوح متغیر های پیش بین مورد توجه قرار گیرد. به طور کلی این روش زمانیکه متغیر وابسته گسسته است مورد استفاده قرار می گیرد و در شرایط پژوهشی به خصوص مطالعات اقتصادی کاربرد وسیعی دارد.
کتاب زیر برای مطالعه بیشتر توصیه می شود.

Long, J. Scott (1997). Regression Models for Categorical and Limited Dependent Variables. Thousand Oaks, CA: Sage Publications


کلمات کليدي:


بازديد:
آموزش spss

نام و نام خانوادگي:

ايميل:
وبسايت:
شماره امنيتي:
پيام شما:


21/5/1391 - ساعت -443/1/-600 ريتا سوري فر
بابت معرفي بسته ologit بسيار ممنون و سپاسگزارم. لطفا امكان رابطه دو طرفه با نويسنده(گان) مقاله نيز فراهم شود. خيلي خيلي مفيد هستش.