International Journal of Industrial Engineering & Production Management (2013)

-144144-24523

February 2013, Volume 23, Number 4
pp. 417-429

http://IJIEPM.iust.ac.ir/

Profile Monitoring for Multinomial Responses

R. Noorossana* & H.R. Izadbakhsh

Rassoul Noorossana, Professor Iran University of Science and Technology, Faculty of Industrial Engineering, [email protected]
HamidReza Izadbakhsh, PhD student Iran University of Science and Technology, Faculty of Industrial Engineering, [email protected]

Keywords 1ABSTRACT

1268732040127

Downloaded from ijiepm.iust.ac.ir at 14:17 IRST on Saturday November 4th 2017

Downloaded from ijiepm.iust.ac.ir at 14:17 IRST on Saturday November 4th 2017

Statistical Control Process,
Signal Probability,
Logistic Regression, Profile,
Control Chart, Hotelling,
Likelihood ratio test In certain statistical process control applications, quality of a process or product can be characterized by a function between response variable and one or more independent variables. This function commonly referred to as profile. Response variable can be continuous or discrete. All of the research assumes that the response variable is continuous. Whereas, some of the potential applications of profile monitoring are cases where the output can be modeled using polytomous (especially multinomial) or binary logistic regression models. Polytomous response variables, especially multinomial variables, can have various applications especially in service industry. In this paper, we propose some methods for monitoring a profile when the process output is a multinomial response variable. Multinomial logistic regression (OLR) provides the basis for our profile model. Performances of the proposed methods in terms of the signal probability for different out-of-control scenarios is compared based on simulation studies.

© 2013 IUST Publication, IJIEPM. Vol. 23, No. 4, All Rights Reserved

*
Corresponding author. Rassoul Noorossana Email: [email protected]
-116839-1452648

پایش پروفایل با پاسخ چند رستهای اسمی

رسول نورالسناء* و حمیدرضا ایزدبخش

کلمات کلیدی چکیده:
-137155302

کنترل کیفیت آماری ، در بسیاری از فرآیندهای تولیدی و خدماتی، کیفیت محصول یا عملکرد فرآیند به کمک رابطهای
احتمال هشدار ، رگرسیون لجستیک ، پروفایل ،
نمودار کنترل2T هتیلینگ ، آزمون نسبت درستنمایی

خطی یا غیرخطی، بین متغیر پاسخ و یک یا چند متغیر مستقل، بیان میگردد. به چنین روابطی در اصطلاح، پروفایل میگویند. متغیر پاسخ در رابطة پروفایل میتواند پیوسته یا گسسته باشد. تحقیقات نسبتاًنسبتا گستردهای تا بحال در رابطه با متغیرهای پاسخ پیوسته انجام شده ولی متغیرهای پاسخ گسسته کمتر مورد توجه قرار گرفته است .در حالی که کاربردهای بالقوهای وجود دارد که متغیر پاسخ با مدل-های رگرسیون لجستک رستهای یا دودویی مدلسازی میشوند. متغیرهای پاسخ رستهای کاربردهای متوعی به ویژه در صنعت خدمات دارند. در این مقاله ابتدا به منظور پایش پروفایلها در فاز I، نمودارهای کنترل پیشنهادی برای پایش پروفایلهایی که دارای پاسخ چندرستهای اسمی هستند توسعه داده شدهاند. مدل مبنای پروفایل، رگرسیون لجستیک چندرستهای اسمی در نظر گرفته شده است. عملکرد نمودارهای کنترل با استفاده از شبیه سازی و احتمال هشدار برای سناریوهای مختلف خارج از کنترل مقایسه شدهاند.
-1371559311

9. مقدمه9
در بسیاری از کاربردهای کنترل فرآیند آماری، از تابع توزیع یک یا چند مشخصه کیفی برای توصیف کیفیت محصول یا عملکرد فرایند استفاده میشود. مطالعات اخیر نشان میدهد که موارد متعددی را میتوان یافت که عملکرد یک فرایند یا کیفیت یک محصول به وسیله رابطه بین متغیر پاسخ و یک یا چند متغیر مستقل توصیف میشود که این رابطه را پروفایل مینامند. به عنوان مثال، می توان به تحقیقات انجام شده توسط واسرمن و همکاران] 1[، مستک و همکاران] 2[، استوور و بریل] 3[، کنگ و آلباین] 4[، نورالسناء و همکاران ]5[ و کاظمزاده و همکاران] 6[ اشاره کرد که اغلب در برگیرنده پروفایلهای خطی هستند .آلت]7[ از دو مرحله یا فاز تحت عنوان فاز I و فاز II در طراحی نمودارهای کنترل نام می برد. در فاز I، نخست مشاهدات گذشته مورد مطالعه قرار میگیرند تا در مورد تحت کنترل بودن فرآیند
تاریخ وصول: 93/5/91 تاریخ تصویب: 63/2/19
*نویسنده مسئول مقاله: دکتر رسول نورالسناء ،دانشکده مهندسی صنایع، دانشگاه علم و صنعت ایران ،[email protected]
حمیدرضا ایزدبخش، دانشکده مهندسی صنایع، دانشگاه علم و صنعت ایران،
[email protected]
1268732040127

Downloaded from ijiepm.iust.ac.ir at 14:17 IRST on Saturday November 4th 2017

Downloaded from ijiepm.iust.ac.ir at 14:17 IRST on Saturday November 4th 2017

در زمان جمع آوری مشاهدات اطمینان حاصل شود. در صورتی که فرآیند تحت کنترل باشد آنگاه پارامترهای توزیع مشخصه یا مشخصههای مورد نظر برآورد و نمودار یا نمودارهای کنترل جهت کنترل فرآیند در مراحل آتی طراحی میشود. در فاز II، نمودارهای کنترل طراحی شده به منظور تشخیص هر گونه تغییر در پارمترهای برآورد شده استفاده میشود و عملکرد آنها مورد ارزیابی قرار میگیرد. . در این مقاله تلاش میشود تا روشهای پایش پروفایلهایی که دارای پاسخ چند رستهای اسمی هستند در فاز I توسعه داده شود .
در دهه گذشته، پایش پروفایلها به عنوان یکی از حوزههای کنترل فرآیند آماری مورد استقبال و توجه محققین و کاربران این حوزه از علم آمار قرار گرفته است. در اغلب مطالعات انجام شده ،مدل رگرسیون خطی جهت توصیف پروفایل در نظر گرفته شده است. به عنوان مثال، میتوان در فاز I به تحقیقات انجام شده توسط مستک و همکاران]2[، استوور و بریل]3[، محمود و وودال]8[، محمود و همکاران]9[ اشاره نمود. همچنین در بین مطالعات انجام شده در فاز II میتوان به تحقیقات انجام شده توسط کنگ و آلباین] 4[، کیم و همکاران] 11[، گیوپتا و همکاران] 11[، زو و همکاران] 12[ اشاره نمود .
مثالهای متعددی وجود دارد که در آنها کیفیت محصول یا فرایند بوسیله رابطه غیرخطی بین دو یا چند متغیر مشخص شده است .برای نمونه میتوان به مطالعه موردی بریل] 13[، والکر و رایت ]14[، جیاُُنگ و همکاران] 15[، و ویلیامز و همکاران] 16و17[ اشاره کرد. نظر به این که پروفایلهای غیرخطی از پیچیدگی نسبتاً بیشتری برخوردار هستند تحقیقات کمتری در راستای توسعة رویکردهایی جهت پایش اینگونه پروفایلها انجام شده است. جین و شی]8[ از موجک برای ارزیابی عملکرد فرآیند همراه با نمودار کنترل 2T استفاده کردهاند. بریل]13[ آماره 2T آنها را برای تشخیص سریع تغییرات فرایند یا محصول مناسب ندانست .برای رفع این مشکل، جیااُنگُنگ و همکاران]15[ از یک آماره 2T مبتنی بر زیر مجموعهای از مشاهدات حاصل از تبدیل موجک استفاده نمودند. ویلیامز و همکاران] 16،17[ نمـودارهای کنترل چند متغیره 2T را برای پایش پروفایلهای غیرخطی ارائه نمودند .
واکر و رایت] 14[ رویکردی ناپارامتری برای مقایسه پروفایلها با استفاده از مدلهای جمع پذیر ارائه دادهاند .
این قبیل مدلها، فرم تابعی خاصی ندارند و همچنین پارامتری برای برآورد در آنها وجود ندارد. روشهای رگرسیون ناپارامتریک ،انعطاف پذیری بیشتری را در مدل سازی پروفایلها فراهم می-سازد ولی بدیهی است که توان آزمون این روش ها به مراتب کمتر از رویکرد های پارامتریک است. از جمله این روشها میتوان به روشهای مختلف هموارسازی اشاره نمود. یک عیب روشهای هموارسازی ناپارامتریک این است که تفسیر منحنی ناپارامتریک برآورد شده ممکن است دشوار باشد و کاربر را در پی بردن به عوامل غیرتصادفی که منجر به حالت خارج از کنترل میگردد دچار مشکل سازد. دینگ و همکاران] 19[ از انواع مختلفی از روشهـای کاهش دادهها از جمله آنالیز اجـزای اصلی و آنالیز اجزای مستقل، برای پایش دادههایی که در قالب یک پروفایل غیرخطی ظاهر میشوند استفاده میکنند. جنسن]21[ از مدل ترکیبی غیرخطی برای پایش پروفایلهای غیرخطی به منظور با هدف لحاظ نمودن ساختار همبستگی استفاده کرد. واقفی و همکاران]21[ دو رویکرد برای پایش پروفایلهای غیرخطی در فاز II ارائه نمودهاند. رویکرد اول شامل روشهای نمودار کنترل با بکارگیری برآوردهای پارامتریک مدل رگرسیون به منظور پایش پروفایلهای غیرخطی و رویکرد دوم بر اساس اندازة انحراف از منحنی مرجع بوده است.
در تمامی روشهای فوق، فرضیات رگرسیون یعنی فرض استقلال و نرمال بودن توزیع مشاهدات و همچنین ثابت بودن واریانس آنها ،به عنوان فرضیات اصلی این روشها مطرح میگردد. اما در واقعیت موارد متعددی میتوان یافت که در آنها این فرضیات برقرار نبوده و بنابراین روشهای ارایه شده در پایش اینگونه پروفایلها کاربرد
491
نخواهد داشت. در این میان می توان به فرایندهایی اشاره نمود که مشخصه کیفی مورد نظر به صورت وصفی و از نوع برنولی بوده )معیوب و نامعیوب( و این مشخصه به متغیرهای مستقل دیگری وابسته باشد. یِِه و همکاران] 22[ روشهای مبتنی بر آمارة 2T هتیلینگ معرفی شده در پایش پروفایلهای غیرخطی را برای پایش پروفایلهای با متغیر پاسخ غیر نرمال و حالت خاصی از آن یعنی دوتایی بکار گرفتهاند .
متغیر پاسخ در نظر گرفته شده در تحقیق آنها، دو سطحی و مبنای پروفایل ارایه شده، مدل لجیت لجستیک است. آنها 5 روش موجود در ادبیات موضوع برای تخمین ماتریس واریانس-کواریانس آماره 2T را استفاده کردند و یکی از نتایج تحقیق آنها ضعف عمکلرد دو روش تخمینگر شامل مینیمم حجم بیضی و مینمم تعیین کننده کواریانس بوده است. لازم به ذکر است که ضعف این دو روش در ادبیات موضوع نیز به آن اشاره شده است .در این مقاله از رگرسیون لجستیک چند رستهای اسمی جهت توصیف پروفایل مورد نظر استفاده شده است. این مدل اجازه می-دهد تا متغیر پاسخ بیش از دو سطح داشته باشد. به عنوان مثال میتوان از سلیقة مشتریان در انتخاب خدمات/ محصولات و عادت کاربران در استفاده از خدمات اینترنتی در طول شبانهروز به عنوان مثالهایی که دارای متغیرهای پاسخ چندسطحی هستند نام برد. در بخش 2 مدل مبنای پروفایل لجستیک چند رستهای اسمی به همراه الگوریتمی برای برآورد ضرایب مدل آورده شده است. نمودارهای کنترل توسعه داده شده برای پایش پروفایل مورد نظر در بخش 3 تشریح میشود. در بخش 4 با استفاده از یک مثال عددی روشهای توسعه داده شده مورد ارزیابی قرار میگیرند .

6. مدل مبنا و برآورد ضرایب
بردار 1p  بُُعدیxi  (x xi1, i2,…,x xip, ip1)T شاملp متغیر مستقل و عرض از مبداء که در آن i 1,…,n نشانگر حالتهای مستقل آزمایش است را در نظر گیرید. بردار
yi  (y yi1, i2,…, yiJ )T متغیر پاسخ متناظر با مشاهدات است و

تعداد رسته های اسمی متغیر پاسخ میباشد. مثلاً برای حالتی که متغیر پاسخ وضعیت محصولی را به صورت سالم، معیوب و یا از نوع دوبارهکاری نشان دهد آنگاه J=3 و بردار yi دارای توزیع چندجملهای با بردار احتمالات i  (  i1, i2,…, iJ )T خواهد بود. بنابراین،

1268732040127

Downloaded from ijiepm.iust.ac.ir at 14:17 IRST on Saturday November 4th 2017

Downloaded from ijiepm.iust.ac.ir at 14:17 IRST on Saturday November 4th 2017

469

yi )  (  i1, i2,…, iJ )T , var( )=(myii i1(1 i1),mi i2(1 i2),…,mi iJ (1 iJ ))T , cov(y ,y )=-mijikiijik


log(

iJij ) kp11jk x ijk , j 1,2,…,J 1 )1(

150618933621

در رابطة فوق و پارامترهای مدل است. به سادگی میتوان نشان داد که

exp(xTi β j )exp(ηij )
27844452149

ij  J 1 J 1, j=1,…,J-1
)2(
1exp(xTi β j )1exp(ηij )
j 1j 1

که در آن
ηij xiT βj
ماکزیمم لگاریتم درستنمایی مدل لوجیت چندرستهای اسمی به صورت زیر بدست میآید: J1
و iJ  1 ij است .miتعداد مشاهدات به ازاء هر
j1
تنظیم آزمایشی از بردار xi را نشان میدهد .
در مدلهای رگرسیون لجستیک که مبنای پایش پروفایلهای چندرستهای این مقاله قرار گرفتهاند بردار احتمالات را تابعی از متغیرهای وابسته در نظر گرفته و این ارتباط با بکارگیری رابط “لوجیت” مدل سازی شده است. لازم به ذکر است که رابطهای دیگر مانند پروبیت یا لگ-لگ نیز برای استفاده وجود دارد ولی بدلیل کاربرد بیشتر رابط لوجیت از آن استفاده شده است. با 1J
درنظرگیری تساوی iJ  1 ij لوجیتهای 1-J جفت از
j1
رستهها را برای مدلسازی به کار میگیرند، بنابراین، بقیة رستهها با توجه به رستة Jام مشخص میشوند]23[.

nJ1 p1nJ1p1
l(j; yj )  yijjk xijk mi log(1 exp( jk xijk )) (3) )3(
i1 j 1 k 1i1j1k1
1268732040127

Downloaded from ijiepm.iust.ac.ir at 14:17 IRST on Saturday November 4th 2017

Downloaded from ijiepm.iust.ac.ir at 14:17 IRST on Saturday November 4th 2017

با هدف برآورد ضرایب مدل، از مدل) 3( به ترتیب دو بار به صورت زیر نسبت به

مشتق گرفته میشود:
p1
lnnxijk exp(k 1 jk xijk )nn
jk  i1 y xijijk  i11 J1 exp(p1jk xijk )  i1 y xijijk  i1 m xiijkij

mi


j1k1
nn
x yijk ( ij miij ) x yijk ( ij ij ) (4) )4(
i1i1 :داریم j  r برای
p1
577463124

219846763124

 jk2l rs in1 m xi ijk kp11 (1xirs exp(exp(k1sk jkxiskxijk))2 in1 m x xi ijk irsij ir (5) )5( exp(jk xijk ) J 1 p 1 
j1k1
به همین ترتیب برایj  r داریم:
l~ T2ln
319725487966

 X (y ) )7(m xx
  jkrsi 1iijkirs ij (1 ij ) )6(
فرم ماتریسی روابط 4 تا 6 به این صورت است: )8( ~2l X W X~ T

T
 
که نمادهای بکار رفته عبارتند از:
1268732040127

Downloaded from ijiepm.iust.ac.ir at 14:17 IRST on Saturday November 4th 2017

Downloaded from ijiepm.iust.ac.ir at 14:17 IRST on Saturday November 4th 2017

Xn p,( 1)0…0
 ~ X n J( 1),(J1)( p1) 


 0

0 Xn p,( )1 …
… … 0
… 
Xn p,( 1) 

0 

Wn J( 1),n J( 1)   w11
w21
… w12
w22
… …
… … w1(J1)  w2(J1) 
…

w(J1)1w(J1)2…w(J1)(J1) 

که wkm برای 1 k m,  J 1 یک ماتریس قطری n n است .
iامین عنصر قطری در wkm به صورت زیر محاسبه میشود:

mi ik (1 ik ) k m
 miikimk m

برآورد ضرایب به روش ماکزیمم درستنمایی از تساوی عبارت) 7( با بردار صفر بدست میآید. از آنجاییکه این دستگاه معادلا ت غیرخطی است لذا بایستی از روشهای تکراری عددی استفاده شود. روش نیوتن رافسون برای حل این دستگاه در این مقاله بکار گرفته شده است. الگوریتم محاسبه شامل مراحل زیر بدست است:
گام اول: به بردار  مقدار اولیة (0) ^تخصیص داده میشود.

گام دوم: با استفاده از و

،
،

،



قیمت: تومان


دیدگاهتان را بنویسید