|
|
پژوهش های ریاضی، جلد ۱۰، شماره ۲، صفحات ۵۱-۶۵
|
|
|
| عنوان فارسی |
طبقهبندی بهینه با استفاده از درخت تصمیم |
|
| چکیده فارسی مقاله |
نمونهگیری طبقهبندی یکی از پرکاربردترین روشهای نمونهگیری است. در برخی موارد تعیین حدود طبقات به عهده محقق است و در مواردی جامعه از قبل طبقهبندی شده است. طبقهبندی بهینه به ازای وضعیتی ازحدود طبقات حاصل میشود که بر اساس آن حدود،واریانس برآوردگر میانگین(یا مجموع) جامعه به کمترین مقدار خود برسد. در روشهای سنتی، واریانس برآوردگر را تابعی از حدود طبقات متغیر پاسخ در نظر میگیرند وجهت رسیدن به کمینه واریانس معادلاتی حاصل میشود که غالبا از روشهای عددی به جوابمیرسد.عیب اول این سبک طبقهبندی بهینه، در نظر نگرفتن همه متغیرهای مستقل است. به عنوان مثال، در برآورد میانگین درآمد، طبقهبندی جامعه بر اساس عواملی نظیر جنسیت و سابقه شغلی، نه تنها میتواند کارایی برآوردگر را افزایش دهد بلکه تفسیرپذیری و تعمیمپذیری نتایج را نیز راحتتر میسازد. عیب دوم، معادلات پیچیدهای است که جوابی بسته و قابل فهم ندارند. در این مقاله، سعی کردهایم طبقهبندی بهینه را بر اساس معیار جدیدی که ترکیبی از واریانس و جریمهای بر زیاد شدن تعداد طبقات است بسازیم طوری که متغیرهای کمکی با اهمیت در تشکیل درخت تصمیم حدود طبقات را مشخص میکنند. فرایند طبقهبندی از درخت اشباعشده شروع و با هرسهای متوالی تا رسیدن به کنده درخت، تعداد طبقات کم میشود، طبقهبندی بهینه بر اساس معیار ترکیبی معرفی شده حاصل میشود. |
|
| کلیدواژههای فارسی مقاله |
حدود طبقات، همگنی واحدها داخل طبقات، کارایی نمونهگیری طبقهبندی، جریمه. |
|
| عنوان انگلیسی |
Optimum stratification using decision tree |
|
| چکیده انگلیسی مقاله |
Stratified sampling is one of the most widely used sampling designs. In some cases, it is up to the researcher to determine the boundaries of the strata, and in some cases, the population is already stratified. The optimal classification is obtained for a situation of strata boundries, where the variance of the population mean (or total) estimator reaches its lowest value. In traditional methods, the variance of the estimator is considered as a function of the strata boiundries for the response variable, in order to reach the minimum of the variance, equations are obtained which are often solved by numerical methods. The first deficiency of this method is not considering all auxiliary variables. For example, in estimating the average income, classifying the society based on factors such as gender and job history can not only increase the efficiency of the estimator, but also make the interpretability and generalizability of the results easier. The second one is complex equations that do not have a closed and understandable solutions n this paper, we have tried to construct the optimal classification based on a new criterion that is a combination of variance and a penalty for increasing the number of strata, so that important auxiliary variables in the formation of the decision tree determine the boundries of the strata. The classification process starts from the saturated tree and with successive pruning until reaching the root node, the number of strata decreases, the optimal stratification is achieved based on the introduced combined criterion. |
|
| کلیدواژههای انگلیسی مقاله |
Strata boundries, homogeneity of units within strata, stratified sampling efficiency, penalty. |
|
| نویسندگان مقاله |
محمد مرادی | Mohammad Moradi
الناز کسانی | Elnaz Kasani
|
|
| نشانی اینترنتی |
http://mmr.khu.ac.ir/browse.php?a_code=A-10-1738-1&slc_lang=fa&sid=1 |
| فایل مقاله |
فایلی برای مقاله ذخیره نشده است |
| کد مقاله (doi) |
|
| زبان مقاله منتشر شده |
fa |
| موضوعات مقاله منتشر شده |
آمار |
| نوع مقاله منتشر شده |
مقاله مستقل |
|
|
|
برگشت به:
صفحه اول پایگاه |
نسخه مرتبط |
نشریه مرتبط |
فهرست نشریات
|