标题:Use of Combined Approach of Support Vector Machine and Feature Selection for Financial Distress Prediction of Listed Companies in Tehran Stock Exchange Market
其他标题:کاربرد روش ترکیبی ماشین بردار پشتیبان و انتخاب ویژگی بهمنظور پیشبینی درماندگی مالی شرکتهای پذیرفته شده در بورس اوراق بهادار تهران
摘要:Financial distress prediction (FDP) is a great important subject that has always been interesting to researchers, financial institutions and banks. Tough many works have been done in this area, but use of combined approach of feature selection and classifier is an issue that has attracted researchers' attention just in recent years. In this paper, four well-known kinds of SVM that each of them has it's own kernel function including: linear, polynomial, radial and sigmoid have been introduced as the main classifiers of our proposed approach. These four methods have been integrated with genetic algorithm (GA) as a wrapper feature selection approach as well as three techniques of filtering feature selection approach called: principle component analysis (PCA), information gain and relief. Brought results indicated that genetic algorithm outperformed the other feature selection techniques in it's combination with SVM methods. Furthermore, implemented hypothesis test implied that there was no significance level among GA-SVM (linear), GA-SVM (radial), GA-SVM (polynomial) and GA-SVM (sigmoid) techniques with confidence level of %95.
其他摘要:پیشبینی درماندگی مالی از مسائل مهمی است که همواره پژوهشگران، مؤسسههای اعتباری و بانکها به آن توجه کردهاند. تاکنون تحقیقات بسیاری در این زمینه صورت گرفته است، ولی استفاده از مدلهای ترکیبشدۀ انتخاب ویژگی و مدل طبقهبندیکننده، از مسائلی است که فقط در سالهای اخیر توجه پژوهشگران را به خود جلب کرده است. در این مقاله ماشین بردار پشتیبان با چهار تابع کرنل خطی، چندجملهای، شعاعی و سیگمویید بهعنوال مدل طبقهبندیکننده و ترکیب آن با روشهای انتخاب ویژگی فیلترکننده و پوششدهنده استفاده شده است. همچنین از الگوریتم ژنتیک که یکی از انواع روشهای پوششدهندۀ انتخاب ویژگی است و روشهای آنالیز اجزای اساسی، زنجیرۀ اطلاعات و رلیف که جزء روشهای فیلترکنندۀ انتخاب ویژگی هستند، استفاده شده است. نتایج بهدست آمده نشان داد که روش الگوریتم ژنتیک نسبت به روشهای فیلترکننده، عملکرد بهتری دارد. همچنین دقت ماشین بردار پشتیبان با توابع کرنل خطی، چندجملهای، شعاعی و سیگمویید در ترکیب با الگوریتم ژنتیک، با سطح اطمینان 95 درصد تفاوت معناداری با هم ندارند.