摘要:Credit scoring methods are widely used for evaluating loan applications in financial and banking institutions.Credit score identifies if applicant customers belong to good risk applicant group or a bad risk applicant group.These decisions are based on the demographic data of the customers,overall business by the customer with bank,and loan payment history of the loan applicants.The advantages of using credit scoring models include reducing the cost of credit analysis,enabling faster credit decisions and diminishing possible risk.Many statistical and machine learning techniques such as Logistic Regression,Support Vector Machines,Neural Networks and Decision tree algorithms have been used independently and as hybrid credit scoring models.This paper proposes an ensemble based technique combining seven individual models to increase the classification accuracy.Feature selection has also been used for selecting important attributes for classification.Cross classification was conducted using three data partitions.German credit dataset having 1000 instances and 21 attributes is used in the present study.The results of the experiments revealed that the ensemble model yielded a very good accuracy when compared to individual models.In all three different partitions,the ensemble model was able to classify more than 80% of the loan customers as good creditors correctly. Also,for 70:30 partition there was a good impact of feature selection on the accuracy of classifiers.The results were improved for almost all individual models including the ensemble model.
其他摘要:Finansijske i bankarske institucije u velikoj meri koriste metode ocene kreditne sposobnosti prilikom evaluacije zahteva za izdavanje kredita. Kreditna ocena daje informaciju o tome da li podnosilac zahteva pripada grupi sa dobrim rizikom ili grupi sa lošim rizikom.Ove odluke se zasnivaju na demografskim podacima o klijentima,ukupnom poslovanju klijenta sa bankom i istoriji otplate kredita koji je odobren podnosiocima.Prednosti korišćenja modela za određivanje kreditne ocene uključuju smanjenje troškova kreditne analize,omogućavanje bržih odluka o kreditu i smanjenje mogućeg rizika. Mnoge tehnike statističkog i mašinskog učenja,kao što su logistička regresija, mašine potpornih vektora,neuronske mreže i algoritmi stabla odlučivanja, korišćene su i nezavisno i kao hibridni modeli kreditnog ocenjivanja.Ovaj rad predlaže tehniku koja se bazira na kombinovanju sedam pojedinačnih modela kako bi se povećala preciznost klasifikacije.Izbor karakteristika se takođe koristi za odabir važnih atributa za klasifikaciju.Unakrsna klasifikacija je sprovedena pomoću tri particije podataka.U studiji je korišćen skup podataka o odobrenim kreditima u Nemačkoj koji ima 1000 instanci i 21 atribut.Rezultati eksperimenata su otkrili da je model kombinovanja omogućio veliku preciznost u odnosu na pojedine modele.U tri različite particije,model kombinovanja je u stanju da pravilno klasifikuje više od 80% korisnika kredita kao dobre poverioce.Pored toga,za partciju 70:30 postojao je dobar uticaj odabira karakteristika na tačnost klasifikatora.Rezultati su poboljšani za skoro sve pojedine modele uključujući model kombinovanja.