Credit - Scoring
1.1 Credit scoring - notiuni generale
In ultimul timp sistemul bancar mondial este supus unui proces din ce in ce mai intens de schimbare in modul de functionare si prestare a serviciilor fata de consumatori. Cladirile "din caramida si mortar " sunt acum dotate cu retele de calculatoare, internet, programe speciale si devin o parte integranta a unui proiect nou numit: "Cele mai importante solutii bancare"(CBS- Core Banking Solutions). Implementarea CBS a permis bancilor sa introduca facilitati si servicii "prietenoase" pentru clienti cum ar fi : internet banking, plata furnizorilor direct de pe card, acces nelimitat la cont indiferent de tara unde te afli. Avand in vedere ca tranzactiile bancare se deruleaza tot mai mult on-line ceea ce inseamna ca operatiile se inregistreaza in momentul realizarii acestora, bancile sunt asaltate de o cantitate exorbitanta de date. Aceste date sunt de o foarte mare valoare pentru desfasurarea activitatii acestor institutii financiare si in acelasi timp pot oferii informatii pretioase cu privire la obiceiurile diferitelor tipuri de clienti . Ca urmare , rolul departamentului de management al relatiilor cu clientii (CRM) a crescut si in acest domeniu al economiei nationale, functionarii din acest departament apeland tot mai mult la tehnicile statistice si de data mining pentru a-si intelege clientii.
In ciuda largirii gamei de servicii bancare prestate, imprumuturile catre societatile comerciale sau catre persoane fizice raman principala sursa de venit pentru bancile comerciale si celelalte institutii de credit din tarile dezvoltate si in curs de dezvoltare.
Din punct de vedere tehnic, procesul de creditare presupune o serie de operatiuni bine stabilite, de la analiza cererii initiale de credit pana la plata / neplata tuturor ratelor de rambursare a creditului. Desi operatiile de creditare sunt una dintre cele mai profitabile investitii din portofoliul unui creditor (cel putin in tarile dezvoltate), cresterea numarului de credite acordate este insotita de asemenea de o crestere a numarului de credite neperformante (credite care nu sunt platite de loc, sau rate de credite care se platesc cu intarziere sau nu se platesc). Astfel, principala problema a oricarui creditor este identificarea modului optim de a face diferenta dintre debitorii "bun" platnici si debitorii "rau" platnici. Realizarea acestei diferente este posibila cu ajutorul tehnicilor de credit scoring.
Credit scoring-ul reprezinta o metoda statistica utilizata pentru a aprecia capacitatea de plata a unui aplicant pentru credit. Aceasta metoda se bazeaza pe informatiile disponibile cu privire la cel care solicita creditul pentru a previziona pe o anumita perioada de timp viitoare probabilitatea intreruperii platilor de catre acesta. Pentru a putea utiliza modele de credit scoring, banca trebuie sa dispuna de informatii privind clientii sai, atat despre cei bun platnici (care au rambursat creditul fara probleme) cat si despre cei rau platnici (care au avut probleme cu rambursarea creditului pe parcurs). Atunci cand se analizeaza dosarul unui nou client, banca va decide daca ii acorda sau nu creditul aplicand o regula de discriminare (de repartizare in grupe anterior formate). In urma aplicarii acestei reguli solicitantul va primi un scor si, pe baza acestuia, va fi incadrat intr-unul dintre grupurile deja existente (bun platnic sau rau platnic). Analiza discriminarii ofera modalitatea de a discerne, adica de a formula regula de discriminare folosind istoricul clientilor bancii dar, in acelasi timp, ofera si o masura a evaluarii riscului unei decizii gresite.
Avand in vedere ca tot mai multe institutii financiare nu ofera doar servicii bancare clasice, standard, ci si asigurari, fonduri mutuale, leasing.o metoda tot mai utilizata este aceea de data-mining. Aceasta permite identificarea clientilor care ar fi interesati sa cumpere un serviciu dintr-o gama noua. Managementul riscului este un alt domeniu de aplicare a acestei tehnici. Bancile pot determina profilul clientilor care prezinta o mai mare probabilitate de a nu plati sau de a frauda cu ajutorul cartilor de credit. De exemplu, o banca a descoperit ca detinatorii de carti de credit care retrageau bani in cazinouri aveau o probabilitate de frauda mai mare. Homorzi si Giles au subliniat ca Sistemul Falcon impotriva fraudelor, realizat de HNC si bazat pe utilizarea retelelor neuronale (tehnica de data-mining) este utilizat cu succes in detectarea fraudelor . Aceiasi autori sustin ca noua din zece banci utilizeaza acest sistem.
1.2 Tehnici utilizate in credit scorig
Asa cum am subliniat mai sus, procesul de credit scoring este foarte important pentru banci, deoarece acestea trebuie sa faca diferenta dintre debitorii " buni" si debitorii "rai". In forma sa automata, credit scoring-ul este singura modalitate de a calcula capacitatea de rambursare a unui client , deoarece bancile nu au resurse suficiente pentru a caracteriza fiecare situatie individual . Metodele utilizate in general pentru credit scoring se bazeaza pe tehnici statistice de "recunoastere a paternurilor". In acelasi timp, credit scoring-ul poate fi privit ca si un simplu proces de data mining.
Un concept important este acela de costuri implicite (sume pierdute), care sunt asociate probabilitatii de rambursare a imprumuturilor. Pentru o mai buna intelegere, sa presupunem ca populatia imprumuturilor este formata din doua grupuri sau clase G si B care arata imprumuturile care (dupa ce au fost acordate) se vor dovedi a fi performante sau nu. Creditele performante sunt cele care sunt rambursate in totalitate si la timp ; celelalte in schimb implica pierderi de diferite grade. De obicei, marimea clasei este diferita si astfel, pentru ca un candidat ales aleator (client) sa apartina grupului G, trebuie ca pG >pB, unde pG reprezinta probabilitatea de a partine grupului G, iar pB reprezinta probabilitatea de a apartine grupului B. Sa consideram ca x este un vector format din variabile independente (un vector de masurare) pe care il vom folosi in procesul de decizie asupra grupului din care debitorii fac parte, G sau B. Fie probabilitatea ca un debitor sa apartina grupului G p(G/x) si sa apartina grupului B p(B/x). Sarcina de lucru este sa estimam probabilitatile p(·/x) din setul de date detinute pentru a identifica debitorii care se vor dovedi a fi bun sau rau platnici, precum si pentru a gasi o regula privind modul de impartire a spatiului dintre cele doua grupuri AG si AB de catre toti vectorii de masurare , bazandu-ne pe aceste probabilitati .
Totusi, de obicei nu este posibil a gasi clasificari perfecte, pentru ca se intampla ca acelasi vector sa fie intalnit in cazul a doi debitori, unul bun si unul rau platnic. Astfel este greu sa se gaseasca o regula care sa minimizeze costurile institutiei de credit , strans legate de neclasificarea corespunzatoare a cererilor de creditare. Sa notam cG costurile datorate clasificarii gresite a debitorilor buni ca fiind rai, iar cB costurile datorate clasificarii gresite a debitorilor rai ca fiind buni. De obicei cB>cG, deoarece costurile datorate clasificarii gresite a unui client rau sunt mult mai daunatoare din punct de vedere financiar decat costurile asociate celuilalt tip de erori. Daca cererile x sunt incadrate in clasa G , costurile asteptate sunt cB p(B/x) si pierderile totale asteptate pentru intregul esantion sunt :
unde p(x) este probabilitatea ca vectorul masura sa fie egal cu x. Aceasta suma este minima atunci cand debitorii din grupul G au ca si vector masura :
ceea ce este echivalent cu
(1)
Costurile clasificarii eronate pot fi normalizate la .In acest caz regula de clasificare este sa incluzi o cerere in clasa G daca p(G/x) > cB si in clasa B in caz contrar.
Este de asemenea important sa specificam costurile erorilor de decizie si deci sa precizam scorul de diferentiere a claselor. Astfel, bancile trebuie sa aleaga combinatia optima dintre profitabilitate si risc. Regulile prea restrictive pot asigura costuri minime in termeni de credite neperformante, dar costul de oportunitate al imprumuturilor refuzate ar putea depasi costurile potentiale ale imprumuturilor neperformante si astfel profitul nu este maximizat. Invers, politicile prea lejere pot duce la pierderi majore ca urmare a creditelor neperformante.
O banca poate utiliza patru grupe de metode[5] pentru a lua decizia de acordare sau nu a unui credit : analiza discriminanta, modele binare, tehnici non-parametrice si algoritmi de inteligenta artificiala, metode pe care le expunem pe scurt in cele ce urmeaza.
1.2.1 Analiza discriminanta liniara
Scopul acesteia este de a clasifica o populatie eterogena in subpopulatii omogene si pe baza acestora din urma sa se ia decizii. Putem presupune ca pentru fiecare cerere de creditare exista un numar specific de variabile disponibile. Ideea este a cauta acea combinatie liniara de variabile explicative care separa cel mai bine cele doua subpopulatii. Intr-un caz simplu de doua subpopulatii, tinta este a gasi acea combinatie de variabile explicative care asigura cea mai mare distanta dintre mediile celor doua subpopulatii.
Pe caz general, consideram distributiile p(x/G) si p(x/B), care sunt distributii normale multivariate. Ecuatia 1 se reduce la :
(1`) conform teoriei econometrice.
Astfel, xi sunt variabilele explicative, wi sunt coeficientii asociati (ponderi) in combinatia liniara a variabilelor explicative. Daca notam s(x)= wixi , atunci este posibil sa discriminam in functie de acest scor si astfel reducem problema la o singura dimensiune.
Analiza discriminanta a fost introdusa de catre Fisher (1936), care a cautat cea mai una modalitate de a separa doua grupuri folosind combinatia liniara de variabile. Eisenbeis (1977) a criticat aceasta metoda considerand ca regula este optima doar pentru un grup mic . Oricum, Hand si Henley (1997) au afirmat ca "daca variabilele urmeaza o distributie multivariata elipsoidala (din care distributia normala reprezinta un caz aparte), atunci regula de discriminare liniara este optima".
Alti critici spun ca selectia nu este impartiala deoarece esantionul utilizat pentru credit scoring este format din cei care au primit creditul si nu din toata populatia. Eisenbeis (1977) a identificat probleme si in modul de definire a grupurilor ( "bun"si "rau" ) in cazul in care nu exista o limita bine definita intre acestea si avand in vedere presupunerea ca cele doua matrici de covarianta ale celor doua distributii sunt egale. In acest caz utilizarea analizei discriminante patratice in locul celei liniare este indicat. Apar probleme si cand se doreste testarea semnificatiei variabilelor individuale, deoarece nu avem certitudinea distributie normale si deci nu putem apela la inferenta statistica. Multe din acestea sunt discutate de Rosenberg si Gleit (1994 ).
Altman (1968), care a aplicat pentru prima data analiza discriminanta, a construit asa numitul scor "z" , care este o combinatie liniara de cateva variabile explicative (indicatori ai activitatii economico-financiare a unor societati comerciale). El a considerat ca modelul este foarte precis in ceea ce priveste previziunea falimentului.
Asa cum am mentionat, avantajele metodei Analizei Discriminante Lineare sunt faptul ca este simpla, poate fi foarte usor de estimat si functioneaza foarte bine; este de obicei folosita de catre banci pentru credit scoring. Intre punctele sale forte mai precizam :
abilitatea de a incorpora simultan mai multi indicatori financiari
identificarea coeficientilor potriviti pentru combinarea variabilelor independente
aplicare simpla dupa ce modelul initial a fost creat
Dezavantajul acestei metode este ca necesita variabile normal distribuite iar datele oferite de solicitantii de credite de cele mai multe ori nu urmeaza legea normala.
Alte probleme cu care se confrunta analiza discriminanta sunt:
- incalcarea ipotezei de independenta din modelul clasic liniar de regresie.
Posibilitatile multiple de interpretare a importantei variabilelor individuale
dificultati in specificarea algoritmului de clasificare adecvat
interpretarea corecta a testelor de previziune
1.2.2 Analiza Logit (model binar)
Asa cum am mentionat anterior, distributia variabilelor cu privire la solicitatorii de credite nu este una normala de obicei si teoretic aceasta reprezinta o problema in ceea ce priveste aplicarea ADL. O metoda de rezolvare a acestei probleme este folosirea unei extensii a ADL care permite utilizarea de distributii parametrice. In acest caz, extensia potrivita o reprezinta un model liniar generalizat, cunoscut sub numele de modelul logit. Fiind dat un vector x probabilitatea p este legata de vectorul x prin relatia :
(2)
Unul dintre principalele avantaje fata de ADL este utilizarea metodei verosimilitatii maxime pentru estimarea parametrilor wi. Un alt avantaj este ca poate duce la determinarea de probabilitati de apartenenta la o anumita clasa concreta. Metoda logit poate de asemenea sa fie utilizata in cazul variabilelor ordinale. S-a demonstrat prin studii ca utilizarea metodei logit inregistreaza performante superioare metodei Analizei discriminante liniare.
Mai recent, analiza logit a devenit una dintre cele mai importante modalitati de abordare a clasificarii in credit scoring-ul bancar (coeficientii obtinuti au aceleasi valori ca si in studiile care utilizau ADL ca si regula de decizie, dar sunt obtinuti in urma unor mai putine presupuneri si aproximari).
Rezultatele actuale ale repartizarii pe grupe sunt similare pentru ambele tipuri de regresii si deoarece ambele sunt sensibile la o corelatie mare intre variabilele explicative , ar trebui sa ne asiguram ca nu sunt astfel de corelatii in esantionul de verificare a modelului. Un alt dezavantaj al acestei metode il reprezinta sensibilitatea sa la valorile lipsa (toate observatiile cu valori lipsa trebuie sa fie sterse).Similar metodei ADL, metoda logit este limitata la o forma parametrica a modelului.
Laurence si Arshadi (1995) au folosit metoda logit pentru a analiza managementul problemelor legate de imprumuturi utilizand o serie de variabile cu privire la debitori precum si la banci. In ceea ce priveste imprumuturile cu ipoteca, Campbell si Dietrich (1983) au utilizat modelul logit pentru a pune in evidenta ca perioada de ipoteca, raportul dintre valoarea acesteia si cea a imprumutului , rata dobanzii, rata somajului sunt semnificative in explicarea ratelor de ipoteca. Gardner si Mills (1989) recunoscand ca debitorii rau platnici nu intotdeauna sfarsesc prin a nu plati si a creat un model de regresie logit pentru a estima probabilitatea de neplata pentru debitorii cu probleme financiare. Ei recomanda ca bancile sa utilizeze acea metoda pentru a identifica gravitatea problemei. Mai recent, Charitou, Neophitou si Chalambous (2004) au descoperit ca metoda logit este superioara altor metode in ceea ce priveste previziunea neplatilor.
Urmatoarele doua metode sunt din grupa tehnicilor non-parametrice.
1.2.3 Clasificarea - metoda vecinilor celor mai apropiati (k-nearest neighbour)
Aceasta metoda este un exemplu de abordare statistica non-parametrica care prezinta similitudinile dintre tiparul identificat in esantionul de verificare si tiparul esantionului de intrare. Se alege o unitate de masura a spatiului reprezentat de cererile de creditare si se ia vecinul cel mai apropiat (in ceea ce priveste distanta) din tiparul initial .O noua cerere va fi repartizata in clasa in care apartin cei mai multi vecini (in cazul in care eroarea de clasificare este aceeasi) sau potrivit regulii exprimate prin ecuatia (1). Acest lucru inseamna ca aceasta metoda estimeaza probabilitatile p(g/x) (sau p(B/x))prin proportia punctelor clasei G (sau B) intre vecinii cei mai apropiati in raport cu punctul x , pentru a fi clasificate. Primii care au folosit aceasta metoda au fost Chatterjee si Barcun (1970). Identificand avantajele acestei metode, Henley si Hand (1996) au afirmat ca natura non-parametrica a metodei permite modelarea in spatiu a "neregularitatilor" din functia de risc. S-a dovedit ca aceasta metoda duce la rezultate mai bune decat orice alta metoda non-parametrica (precum metodele Kernel) atunci cand datele sunt multidimensionale. Este un procedeu usor intuitiv si astfel poate fi explicata simplu managerilor care ar trebui sa aprobe implementarea sa. Poate de asemenea sa fie utilizata in mod dinamic prin adaugarea de noi debitori atunci cand clasa din care fac parte devine cunoscuta si prin stergerea vechilor debitori pentru a depasi problemele privind schimbarile in cadrul populatiilor pe parcursul timpului.
Atunci cand se pune in aplicare metodologia vecinilor celor mai apropiati, un pas foarte important este alegerea unitatii de masura. Henley si Hand (1996 ) descriu alegerea unitatii de masura precum si a numarului de "vecini" care sa fie considerati. De obicei se utilizeaza norma Euclidiana standardizata :
(3) unde x si y sunt vectori de masura.
Totusi, atunci cand variabilele sunt in unitati diferite este necesar sa se utilizeze metode adecvate de standardizare a variabilelor precum si sa selectam o alta forma a normei Euclidiene precum:
(3
unde A este o matrice n x n cu n variabile. Cum matricea A depinde de x putem defini doua tipuri de masuri in functie de modul in care este selectata A : masuri locale - cand A depinde de x , masuri globale - cand A este independenta de x.
Henley si Hand (1996 ) au propus o masura globala data de parametrizarea A=I+DwT, unde w este directia ortogonala la probabilitatea p(G/x) iar D este un parametru de distanta. Directia w poate fi calculata folosind ponderile din regresia liniara.
Alegerea numarului de clase (k) determina varianta estimatorului. K trebuie sa fie mult mai mic decat cea mai mica clasa. O simulare realizata de Enas si Choi (1986) a sugerat ca k n 2/8 sau n 3/8 este adecvat.
Recent, Hand si Vinciotti (2003) au observat ca in cazul in care este vorba de doua clase de volum diferit, faptul ca k este finit (si astfel proprietatile asimptotice nu sunt valabile ) se concretizeaza intr-o relatie nemonotonica intre k si proportia corect clasificata din fiecare clasa. Aceasta inseamna ca in general, un k mai mare nu indica o performanta mai buna decat un k mai mic. De exemplu , daca numarul de puncte din clasa cea mica este mai mic decat (1-cB)-1 , atunci cea mai buna regula de clasificare pentru a incadra elementele din clasa G este a folosi k=1.
Holmes si Adams (2002) au constatat ca lipseste o metoda formala de alegerea a lui k si ca metoda vecinilor celor mai apropiati poate sa faca doar predictii discrete prin oferirea de informatii despre frecventele relative care nu au nici o interpretare probabilistica. Ei au incercat sa depaseasca aceste dificultati propunand o abordare Bayesiana, care schimba regula asupra alegerii lui k. O astfel de abordare duce la concluzia ca predictiile marginale sunt date ca si predictii potrivite.
1.2.4. Arborii de decizie (CART)
Aceasta este o metoda neparametrica a carei existenta se datoreaza lui Breiman, Friedman Olshen si Stone (1984).Este o tehnica flexibila si care promite mult; totusi, este folosita in practicile bancare in special ca o unealta ajutatoare pentru metodele de estimare parametrica prezentate anterior. Este utilizata de exemplu cu cea mai mare putere explicativa in procesul de selectare a variabilelor independente sau a celor discriminante . Metoda CART utilizeaza arbori binari si clasifica un set de date intr-un numar finit de clase. La inceput a fost un instrument pentru analiza datelor binare si astfel a fost utilizata in credit scoring .Mai apoi a fost imbunatatita de aceiasi autori.
Asemanator metodologiei prezentate anterior, facem presupunerea ca esantionul este caracterizat de vectorii de masura XT= si cunoastem daca un individ j este performant sau nu (si este codificat 1, respectiv 0). Arborele CART consta in cateva randuri de noduri : primul nivel consta in nodul radacina, iar ultimul in nodurile frunze. Deoarece este un arbore binar, fiecare nod, cu exceptia nodurilor frunza, este legat de alte doua noduri din nivelul urmator .Nodul radacina contine intregul set de date, iar celelalte contin subseturi de date. La fiecare nod, acest subset se divide in doua grupuri disjuncte, bazandu-se pe o caracteristica specifica, xi din vectorul de masurare. Daca xi este ordinal, clasificarea rezulta din acest lucru pentru fiecare individ, astfel ca daca xj >c pentru o anumita constanta c, atunci individul j este introdus in nodul din dreapta. Daca nu, atunci va fi introdus in nodul din stanga.
Caracteristica xi e aleasa din cadrul tuturor caracteristicilor iar constanta c este aleasa astfel incat subseturile care rezulta sa fie cat mai omogene. Altfel spus, xi si c sunt alese pentru a minimiza diversitatea grupelor care se obtin. Procesul de clasificare este o procedura recursiva care incepe de la nodul radacina si la fiecare nod ulterior (cu exceptia frunzelor) o singura caracteristica si o singura regula de impartire (o constanta c) este folosita.
Rezultatul acestui procedeu este ca grupele care se obtin sunt mai omogene decat grupa "parinte"din care acestea s-au format. Procedeul se incheie cand nodurile contin doar indivizi cu acelasi yj sau cand nu se mai poate descompune in continuare. Pentru a exemplifica, sa consideram ca p(-/t) este proportia grupelor G respectiv B la nodul t. Ca un exemplu al diversitatii functiilor utilizam o functie indice Gini care poate fi definita astfel: d(t)=p(G/tp(B/t)). Valoarea constantei c care este instrumentul de separare intre noduri, este definita astfel incat sa minimizeze diversitatea in cadrul nodurilor "fiice" (pentru care nodul t este nod parinte). Scopul este de fapt a alege pe c pentru a minimiza pLd(tL)+pRd(tR), unde pL si pR sunt proportiile indivizilor incadrati in nodurile tL si tR .Arborele complet este de obicei foarte mare, dar exista algoritmi pentru a-l transforma intr-un arbore final mai simplu. Avantajele metodei CART in credit scoring se refera la faptul ca este o metoda intuitiva, usor de explicat managerilor si ca poate face fata informatiilor lipsa. Dezavantajul major este ca sunt foarte multe calcule in cazul bazelor de date foarte mari, deoarece la fiecare nod fiecare caracteristica trebuie sa fie examinata. De obicei rezultatele sunt foarte ample si deci procesul devine un consumator mare de timp. Unele studii empirice apreciaza de asemenea ca arborii nu sunt stabili deoarece o mica schimbare in setul de date poate schimba considerabil structura intregului arbore. O problema semnificativa este faptul ca metoda CART optimizeaza doar "local", pe baza unei singure variabile, pe rand si astfel nu poate minimiza costurile totale ale clasificarii gresite.
Primii care au utilizat metoda CART in credit scoring au fost Frydman, Altman si Kao (1985), care au dovedit ca este mai performanta decat ADL.
Unele derivate de la metoda CART utilizeaza abordarea Bayesiana in construirea arborilor pentru luarea deciziei la fiecare nod, reducerea dimensiunii arborelui sau realizarea mediei mai multor arbori (Denison-Mallick-Smith, 1998).Un studiu comparativ al metodelor de reducere a dimensiunilor pentru CART a fost pusa in evidenta de Esposito-Malerba-Semeraro, 1997.
1.2.5.Retelele neuronale (algoritm de inteligenta artificiala)
O retea neuronala (NNW) este o reprezentare matematica inspirata de creierul uman si de abilitatea acestuia de a se adapta in functie de fluxul nou de informatie primit. Din punct de vedere matematic este un instrument de optimizare neliniar.
Forma de retea NNW este in special destinata clasificarilor si este foarte utilizata in practica. Reteaua consta intr-un nivel de intrare, unu sau mai multe niveluri ascunse si unul de iesire, fiecare fiind formate din mai multi neuroni. Fiecare neuron proceseaza informatia pe care o primeste si genereaza o valoare de iesire care se transmite la neuronii din nivelul urmator. Fiecare neuron din nivelul de intrare (indexat i=1,.n) trimite valoare unei caracteristici (variabile) din vectorul x. Atunci cand variabila de decizie are doua stari, un singur neuron de iesire este suficient. La fiecare nivel propagarea informatiei se face dupa cum urmeaza: Mai intai, la nivelul fiecarui neuron se masoara un numar de intrari; valoarea de iesire de la fiecare neuron catre nivelul urmator al retelei leaga acea conexiune de neuronul respectiv. O functie de transfer g(x) este apoi aplicata acestei sume pentru a determina valoarea de iesire a acestui neuron. Astfel , fiecare neuron din nivelurile ascunse (indexate j=1.q) produce asa numita activare :
(4)
Neuronii din nivelul de iesire (indexati k=1,..m) se comporta intr-un mod similar cu cei din nivelurile ascunse pentru a produce rezultatul retelei:
,unde wij si wjk sunt ponderi.
Sunt doua stadii de optimizare. Mai intai ponderile trebuie sa fie initializate iar apoi o a doua optimizare neliniara este implementata. In primul stadiu, ponderile sunt de obicei initializate cu un numar mic si ales aleator. A doilea stadiu este numit "invatare" sau "training" a/al NNW. Cel mai cunoscut algoritm este algoritmul propagarii inverse. Asa cum sugereaza si numele, eroarea rezultata din nivelul de iesire este propagata invers, prin retea iar ponderile se modifica potrivit contributiei lor la functia erorii. Propagarea inversa realizeaza o cautare locala si, desi nu este dificil de realizat, nu garanteaza atingerea unui minim global. Pentru fiecare individ ponderile se modifica in asa fel incat eroarea obtinuta la nivelul de iesire sa fie minimizata.
Retelele NNW au fost descrise in anii 1960 dar in literatura de specialitate sunt pentru prima data mentionate ca fiind utilizate in credit scoring la inceputul anilor 1990. Altman (1994) a utilizat atat ADL cat si retelele neuronale pentru a diagnostica problemele financiare a 1,000 societati italiene si a concluzionat ca retelele neuronale nu sunt o tehnica clar fundamentata matematic, comparativ cu tehnicile statistice traditionale precum ADL, dar ca cele doua metode se aseamana in ceea ce priveste acuratetea deciziilor. Pe de alta parte, cu rezultate diferite, Tam si Kiang (1992)au studiat aplicarea modelului retelelor neuronale pentru predictia falimentului bancilor din Texas din perioada 1985-1987.Ei au comparat acuratetea predictiei NNW cu cea a ADL ,a regresiei logistice , k-NN si a modelului arborilor de decizie. Rezultatul lor a sugerat ca NNW este cea mai precisa metoda , urmata de Analiza discriminanta , Regresia logistica, Arborii de decizie si k-NN.
Cel mai mare dezavantaj al NNW il reprezinta lipsa capacitatii de explicare. In timp ce ele permit realizarea de previziuni cu un grad mare de acuratete, motivul care sta la baza modului in care decizia a fost luata nu este accesibil. De exemplu, in cazul unui imprumut respins nu este posibil sa determini care caracteristica a fost exact cea care a dus la respingerea cererii de imprumut. Astfel, este foarte greu de explicat decizia catre manageri.
1.2.6.Concluzii
Am identificat cele mai utilizate metode in procesul de credit scoring. De cele mai multe ori se utilizeaza modele bazate pe metoda logit , ca derivata a metodei ADL . Alte metode precum CART, retelele neuronale se utilizeaza mai ales ca unelte suport in alegerea variabilelor sau in procesul de evaluare a calitatii modelului. Metoda k-NN nu este folosita si este si mai putin cunoscuta.
Este greu de raspuns la intrebarea care metoda sa fie aleasa? , pentru ca depinde de datele disponibile, de caracteristicile bancii, preferintele acesteia.
Totusi, se constata ca rezultatele acestor metode sunt comparabile .Acest lucru este partial explicat de relatiile matematice care exista intre aceste modele: NNW poate fi vazuta ca o generalizare a metodei logit. Insa, tot metoda logit este cea mai utilizata in practica , mai ales pentru ca nu se impun nici un fel de restrictii cu exceptia celor cu privire la valorile lipsa si a multicoliniaritatii (corelatiei ) dintre variabile. Metodele nonparametrice pot sa faca fata valorilor lipsa si multicoliniaritatii, insa necesita calcule numeroase.
Regulile pe care se bazeaza unele dintre aceste metode sunt greu de explicat managerilor si clientilor de asemenea. De exemplu, NNW au capacitatea de a produce rezultate excelente, dar incapacitatea de a explica "de ce?" reprezinta un impediment pentru utilizarea acestora.
1.3 Indicatori de baza
Inainte de a prezenta principalii indicatori utilizati in luarea deciziei de creditare, trebuie facuta diferenta dintre creditele acordate persoanelor fizice si cele acordate persoanelor juridice. In primul caz sumele sunt mult mai mici, astfel riscul nu este atit de mare, iar variabilele de decizie sunt cu totul altele decat pentru societatile comerciale (diferiti indicatori financiari, de exemplu). In primul caz sunt importante caracteristicile individuale ale imprumutatului, in cel de-al doilea, calitatea conducerii si a pietei au o pondere mica la luarea deciziei fata de ceilalti indicatori economico-financiari.
In ceea ce priveste indicatorii implicati in decizia de acordare de credite catre persoanele fizice, acestia sunt cuprinsi in urmatorul tabel si sunt impartiti in patru categorii:[7]
Indicatori demografici |
Indicatori financiari |
Indicatori ai activitatii |
Indicatori ai comportamentului anterior privind imprumuturile |
1 varsta 2.sexul 3.statutul civil 4.numarul persoanelor pe care le are in grija 5. statutul locuintei (proprietar, chirias) |
1.venitul total brut al imprumutatului 2.valoarea totala a bunurilor detinute 3. venitul total brut al gospodariei 4.costurile lunare ale gospodariei |
1. tipul activitatii desfasurate 2.vechimea la locul actual de munca 3. numarul de locuri de munca in ultimii X ani |
1. contul curent 2. soldul mediu al contului curent 3. valoarea imprumuturilor existente 4.valoarea imprumuturilor nerambursate 5.numarul de rate pe an 6.garantii |
In cazul persoanelor juridice institutiile de credit au la dispozitie o gama variata de indicatori pe care ii pot combina pentru a construi modele de creditare. Dintre acestia voi prezenta in continuare indicatorii din OMFP 1752/2006[8] ( grupati in patru categorii de baza : indicatori de lichiditate, indicatori de solvabilitate, indicatori ai activitatii, indicatori de profitabilitate).
Lichiditatea o reprezinta capacitatea unei organizatii de a face fata datoriilor pe termen scurt (inclusiv dobanda pentru imprumuturile acordate de creditori) prin valorificarea activelor curente. In general, datoriile pe termen scurt reprezinta o parte importanta din totalul datoriilor unei companii, si depasesc intotdeauna resursele de numerar. De aceea, primul test al situatiei financiare a unei companii este daca va avea suficient numerar pentru a-si acoperi datoriile pe termen scurt. Daca raspunsul la aceasta intrebare este negativ, compania este in pragul unei crize financiare.
a) Indicatorul lichiditatii curente
Indicatorul cel mai des folosit pentru aprecierea gradului de lichiditate este RLG. Acesta arata marja conferita firmei de activele sale curente in respectarea obligatiilor curente.
Se apreciaza ca intervalul de siguranta este intre 1.5 - 2.5. Marimea companiei si natura afacerii sunt elemente de care depinde aprecierea acestei rate ca buna sau rea.
S-ar parea ca o rata superioara a lichiditatii generale este de dorit ; este adevarat pana la un punct. Din punctul de vedere al investitorilor, o rata ridicata ar garanta recuperarea datoriilor in cazul unor pierderi foarte mari sau chiar al falimentului companiei. Cu toate acestea, mentinerea nejustificata a unei rate exagerate arata un management slab al capitalului de lucru. Poate fi costisitor sa-ti blochezi banii in stocuri supradimensionate, creante neincasate, sau disponibil in cont curent (cu dobanda la vedere).
Pe de alta parte o RLG redusa (apropiata de limita inferioara) nu trebuie privita neaparat ca o caracteristica negativa. Sunt multe companii care abia reusesc sa-si acopere nivelul obligatiilor curente cu activele curente. Ele reusesc sa se descurce in asemenea conditii deoarece activele lor circulante sunt foarte lichide si pot fi convertite in numerar imediat ce datoriile devin exigibile.
Este foarte important ca RLG, analizata separat, fara a tine cont de viteza de rotatie a activelor curente, poate conduce la erori, provenind din faptul ca este un indicator static, care masoara gradul de lichiditate al companiei ca si cum aceasta ar fi in pragul falimentului.
b) Indicatorul lichiditatii imediate
(Testul acid -Quick Ratio), cum mai este numit arata posibilitatea
de acoperire imediata a obligatiilor pe termen scurt, si se
calculeaza dupa relatia:
In unele lucrari
numaratorul formulei este reprezentat de " Disponibil + Creante
", indiferent daca aceste creante sunt certe sau mai putin
certe. Totusi optam pentru excluderea creantelor incerte, avand
in vedere ca acestea fie se vor incasa dupa o perioada mare de
timp, fie nu se vor incasa de loc - deci nu se pot "mobiliza " pentru a face
fata rapid necesarului de lichiditati.
Literatura de specialitate apreciaza ca o buna RLI este intre 0.5 si 1. Aceasta rata indica posibilitatea de acoperire imediata, cu activele cele mai lichide, a obligatiilor pe termen scurt, adica situatia in care societatea s-ar afla daca ar fi obligata sa-si inceteze activitatea imediat si sa-si plateasca datoriile cu scadenta sub 1 an. Ea reprezinta un test mult mai dur al lichiditatii firmei, de aceea mai este denumit si "testul acid ".
O alta denumire este de "quick ratio", deoarece arata capacitatea companiei de a-si plati datoriile curente cat mai curand ( quickly) posibil. Stocurile si creantele indoielnice se scad deoarece ele presupun trecerea unui anumit interval de timp pana la transformarea acestora in numerar.
Este important sa avem in vedere atat calitatea creante firmei ( identificarea si eliminarea creantelor indoielnice ) cat si calitatea titlurilor de plasament luate in calcul ( altfel spus, numai cele care pot fi transformate rapid si la valori anticipate in numerar).
Aceasta rata este intens folosita de bancile comerciale. Pe cand disponibilul reprezinta cel mai lichid tip activ si creantele reprezinta obligatia legala de a primi numerar, stocurile depind de succesul eforturilor de marketing si vanzare. Multe societati cu probleme financiare au rate ale lichiditatii generale excelente numai datorita existentei unor mari stocuri nevandabile.
Cazul in care Rata lichiditatii intermediare este prea mica constituie un semn de nesiguranta pentru finantator.
Indatorarea reprezinta masura in care fondurile folosite de o societate comerciala sunt asigurate de creditori si nu de proprietari. Totodata, solvabilitatea reprezinta capacitatea unei companii de a-si onora obligatiile fata de partenerii de afaceri din activele sale.
Trebuie facuta distinctie intre principalele interpretari referitoare la datoriile unei companii:
. imprumuturi pe termen lung
. imprumuturi pe termen lung + imprumuturi pe termen scurt (imprumuturi totale)
. imprumuturi pe termen lung + toate datoriile pe termen scurt (datorii totale)
Astfel, primele doua definitii se concentreaza pe imprumuturile purtatoare de dobanda (acordate de banci sau de alte institutii financiare), si sunt de obicei folosite in calculele indicatorilor efectuate la banca. Ultima definitie include imprumuturile si toate celelalte datorii (cum ar fi taxe, dividende neplatite, datorii catre furnizori etc.) Din punctul de vedere al companiei, toate aceste datorii sunt la fel de importante, afectandu-i activitatea in mod identic. Iata de ce datoriile totale sunt luate mai frecvent in calcul in cadrul indicatorilor de solvabilitate.
a) Indicatorul gradului de indatorare
(Long Term Debt to Equity Ratio)
Acest coeficient indica ponderea datoriei pe termen lung in capitalul propriu, mai exact arata modul de finantare a capitalului permanent pus la dispozitia companiei (surse proprii sau surse atrase).
Alte metode de evaluare a solvabilitatii companiei se bazeaza fie pe raportarea Datoriilor pe termen lung la Capitalul permanent, fie pe raportarea Capitalului propriu la Capitalul permanent (in exprimare procentuala)
b) Indicatorul de acoperire a dobanzilor (RAD - Debt Coverage Ratio/Burden Coverage)
Acest indicator trateaza solvabilitatea proiectelor de investitii. In esenta el indica de cate ori profitul din activitatea companiei inainte de plata dobanzilor acopera serviciul datoriei (rata anuala de rambursare a imprumutului plus plata dobanzilor aferente). RAD <1 arata ca sunt mari sanse ca firma sa nu-si poata plati datoriile. Acest indicator este de mare interes mai ales pentru creditori, care pot afla in ce masura isi vor putea recupera datoriile la data scadentei.
Acesti indicatori masoara eficacitatea unei companii in administrarea resurselor stabile si derularea activitatilor.
a).Viteza de rotatie a stocurilor (RS - Inventory Turnover)
Stocurile reprezinta adesea cea mai mare parte din capitalul de lucru al unei companii. De aceea, ca si creantele, trebuie rotite cat mai repede posibil. In caz contrar, compania a investit o mare parte din numerarul disponibil intr-un activ greu lichidabil. Costul stocarii include finantarea, inregistrarea, depozitarea, prezentarea, asigurarea, pierderea din degradare, uzura morala si furturile.
Spre deosebire de celelalte rate de rotatie, ce utilizeaza valoarea vanzarilor in formula , acest indicator foloseste costul bunurilor vandute, deoarece stocurile sunt inregistrate la cost de productie/ achizitie.
RS exprima viteza cu care o companie isi roteste stocurile necesare pentru a sustine o valoare data a vanzarilor. De asemenea, arata capacitatea conducerii de a reduce costul, mentinand fondurile blocate in stocuri la un nivel minim.
b).Viteza de rotatie a debitelor clienti
(Accounts Receivable Turnover)
Exprima viteza cu care o companie isi roteste creantele detinute pentru a realiza un anumit volum al vanzarilor. Ea demonstreaza capacitatea conducerii de a determina clientii sa plateasca rapid pentru bunurile si serviciile deja livrate.
Banii ce sunt blocati in creante sunt bani care nu pot fi utilizati in dezvoltare sau pentru constituirea de rezerve bancare purtatoare de dobanda. Atata timp cat sunt neincasate, aceste fonduri sunt neproductive pentru societate.
Invechirea creantelor contribuie la marirea perioadei medii de incasare a acestora. Existenta unor creante indoielnice indica posibilitatea aparitiei unor probleme in fluxul de lichiditati.
Indicatorul poate fi calculat fie utilizand valoarea creantelor de la sfarsitul anului fie utilizand media aritmetica a creantelor intre inceputul si sfarsitul anului. Totodata se mai practica si formula ce contine la numitor Vanzarile anuale pe credit, adica rulajul debitor anual al creantelor fata de clienti. Aceasta suma poate fi obtinuta prin scaderea din cifra de afaceri anuala a veniturilor din vanzare cu incasare imediata.
Este de dorit ca numarul de zile de rotatie a creantelor prin Cifra de afaceri/Vanzari pe credit sa fie cat mai mic.
c).Viteza de rotatie a creditelor furnizor
(Credit Days Ratio)
Exprima gradul de dependenta al companiei de finantarea pe baza creditului-furnizor.
Cresterea numarului de zile poate fi rezultatul deciziei conducerii de a apela la creditul furnizor pentru a rezolva unele probleme ale fluxului de lichiditati pe termen scurt.
Rezultatul obtinut trebuie analizat in raport de viteza de incasare a creantelor pentru a vedea daca sursele atrase din partea furnizorilor sunt mai mari decat sumele atrase de clientii companiei (aspect pozitiv).
d).Viteza de rotatie a activelor imobilizate
In unele domenii de activitate accesul este impiedicat de nivelul ridicat de active necesar pentru a genera venit. De exemplu, in domeniul rafinariilor este necesara constructia unei intregi platforme inainte ca orice venit sa poata fi obtinut. Prin folosirea raportului dintre CA si activele imobilizate putem observa daca intreprinderea investeste sume mari de bani in active, cu scopul de a putea avea vanzari. Acesta este un indicator eficace indeosebi atunci cand este comparat cu acelasi raport obtinut de alte companii din aceeasi bransa; daca alta companie a gasit o cale de a realiza vanzari profitabile cu o investitie mai scazuta in active, aceasta va genera mai multa plusvaloare.
e).Viteza de rotatie a activelor totale
Evalueaza eficacitatea managementului activelor totale (eficienta utilizarii tuturor bunurilor pe care intreprinderea le-a avut la dispozitie intr-un exercitiu financiar) prin examinarea valorii cifrei de afaceri generate de o anumita cantitate de active .
Profitul constituie punctul de interes maxim in majoritatea analizelor financiare. Toate celelalte rate servesc la luarea unor decizii care sa duca in final la maximizarea profitului.
Rentabilitatea reprezinta capacitatea unei companii de a realiza vanzari care depasesc costurile implicate pentru rezolvarea lor, costurile activitatilor.
O rata inalta permite luxul unor greseli ocazionale, erori care in conditiile unor afaceri mai putin profitabile ar fi dus firma in pierdere.
a).Rentabilitatea capitalului angajat
Reprezinta profitul pe care il obtine entitatea din banii investiti in afacere:
unde capitalul angajat se refera la banii investiti in entitate atat de catre actionari, cat si de creditorii pe termen lung, si include capitalul propriu si datoriile pe termen lung sau active totale minus datorii curente.
b). Marja bruta din vanzari
Acest indicator serveste la compararea activitatii companiei cu firmele concurente, costul bunurilor vandute variind foarte mult in functie de produsul realizat.
O tendinta ascendenta a acestui indicator duce la scaderea rentabilitatii companiei, iar o tendinta descendenta poate indica o rationalizare eficienta a costurilor.
c). Rezultatul pe actiune (Earning per share-EPS)
Face parte din grupul de indicatori de evaluare a pietei si
se refera la pretul actiunilor firmei comparat cu veniturile
si valoarea inregistrata pe actiune. Acesti indicatori
arata ce cred investitorii despre performantele trecute ale firmei
si despre perspectivele de viitor.
Se determina conform IAS 33:
Cristian DRAGOS, Elemente de econometria variabilelor calitative cu aplicatii in finante, Ed Presa Universitara Clujeana, 2006
Louise FRANCIS , Neural Networks Demystified, www.casact.org/pubs/forum
Politica de confidentialitate |
.com | Copyright ©
2024 - Toate drepturile rezervate. Toate documentele au caracter informativ cu scop educational. |
Personaje din literatura |
Baltagul – caracterizarea personajelor |
Caracterizare Alexandru Lapusneanul |
Caracterizarea lui Gavilescu |
Caracterizarea personajelor negative din basmul |
Tehnica si mecanica |
Cuplaje - definitii. notatii. exemple. repere istorice. |
Actionare macara |
Reprezentarea si cotarea filetelor |
Geografie |
Turismul pe terra |
Vulcanii Și mediul |
Padurile pe terra si industrializarea lemnului |
Termeni si conditii |
Contact |
Creeaza si tu |