Costruire modelli di scoring su dati reali. Formazione di un modello di punteggio per la valutazione del merito di credito di un mutuatario aziendale. Quali dati sono coinvolti nella costruzione del modello

Dubovitsky V.S.
analista presso una grande banca russa
(città di Mosca)
Gestione delle finanze aziendali
05 (65) 2014

Questo articolo descrive uno studio sullo sviluppo di un modello di punteggio per valutare l'affidabilità creditizia delle grandi imprese commerciali, che consente, sulla base dei valori dei singoli indicatori, di giudicare la solvibilità del mutuatario e valutarne l'efficacia. I blocchi più voluminosi nello sviluppo di un modello di scoring sono la scelta di un sistema di indicatori di valutazione e la determinazione dei coefficienti di peso per questi indicatori, che saranno trattati in dettaglio in questo articolo.

INTRODUZIONE

Una delle aree chiave di attività nel settore bancario è il prestito. Sono i prestiti che costituiscono la base delle attività bancarie, fornendo alla banca interessi attivi. Di recente, nel nostro Paese c'è stato un rapido sviluppo del settore bancario, in primo luogo rapporti di credito tra banche e popolazione, imprenditori e grandi imprese. I prestiti comportano non solo interessi attivi, ma anche rischi di credito associati all'insolvenza del mutuatario e alla perdita del prestito. La valutazione del rischio di credito è un'area chiave di analisi quando si prende una decisione sul prestito a un particolare mutuatario e il benessere di un istituto finanziario dipende in gran parte da questo.

Al giorno d'oggi, le banche utilizzano vari metodi di analisi, valutando il livello di possibili perdite e la probabilità di insolvenza del mutuatario. Sulla base di questa analisi, al mutuatario viene assegnato un rating di qualità - "buono", "medio" o "scarso", in conformità con il regolamento della Banca centrale della Federazione Russa n. 254-p "Sulla procedura per la formazione da parte degli enti creditizi delle riserve per eventuali perdite su mutui, mutui e debiti assimilati” 26 marzo 2004

La Banca centrale funge da principale regolatore del sistema creditizio e formula raccomandazioni sulla valutazione dell'affidabilità creditizia dei mutuatari. In accordo con loro, le banche costruiscono i propri modelli di valutazione: la loro diversità e ingegnosità dei loro autori sono sorprendenti. Tali modelli includono una valutazione completa della condizione finanziaria del mutuatario come principale indicatore della solvibilità futura. Tuttavia, tutti i modelli sono mirati al rating creditizio del mutuatario, che descrive il livello di rischio di perdita finanziaria. Secondo la classificazione generalmente accettata, un buon livello di affidabilità creditizia corrisponde a una buona condizione finanziaria dell'impresa e un basso rischio di possibili perdite, medio - una condizione finanziaria e rischi medi, cattivo - ad un'alta probabilità di insolvenza da parte del mutuatario. In buone condizioni, molto probabilmente, verrà presa una decisione positiva sull'emissione di un prestito, la media richiederà ulteriori ricerche e un cattivo mutuatario verrà negato.

La valutazione del rischio di credito nelle banche ha sempre occupato una posizione significativa. Quindi, secondo una ricerca di Bailey e Gately, metodi esistenti le valutazioni sono in costante miglioramento, con nuove tecniche che emergono di volta in volta, come la valutazione tramite reti neurali, a causa dell'elevata domanda da parte degli istituti di credito per ottimizzare e migliorare la capacità predittiva degli strumenti per valutare la probabilità di insolvenza dei potenziali mutuatari.

Pertanto, la valutazione della solvibilità è un compito chiave quando si emette un prestito. Lo scopo di questo lavoro è quello di creare il nostro modello di scoring per valutare la qualità del credito persone giuridiche. Sarà progettato per le grandi imprese vedere al dettaglio e ti consentirà di prendere rapidamente una decisione sull'opportunità di finanziare vari mutuatari.

In primo luogo, verrà effettuata una breve analisi comparativa degli approcci esistenti per valutare l'affidabilità creditizia. Sulla sua base, verranno fornite argomentazioni a favore dello sviluppo di un modello di punteggio, quindi verrà sviluppato direttamente un modello di punteggio utilizzando vari metodi teorici. Uno dei compiti principali nello sviluppo è la definizione di una Balanced Scorecard che tenga conto del settore selezionato e la determinazione dei fattori di ponderazione per questi indicatori.

Successivamente, verrà effettuato uno studio statistico sulla base di un campione di 41 esercenti (per 16 di essi si è registrato il default) al fine di confrontare i risultati per peso indicatore con i risultati ottenuti inizialmente. Sulla base dei risultati del confronto, verrà fornita una conclusione sulla correttezza del modello di punteggio compilato. Alla fine di questo articolo, verrà presentata una valutazione dell'efficacia del modello sviluppato, verrà determinata la capacità predittiva del modello sviluppato e si trarrà una conclusione sulla sua fattibilità.

DIVERSI APPROCCI ALLA VALUTAZIONE DEL CREDITO

Tutti i modelli esistenti per la valutazione del merito creditizio dei mutuatari possono essere rappresentati dalla seguente classificazione (Fig. 1).

Quindi, la varietà di approcci all'analisi del merito di credito può essere sistematizzata dividendo tutti i metodi in tre grandi blocchi:

  • modelli quantitativi;
  • modelli predittivi;
  • modelli di qualità.

I modelli quantitativi utilizzano indicatori pertinenti e consentono di assegnare un determinato rating al mutuatario sulla base di essi, i modelli predittivi si basano su statistiche passate e mirano a modellare ulteriori sviluppi e la probabilità di insolvenza del mutuatario, mentre i modelli qualitativi utilizzano un sistema di indicatori qualitativi versatili.

Per determinare l'approccio più efficace per valutare l'affidabilità creditizia, confrontiamo i metodi di valutazione descritti. A tavola. 1 sono riportate le caratteristiche comparative dei modelli di valutazione del credito precedentemente considerati.

Tabella 1. Tabella riassuntiva dei modelli di rating del credito

Nome del modello Vantaggi del modello Svantaggi del modello
Metodo dei coefficienti Consente di valutare in modo completo le condizioni finanziarie del mutuatario Non tiene conto degli indicatori di qualità, delle statistiche degli anni precedenti. Un sistema non automatizzato richiede un'interpretazione costante dei valori dei singoli indicatori
Modelli di valutazione Consentono di automatizzare la valutazione con il metodo dei coefficienti calcolando l'indicatore integrale. Differiscono per praticità e facilità d'uso Prendono in considerazione solo indicatori finanziari, non utilizzano statistiche degli anni precedenti. Richiedere la ristrutturazione per diversi tipi di società
Modelli di punteggio Consentono di ottenere una valutazione della solvibilità in un punto equivalente e di assegnare il mutuatario a uno dei tre gruppi. Semplice e facile da usare, aiuta a valutare gli indicatori di qualità non finanziari. Nel valutare i coefficienti di ponderazione con metodi statistici, consentono di tenere conto dei dati sui prestiti già emessi, sono economicamente giustificati Non universali, richiedono la ristrutturazione per alcuni tipi di società. Richiede una grande quantità di dati per studiare i coefficienti di ponderazione
Modelli di flusso di cassa Consente di stimare i flussi di cassa futuri dell'azienda e confrontarli con il carico del debito Non tengono conto delle condizioni di mercato e degli indicatori di qualità della società mutuataria. Può produrre risultati incoerenti
Modelli di analisi discriminante Consentono di determinare la probabilità di default della società mutuataria sulla base delle statistiche degli anni precedenti
Modelli di regressione Consentono di determinare la probabilità di default della società debitrice sulla base delle statistiche degli anni precedenti. Quando si utilizza il modello sui dati corretti, è possibile ottenere risultati con un elevato grado di certezza Puramente empirici, i risultati dipendono fortemente dal campione di addestramento e quando si studia il modello su altri dati, spesso non corrispondono alla realtà. Richiede una grande quantità di dati per studiare i coefficienti di ponderazione
Modelli di analisi qualitativa Consenti di spendere analisi complessa aziende L'assenza di metodi matematici, che porta a una valutazione soggettiva dei singoli indicatori ed errori associati al fattore umano. Non tenere conto delle statistiche degli anni precedenti. Non esistono regole chiare per la valutazione del merito di credito per i blocchi di analisi della qualità

Sulla base dell'analisi comparativa di cui sopra, possiamo concludere che il modello di punteggio è al vertice dell'evoluzione quantitativa Nome del modello Vantaggi del modello Svantaggi del modello

Metodo del rapporto Consente una valutazione completa della condizione finanziaria del mutuatario Non tiene conto degli indicatori di qualità, delle statistiche degli anni precedenti. Un sistema non automatizzato richiede un'interpretazione costante dei valori dei singoli indicatori

Modelli di rating Consentono di automatizzare la valutazione con il metodo dei coefficienti calcolando l'indicatore integrale. Si distinguono per praticità e facilità d'uso, tengono conto solo degli indicatori finanziari, non utilizzano statistiche degli anni precedenti. Richiedere la ristrutturazione per diversi tipi di società

Modelli di scoring Consentono di ottenere una valutazione del merito creditizio in punti equivalenti e di assegnare il mutuatario ad uno dei tre gruppi. Semplice e facile da usare, aiuta a valutare gli indicatori di qualità non finanziari. Quando si valutano i coefficienti di ponderazione con metodi statistici, consentono di tenere conto dei dati sui prestiti già emessi, sono economicamente giustificati Non universali, richiedono ristrutturazioni per alcuni tipi di società. Richiede una grande quantità di dati per studiare i coefficienti di ponderazione

Modelli di flussi di cassa Consentono di stimare i flussi di cassa futuri dell'azienda e di confrontarli con il carico del debito Non tengono conto delle condizioni di mercato e degli indicatori di qualità dell'azienda richiedente. Può produrre risultati incoerenti

Modelli di analisi discriminanti Consentono di determinare la probabilità di insolvenza dell'azienda affidataria sulla base delle statistiche degli anni passati I risultati, puramente empirici, sono fortemente dipendenti dal campione formativo e quando si studia il modello su altri dati, spesso non corrispondono a la realtà. Richiede una grande quantità di dati per studiare i coefficienti di ponderazione

Modelli di analisi di regressione Consentono di determinare la probabilità di insolvenza della società debitrice sulla base delle statistiche degli anni precedenti. Quando si utilizza il modello sui dati corretti, è possibile ottenere risultati con un alto grado di affidabilità: questi sono puramente empirici, i risultati dipendono fortemente dal training set e, quando si studia il modello su altri dati, spesso non corrispondono a la realtà. Richiede una grande quantità di dati per studiare i coefficienti di ponderazione

Modelli di analisi qualitativa Consentono un'analisi completa dell'azienda Assenza di metodi matematici, che porta a una valutazione soggettiva dei singoli indicatori ed errori associati al fattore umano. Non tenere conto delle statistiche degli anni precedenti. Non esistono regole chiare per la valutazione del merito di credito per i blocchi di analisi della qualità importo diverso punti. I valori dei coefficienti saranno ulteriormente suddivisi in range. Per ogni intervallo (colonna Intervallo coefficienti nella Tabella 2), verrà impostata una percentuale (25%, 50%, 75% o 100%) del coefficiente di ponderazione nella Tabella 2. 2. Il fattore di ponderazione in questo caso è il punteggio massimo. Di seguito, ci concentreremo sulla ricerca dei coefficienti di peso. Pertanto, la suddivisione dei coefficienti in intervalli è condizionata (basata su considerazioni logiche basate sui valori di questi indicatori per varie aziende del settore; gli intervalli sono presi in modo tale che circa il 60% delle aziende leader del settore industria (Magnit, Dixy) rientrano nel secondo intervallo dopo il massimo , X5 Retail Group, OK, L'Etoile) selezionati per determinare i coefficienti medi di mercato e i benchmark). abbassare il numero di punti che l'indicatore dovrebbe ricevere coefficienti e sarà rappresentato da due approcci: analitico (metodo di T. Saaty) e statistico (studio di regressione) (il numero massimo di punti in questo caso coincide con il coefficiente di peso). i coefficienti stessi saranno determinati in seguito.

Indicatori finanziari modello di punteggio sono presentati in Tabella. 2.

Tabella 2. Indicatori finanziari del modello di scoring

Gruppo indicatore Indice Gamma di coefficienti
Liquidità > 0,75 1
0,5-0,75 0,75
0,25-0,5 0,25
0-0,25 0
Solvibilità 0-1 1
1-1,5 0,75
1,5-2 0,5
2-2,5 0,25
> 2,5 0
< 1,5 1
1,5-2 0,5
> 2 0
Rapporto di copertura degli interessi, EBIT/Interessi > 1,5 1
1,3-1,5 0,75
1-13 0,5
< 1 0
Attività economica Ritorno sulle vendite, ROS > 0,025 1
0,02-0,025 0,75
0,015-0,02 0,5
< 0,015 0
Perdita della società per gli ultimi tre periodi di riferimento NO 1
Per un periodo di riferimento 0,5
0

I valori del rapporto ammissibile sono stati determinati sulla base dei valori medi per le cinque principali società commerciali in Russia sulla base delle dichiarazioni IFRS per tre anni: Magnit, X5 Retail Group, Dixy, OK, M.Video. Abbiamo esaminato gli indicatori finanziari più importanti per determinare la condizione finanziaria del mutuatario. Tuttavia, l'affidabilità creditizia dell'azienda è fortemente influenzata anche da fattori che provocano l'insorgere di rischi nei processi aziendali del debitore. Prima di tutto, è necessario tenere conto della qualità della gestione. Questo è un indicatore molto difficile per l'analisi quantitativa, perché. è problematico valutare obiettivamente il livello della gestione aziendale.

Cercheremo di passare dalla valutazione qualitativa a quella quantitativa e fissare la valutazione massima di questo indicatore alle seguenti condizioni:

  • c'è una chiara strategia per lo sviluppo dell'azienda per i prossimi anni;
  • la composizione del top management non è cambiata (il direttore generale e il capo contabile sono in carica da più di due anni), perché la presenza di un forte gruppo dirigente è testimoniata, tra l'altro, dalla sua costanza;
  • le competenze professionali corrispondono elevati requisiti(disponibilità del profilo istruzione superiore Direttore generale e capo contabile, esperienza lavorativa - più di cinque anni).

Il prossimo fattore importante da includere nel modello di punteggio è la vita dell'azienda. Inoltre, è necessario introdurre un fattore di arresto: se il periodo di attività è inferiore a un anno questo modello non sarà applicabile a causa della mancanza di rendicontazione e della capacità di comprendere l'attività dell'azienda.

Un altro indicatore necessario è una storia creditizia positiva. Questo è uno degli indicatori non finanziari più importanti, che caratterizzano, infatti, la qualità del servizio di un prestito futuro. Sarebbe irragionevole contare sul rimborso tempestivo dei fondi di credito da un'impresa che ha ritardi nei confronti di altri creditori. Presentiamo gli indicatori non finanziari considerati e la distribuzione dei punti per loro in Tabella. 3.

Tabella 3. Indicatori non finanziari del modello di scoring

Gruppo Indicatori indicatori Percentuale del punteggio massimo per l'intervallo
Processi di business Qualità gestionale 1
0,5
0
> 5 anni 1
3-5 anni 0,75
1-3 anni 0,25
< 1 года Fattore di arresto
1
0,5
0
La presenza di un ritardo sistematico nei prestiti e nei prestiti per l'ultimo esercizio; un importo significativo di debiti scaduti (> 25%) Fattore di arresto

Abbiamo compilato un sistema di indicatori di valutazione che, a nostro avviso, dovrebbero valutare in modo completo e completo la qualità del mutuatario e la sua capacità di adempiere ai propri obblighi. La parte successiva del lavoro, durante la creazione di qualsiasi modello di punteggio, è quella che richiede più tempo: determinare il peso di vari indicatori stimati. Il valore predittivo del nostro modello dipende da quanto oggettivamente valutiamo l'importanza di determinati fattori. Questo articolo analizzerà i pesi sulla base di diversi metodi per eliminare possibili errori.

I coefficienti di ponderazione saranno dapprima determinati mediante procedure analitiche e poi confrontati con i risultati dell'analisi di regressione.

STIMA ANALITICA DEI COEFFICIENTI DI PONDERAZIONE DEL MODELLO

Come strumento di valutazione, prenderemo la metodologia descritta in dettaglio nel libro TL. Saaty "Modelli matematici di situazioni di conflitto" [b]. Questo metodo consente di allontanarsi dalla varietà di fattori e confrontarne solo due per significato in un determinato momento, determinando in ultima analisi il significato dell'influenza di ciascuno dei fattori su qualsiasi indicatore generale. La tecnica si basa sulla compilazione di matrici di confronti accoppiati, costruite per fattori che influenzano qualsiasi indicatore comune. Tali matrici possono essere costruite, ad esempio, per l'indicatore di solvibilità nell'ambito dei fattori rappresentati dai coefficienti di leva finanziaria, onere del debito e copertura degli interessi. Il compito è costruire tali matrici per tutti i gruppi di fattori che influenzano qualsiasi indicatore generale. Di conseguenza, verranno create due matrici per la tabella. 2 - per i gruppi di indicatori "Solvibilità" e "Attività aziendale", una matrice per tabella. 3 - per indicatori di processi aziendali, nonché due matrici per livelli aggregati - una matrice per un gruppo di indicatori finanziari, costituita da gruppi di indicatori "Liquidità", "Solvibilità" e "Attività aziendale", e una per due blocchi aggregati - indicatori finanziari e non finanziari in genere.

Ci sono cinque matrici di confronto a coppie in totale, ognuna delle quali fornirà il proprio coefficiente per l'indicatore incluso in essa. Pertanto, per ottenere un fattore di ponderazione per una misura in fondo alla gerarchia, ad esempio per il tasso di copertura degli interessi, è necessario moltiplicare il fattore di ponderazione degli indicatori finanziari per il fattore di ponderazione degli indicatori di solvibilità all'interno degli indicatori finanziari e dal coefficiente dell'indicatore di copertura degli interessi all'interno degli indicatori finanziari.

Nelle intestazioni delle matrici stesse per gruppi di indicatori, i nomi dei fattori sono collocati in colonne verticali e orizzontali. Quindi le matrici vengono riempite con valori che rappresentano la trasformazione delle preferenze soggettive di un fattore in un altro visione empirica secondo la metodologia presentata in tabella. 4 (utilizzando i dati della Fig. 2).

Tabella 4. Metodo di T. Saaty. Classificazione delle preferenze (basata sulla Fig. 2)

Vengono utilizzati principalmente numeri dispari, tuttavia, se è difficile scegliere, puoi utilizzare quelli pari come livello medio tra due numeri dispari. Un esempio di tale matrice per quattro fattori è mostrato in Fig. 2. Di conseguenza, quando confrontiamo lo stesso fattore, l'elemento assume il valore 1, quindi tali matrici sono identità. È facile vedere che sono anche inversamente simmetrici, il che ci consente di riempire tale matrice solo per i valori che si trovano sopra o sotto la diagonale principale.

Dato che le matrici dei confronti a coppie sono inversamente simmetriche, si dovrebbe confrontare solo in una direzione e inserire i valori corrispondenti nella matrice sopra la diagonale principale, mentre i valori sotto la diagonale principale saranno invertiti.

Dopo aver ricevuto cinque di queste matrici, vengono calcolati i coefficienti di peso: verrà misurato il peso di ciascun valore nelle matrici rispetto alla somma totale nella colonna, quindi da questi valori verrà presa la media aritmetica di questi valori in ogni riga. I valori medi aritmetici saranno i coefficienti di peso. Un esempio di matrice per un gruppo di indicatori di solvibilità è mostrato in fig. 3.

Effettuati i calcoli descritti, si ottiene il peso specifico di ciascun indicatore. Per comodità di ulteriori calcoli, definiamo il punteggio massimo possibile come il prodotto del peso specifico dell'indicatore per 50 1, seguito da arrotondamento a un numero intero (Tabella 5.6).

1 Questa operazione è fatta solo per comodità, il numero 50 permette di portare il coefficiente minimo ad un valore intero (in questo caso il valore 2). Poiché tutti i coefficienti sono moltiplicati per lo stesso numero, non distorciamo i risultati dell'approccio analitico. - Circa. ed.

DETERMINAZIONE DEL SIGNIFICATO DEGLI INDICATORI MEDIANTE L'ANALISI DI REGRESSIONE

Per condurre uno studio statistico, abbiamo utilizzato i dati su 41 grande azienda dal settore della vendita al dettaglio. Queste società hanno emesso obbligazioni societarie e 16 obbligazioni sono andate in default. Per ciascuna società, sono stati calcolati otto indicatori selezionati del modello di scoring sulla base delle relazioni annuali nell'anno di emissione delle obbligazioni societarie. Il campione è presentato nell'Appendice 1. Contiene un indicatore esplicativo y - la probabilità di default, che assume il valore 1 se la società non ha adempiuto ai propri obblighi. I tre indicatori selezionati sulla destra sono stati impostati come variabili fittizie (possono assumere solo valori pari a 0 o 1) per la loro natura qualitativa. Prendono i valori 1 se negli ultimi tre anni la società ha un utile netto > O (Nl > 0), un management team stabile e di alta qualità (manager) e una storia creditizia positiva (histor). Gli indicatori finanziari (i primi cinque indicatori) sono stati calcolati sulla base dei bilanci annuali secondo i principi IFRS nell'anno di emissione delle obbligazioni in default.

Come modello per lo studio, scegliamo la costruzione di una regressione multivariata lineare:

p = w 0 + w 1 x 1 + w 2 x 2 + ... + w n x n ,

dove p è la variabile dipendente che descrive la probabilità di default;
w - coefficienti di peso; x - indicatori.

Quindi, inseriamo i dati iniziali in Excel e utilizziamo la funzione Analisi dei dati - Regressione. Analizzando i dati iniziali per otto indicatori del modello di punteggio senza aggiustamenti, otteniamo il risultato presentato nell'Appendice 2. R^2 aggiustato è 0,55 - un valore basso ma accettabile, che indica il significato pratico della regressione costruita. È possibile avanzare un'ipotesi sul motivo della scarsa significatività della presenza di valori anomali nei dati, ad esempio l'assenza di valori per alcune società in termini di EBIT/Interessi per mancanza di carico del debito ( semplificato, ai fini dello studio si è assunto in questo caso il valore del coefficiente pari a 0) o il valore negativo dell'indicatore Debito/EBITDA a fronte del negativo flusso di cassa. In questo caso l'influenza di un indicatore negativo viene percepita in modo errato, perché, secondo la logica dello studio, maggiore è il Debito/EBITDA, maggiore è la probabilità di default; un indicatore negativo, a sua volta, non è un indicatore di un basso onere del debito. Inoltre, la capacità predittiva è influenzata dalle aziende con valori estremi pronunciati dei singoli indicatori. Quindi, la società Banana-Mama ha un capitale proprio di 10.000 rubli, il che porta a una distorsione degli indicatori corrispondenti: la leva finanziaria è di 181.957 (con valori medi del settore compresi tra 0,7 e 1,5).

Tabella 5. Indicatori finanziari che tengono conto del peso

Indice Peso nella scorecard Punteggio massimo Gamma di coefficienti
>1 5
Indice di liquidità corrente 0,1072 5 > 1 5
0,75-0,1 4
0,5-0,75 1
0-0,5 0
Indice di liquidità corrente 0,1581 8 < 1 8
1-1,5 6
1,5-2 4
2-2,5 2
> 2,5 0
Indice di carico del debito, indebitamento netto / EBITDA 0,1581 8 < 1.5 8
1,5-2 4
> 2 0
0,0790 4 > 1,5 4
1,3-1,5 3
1-1,3 2
< 1 0
Ritorno sulle vendite, ROS 0,1256 6 > 0,025 6
0,02-0,025 5
0,015-0,02 3
< 0,015 0
0,0418 2 NO 2
Per un periodo di riferimento 1
Per due o più periodi di rendicontazione 0
Totale 0,6698 33 - 68

Escludiamo dallo studio le seguenti sei società: supermercato Gorod, Intertrade, M.Video (2013), Svyaznoy, Banana-Mama e Proviant. Notiamo anche l'impossibilità di utilizzo simultaneo degli indicatori ROS e l'assenza di perdite (Nl > 0) a causa della loro elevata correlazione. Il fatto è che se l'azienda ha delle perdite, la redditività delle vendite assume automaticamente un valore negativo.

Tabella 6. Indicatori non finanziari per peso

Indice Peso nella scorecard Punteggio massimo Intervallo del rapporto / Metodologia di stima Numero di punti per la fascia di peso
Qualità gestionale 0,099 5 Adempimento di tutte le condizioni descritte 5
Mancato rispetto di una delle condizioni 2,5
Mancato rispetto di più di una condizione 0
La vita dell'azienda 0,0528 3 > 5 anni 3
3-5 anni 2
1-3 anni 1
< 1 года Fattore di arresto
Storia creditizia positiva 0,1782 9 Assenza di morosità su mutui e mutui, debiti scaduti 9
Disponibilità di informazioni sulla ristrutturazione del debito; ritardi insignificanti nei conti da pagare (fino al 10%) 4,5
Un solo caso di mora su prestiti e crediti con successiva restituzione; ritardi significativi nei conti da pagare (10-25% del debito totale) 0
La presenza di un ritardo sistematico nei prestiti e nei prestiti per l'ultimo esercizio; Importo significativo dei debiti scaduti (>25%) Fattore di arresto
Totale 17

Sulla base di queste considerazioni, rimuoviamo l'indicatore Nl > 0 dal nostro modello. Per una nuova regressione a sette fattori su un campione aggiornato di 35 società, otteniamo il seguente risultato (Appendice 3). Vediamo che sei dei sette indicatori studiati sono significativi. I segni ai coefficienti riflettono correttamente le ipotesi fatte in precedenza: maggiore è la redditività delle vendite e la qualità della gestione, minore è la probabilità di default (y = 1), e viceversa: maggiore è il carico di indebitamento, maggiore è la probabilità di default. A prima vista, il segno non è corretto solo per l'attuale indice di liquidità. Tuttavia, valori di liquidità elevati sono altrettanto negativi di quelli piccoli: indicano una bassa efficienza aziendale e profitti persi. Le società con elevati indici di liquidità sono soggette a perdite di profitti, bassa redditività e redditività aziendale, il che le rende meno attraenti agli occhi dei potenziali investitori e quindi più vulnerabili ai cambiamenti delle condizioni finanziarie. I più significativi sono i coefficienti D (o Debito - il volume del debito fruttifero) / EBITDA, storia creditizia positiva e leva finanziaria; il rapporto di copertura degli interessi è insignificante.

Sopra, modellando i coefficienti utilizzando il metodo T. Saaty, abbiamo anche ipotizzato che gli indicatori più significativi sarebbero stati i coefficienti per il carico del debito e la leva finanziaria. L'analisi comparativa del significato finale dei coefficienti è riportata in Tabella. 7.

Tabella 7. Analisi comparativa della significatività dei coefficienti

Indicatore basato su valutazioni di esperti secondo il metodo di T. Saaty Coefficiente Indicatore basato sull'analisi di regressione valore p
Storia creditizia positiva 0,1782 Indice di carico del debito, indebitamento netto / EBITDA 0,014
Rapporto di leva finanziaria 0,1581 Storia creditizia positiva 0,020
Indice di carico del debito, indebitamento netto/EBITDA 0,1581 Rapporto di leva finanziaria 0,022
Ritorno sulle vendite, ROS 0,1256 Qualità gestionale 0,037
Indice di liquidità corrente 0,1072 Ritorno sulle vendite, ROS 0,039
Qualità gestionale 0,099 Indice di liquidità corrente 0,047
Rapporto di copertura degli interessi, EBIT / Interessi 0,0790 Rapporto di copertura degli interessi, EBIT / Interessi Insignificante
Perdita della società per gli ultimi tre periodi di riferimento 0,0418 Perdita della società per gli ultimi tre periodi di riferimento È stato studiato come un indicatore non finanziario, insignificante

Questi risultati indicano la coerenza del metodo di T. Saaty e dei dati statistici. I tre indicatori più significativi secondo l'approccio analitico confermano la loro elevata significatività in ricerca pratica, è cambiata solo la distribuzione dell'ordine degli indicatori stessi. Inoltre, i due indicatori meno significativi per la prima parte del lavoro - la qualità della gestione e l'EBIT / Interessi - si sono rivelati insignificanti nello studio statistico.

Pertanto, l'analisi di regressione conferma i principi di classificazione del significato dei coefficienti di peso nella parte analitica del lavoro e ci consente di parlare della significatività statistica del modello di punteggio costruito.

DETERMINAZIONE DEI RISULTATI DEL MODELLO DI PUNTEGGIO SVILUPPATO

Il punteggio massimo totale del modello di scoring è 50. Per ciascun indicatore, nel processo di determinazione degli intervalli di valori, è stato individuato il livello successivo al punteggio massimo, anch'esso accettabile, seppur con un livello di rischio relativamente elevato, basato sui valori di mercato degli indicatori. Per alcuni indicatori, il livello successivo al massimo era del 75% del numero totale di punti, per altri del 50%. Tutti i livelli successivi saranno considerati livelli ad alto rischio di credito ei corrispondenti mutuatari saranno classificati a sofferenza. Il gruppo più preferibile comprende i mutuatari che soddisfano i requisiti massimi per gli indicatori più significativi (in termini di coefficienti di ponderazione): storia creditizia, leva finanziaria e carico del debito, nonché ritorno sulle vendite per un importo di 31 punti e adempimento di almeno il seguente livello massimo di requisiti per altri indicatori - 12,5 in totale. Totale 43,5 punti per il livello inferiore di elevata affidabilità creditizia.

Per determinare l'intervallo limite che caratterizza un alto grado affidabilità creditizia, calcolare il numero di punti per gli indicatori finanziari e non finanziari nel successivo dopo l'intervallo massimo di valori dalla tabella. 5 e b. Gli indicatori sono divisi in base ai valori accettati dei coefficienti in altri intervalli. Otterremo la seguente classificazione (Tabella 8).

Tabella 8. Classificazione dei risultati

Tabella 9. Capacità predittiva del modello di punteggio, %

Basato su tabella. 8, valuteremo la capacità predittiva del nostro modello sostituendo i dati aziendali nelle sue condizioni. L'Appendice 4 mostra i punteggi calcolati per le aziende intervistate. A seconda del valore dell'indicatore, il suo punteggio è stato inserito nella tabella secondo il modello sviluppato, quindi tutti i punteggi sono stati riassunti in un indicatore integrale (colonna “Somma”). Sulla base dei punteggi totali le imprese sono state suddivise in tre classi, quindi il dato è stato confrontato con l'effettiva presenza o meno di un default da parte dell'azienda. Nella colonna "Vero o no", 1 indica il risultato corretto del modello di punteggio, 0 - un errore. Pertanto, abbiamo ottenuto il seguente risultato (Tabella 9).

Abbiamo ottenuto un risultato medio (relativo a quelli descritti in varie fonti) per la capacità predittiva dei modelli di scoring. Tuttavia, vale la pena notare la bassa percentuale di errori di tipo II, che aumenta il valore predittivo del nostro modello. Questo risultato può essere considerato positivo e conferma l'efficacia dello studio.

CONCLUSIONE

In questo lavoro è stato proposto un modello di punteggio per valutare l'affidabilità creditizia delle grandi imprese del commercio al dettaglio. Il modello si basa su un insieme di indicatori di performance che consentono di valutare in modo complessivo la condizione finanziaria e non finanziaria del debitore.

Sulla base degli esiti della valutazione, all'affidato viene assegnata una delle tre classi di merito creditizio, che caratterizza il grado di rischio di credito e la fattibilità dell'affidamento.

Abbiamo modellato un sistema di indicatori di performance che ci consentono di valutare con la massima precisione la condizione di un mutuatario del settore retail. Dopo aver analizzato i leader del mercato al dettaglio e aver calcolato gli indicatori utilizzati per loro, abbiamo determinato i limiti dei valori accettabili per loro e li abbiamo classificati per diversi gruppi con diverse percentuali del punteggio massimo possibile.

Il compito più dispendioso in termini di tempo è stato determinare i coefficienti di peso per gli indicatori studiati. Si è concluso che è necessario un approccio integrato a causa della mancanza di un metodo ideale. Un approccio complessoè stato implementato come segue: nella prima parte del lavoro i coefficienti di peso sono stati determinati mediante procedure analitiche e nella seconda parte mediante uno studio statistico.

Il modello sviluppato ha mostrato risultati elevati nella capacità predittiva, mentre non richiede grandi costi di risorse per l'analisi. La messa in servizio del sistema di punteggio sviluppato aumenterà l'efficienza del processo decisionale del credito nel campo delle grandi imprese al dettaglio e ottimizzerà il processo di credito.

Letteratura

1. Ayvazyan S.A., Mkhitaryan a.C. Statistica applicata e fondamenti di econometria. - M.: GU HSE, 1998.

2. Gavrilova A.H. Finanze dell'organizzazione. - M.: Knorus, 2007.

3. Korobova G.G., Petrov M.A. Solvibilità di un mutuatario bancario e sua valutazione in un ambiente competitivo // Servizi bancari. -2005. - N. 7/8. -C. 22-24.

4. Kulikov N.I., Chainikova L.I. Valutazione del merito di credito dell'impresa-debitrice. - Tambov: Università di TSTU, 2007.

5. Regolamento della Banca centrale della Federazione Russa n. 254-P "Sulla procedura per la formazione da parte degli istituti di credito di riserve per eventuali perdite su prestiti, prestiti e debiti equivalenti" del 26 marzo 2004 - http:// base.garant.ru/584458/.

6. Saati TL Modelli matematici di situazioni di conflitto / Ed. I.A. Ushakov. - M.: Radio sovietica, 1977.

7. Sheremet A.D., Saifulin R.C., Negashev H.B. Metodologia analisi finanziaria. - M.: Infra-M, 2001.

8. Abdou HA, Pointon J. (2011). "Credit scoring, tecniche statistiche e criteri di valutazione: una rassegna della letteratura". Sistemi intelligenti in contabilità, finanza e gestione, vol. 18, n. 2-3, pp. 59-88.

9. Bailey M. (2004). Qualità del Credito al Consumo: Assunzione, Scoring, Prevenzione Frodi e Incassi. White Box Publishing, Kingswood, Bristol.

10. Crook J., Edelman D., Thomas L. (2007). "Recenti sviluppi nella valutazione del rischio di credito al consumo". Giornale europeo di ricerca operativa, vol. 183, n. 3, pagg. 1447-1465.

11. Gately E. (1996). Reti neurali per previsioni finanziarie: le migliori tecniche per progettare e applicare i più recenti sistemi di trading. New York: JohnWiley & Sons, Inc.

12. Guillen M., Artis M. (1992). Count Data Models for a Credit Scoring System: the European Conference Series in Quantitative Economics and Econometrics on Econometrics of Duration, Count and Transition Models. Parigi.

13. Heffernan S. (2004). bancario moderno. John Wiley & Sons, Inc., Chichester, West Sussex.

14. Liang D. (2003). "Difficoltà finanziarie aziendali in Cina: un'analisi empirica utilizzando modelli di punteggio di credito". Hitotsubashi Journal of Commerce and Management, vol. 38, n. 1, pagg. 13-28.

ALLEGATO 1.

Campione di studio

Azienda y / Contrassegno predefinito Indice di liquidità corrente EBIT / Interessi/ Rapporto EBIT/interessi NI > 0/ Presenza di utile netto
1 Farmacia 36.6 0 0,82 1,32 2,41 1,83 0,0496 1 1 1
2 L "Etoile 0 5,04 2,75 10,98 1,64 0,007 1 1 1
3 Abbaio 0 0,795 0,77 3,13 1,89 0 0 1 1
4 Nastro 0 0,75 9,7 2,91 3,1 0,049 1 1 1
5 OK 0 0,67 0,78 1,59 7,01 0,0357 1 1 1
6 Automondo 0 1,2 0,65 3,09 1,35 0,04 1 1 1
7 Х5 Gruppo al dettaglio 0 0,55 0,53 3,32 2,82 0,027 1 1 1
8 Città 0 0,99 18,97 10,25 1,29 0,01 1 1 0
9 Il mondo del bambino 0 0,93 0,83 2,14 3,99 0,032 1 1 1
10 Dixie 0 0,77 1,19 6,1 1,78 0,01 1 1 1
11 InterTrade 0 1,24 20,65 4,92 2,1 0,015 1 1 0
12 Giostra 0 0,73 0,68 3,175 1,71 0,059 1 1 1
13 centesimo 0 0,68 2,93 7,03 1,82 0 0 1 1
14 Gruppo Kosmo 0 1,64 1,11 2,88 2,65 0,043 1 1 1
15 Magnete 0 E 0,54 1,11 10,2 0,061 1 1 1
16 Magnolia 0 0,27 2,35 3,55 1,02 0,064 1 1 1
17 M.Video (2007) 0 1,31 0,73 1,9 2,58 0,013 1 1 1
18 M.Video (2013) 0 0,95 0 0 0 0,039 1 1 1
19 JSC "NTS" 0 1,18 3,09 5,44 1,05 0,21 1 0 1
20 Scarpe della Russia 0 0,87 2,34 1,87 5,65 0,1 1 1 1
21 Crocevia (2005) 0 0,54 1,09 3,16 3,92 0,026 1 1 1
22 Pivdom 0 1,99 3 8 1,1 0,0006 1 0 1
23 Famiglia 0 10 0,28 1,66 6 0,58 1 1 1
24 Svyazny 0 1,07 0 0 0 0,001 1 1 1
25 Elekam 0 1,44 1,82 4,25 1,3 0,01 1 1 1
26 Macro 1 1 15 11 1,52 0,01 1 0 1
27 Prestigio espresso 1 8 0,98 12,43 1,02 0,002 1 0 1
28 Prestigio dell'Arbat 1 0,49 1,81 7,6 1,45 0,017 1 1 0
29 Orchidea 1 3 1,164 13 0 0,01 1 0 1
30 mamma banana 1 0,94 181957 -35 -0,6 -0,033 0 1 0
31 fregata bianca 1 7 932 8,76 0,88 -0,4 0 1 1
32 Marta 1 3,96 20 11 1/17 0,003 1 1 1
33 Matrice 1 2,38 21 6,82 1 0,001 1 0 0
34 Mercurio
(autoelogio)
1 1,12 9,98 7,32 1,27 0,003 1 1 1
35 Minnesota 1 0,79 4,39 12 0,12 -0,047 0 1 1
36 Smart 1 12 5 8 1,5 0 0 0 0
37 Polissia 1 7,93 15 14 1,03 0,003 1 0 1
38 Fornitura 1 0,12 35557 0 0 -0,819 0 0 1
39 settimo continente 1 1,93 0,41 1,52 1,35 0,07 1 0 1
40 Tecnosila 1 14 18 10,36 1 0,002 1 1 1
41 TOAP 1 7 22 10,83 1,04 0,009 0 0 1

Nota: se la società ha avuto un default, allora il coefficiente assume il valore 1, e 0 se non c'è stato default.

APPENDICE 2

Regressione su otto fattori per 41 società

Regressione e residuo DF / Numero di gradi di libertà SS / Somma dei quadrati SM=SS/DF Statistica F Significato F / Significato
Regressione / Regressione 8 6,250849408 0,781356176 7,133131961 2.17209Е-05
Residuo 32 3,505248153 0,109539005 - -
Totale / Totale 40 9,756097561 - - -
Parametri utilizzati tStat/ t-statistica P-vaiue / Significato
Intercetta / Costante 0,354797355 0,281481615 1,260463691 0,216616062
Indice di liquidità corrente 0,034652978 0,01876389 1,846790732 0,074043212
Leva / Leva finanziaria 1.31819Е-05 4.77939E-06 2,758072506 0,009529947
D / EBITDA / Rapporto debito fruttifero/EBITDA 0,044980795 0,018152923 2,477881708 0,018682248
-0,012377044 0,030936193 -0,40008296 0,691753745
ROS / Ritorno sulle vendite -0,530759612 0,375019201 -1,415286499 0,166643428
NI > 0 / Presenza di utile netto -0,02891433 0,164713359 -0,175543319 0,861758855
Responsabile / Gestione della qualità -0.266367tl2 0,134861932 -1,975109717 0,056935374
Storico/Qualità della storia creditizia -0,109402928 0,159841844 -0,684444857 0,498621797

APPENDICE 3

Regressione su sette fattori per 35 società

Regressione e residuo DFI Numero di gradi di libertà SS / Somma dei quadrati SM=SS/DF Statistica F Significato F / Significato F
Regressione / Regressione 7 5,898901667 0,842700238 9,097165886 9.56Е-06
Residuo 27 2,501098333 0,092633272 - -
Totale / Totale 34 8,4 - - -
Parametri utilizzati Coefficienti / Coefficienti Errore standard / Errore standard t Stat/ t-statistica Valore P / Significato
Intercetta / Costante 0,473712463 0,25308461 1,871755309 0,072111654
Indice di liquidità corrente 0,018420061 0,017803477 1,034632774 0,047018946
Leva / Leva finanziaria 0,017110959 0,009674238 1,768713818 0,022823937
D / EBITDA / Rapporto debito fruttifero/EBITDA 0,046019604 0,021802198 2,110778177 0,014194286
EBIT / Interessi / Rapporto EBIT/interessi -0,004583381 0,032996403 -0,13890548 0,89055573
ROS / Ritorno sulle vendite -0,582081686 0,483677061 -1,203451088 0,039247801
Responsabile / Gestione della qualità -0,174077167 0,138900851 -1,253247659 0,03786026
Storico / Qualità della storia creditizia -0,378981463 0,194742843 -1,946061058 0,020243892

APPENDICE 4

Valutazione delle aziende del campione utilizzando il modello di scoring

Azienda A Indice di liquidità corrente Leva / Leva finanziaria D / EBITDA / Rapporto debito fruttifero/EBITDA EBIT / Interessi / Rapporto EBIT/interessi ROS / Ritorno sulle vendite Responsabile / Gestione della qualità Storia / Storia creditizia positiva La vita dell'azienda Somma Classe Vero o no*
Farmacia 36.6 0 4 6 4 4 6 5 9 3 41 2 1
L "Etoile 0 5 0 0 4 0 5 9 3 26 3 0
Abbaio 0 4 8 0 4 0 5 9 3 33 2 1
Nastro 0 1 0 0 4 6 5 9 3 28 3 0
OK 0 1 8 4 4 6 5 9 3 40 2 1
Automondo 0 5 8 0 3 6 5 9 3 39 2 1
Х5 Gruppo al dettaglio 0 1 8 0 4 5 5 9 3 35 2 1
Il mondo del bambino 0 4 8 4 4 6 5 9 3 43 2 1
Dixie 0 4 6 0 4 0 5 9 3 31 2 1
Giostra 0 1 8 0 4 6 5 9 3 36 2 1
centesimo 0 1 0 0 4 0 5 9 3 22 3 0
Gruppo Kosmo 0 5 6 0 4 6 5 9 3 38 2 1
Magnete 0 5 8 8 4 6 5 9 3 48 1 1
Magnolia 0 0 2 0 2 6 5 9 3 27 3 0
M.Video (2007) 0 5 8 4 4 0 5 9 3 38 2 1
JSC "NTS" 0 5 0 0 2 6 0 9 3 25 3 0
Scarpe della Russia 0 4 2 4 4 6 5 9 3 37 2 1
Crocevia (2005) 0 1 6 0 4 5 5 9 3 33 2 1
Pivdom 0 5 0 0 2 0 0 9 3 19 3 0
Famiglia 0 5 8 4 4 6 5 9 3 44 1 1
Elekam 0 5 4 0 2 0 5 9 3 28 3 0
Macro 1 4 0 0 4 0 0 9 3 20 3 1
Prestigio espresso 1 5 8 0 2 0 0 9 3 27 3 1
Prestigio dell'Arbat 1 0 4 0 3 0 5 0 3 15 3 1
Orchidea 1 5 6 0 0 0 0 9 3 23 3 1
fregata bianca 1 5 0 0 0 0 5 9 3 22 3 1
Marta 1 5 0 0 2 0 5 9 3 24 3 1
Matrice 1 5 0 0 0 0 0 0 3 8 3 1
Mercurio (autoelogio) 1 5 0 0 2 0 5 9 3 24 3 1
Minnesota 1 4 0 0 0 0 5 9 3 21 3 1
Smart 1 5 0 0 3 0 0 0 3 11 3 1
Polissia 1 5 0 0 2 0 0 9 3 19 3 1
settimo continente 1 5 8 4 3 6 0 9 3 38 2 0
Tecnosila 1 5 0 0 0 0 5 9 3 22 3 1
TOAP 1 5 0 0 2 0 0 9 3 19 3 1

* La colonna mostra se abbiamo ricevuto la decisione corretta sul prestito alla società in base al modello di punteggio.

Il termine "punteggio" nella traduzione letterale da in inglese significa "segnare". Questo è il nome del sistema e del metodo di valutazione del rischio per il prestito a una determinata persona, gestione del rischio basata su una previsione matematica. Il punteggio bancario ti consente di determinare la probabilità di ritardi nei pagamenti, in base alle informazioni della tua storia creditizia e ad altri dati. Il criterio principale sono i punti, che prima venivano calcolati manualmente dai dipendenti degli istituti finanziari, ma ora sempre più spesso vengono calcolati da un programma speciale.

Il punteggio funziona efficacemente nel campo del prestito espresso, della microfinanza, in cui uno specialista non ha più di un'ora per considerare una domanda. IN programma speciale vengono inseriti i dati di un potenziale mutuatario. Il sistema confronta le informazioni con le statistiche. Ad esempio, se nel database sono presenti molte informazioni secondo cui persone della stessa età e / o professione non hanno rimborsato i prestiti, la decisione potrebbe essere negativa: la banca potrebbe rifiutare senza spiegarne i motivi.



Valutazione del merito creditizio del debitore − individuale- automaticamente sulla base dell'analisi di varie informazioni, tra cui:

  • dati identificativi. I dati del passaporto, la foto del richiedente sono in fase di elaborazione. Già in questa fase vengono identificati i truffatori, le persone con una storia creditizia negativa;
  • stato sociale. Vengono presi in considerazione il sesso, l'età del richiedente, la sua istruzione e il luogo di lavoro. Si tiene conto dell'indirizzo di registrazione e di residenza, della presenza di una famiglia, delle persone a carico;
  • posizione finanziaria. Idealmente, è necessario avere un reddito non solo sufficiente, ma anche regolare. Alcune banche tengono conto anche di possibili spese: utilità, asilo ecc. Molti richiedenti fanno di tutto per non reclamare persone a carico o per sopravvalutare il loro reddito. Per i piccoli prestiti questo può funzionare, ma per i grandi prestiti le banche di solito controllano i dati in modo molto più approfondito;
  • storia creditizia. Nella valutazione del merito creditizio di un individuo, le informazioni sui prestiti precedenti sono uno dei fattori decisivi. Vengono determinati i prestiti in essere, la presenza di ritardi e il tempo durante il quale sono stati pagati. Se i prestiti sono stati serviti con attenzione, il sistema darà un'alta probabilità dello stesso comportamento del cliente in futuro, aumentando il punteggio. Lo stesso principio funziona rovescio;
  • comportamento transazionale. L'opzione di valutazione è disponibile per i candidati che sono clienti di un istituto finanziario. I titolari di carte di plastica, conti di deposito, partecipanti a progetti di buste paga spesso ricevono un punteggio elevato. Il sistema valuta gli importi per i quali vengono effettuati gli acquisti, categorie di punti vendita.

Tutti i dati vengono controllati separatamente e confrontati tra loro per eventuali incoerenze. Ci deve essere un collegamento tra entrate e spese, posizione e luogo di residenza, ecc.

imparzialità. Il sistema di scoring per la valutazione del merito creditizio opera con dati e cifre, senza tener conto delle caratteristiche personali di una persona. L'impiegato d'ufficio che accetta la domanda non può in alcun modo influenzare l'algoritmo di calcolo. Un agente di prestito non ha il diritto di rifiutare irragionevolmente di emettere un prestito se il programma ha valutato il mutuatario come una persona solvibile.

Efficienza. Il punteggio in modalità manuale viene eseguito sotto forma di tabella. In righe separate, lo specialista inserisce autonomamente dati e assegna punti, concentrandosi solo sulla propria esperienza e conoscenza. Il processo è laborioso e lungo, i candidati devono aspettare un'ora o più. I programmi moderni calcolano il punteggio centinaia di volte più velocemente.

vantaggio finanziario. Le banche che utilizzano un sistema di valutazione del credito spesso offrono condizioni di prestito più favorevoli. Il calcolo dei rischi e l'eliminazione automatica di eventuali insolventi riduce significativamente la quota di mancato rimborso, che di solito è inclusa nel tasso di interesse. Ciò avvantaggia sia il mutuatario che il prestatore.

Prima di tutto, è necessario formare una buona storia creditizia, senza ritardi. Se i pagamenti puntuali sono impossibili per motivi oggettivi, è necessario informare la banca il prima possibile e dimostrare l'insolvenza temporanea. La maggior parte degli istituti di credito soddisfa le esigenze dei clienti fornendo dilazioni di pagamento, ricalcolo o altre soluzioni. In questo caso, la storia non sarà rovinata dal rifiuto dei pagamenti. Se ci sono già linee negative nella storia, possono essere compensate da prestiti puntualmente pagati.

Un altro modo per aumentare la valutazione del punteggio del merito creditizio è la presenza di un deposito. Un deposito bancario aperto chiarisce che il cliente ha i fondi per pagare. Lo stesso vale per i titolari di carta del libro paga, che di solito hanno un punteggio elevato.

Per aumentare il punteggio, devi considerare attentamente la compilazione della domanda. Si consiglia di fornire informazioni di contatto affidabili e di avvisare tutti i cui numeri di telefono vengono inseriti nel questionario. Se un impiegato di banca inizia a squillare, deve chiamare tutti gli abbonati. In caso contrario, le informazioni potrebbero essere riconosciute come inaffidabili e negare il credito a causa di ciò.

Se ti è stato negato un prestito perché il programma di punteggio ti ha ritenuto insolvente, non disperare. Forse le impostazioni dell'algoritmo sono sfavorevoli per te solo in questa banca. Per verificarlo, prova a superare il punteggio nel nostro sito.

Invia il tuo buon lavoro nella base di conoscenza è semplice. Utilizza il modulo sottostante

Studenti, dottorandi, giovani scienziati che utilizzano la base di conoscenza nei loro studi e nel loro lavoro ti saranno molto grati.

postato su http://www.allbest.ru/

postato su http://www.allbest.ru/

  • introduzione
    • 1.4 Reti neurali
    • 1.5 CHAIDanalisi
    • 1.6 Altri metodi
    • 2.1 Dichiarazione del problema
    • 3.1 Problema di Monge-Kantorovich
    • 3.2 Applicazione del problema di Monge-Kantorovich al punteggio
  • Conclusione
  • Bibliografia

introduzione

Il punteggio è un modo euristico di costruire valutazioni e classificare vari oggetti in gruppi. Si basa sul presupposto che le persone con indicatori sociali simili si comportino allo stesso modo. È utilizzato nel settore bancario, marketing, assicurativo.

Lo scopo principale del punteggio tradizionale è classificare i clienti bancari in "buoni" e "cattivi", in base ai quali l'istituto di credito può scegliere le azioni appropriate in relazione a questo cliente. Un cliente “cattivo”, ad esempio, può essere definito come un cliente con una bassa probabilità empirica di rimborsare un prestito. Ma, di norma, tale definizione di cliente "cattivo" viene estesa a qualsiasi comportamento del cliente indesiderabile per la banca. La classificazione viene effettuata sulla base di una scheda di punteggio, con l'aiuto della quale viene calcolato il punteggio del cliente. Punteggio discriminante bayesiano

Dalla letteratura dedicata al punteggio, notiamo diversi lavori.

"Guide to Credit Scoring" a cura di Elizabeth Mays, 2008 - l'unico libro sul punteggio in russo. Descritto concetti generali, vengono analizzati i metodi per costruire una scorecard e viene discussa l'applicazione pratica del punteggio. Il libro è composto da articoli scritti da esperti stranieri nel campo della finanza.

La dissertazione di Samuel Glasson, "A Censored Sampling Method for Credit Scoring", 2007. Esamina gli strumenti di analisi della sopravvivenza per il credit scoring con dati censurati. Viene analizzata l'applicazione del metodo della regressione lineare e, in particolare, del metodo Buckley-James. Parte pratica L'opera contiene l'applicazione di questi metodi alla stima del tempo di default del credito e del tempo di pagamento della rata successiva.

Lavoro di tesi di Christina Bolton “Regressioni logistiche e loro applicazione nel credit scoring”, 2009. Il concetto di credit scoring viene analizzato in relazione al settore bancario in Sud Africa. I metodi per la costruzione di un modello di scoring sono considerati con un'enfasi speciale sul metodo della regressione logistica. Questo metodo viene utilizzato per creare un modello di punteggio.

Lavoro di tesi di Mattias Kremple “Modelli adattivi e loro applicazione nel credit scoring”, 2011. L'enfasi è sullo studio dei metodi per la costruzione di modelli predittivi nelle condizioni di deriva e ritardo dei dati. Introdotto nuovo metodo per costruire modelli di scoring basati sul metodo dell'albero decisionale. Il metodo presentato viene applicato per stimare la deriva in due serie di dati finanziari reali.

Le opere sopra citate hanno un problema comune: l'applicazione di metodi alla costruzione di modelli di scoring non è giustificata. Ciò solleva dubbi sulla correttezza dei dati ottenuti. Il compito è costruire un metodo la cui applicazione sarebbe giustificata. In questo articolo, presentiamo un metodo che risolve questo problema.

Esistono molti approcci alla creazione di un modello di punteggio. Il capitolo 1 di questo lavoro descrive i metodi utilizzati nelle dissertazioni di cui sopra. Il capitolo 2 introduce modello matematico punteggio e analizza l'approccio bayesiano empirico alla costruzione di un modello di punteggio: l'approccio è descritto teoricamente e quindi applicato ai dati reali di Sberbank of Russia per costruire un modello di punteggio. Il capitolo 3 introduce un metodo basato sul problema di Monge-Kantorovich. La fondatezza teorica dell'uso questo metodo. Viene quindi utilizzato per costruire un modello di punteggio sui dati utilizzati nel capitolo 2.

Capitolo 1. Metodi per costruire modelli di scoring

1.1 La storia dell'emergere e dello sviluppo del punteggio

Inizialmente, il punteggio è stato sviluppato con l'obiettivo di automatizzare il processo di decisione sull'emissione di un prestito. Prima dell'introduzione del punteggio, la decisione su chi emettere un prestito in quale importo veniva presa da un addetto ai prestiti. Lo ha deciso sulla base dell'esperienza e della propria opinione, guidato dai parametri del cliente che incidono sulla sua solvibilità.

Negli anni '40 iniziò l'introduzione dei sistemi di punteggio. Nel 1941, David Durand pubblicò il primo lavoro di ricerca sul credit scoring, in cui ha valutato il ruolo di vari fattori nel sistema predittivo. Dopo la fine della seconda guerra mondiale, la domanda di prodotti di credito è aumentata notevolmente e questo è diventato chiaro metodi tradizionali il processo decisionale funziona male in determinate condizioni un largo numero clienti. L'esplosione della domanda di prestiti, guidata in parte dall'introduzione delle carte di credito, ha motivato gli istituti di credito a implementare sistemi automatizzati di decisione sui prestiti. A ciò ha contribuito lo sviluppo parallelo della tecnologia informatica, che ha reso possibile l'elaborazione di grandi quantità di dati finanziari.

FICO nasce nel 1956 per sviluppare il credito al consumo. Negli anni '60 iniziò l'introduzione delle tecnologie informatiche nel campo del punteggio. Nel 1963 fu proposto l'uso dell'analisi dei dati discriminanti per il punteggio di credito. E infine, nel 1975, con l'approvazione dello "US Equal Credit Opportunity Act I", il punteggio è stato finalmente riconosciuto.

Un passo importante nello sviluppo del punteggio di credito è stato l'emergere del punteggio comportamentale nei primi anni '90. Il suo scopo è prevedere i pagamenti dei clienti esistenti.

Recentemente, lo sviluppo dei sistemi di punteggio è stato guidato dalla regolamentazione dell'ambiente esterno. Nell'ambito dei requisiti di adeguatezza patrimoniale imposti alle banche in relazione all'entrata in vigore del secondo Accordo di Basilea (Comitato di Basilea per la vigilanza bancaria 2001), gli istituti devono monitorare attentamente i rischi associati ai loro portafogli di prestiti. I metodi di valutazione del credito ti consentono di farlo.

Dall'introduzione del primo sistema di punteggio, sono stati utilizzati molti metodi matematici e statistici. Tra quelli statistici vi sono: l'analisi discriminante, la regressione lineare, la regressione logistica e l'albero decisionale. Altri metodi provenivano dalla matematica: programmazione matematica, reti neurali, algoritmi genetici e sistemi esperti. Successivamente, analizzeremo i metodi più comuni e parleremo dei loro vantaggi e svantaggi.

1.2 Analisi discriminante lineare e regressione lineare

L'analisi discriminante lineare è un metodo per classificare gli oggetti in categorie predefinite. L'idea è di trovare una combinazione lineare di variabili esplicative che meglio categorizzino gli oggetti. Per miglior divisione si intende quella che prevede la massima distanza tra le medie di queste categorie. Il punteggio è calcolato come una funzione lineare dei valori degli attributi del cliente:

Qui ci sono i valori degli attributi del cliente, sono i parametri del modello che massimizzano la relazione

dove è il vettore delle medie per Bene E Cattivo clienti, è la matrice di covarianza comune.

Il metodo discriminante lineare presuppone il rispetto di due condizioni. Innanzitutto, le matrici di covarianza delle variabili indipendenti per entrambi i gruppi devono corrispondere. In secondo luogo, le variabili indipendenti devono essere distribuite normalmente. Spesso, nel punteggio, le variabili indipendenti sono discrete o non distribuite normalmente. Quindi, ci sono problemi nell'applicazione di questo metodo. Tuttavia, è stato dimostrato che anche in caso di violazione della normalità, questo metodo è ampiamente applicabile. Il suo vantaggio è la facilità d'uso.

Un metodo di regressione lineare simile viene utilizzato anche per generare il modello di punteggio. Nel caso di due categorie, equivale al metodo dell'analisi discriminante lineare ed esprime la dipendenza di una variabile (dipendente) da altre (indipendenti). In generale sembra così:

variabile dipendente;

Variabili indipendenti esplicative;

Coefficienti di regressione sconosciuti che si trovano con il metodo dei minimi quadrati;

Per applicare un modello di punteggio lineare, è richiesta la seguente ipotesi: la relazione tra le variabili dipendenti e indipendenti deve essere lineare. In caso contrario, l'accuratezza della stima si deteriora in modo significativo. Gli errori devono essere indipendenti e normalmente distribuiti.

Come con l'analisi discriminante, in condizioni di valutazione del credito, le ipotesi richieste per applicare la regressione lineare sono spesso violate. La regressione lineare può fornire una stima di probabilità fuori intervallo, il che è inaccettabile. Ad esempio, la regressione logistica non presenta questo svantaggio.

1.3 Regressione logistica e regressione probit

Questi tipi di regressione sono più adatti per costruire un modello di punteggio, in quanto consentono una presentazione categorica dei dati. Il modello di regressione logistica è definito come segue:

dove è una stima della probabilità che il cliente sia "cattivo" , - un vettore di parametri di regressione sconosciuti che viene calcolato tramite la condizione di massimizzazione del rapporto di verosimiglianza.

Il modello di regressione logistica si basa sulla funzione logaritmica. A sua volta, la regressione probit si basa sulla distribuzione normale ed è data come segue:

Dove. Il vettore si trova allo stesso modo del modello di regressione logistica.

Poiché la regressione logistica e la regressione probit utilizzano distribuzioni di forma simile, anche i risultati dell'applicazione di questi modelli sono simili. La regressione logistica è preferita perché i calcoli sono più semplici della regressione probit e ci sono più strumenti per lavorarci. A causa della sua natura binaria, la regressione logistica è preferibile alla regressione lineare quando viene utilizzata per costruire modelli di punteggio. In pratica, si è riscontrato che la differenza nell'accuratezza dei risultati previsti è insignificante. Tuttavia, vi è una predominanza della regressione logistica nei sistemi di punteggio.

1.4 Reti neurali

Le reti neurali artificiali sono simulazioni di reti neurali presenti in natura. Questo concetto è nato quando si è cercato di modellare i processi che si verificano nel cervello umano.

Le reti neurali, chiamate anche percettroni multistrato, sono particolarmente adatte a risolvere il problema della classificazione. Sono ampiamente utilizzati in vari campi: finanza, informatica, fisica e medicina. La popolarità delle reti neurali è in parte dovuta alla capacità di modellare situazioni complesse a basso costo per l'utente. Per loro natura, le reti neurali rilevano automaticamente qualsiasi situazione non lineare nei dati e si adattano di conseguenza. Inoltre, le reti neurali multistrato sono approssimatori universali, ovvero possono approssimare qualsiasi funzione con la precisione desiderata.

Le reti neurali sono costituite da strati che, a loro volta, sono costituiti da nodi. Ci sono 3 tipi di layer nelle reti: input, hidden, output. Il livello di input è formato da attributi client come sesso, età e così via.

L'output per il k-esimo nodo con m input è rappresentato come segue:

dove è la funzione di attivazione, è il vettore dei dati di input, è il vettore dei pesi che denota la forza della connessione tra i nodi.

Lo svantaggio principale è che, nonostante la capacità di ottenere un'elevata precisione della previsione, è impossibile comprendere i motivi per cui è stata presa questa o quella decisione.

Nel contesto del punteggio di credito, le reti neurali hanno dimostrato di funzionare bene quanto i metodi tradizionali.

1.5 Analisi CHAID

Questo metodo è ottimo per trovare relazioni tra i dati, soprattutto se le relazioni non sono lineari. Viene utilizzato per costruire alberi decisionali e ha molto in comune con metodi classici come l'analisi discriminante e la regressione lineare.

L'abbreviazione CHAID sta per Chi-squared Automated Interaction Detector.

La flessibilità di questo metodo lo rende interessante da usare, ma ciò non significa che debba essere utilizzato al posto dei metodi tradizionali. Nel caso in cui si incontrino rigide assunzioni teoriche sulla distribuzione, sono preferibili i metodi tradizionali. Come tecnica di ricerca o quando i metodi tradizionali falliscono, l'analisi CHAID è uno strumento insuperabile.

CHAID costruisce alberi non binari (ovvero alberi che possono avere più di due rami) sulla base di un algoritmo relativamente semplice particolarmente adatto per l'analisi di set di dati di grandi dimensioni. L'algoritmo si basa sull'applicazione del test del chi-quadrato.

1.6 Altri metodi

Albero decisionale.

Il metodo divide i dati in sottoinsiemi, ognuno dei quali è più uniforme nel suo comportamento rispetto al set di dati originale. Ciascuno di questi sottoinsiemi è ulteriormente suddiviso secondo lo stesso algoritmo. Il risultato della divisione è chiamato la "foglia" di questo albero. Esistono altri metodi che funzionano su un principio simile.

I vantaggi di questo metodo sono la semplicità e l'intuitività. Il metodo è in grado di lavorare con le osservazioni mancanti. È particolarmente applicabile nel caso in cui non si sappia praticamente nulla dei dati prima del loro studio ed è impossibile formulare ipotesi o ipotesi.

Il principale svantaggio di questo metodo è la complessità dei calcoli del computer. A causa dell'ingombro degli alberi risultanti, il processo di studio del modello è laborioso. I cambiamenti nella situazione possono portare a una revisione dell'intero albero decisionale.

Fondamentalmente, il metodo è usato come ausiliario. Ad esempio, per determinare le variabili che spiegano maggiormente il comportamento della variabile dipendente.

MetodoKvicini più prossimi. Metodo non parametrico di classificazione degli oggetti. Basato su una metrica che misura la somiglianza tra i dati.

Inizialmente, vengono inseriti i dati di allenamento, suddivisi in classi. Quindi vengono inseriti i dati stimati e viene determinata la somiglianza tra i dati inseriti e quelli di addestramento. In base alla metrica, vengono selezionati k vicini più prossimi. Il nuovo elemento viene assegnato alla classe a cui appartiene la maggior parte dei suoi vicini.

Il numero di vicini k è determinato da un compromesso tra compensazione e dispersione. Più piccola è la classe, minore è la scelta di k. In questo caso non è necessario che per k grandi il risultato sia migliore.

Uno dei vantaggi di questo metodo è che è facile aggiungere nuovi dati senza modificare il modello. La natura non parametrica di questo metodo consente di lavorare con irrazionalità nelle funzioni di rischio nello spazio delle caratteristiche.

La mancanza di un metodo formale per la scelta di k e l'impossibilità di un'interpretazione probabilistica del risultato, poiché il risultato sono le frequenze attese, sono i principali svantaggi del metodo. Queste difficoltà possono essere risolte utilizzando il metodo dell'approssimazione bayesiana.

Questo metodo è poco utilizzato nel punteggio. Uno dei motivi è che per classificare un oggetto è necessario avere una base su tutti gli oggetti.

Più nuovo macchina vettoriale di supporto, basato sull'apprendimento automatico, si è rivelato non peggiore dei tradizionali metodi di punteggio. Consiste di due processi: il primo trasforma i dati di input in dati ad alta dimensione nello spazio delle caratteristiche; il secondo classifica i dati utilizzando un classificatore lineare. Il classificatore può essere, ad esempio, un'analisi discriminante lineare.

1.7 Confronto di diversi metodi

Sono stati condotti numerosi studi comparativi per i metodi di punteggio. I criteri di classificazione erano la percentuale di errori di classificazione e la curva ROC. Sono stati studiati 8 set di dati.

voto medio

Reti neurali

Vettori di supporto

Regressione logistica

Analisi discriminante lineare

LS-SVM lineari

Albero di Bayes esteso

Classificatore ingenuo di Bayes

Funzioni a base radiale

k-vicini più vicini (k=100)

SVM lineare

Analisi discriminante quadratica

albero decisionale

Programmazione lineare

albero decisionale

albero decisionale

k-vicini più vicini (k=10)

albero decisionale

La tabella mostra che le reti neurali e la macchina vettoriale di supporto erano le migliori sugli 8 set di dati studiati. Inoltre, i metodi tradizionali come l'analisi lineare e discriminante si sono dimostrati competitivi. Ne consegue che è probabile che la maggior parte dei dati sul punteggio di credito sia solo leggermente non lineare. Di conseguenza, i metodi lineari si sono dimostrati allo stesso livello di quelli non lineari.

Non esiste un modello di punteggio ottimale per ogni situazione. La scelta del modello dipende dai dati e dallo scopo per cui è diretta la creazione del modello. Inoltre, il metodo che stima il meglio non è necessariamente il migliore in una data situazione.

Capitolo 2 L'approccio bayesiano empirico

In questo capitolo analizzeremo l'approccio bayesiano empirico e lo utilizzeremo per costruire un modello di punteggio. La costruzione si baserà sulle statistiche sui prestiti al consumo della banca «Sberbank of Russia».

2.1 Dichiarazione del problema

Supponiamo che ci sia una certa banca impegnata nel prestito a privati. I clienti si rivolgono alle banche per i prestiti. La decisione di emettere un prestito viene presa dalla banca sulla base delle informazioni sul cliente.

La banca riceve informazioni sul cliente da varie fonti: dal cliente stesso, dall'ufficio crediti e da altre fonti. Prenderemo in considerazione le informazioni fornite dal cliente stesso. La banca lo riceve attraverso un questionario compilato dal mutuatario.

Nel questionario il mutuatario indica i seguenti dati: sesso, età, stato civile, presenza di figli, reddito mensile, disponibilità di immobili, ecc.

Sulla base di questi dati, divideremo i clienti in gruppi in cui sono simili per certi aspetti. Per ogni cliente, con il metodo bayesiano, troveremo un rating - la probabilità empirica che il cliente ripaghi il prestito, a condizione che appartenga a questo gruppo.

Per applicare il metodo, i dati devono soddisfare le seguenti condizioni:

Indipendenza - i clienti non colludono per rimborsare il prestito;

omogeneità: i dati sono presi da uno popolazione;

equiprobabilità: i clienti hanno la stessa probabilità di essere distribuiti in gruppi.

La loro implementazione è verificata di seguito.

2.2 Costruire un modello di scoring

Introduciamo uno spazio di probabilità. Designiamo in questo spazio - il cliente della banca.

Ogni cliente della banca ha una serie di caratteristiche in base al questionario compilato. Ad esempio: sposato o no, livello di reddito suddiviso in categorie, proprietà dell'auto e altre caratteristiche. In base a queste caratteristiche, introduciamo una partizione dello spazio in insiemi

Pertanto, l'insieme dei clienti è diviso in gruppi.

Introduciamo le variabili casuali.

Il numero di client nel gruppo j-esimo.

Dai dati, possiamo costruire una distribuzione di probabilità empirica congiunta.

dove è la probabilità empirica a priori dell'evento A,

Probabilità empirica dell'evento B nella condizione A,

La probabilità empirica di un evento A nella condizione B, che è chiamata probabilità a posteriori,

La probabilità empirica dell'evento B.

Questa formula consente di sovrastimare la probabilità dell'evento A, dato che l'evento B si è verificato.

Dalla definizione di probabilità condizionata possiamo scrivere:

Esprimendo da (1) e sostituendo l'espressione for in questa formula, otteniamo:

2.3 Applicazione di un modello ai dati

Disponiamo di dati sui clienti del 1977 di Sberbank of Russia, comprese le informazioni sul rimborso o meno del prestito.

Per applicare l'approccio bayesiano, è necessario assicurarsi che siano soddisfatte 3 ipotesi:

· sull'indipendenza - i clienti non colludono per pagare o non pagare il prestito;

sull'omogeneità - i dati sono presi da una popolazione generale;

· sul tipo di distribuzione - i dati sono distribuiti in modo equiprobabile.

Ipotesi di indipendenza

Per verificare questa ipotesi, usiamo il test del rango di Spearman. La statistica di questo criterio è il coefficiente di correlazione di rango definito come segue.

Si danno due serie di osservazioni: i. Sulla base di queste osservazioni, costruiamo coppie di ranghi. Per rango si intende il numero del posto occupato da un'osservazione in una serie variazionale. Comprendiamo il rango allo stesso modo. Quindi, riorganizziamo le coppie di ranghi in ordine crescente del primo componente. Indichiamo la serie risultante.

Il coefficiente di correlazione si trova con la formula:

Regione critica del criterio. Per trovare, usiamo il fatto che la legge di distribuzione tende a, per n grande. Da qui. Ecco la funzione di distribuzione della legge gaussiana standard.

A livello di significatività, =1.959964. Il confine della zona critica. Il coefficiente di correlazione trovato.

Pertanto, la statistica del criterio non rientra nella sua regione critica e possiamo accettare l'ipotesi di indipendenza a un livello di significatività di 0,05.

Ipotesi di omogeneità

L'ipotesi è così formulata. Dati due campioni e da distribuzioni e rispettivamente, con funzioni di distribuzione e. Quindi l'ipotesi di omogeneità.

Per verificare questa ipotesi, usiamo il criterio di Smirnov.

La statistica di questo criterio è, dove sono le funzioni di distribuzione empiriche costruite sui campioni e. La regione critica è specificata nel modulo. Per grandi n e m, il confine della regione critica può essere preso uguale a, dove. è la funzione di distribuzione di Kolmogorov.

Pertanto, l'ipotesi di omogeneità è rifiutata se. A un livello di significatività di 0,05 . è il confine della regione critica. Statistiche.

La statistica del test non cade nella regione critica e possiamo accettare l'ipotesi di omogeneità a un livello di significatività di 0,05.

Ipotesi sul tipo di distribuzione

Formuliamo un'ipotesi. Ci viene fornito un campione da una distribuzione con una funzione di distribuzione sconosciuta. Occorre verificare che è la funzione di ripartizione della distribuzione uniforme sull'intervallo .

Per fare questo, usiamo il test di bontà di adattamento di Pearson.

La statistica del test è. Ecco la frequenza con cui inserire le osservazioni segmento i-esimo, - la probabilità di entrare nell'i-esimo segmento. Se l'ipotesi in esame è vera, per n grandi le statistiche obbediscono a una distribuzione chi-quadrato con k-1 gradi di libertà.

L'ipotesi viene respinta se la statistica supera il valore critico.

Calcoleremo il valore delle statistiche utilizzando il pacchetto software Statistica - =24.19468, k-1=39. Il confine della regione critica a livello di significatività.

Pertanto, il valore delle statistiche non supera il livello critico e l'ipotesi di una distribuzione uniforme dei clienti per gruppi è accettata a un livello di significatività di 0,05.

Quindi, i dati soddisfano tutte le ipotesi sopra riportate e possiamo iniziare a trovare valutazioni.

I dati disponibili ne contengono molti varie caratteristiche clienti. Per la costruzione ne utilizzeremo 4, i più significativi. La limitatezza del nostro campione (1977 elementi) non ci consente di prendere più elementi.

Caratteristiche selezionate: età e sesso del mutuatario, presenza di figli, rimborso del prestito in % del reddito totale del mutuatario. L'età caratteristica assume 3 valori: 18-29, 30-45, 46-...; genere del mutuatario due valori: maschio e femmina; la presenza dei bambini ha due significati: ci sono bambini e non ci sono bambini; i pagamenti assumono 5 valori - (<5%),(6-10%), (11-16%), (17-22%),(23-55%).

Ogni valore specifico della caratteristica sarà chiamato proprietà del mutuatario. Dividiamo tutti i nostri clienti in insiemi, in base alla presenza di una specifica proprietà in un determinato cliente. Ad esempio, ci sono molti clienti che non hanno figli.

Ecco le notazioni:

Figli, = Nessun figlio, = Avere figli;

Età, =Età1(18-29), =Età2(30-45), =Età3(46-…);

Genere, =Femmina, =Maschio;

Rimborsi del prestito in % del reddito totale del mutuatario, =In1(<5), =Вып2(6-10), =Вып3(11-16), =Вып4(17-22), =Вып5(23-55).

Formiamo nuovi set come combinazione di tutte le possibili proprietà del cliente - per tutto il possibile Ad esempio, il set è composto da donne di età compresa tra 18 e 29 anni senza figli che pagano<5% от своего суммарного дохода. Количество таких множеств равно 60.

Tabella 2.1. Imposta la codifica.

Niente bambini

Avere bambini

Nota che - forma una partizione dell'intero set di client:

Costruiamo una distribuzione empirica congiunta di due variabili casuali discrete - e, dove =(0,1), =(, i=1:60). Lo costruiremo come rapporto tra il numero di clienti che soddisfano una coppia di valori di variabili casuali (X, Y) e il numero totale di clienti.

Fissiamo il numero di clienti corrispondente a ogni possibile coppia (X,Y).

Tabella 2.2. Il numero di clienti che hanno rimborsato e non hanno rimborsato il prestito in ciascun gruppo. 0 - ha restituito il prestito, 1 - non ha restituito il prestito.

Costruiamo una distribuzione di probabilità empirica congiunta. Per fare ciò, dividiamo il numero di clienti che hanno restituito e non hanno restituito il prestito in ciascuno dei gruppi per il numero totale di clienti.

Tabella 2.3. Distribuzione di probabilità empirica congiunta.

Figura 2.1. Funzione di distribuzione empirica in X=0.

Figura 2.2. Funzione di distribuzione empirica per X =1.

Figura 2.3. Istogramma della distribuzione congiunta in X=0.

Figura 2.4. Istogramma della distribuzione congiunta in X=1.

Troviamo la distribuzione empirica delle probabilità di entrare in ciascuno dei gruppi. Per fare ciò, dividiamo il numero di clienti in ciascun gruppo per il numero totale di clienti. Il numero totale di clienti.

Tabella 2.4. La distribuzione empirica delle probabilità di entrare in ciascun gruppo.

Figura 2.5. Istogramma di entrare nel gruppo i.

Sulla base di questo, otteniamo la classificazione:

Clienti del gruppo di rischio 60

Clienti dei gruppi 1-5, 7-12, 15, 17, 25, 31, 32, 33, 35-37, 39, 40, 42, 54-56, 58 - rischio medio

· I clienti dei gruppi 6, 13, 14, 16, 18-24, 26-30, 34, 38, 41, 43-53, 57, 59 sono affidabili

Capitolo 3. Approccio basato sul problema di Monge-Kantorovich

3.1 Problema di Monge-Kantorovich

Il problema di Monge.

Dati due spazi di probabilità e una funzione misurabile non negativa su, ...

Documenti simili

    L'analisi discriminante come branca dell'analisi statistica multivariata. Analisi discriminante secondo la normale legge di distribuzione degli indicatori. Applicazione dell'analisi discriminante in presenza di due campioni di addestramento. La soluzione del problema nel sistema statistika.

    tesina, aggiunta il 21/01/2011

    Modelli di analisi discriminante. Efficienza dei modelli classici occidentali e russi di previsione del fallimento. Specifico del settore. Descrizione degli articoli, comprese le caratteristiche del campione, il metodo, l'elenco dei fattori e il potere predittivo del metodo di analisi.

    abstract, aggiunto il 24/07/2016

    Fondamenti di analisi di regressione lineare. Caratteristiche dell'utilizzo della funzione Cobb-Douglas. Applicazione della regressione lineare multipla. L'essenza del metodo dei minimi quadrati. Modi per evitare false correlazioni. Verifica della significatività dei coefficienti di regressione.

    abstract, aggiunto il 31/10/2009

    Classificazione economica dei paesi, caratteristiche dei principali indicatori di sviluppo economico. Metodi statistici di analisi, descrizione dell'analisi discriminante, cluster, fattoriale e grafica. Parametri dello studio della sicurezza economica.

    tesi, aggiunta il 14/10/2013

    La storia dell'emergere dell'analisi dei costi funzionali, la sua metodologia, i principi, i compiti e le fasi di attuazione. L'uso dell'analisi del sistema e lo sviluppo elemento per elemento del design di ogni parte Yu.M. Sobolev. Applicazione dell'analisi dei costi funzionali.

    test, aggiunto il 04/08/2012

    Fondamenti teorici e metodologici dell'analisi economica, suo soggetto, oggetto, compiti. Caratteristiche dei principi dell'analisi economica, approcci e caratteristiche del loro utilizzo nella pratica. Determinazione delle tendenze di sviluppo aziendale basate sull'analisi.

    tesina, aggiunta il 20/12/2010

    Essenza e applicazione del metodo dei minimi quadrati per la regressione lineare unidirezionale. Trovare il coefficiente di elasticità per il modello specificato in un dato punto X e sua analisi economica. Previsione di perdita basata sulla regressione lineare.

    test, aggiunto il 15/06/2009

    L'essenza del modello Olson come uno degli sviluppi moderni più promettenti nella teoria della valutazione aziendale. EVO in valutazione pratica, caratteristiche del suo lavoro in Russia. Caratteristiche di Olson e Feltham-Olson Linear Information Dynamics.

    test, aggiunto il 04/07/2011

    Il concetto di informazione economica, la sua essenza e caratteristiche, classificazione e varietà, caratteristiche e tratti distintivi. Essenza, soggetto e oggetti dell'analisi economica, scopi e obiettivi. Il rapporto dell'analisi con le altre scienze, la sua organizzazione.

    cheat sheet, aggiunto il 04/05/2009

    Metodi per lo sviluppo di un modello economico-matematico: formulazione del problema, sistema di variabili e vincoli. Tipi di soluzione del modello economico-matematico per l'ottimizzazione della struttura produttiva di un'impresa agricola, analisi delle stime duali.

L'aumento della redditività delle operazioni di prestito è direttamente correlato alla qualità della valutazione del rischio di credito. A seconda della classificazione del cliente per gruppi di rischio, la banca decide se emettere o meno un prestito, quale limite di credito e quale interesse fissare.

Nella pratica mondiale, esistono due metodi principali per valutare il rischio di prestito, che possono essere utilizzati sia separatamente che in combinazione tra loro:

  • parere soggettivo di esperti o addetti al prestito;
  • sistemi di punteggio automatizzati.

Questo articolo è dedicato alla pratica occidentale di utilizzare i sistemi di punteggio, attualmente ampiamente utilizzati in tutti i paesi economicamente sviluppati. Sebbene il punteggio sia uno degli esempi di maggior successo dell'uso di metodi matematici e statistici negli affari, questo argomento è immeritatamente ignorato dalla stampa russa. Lo scopo di questa pubblicazione è colmare questa lacuna e fornire una panoramica generale della storia e della pratica del punteggio. Poiché l'articolo è destinato a una gamma abbastanza ampia di lettori, fornisce solo una descrizione molto generale di come funziona il punteggio. Le basi teoriche e le giustificazioni per la legalità dell'uso dell'uno o dell'altro metodo non sono interessate qui.

Poiché il punteggio viene utilizzato principalmente nei prestiti ai privati, in particolare nel credito al consumo per i prestiti non garantiti, la discussione che segue si concentrerà sulla valutazione del rischio di credito dei mutuatari - privati.

Definizione del merito di credito e informazioni utilizzate per prevederlo

Per valutare il rischio di credito, viene effettuata un'analisi dell'affidabilità creditizia del mutuatario, che nella pratica bancaria russa significa capacità una persona fisica o giuridica di estinguere integralmente e puntualmente i propri debiti. Nella pratica bancaria occidentale, l'affidabilità creditizia è interpretata come desiderio collegato a opportunità estinguere tempestivamente l'obbligo emesso. Nel seguito utilizzeremo il termine "merito creditizio" in questo senso. Secondo questa definizione, il compito principale del punteggio non è solo scoprire se il cliente è in grado di rimborsare o meno il prestito, ma anche il grado di affidabilità e impegno del cliente. In altre parole, lo scoring valuta quanto sia meritevole di credito un cliente, ovvero quanto sia “degno” di un prestito.

Punteggioè un modello matematico o statistico mediante il quale, sulla base della storia creditizia dei clienti "passati", la banca cerca di determinare la probabilità che un particolare potenziale mutuatario ripaghi il prestito in tempo.

Nel sistema bancario occidentale, quando una persona richiede un prestito, la banca può disporre delle seguenti informazioni per l'analisi:

un questionario compilato dal mutuatario;

informazioni su questo mutuatario da un ufficio crediti - un'organizzazione che memorizza la storia creditizia dell'intera popolazione adulta del paese;

dati sui movimenti del conto, se si tratta di un cliente esistente della banca.

Gli analisti del credito operano con i seguenti concetti: "caratteristiche" dei clienti (nella terminologia matematica - variabili, fattori) e "segni" - i valori che assume la variabile. Se immaginiamo un questionario che un cliente compila, allora le caratteristiche sono le domande del questionario (età, stato civile, professione) ei segni sono le risposte a queste domande.

Nella sua forma più semplificata, un modello di punteggio è una somma ponderata di determinate caratteristiche. Il risultato è un indicatore integrale (punteggio); più è alto, maggiore è l'affidabilità del cliente e la banca può disporre i propri clienti in ordine crescente di solvibilità.

L'indicatore integrale di ciascun cliente viene confrontato con una certa soglia numerica, o linea di demarcazione, che, in sostanza, è una linea di pareggio ed è calcolata dal rapporto tra quanti clienti che pagano puntualmente, in media, sono necessari in per compensare le perdite di un debitore. I clienti con un indicatore integrale al di sopra di questa linea ricevono un prestito, i clienti con un indicatore integrale al di sotto di questa linea no.

Sembra tutto molto semplice, ma la parte difficile è decidere quali caratteristiche includere nel modello e quali pesi abbinare. Esistono diversi approcci a questo problema, che verranno discussi nella sezione Metodi di classificazione del cliente.

La filosofia del punteggio non è trovare una spiegazione del motivo per cui questa persona non paga. Il punteggio evidenzia quelle caratteristiche che sono più strettamente correlate all'inaffidabilità o, al contrario, all'affidabilità del cliente. Non sappiamo se questo mutuatario restituirà il prestito, ma sappiamo che in passato persone di questa età, stessa professione, stesso livello di istruzione e con lo stesso numero di persone a carico non hanno rimborsato il prestito. Pertanto, non daremo credito a questa persona.

Questa è la natura discriminatoria (non nel senso statistico, ma nel senso sociale del termine) del punteggio, ad es. se una persona è formalmente vicina a un gruppo con una storia creditizia negativa, allora non gli concederanno un prestito. Pertanto, anche con un grado molto elevato di utilizzo di sistemi di punteggio automatizzati, l'intervento soggettivo si verifica quando l'ufficiale di prestito ha informazioni aggiuntive che dimostrano che una persona classificata come inaffidabile è in realtà "buona" e viceversa.

Quali sono le caratteristiche più “preziose” per la previsione del rischio di credito? Nel Regno Unito, le seguenti caratteristiche sono più comunemente utilizzate:

  • Numero di figli/persone a carico

    Professione

    Professione del coniuge

    Reddito del coniuge

    Zona di residenza

    Costo della casa

    Avere un telefono

    Da quanti anni abiti a questo indirizzo?

    Da quanti anni fai questo lavoro?

    Da quanti anni sei cliente di questa banca?

    Avere una carta di credito/libretto degli assegni

    In altri paesi, l'insieme delle caratteristiche che sono più strettamente correlate alla probabilità di default - la probabilità che un mutuatario fallisca o sia in ritardo nel rimborso - differirà a causa delle caratteristiche economiche e socio-culturali nazionali. Più omogenea è la popolazione di clienti su cui viene sviluppato il modello, più accurata sarà la previsione di default. Pertanto, è ovvio che non si può trasferire automaticamente un modello da un paese all'altro o da una banca all'altra. Anche all'interno della stessa banca esistono diversi modelli per diversi gruppi di clienti e diversi tipi di prestiti.

    Storia dello sviluppo del punteggio

    Il punteggio, in sostanza, è un metodo per classificare l'intera popolazione di nostro interesse in diversi gruppi, quando non conosciamo la caratteristica che separa questi gruppi (se il cliente restituirà o meno il prestito), ma altre caratteristiche relative al uno di nostro interesse è noto. In statistica, l'idea di classificare una popolazione in gruppi fu sviluppata da Fischer nel 1936 usando le piante come esempio. Nel 1941, David Durant applicò per la prima volta questa tecnica alla classificazione dei prestiti in "cattivi" e "buoni". Ciò coincise con la seconda guerra mondiale, quando quasi tutti gli analisti del credito furono chiamati al fronte e le banche dovettero affrontare la necessità di sostituire urgentemente questi specialisti. Le banche hanno costretto i loro analisti a scrivere una serie di regole prima di partire per guidare la loro decisione di concedere un prestito in modo che l'analisi potesse essere effettuata da non specialisti. Questo era, per così dire, un prototipo di futuri sistemi esperti.

    Nei primi anni '50. a San Francisco è stata costituita la prima società di consulenza nel campo dello scoring, Fair Issac, che è tuttora leader tra gli sviluppatori di sistemi di scoring.

    Ma l'uso diffuso dello scoring è iniziato con la diffusione delle carte di credito. Con il numero di persone che quotidianamente richiedevano carte di credito, le banche non avevano altra scelta che automatizzare il processo decisionale per l'emissione di un prestito. Tuttavia, molto presto hanno apprezzato non solo la velocità di elaborazione delle domande di prestito, ma anche la qualità della valutazione del rischio. Secondo alcuni studi, dopo l'introduzione dei sistemi di scoring, il livello di sofferenze è stato ridotto al 50% ( Churchill GA, Nevin J.R., Watson RR//Il ruolo del punteggio di credito nella decisione di prestito. mondo del credito. marzo/1977; Myers J.H., Forgy E.W. Lo sviluppo di sistemi di valutazione di credito numerici//Journal of American Statistical Association. settembre/1963).

    Nel 1974 gli Stati Uniti vararono l'Equal Credit Opportunity Act, che vietava il rifiuto di un prestito sulla base delle seguenti caratteristiche: razza, colore, origine nazionale, età, sesso, stato civile, religione, fruizione di benefici sociali, tutela del consumatore diritti. Nel Regno Unito, la legge consente l'uso di informazioni sull'età e lo stato civile, ma vieta di tenere conto di eventuali lesioni fisiche e handicap (disabilità). Per gli istituti di credito, l'utilizzo di sistemi di scoring è diventato la prova dell'attuazione di queste leggi antidiscriminatorie: il computer non ha pregiudizio.

    Oltre a stabilire i principi di equità nei prestiti, la legislazione statunitense sul credito, come il Consumer Credit Act, adottato nel Regno Unito nello stesso 1974, è stata importante per la formazione del servizio di ufficio crediti. In tali uffici viene registrata la storia creditizia di tutte le persone che hanno mai richiesto un prestito in qualsiasi istituto di credito del paese.

    Le agenzie di credito detengono i seguenti tipi di dati:

    caratteristiche socio-demografiche;

    decisioni giudiziarie (in caso di trasferimento di casi in merito alla rivendicazione del debito su un prestito al tribunale);

    informazioni sui fallimenti;

    dati sui singoli mutuatari ricevuti da istituti di credito sulla base del principio “tu - a me, io - a te”, ovvero una banca può ricevere informazioni sui clienti di altre banche solo se fornisce essa stessa informazioni simili.

    La portata e la natura delle informazioni detenute dall'ufficio sono strettamente regolate dalle leggi di ciascun paese. In "Banking Technologies" c'era già una pubblicazione sugli uffici di credito nel settembre 1999 - "Problemi relativi alla creazione di un ufficio di credito in Russia". Vorrei aggiungere che oltre ai modelli di bureau discussi nell'articolo, esistono anche società commerciali transnazionali, come Experian, Equifax, TransUnion, Scorex. Queste stesse aziende utilizzano sistemi di punteggio e in molti casi vendono ai clienti non informazioni "grezze", ma un indicatore integrale già pronto che viene inserito nel sistema automatizzato di un istituto di credito.

    L'importanza delle agenzie di credito è estremamente elevata, la loro esistenza consente alle organizzazioni creditizie di emettere prestiti a clienti che non erano precedentemente serviti da questa organizzazione. Inoltre, viene generalmente riconosciuto il valore della precedente storia creditizia nella previsione della probabilità di insolvenza.

    Attualmente, il punteggio sta diventando sempre più popolare non solo nella valutazione del rischio per vari tipi di prestiti, ma anche in altre aree: nel marketing (per determinare la probabilità che questo particolare gruppo di clienti utilizzi questo tipo di prodotto), quando si lavora con debitori (se il cliente ritarda con il pagamento successivo, quale metodo di influenza sarà più efficace), quando si identificano le frodi con carta di credito, quando si determina la probabilità che un cliente possa disertare a favore di un concorrente, ecc.

    Metodi di classificazione del cliente

    Quindi, abbiamo a nostra disposizione una grande quantità di varie informazioni sui clienti. In questo oceano di informazioni, anche un agente di prestito con una significativa esperienza lavorativa a volte è difficile da navigare quando risponde, ad esempio, alla domanda: quale cliente presenta un rischio maggiore: un imprenditore maschio divorziato senza figli o un'avvocatessa sposata con tre figli, nonostante il fatto che il loro livello di reddito è lo stesso? Per poter confrontare clienti con caratteristiche completamente diverse e prendere decisioni di affidamento non in modo intuitivo, ma sulla base di criteri formalizzati direttamente correlati alla probabilità di default, è necessario costruire un modello matematico che ci permetta di valutare quali informazioni è significativo e può essere trascurato.

    Per costruire un modello, in primo luogo, viene creato un campione di clienti di un istituto di credito, di cui è già noto se si sono dimostrati buoni mutuatari o meno, a volte tale campione viene chiamato "formazione". Può variare da poche migliaia a centinaia di migliaia, il che non è un problema in Occidente, dove il portafoglio prestiti di un'azienda può essere composto da decine di milioni di clienti. Il campione è diviso in due gruppi: rischi "buoni" e "cattivi". Ciò è giustificato nel senso che la banca, quando prende una decisione sul prestito, nella prima fase sceglie tra due opzioni: concedere un prestito o non concedere. Nonostante l'"infantilismo" delle definizioni di "buono" / "cattivo", questi sono esattamente i termini utilizzati dagli analisti del credito.

    La definizione di rischio "cattivo" può variare a seconda della politica della banca; in Europa occidentale, un rischio "cattivo" è generalmente considerato un cliente che è in ritardo con il pagamento successivo per tre mesi. A volte i rischi "cattivi" includono i clienti che rimborsano il prestito troppo presto e la banca non ha il tempo di guadagnare nulla da loro.

    Pertanto, il punteggio è un'attività di classificazione, in cui, sulla base delle informazioni disponibili, è necessario ottenere una funzione che divida in modo più accurato un campione di clienti in "cattivi" e "buoni".

    Ma prima è necessario trasformare le informazioni disponibili in una forma che possa essere analizzata. Esistono due approcci principali adatti a lavorare con caratteristiche sia quantitative che qualitative:

    1. Converti ogni caratteristica in una variabile binaria separata. Questo approccio è scomodo in quanto porta a un gran numero di variabili, sebbene non imponga alcuna relazione aggiuntiva tra le variabili dipendenti e indipendenti.

      Converti ogni caratteristica in una variabile che assumerà valori corrispondenti al rapporto tra il numero di clienti "cattivi" con un dato attributo e il numero di clienti "buoni" con lo stesso attributo. Un'opzione più complicata è prendere il logaritmo di questo rapporto. Pertanto, ogni attributo riceve un valore numerico corrispondente al livello della sua "rischiosità".

    I metodi di classificazione stessi sono molto diversi e includono:

  • metodi statistici basati sull'analisi discriminante (regressione lineare, regressione logistica);

    varie varianti della programmazione lineare;

    albero di classificazione o algoritmo di partizione ricorsiva (RPA);

    reti neurali;

    algoritmo genetico;

    metodo del vicino più prossimo.

    I metodi tradizionali e più comuni sono i metodi di regressione, principalmente lineari regressione multivariata :

    R = wo + w 1 x 1+ w 2 x 2 + … + w n x n ,

    Dove R- probabilità di default, w-- coefficienti di peso, X-- caratteristiche del cliente.

    Lo svantaggio di questo modello è che sul lato sinistro dell'equazione c'è una probabilità che assume valori da 0 a 1, mentre le variabili sul lato destro possono assumere qualsiasi valore da - Ґ a + Ґ .

    Regressione logistica supera questa lacuna:

    log(p/(1-p)) = wo + w 1 x 1+ w 2 x 2 + … + w n x n .

    L'applicazione della regressione logistica richiede calcoli molto più complessi per derivare i pesi e quindi una base di computer più potente e un software migliorato. Ma con l'attuale livello di sviluppo della tecnologia informatica, questo non è un problema e, al momento, la regressione logistica è leader nei sistemi di punteggio.

    Il vantaggio della regressione logistica è che può suddividere i clienti in due gruppi (0 - cattivo, 1 - buono) o in più gruppi (1, 2, 3, 4 gruppi a rischio).

    Tutti i metodi di regressione sono sensibili alla correlazione tra le caratteristiche, quindi non dovrebbero esserci variabili esplicative altamente correlate nel modello.

    Programmazione lineare porta anche a un modello di punteggio lineare. È impossibile effettuare una classificazione assolutamente accurata in clienti cattivi e buoni, ma è auspicabile ridurre al minimo l'errore. Il problema può essere formulato come una ricerca di coefficienti di peso per i quali l'errore sarà minimo.

    Albero di classificazione e reti neurali sono sistemi che suddividono i clienti in gruppi, all'interno dei quali il livello di rischio è uguale e al massimo diverso dal livello di rischio di altri gruppi. Le reti neurali sono utilizzate principalmente per determinare l'affidabilità creditizia delle persone giuridiche, dove vengono analizzati campioni più piccoli rispetto al credito al consumo. Ma la loro applicazione di maggior successo è stata nel rilevamento di frodi con carte di credito grazie alla loro capacità di rilevare situazioni insolite (vedi: norton m. Affari nervosi//Tecnologie bancarie. 1995. N. 3. S. 73).

    algoritmo genetico sulla base di un'analogia con il processo biologico della selezione naturale. Nel campo del prestito, si presenta così: esiste una serie di modelli di classificazione che sono "mutati", "incrociati" e, di conseguenza, viene selezionato il "più forte", ovvero il modello che fornisce il più accurato classificazione.

    Usando metodo del vicino più prossimo viene selezionata un'unità di misura per determinare la distanza tra i clienti. Tutti i clienti del campione ricevono una determinata posizione spaziale. Ogni nuovo cliente viene classificato a seconda che ci siano più buoni o cattivi clienti intorno a lui.

    In pratica, viene utilizzata una combinazione di diversi metodi e le aziende mantengono i loro modelli di punteggio nella massima riservatezza, quindi è difficile dire quale sia il metodo migliore. Si possono trarre solo conclusioni approssimative basate su pubblicazioni scientifiche, di seguito è riportata una tabella comparativa dell'accuratezza della classificazione per vari metodi compilata dal professor L. Thomas ( Tommaso LC Un'indagine sul punteggio di credito e comportamentale//Università di Edimburgo. 1999).

    Il confronto dovrebbe essere fatto solo orizzontalmente perché gli autori hanno utilizzato definizioni diverse di rischi "buoni" e condotto studi su popolazioni e campioni diversi. La tabella mostra la percentuale di clienti classificati correttamente. Lo scopo di tutti gli studi citati era confrontare l'efficacia di diversi metodi di classificazione, quindi non si dovrebbe concludere che queste cifre mostrino l'efficacia dei sistemi di punteggio in generale, poiché è già stato detto che i sistemi commerciali utilizzano diversi metodi.

    Tavolo

    Fonti:

    Henley WE Aspetti statistici del credit scoring. dottorato di ricerca tesi. Università Aperta. 1995.
    Boyle M., Crook J.N., Hamilton R., Tommaso LC Metodi per il punteggio di credito applicato a pagatori lenti in Credit Scoring e Credit Control//Oxford University Press. 1992.
    Srinivasan V., Kim Y. H. Concessione di credito: un'analisi comparativa di procedure di classificazione//Journal of Finance. 1987. N. 42.
    Yobas M.B., Crook J.N., Ross P. Valutazione del credito utilizzando tecniche neurali ed evolutive//Carta di lavoro 97/2, Centro di ricerca sul credito, Università di Edimburgo.
    Desai V.S., Conway DG, Crook J.N., Overstreet GA Modelli di punteggio di credito nell'ambiente di credito d'unione usando reti neurali e algoritmi genetici//IMA J. Matematica applicata in affari e industria. 8/1997.

    Ciascuno dei metodi ha i suoi vantaggi e svantaggi, inoltre, la scelta dell'uno o dell'altro metodo è correlata alla strategia della banca e ai requisiti che la banca considera prioritari nello sviluppo dei modelli. I metodi di regressione mostrano il significato di ciascuna caratteristica per determinare il livello di rischio e pertanto sono particolarmente importanti nella fase di sviluppo di un questionario che i clienti compilano. La programmazione lineare può operare su un gran numero di variabili e modellare determinate condizioni: ad esempio, se la strategia di marketing di una banca è rivolta ai giovani, si può inserire la condizione che l'indicatore integrale dei giovani sia superiore a quello degli over 60. Reti neurali e gli alberi di classificazione rivelano relazioni non lineari tra variabili che possono portare a errori nei modelli lineari.

    L'accuratezza della classificazione viene verificata o con il metodo dell'esame scorrevole per piccoli campioni (il modello viene costruito sull'intero campione, ad eccezione di un cliente, scelto a caso, quindi viene verificato su questo cliente e tutti i clienti vengono ordinati in questo modo), o con un campione sufficientemente ampio, è diviso in due parti: su un modello viene costruito, sull'altro viene verificato.

    Limitazioni relative all'uso del punteggio

    Ci sono due problemi principali con il punteggio. La prima è che la classificazione del campione viene fatta solo sui clienti che hanno usufruito di un prestito. Non sapremo mai come si sarebbero comportati i clienti a cui è stato negato il credito: è del tutto possibile che una parte si sarebbe rivelata mutuatari abbastanza accettabili.

    Ma, di norma, un prestito viene negato sulla base di motivi abbastanza seri. Le banche correggono questi motivi di rifiuto e memorizzano informazioni sui "refusenik". Ciò consente loro di ricostruire la popolazione originaria di richiedenti prestito.

    Il secondo problema è che le persone cambiano nel tempo, così come le condizioni socio-economiche che influenzano il comportamento delle persone. Pertanto, i modelli di scoring devono essere sviluppati su un campione dei clienti più "freschi", controllare periodicamente la qualità del sistema e, quando la qualità peggiora, sviluppare un nuovo modello. In Occidente, un nuovo modello viene sviluppato in media una volta ogni anno e mezzo, il periodo tra le sostituzioni del modello può variare a seconda della stabilità dell'economia in quel momento. Per la Russia, probabilmente, il periodo massimo sarà di sei mesi, e anche allora, a condizione che durante questo periodo non si verifichino shock cardinali come gli eventi dell'agosto 1998.

    Sono attualmente in corso ricerche su come incorporare le caratteristiche socio-economiche nel modello in modo che duri più a lungo.

    Prospettive per lo sviluppo del punteggio in Russia

    In Russia, l'utilizzo dei sistemi di scoring è ostacolato, in primo luogo, dai bassi volumi di prestito. Ma con la crescita economica (siamo ottimisti), la situazione comincerà a cambiare.

    Di per sé, un numero ridotto di prenditori rispetto agli istituti di credito occidentali non è un ostacolo, è necessario solo monitorare il numero di caratteristiche in relazione alla dimensione del campione. Nell'articolo di V. Stepanov, A. Zayats "Analisi dello stato della banca" (Banking Technologies. 1996. No. 8. P. 58), gli autori hanno utilizzato un approccio statistico - cluster analysis - per classificare le banche in base al rischio gruppi in un totale di 76 stati e allo stesso tempo hanno ottenuto un buon risultato - oltre il 90% delle partite con la valutazione dell'esperto.

    Anche l'assenza di agenzie di credito, ovviamente, non contribuisce allo sviluppo del punteggio. Ma, d'altra parte, in Occidente c'è il problema di verificare l'accuratezza delle informazioni che una persona indica su se stessa nel questionario. In Russia, la maggior parte di queste informazioni è contenuta nel passaporto. È sufficiente che le banche dispongano dei dati del passaporto e dei dati del libro di lavoro: questo è il materiale di partenza per l'analisi.

    Un altro fattore sfavorevole è l'insufficiente prevalenza di tali pacchetti statistici universali come SAS e SPSS. Ma, riferendoci ancora all'articolo di V. Stepanov e A. Zayats, notiamo l'uso del pacchetto Stat-Media. Inoltre, ci sono altri programmi disponibili a un prezzo accessibile che possono eseguire la regressione multivariata lineare, e questo è abbastanza per iniziare.

    È probabile che in Russia il punteggio non venga inizialmente utilizzato per le persone fisiche, ma per le persone giuridiche, semplicemente perché le banche hanno accumulato molte più informazioni sulle imprese, utilizzando sistemi di punteggio del rischio di varia complessità e con diversi livelli di automazione. La differenza tra sistema di scoring e sistema di scoring sta nel fatto che nel primo la significatività di un determinato coefficiente o indicatore finanziario è determinata soggettivamente, mentre nel secondo i coefficienti sono legati al livello di rischio.

    In Occidente, quando si prestano a persone giuridiche, i modelli di scoring non sono così diffusi come nei prestiti al consumo. Ciò è dovuto al fatto che è molto difficile reclutare un numero sufficiente di aziende simili tra loro per sviluppare un modello: le aziende differiscono notevolmente per dimensioni, fatturato e settori dell'economia. Più grande è l'impresa, più difficile è trovare imprese simili per il confronto.

    Negli ultimi anni si sono verificati grandi cambiamenti nello sviluppo di modelli di scoring per le piccole imprese. L'utilizzo dello scoring per le piccole e medie imprese si è rivelato possibile proprio per l'elevato numero di imprese simili.

    In conclusione, vorrei sottolineare che in Russia l'introduzione del punteggio è ostacolata non tanto da ragioni oggettive quanto soggettive legate all'atteggiamento diffidente dei dirigenti bancari nei confronti dei metodi matematici e statistici. Non ci vuole molto per iniziare ad analizzare i tuoi clienti - la cronologia dei crediti dei clienti passati e il pacchetto di statistiche - e il guadagno sarà enorme. Tra i vantaggi dei sistemi di punteggio, i banchieri occidentali indicano, prima di tutto, una diminuzione del livello delle insolvenze sui prestiti. Si rilevano, inoltre, rapidità e imparzialità nel processo decisionale, possibilità di una gestione efficace del portafoglio crediti, assenza di necessità di formazione del personale a lungo termine.

    In Russia, l'introduzione del punteggio dovrebbe essere effettuata gradualmente. Per cominciare, è possibile creare un sistema automatizzato per la valutazione preliminare dei mutuatari, che filtrerà automaticamente i rischi ovviamente "cattivi" e offrirà rischi "buoni" e "marginali" all'esame del comitato creditizio. Ma anche senza introdurre l'automazione, è possibile valutare il rapporto delle caratteristiche individuali del cliente con la probabilità di inadempienza sia per le persone fisiche che per le persone giuridiche: la conoscenza di tali caratteristiche può servire da supporto significativo agli addetti ai prestiti.

    Quindi, il punteggio è un sistema automatizzato di valutazione del rischio di credito ampiamente utilizzato negli Stati Uniti e nell'Europa occidentale. Il materiale di base per il punteggio è una varietà di informazioni sui clienti passati, sulla base delle quali, utilizzando vari metodi di classificazione statistici e non statistici, viene effettuata una previsione sull'affidabilità creditizia dei futuri mutuatari. I sistemi di scoring consentono ai dipendenti delle banche di prendere decisioni di prestito rapide, regolare i volumi di prestito in base alla situazione del mercato e determinare il rapporto ottimale tra la redditività delle operazioni di prestito e il livello di rischio.

    Nella stesura dell'articolo sono stati utilizzati materiali del Centre for the Study of Credit dell'Università di Edimburgo (Gran Bretagna).

    Lo scoring è un sistema di valutazione della clientela utilizzato dalle banche, che si basa su metodi statistici. Di norma, si tratta di un programma per computer in cui vengono inseriti i dati di un potenziale mutuatario. In risposta, viene fornito il risultato: vale la pena dargli un prestito. Il nome punteggio deriva dalla parola inglese punteggio, cioè "punteggio".

    Esistono quattro tipi di punteggio:

    punteggio delle applicazioni (traduzione letterale dall'inglese - "punteggio di domande, ricorsi") - una valutazione dell'affidabilità creditizia dei mutuatari al momento dell'emissione di un prestito. Questo è il tipo di punteggio più comune noto ai clienti. Si basa sulla raccolta primaria dei dati personali del mutuatario, sulla loro elaborazione da parte di un computer e sulla conclusione del risultato: concedere o meno un prestito;

    punteggio raccolta - sistema di punteggio nella fase di lavoro con crediti inesigibili. Determina le azioni prioritarie dei dipendenti della banca per rimborsare i prestiti "cattivi". Il programma, infatti, consente di compiere una serie di passaggi per far fronte ai crediti inesigibili, ad esempio, dal primo avvertimento al rinvio del caso a un'agenzia di riscossione. Si ritiene che nel corso di tale elaborazione circa il 40% dei clienti si riferisca all'oblio e ripaghi il prestito;

    punteggio comportamentale, "punteggio comportamentale" - una valutazione delle azioni finanziarie più probabili del mutuatario. Tale sistema consente di prevedere i cambiamenti nella solvibilità del mutuatario, adeguare i limiti fissati per lui. La base dell'analisi possono essere le azioni del cliente per un certo periodo, ad esempio le transazioni con carta di credito;

    punteggio di frode: una valutazione statistica della probabilità di azioni fraudolente da parte di un potenziale mutuatario. Tale punteggio viene solitamente utilizzato insieme ad altri tipi di ricerca sui clienti. Allo stesso tempo, si ritiene che fino al 10% delle inadempienze sui prestiti in Russia siano associate a frodi a titolo definitivo e questa cifra è in crescita.

    Molti sistemi di punteggio non solo elaborano i dati inseriti, ma sono anche in grado di autoapprendere: tengono conto del comportamento dei clienti già accettati per adeguare la loro valutazione dei futuri mutuatari.

    Esistono soluzioni già pronte sul mercato del software bancario. I programmi occidentali più famosi sono SAS Credit Scoring, EGAR Scoring, Transact SM (Experian-Scorex), K4Loans (KXEN), Clementine (SPSS). Tra gli sviluppatori russi spiccano Basegroup Labs, Diasoft e la società ucraina Neuro-Systems Business è ben nota. Allo stesso tempo, molte banche stanno sviluppando i propri sistemi.

    I sistemi di punteggio consentono di ridurre i costi e minimizzare il rischio operativo automatizzando il processo decisionale, riducendo i tempi di elaborazione delle richieste di prestito, consentendo alle banche di condurre la propria politica creditizia a livello centrale e fornendo una protezione aggiuntiva per gli istituti finanziari dalle frodi. Allo stesso tempo, il punteggio presenta anche una serie di svantaggi: spesso la decisione del sistema si basa sull'analisi dei dati forniti esclusivamente dal mutuatario. Inoltre, i sistemi di punteggio devono essere costantemente migliorati e mantenuti, poiché tengono conto solo dell'esperienza passata e reagiscono con ritardo ai cambiamenti della situazione socio-economica.