実際のデータに基づくスコアリング モデルの構築。 企業の借り手の信用力を評価するためのスコアリング モデルの形成。 モデルの構築に関係するデータ

デュボヴィツキー V. S.
ロシアの大手銀行のアナリスト
(モスクワ市)
企業財務管理
05 (65) 2014

この記事では、個々の指標の値に基づいて、借り手の支払能力を判断し、その有効性を評価することを可能にする、大規模な商社の信用力を評価するためのスコアリング モデルの開発に関する研究について説明します。 スコアリング モデルの開発における最も膨大なブロックは、評価指標のシステムの選択と、これらの指標の重み係数の決定です。これについては、この記事で詳しく説明します。

序章

銀行セクターの重要なビジネス分野の 1 つは融資です。 銀行資産の基礎となるのはローンであり、銀行に利子収入を提供します。 最近、わが国では、銀行セクター、主に銀行と人口、起業家、大企業との間の信用関係が急速に発展しています。 ローンには、金利収入だけでなく、借り手の破産やローンの損失に関連する信用リスクも伴います。 信用リスク評価は、特定の借り手への融資を決定する際の重要な分析領域であり、金融​​機関の健全性はそれに大きく依存します。

今日、銀行はさまざまな分析方法を使用して、起こりうる損失のレベルと借り手の債務不履行の可能性を評価しています。 この分析に基づいて、借り手は、ロシア連邦中央銀行の規則No. 254-p「形成の手順について」に従って、「良い」、「中」、または「悪い」の品質評価を割り当てられます。 2004 年 3 月 26 日

中央銀行は、信用システムの主要な規制当局として機能し、借り手の信用力の評価に関する勧告を行います。 それらに従って、銀行は独自の評価モデルを構築します-その多様性と作成者の創意工夫は驚くべきものです。 このようなモデルには、将来のソルベンシーの主な指標として、借り手の財政状態の包括的な評価が含まれます。 ただし、すべてのモデルは、財務上の損失のリスクのレベルを表す借り手の信用格付けを対象としています。 一般に受け入れられている分類によれば、信用度の高いレベルは、会社の財務状態が良好で、損失の可能性が低いリスク、中程度から平均的な財務状態、リスクが中程度のリスク、悪ければ、企業がデフォルトする可能性が高いことに対応します。借り手。 良好な状態では、ローンの発行に関して肯定的な決定が下される可能性が高く、平均には追加の調査が必要であり、悪い借り手は拒否されます。

銀行における信用リスク評価は、常に重要な位置を占めてきました。 したがって、ベイリーとゲイトリーの調査によると、 既存の方法潜在的な借り手の債務不履行の確率を評価するためのツールの予測能力を最適化および改善するという貸し手からの高い要求により、ニューラルネットワークを使用した評価などの新しい手法が時々登場することで、評価は常に改善されています。

したがって、信用力の評価は、ローンを発行する際の重要なタスクです。 この作業の目的は、信用の質を評価するための独自のスコアリング モデルを作成することです。 法人. 大企業向けに設計されます 小売りまた、さまざまな借り手に資金を提供することの適切性について迅速に決定を下すことができます。

最初に、信用力を評価するための既存のアプローチの簡単な比較分析を行います。 それに基づいて、スコアリング モデルの開発を支持する議論が行われ、その後、さまざまな理論的手法を使用してスコアリング モデルが直接開発されます。 開発における主なタスクの 1 つは、選択した業界を考慮したバランス スコアカードの定義と、これらの指標の加重係数の決定です。

次に、指標の重みによる結果を最初に得られた結果と比較するために、41 の加盟店のサンプル (そのうち 16 のデフォルトが記録された) に基づいて統計的調査が行われます。 比較の結果に基づいて、コンパイルされたスコアリング モデルの正確性に関する結論が示されます。 この記事の最後に、開発されたモデルの有効性の評価が提示され、開発されたモデルの予測能力が決定され、その実行可能性について結論が下されます。

信用評価へのさまざまなアプローチ

借り手の信用力を評価するための既存のモデルはすべて、次の分類として表すことができます (図 1)。

したがって、信用力の分析に対するさまざまなアプローチは、すべての方法を 3 つの大きなブロックに分割することで体系化できます。

  • 定量モデル;
  • 予測モデル;
  • 品質モデル。

定量モデルは関連する指標を使用し、それらに基づいて借り手に特定の格付けを割り当てることができます。予測モデルは過去の統計に基づいており、さらなる発展と借り手の債務不履行確率をモデル化することを目的としています。定性モデルは、汎用性の高い定性指標のシステムを使用します。

信用力を評価するための最も効果的なアプローチを決定するために、説明されている評価方法を比較します。 表で。 図 1 は、以前に検討されたローン評価モデルの比較特性を示しています。

表 1. 信用格付けモデルの要約表

モデル名 モデルの利点 モデルの欠点
係数法 借り手の財務状況を総合的に評価できます 品質指標、前年度の統計は考慮されていません。 自動化されていないシステムでは、個々の指標の値を常に解釈する必要があります
評価モデル 積分指標を計算することにより、係数法による評価を自動化できます。 利便性や使いやすさが違う 彼らは財務指標のみを考慮し、前年度の統計は使用しません。 さまざまな種類の企業のリストラが必要
スコアリング モデル 彼らは、ポイントに相当する信用力の評価を取得し、借り手を3つのグループのいずれかに割り当てることができます. シンプルで使いやすく、非財務品質指標の評価に役立ちます。 統計的方法で重み係数を評価する場合、すでに発行されたローンのデータを考慮に入れることができ、経済的に正当化されます 普遍的ではなく、特定の種類の企業ではリストラが必要です。 重み付け係数を調べるために大量のデータが必要
キャッシュ フロー モデル 会社の将来のキャッシュ フローを推定し、それらを債務負担と比較することができます。 彼らは、借入会社の市況や品質指標を考慮していません。 一貫性のない結果が生じる可能性があります
判別分析モデル 過去数年間の統計に基づいて、借入企業の債務不履行の確率を判断できるようにする
回帰モデル それらは、前年度の統計に基づいて、借り手企業の債務不履行の確率を決定することを可能にします。 正しいデータでモデルを使用すると、確実性の高い結果を得ることができます 純粋に経験的な結果は、トレーニング サンプルに大きく依存し、他のデータでモデルを調査する場合、多くの場合、現実に対応していません。 重み付け係数を調べるために大量のデータが必要
定性分析モデル 過ごすことを許可する 複雑な分析企業 数学的方法の欠如は、個々の指標の主観的評価と人的要因に関連するエラーにつながります。 前年の統計を考慮しないでください。 分析の品質ブロックの信用力を評価するための明確な規制はありません

上記の比較分析に基づいて、スコアリング モデルは量的進化の頂点にあると結論付けることができます. モデルの名前 モデルの利点 モデルの欠点

比率法 借り手の財政状態の包括的な評価を可能にします 品質指標、前年度の統計は考慮されません。 自動化されていないシステムでは、個々の指標の値を常に解釈する必要があります

評価モデル 積分指標を計算することにより、係数法による評価を自動化できます。 それらは利便性と使いやすさによって区別され、財務指標のみが考慮され、前年度の統計は使用されません。 さまざまな種類の企業のリストラが必要

スコアリング モデル 信用力の評価を点数で取得し、借り手を 3 つのグループのいずれかに割り当てることができます。 シンプルで使いやすく、非財務品質指標の評価に役立ちます。 統計的方法で加重係数を評価する場合、すでに発行されたローンのデータを考慮に入れることができ、経済的に正当化されます。普遍的ではなく、特定の種類の企業のリストラが必要です。 重み付け係数を調べるために大量のデータが必要

キャッシュ フロー モデル 会社の将来のキャッシュ フローを推定し、それらを債務負担と比較することを可能にします。 借入会社の市況と品質指標を考慮しません。 一貫性のない結果が生じる可能性があります

判別分析モデル 過去数年間の統計に基づいて、借り手企業の債務不履行の確率を決定することができます. 純粋に経験的な結果は、トレーニングサンプルに大きく依存し、他のデータでモデルを研究する場合、しばしば対応していません.現実。 重み付け係数を調べるために大量のデータが必要

回帰分析モデル 過去数年間の統計に基づいて、借入企業の債務不履行の確率を決定できます。 正しいデータでモデルを使用すると、信頼性の高い結果を得ることができます.これらは純粋に経験的なものであり、結果はトレーニング セットに大きく依存し、他のデータでモデルを調査する場合、多くの場合、対応していません。現実。 重み付け係数を調べるために大量のデータが必要

定性分析モデル 会社の包括的な分析を可能にする 数学的手法の欠如により、個々の指標の主観的評価と人的要因に関連するエラーにつながる。 前年の統計を考慮しないでください。 分析の品質ブロックの信用力を評価するための明確な規制はありません 異なる金額ポイント。 係数の値は、さらに範囲に分割されます。 各範囲 (表 2 の係数範囲の列) について、表 2 の重み付け係数のパーセンテージ (25%、50%、75%、または 100%) が設定されます。 2. この場合の加重係数は最大スコアです。 以下では、重み係数の検索に焦点を当てます。 したがって、係数の範囲への内訳は条件付きです(業界のさまざまな企業のこれらの指標の値に基づく論理的考察に基づいています。間隔は、業界の主要企業の約60%が業界 (Magnit、Dixy) は、平均市場係数とベンチマークを決定するために選択された最大値 (X5 Retail Group、OK、L'Etoile) の後の 2 番目の間隔に入ります) 負債負荷が高いほど、債務不履行の確率が高くなり、インディケータが受け取るべきポイントの数を減らします. 係数は分析的 (T. Saaty の方法) と統計的 (回帰研究) の 2 つのアプローチで表されます (この場合のポイントの最大数は重み係数と一致します.)係数自体は後で決定されます。

財務指標スコアリング モデルを表に示します。 2.

表 2. スコアリング モデルの財務指標

指標グループ 索引 係数範囲
流動性 > 0,75 1
0,5-0,75 0,75
0,25-0,5 0,25
0-0,25 0
ソルベンシー 0-1 1
1-1,5 0,75
1,5-2 0,5
2-2,5 0,25
> 2,5 0
< 1,5 1
1,5-2 0,5
> 2 0
インタレスト・カバレッジ・レシオ、EBIT/インタレスト > 1,5 1
1,3-1,5 0,75
1-13 0,5
< 1 0
事業活動 売上高利益率、ROS > 0,025 1
0,02-0,025 0,75
0,015-0,02 0,5
< 0,015 0
過去 3 報告期間の会社の損失 いいえ 1
1 つの報告期間について 0,5
0

許容比率値は、3 年間の IFRS ステートメントに基づいて、ロシアの 5 つの大手商社の平均値に基づいて決定されました: Magnit、X5 Retail Group、Dixy、OK、M.Video。 借り手の財務状況を判断するために、最も重要な財務指標を確認しました。 しかし、企業の信用力は、借り手のビジネスプロセスにおけるリスクの出現を引き起こす要因によっても大きく影響されます。 まず第一に、管理の質を考慮する必要があります。 これは、定量分析にとって非常に難しい指標です。 企業経営のレベルを客観的に評価するのは難しい。

定性的評価から定量的評価に移行し、次の条件下でこの指標の最大評価を設定しようとします。

  • 今後数年間の会社の発展のための明確な戦略があります。
  • トップマネジメントの構成は変わっていない(ゼネラルディレクターと主任会計士は2年以上の地位にある)ため、 強力な経営陣の存在は、とりわけ、その恒常性によって証明されます。
  • 専門能力が対応 高い要件(プロファイルの可用性 高等教育ゼネラルディレクターおよび主任会計士、実務経験 - 5年以上)。

スコアリング モデルに含まれる次の重要な要素は、会社の寿命です。 また、ストップ要因の導入が必要:事業期間が1年未満の場合 このモデル報告が不足しており、会社のビジネスを理解する能力がないため、適用されません。

もう1つの必要な指標は、良好な信用履歴です。 これは最も重要な非財務指標の 1 つであり、実際には、将来のローンのサービスの質を特徴付けます。 他の債権者への遅延がある企業からのタイムリーな信用資金の返済を期待するのは不合理です。 考慮された非財務指標とそれらのポイントの分布を表に示しましょう。 3.

表 3. スコアリング モデルの非財務指標

グループ 指標指標 範囲の最大スコアのパーセンテージ
ビジネスプロセス 経営品質 1
0,5
0
> 5年 1
3~5年 0,75
1~3年 0,25
< 1 года 停止要因
1
0,5
0
昨年の会計年度のローンと借入の体系的な遅延の存在; 多額の未払い債務 (> 25%) 停止要因

私たちの意見では、借り手の質と義務を果たす能力を包括的かつ包括的に評価する評価指標のシステムをまとめました。 スコアリング モデルを作成するときの作業の次の部分は、最も時間のかかる部分であり、さまざまな推定指標の重みを決定します。 モデルの予測値は、特定の要因の重要性をどの程度客観的に評価するかに依存します。 この記事では、考えられるエラーを排除するために、いくつかの方法に基づいて重みを分析します。

加重係数は、最初に分析手順を使用して決定され、次に回帰分析の結果と比較されます。

モデルの重み付け係数の分析的推定

評価ツールとして、TL ブックで詳細に説明されている方法論を使用します。 Saaty「紛争状況の数学的モデル」[b]。 この方法を使用すると、さまざまな要因から離れて、特定の時点での重要性についてそのうちの 2 つだけを比較し、最終的に、一般的な指標に対する各要因の影響の重要性を判断できます。 この手法は、一般的な指標に影響を与える要因のために構築されたペア比較の行列の編集に基づいています。 このようなマトリックスは、たとえば、財務レバレッジ、債務負担、およびインタレスト カバレッジの係数によって表される要因との関連でソルベンシー指標のために構築することができます。 タスクは、一般的な指標に影響を与える要因のすべてのグループについて、そのようなマトリックスを構築することです。 その結果、テーブルの 2 つのマトリックスが作成されます。 2 - 指標「ソルベンシー」および「事業活動」のグループの場合、表の 1 つのマトリックス。 3 - ビジネス プロセスの指標、および集計レベルの 2 つのマトリックス - 指標のグループ「流動性」、「ソルベンシー」、および「事業活動」で構成される財務指標のグループの 1 つのマトリックスと、2 つの集計ブロックの 1 つのマトリックス- 一般的な財務および非財務指標。

合計で 5 つのペアワイズ比較行列があり、それぞれに含まれる指標に独自の係数が与えられます。 したがって、階層の最下位にある指標、たとえばインタレスト カバレッジ レシオの重み係数を取得するには、財務指標の重み係数に財務指標内のソルベンシー指標の重み係数を掛けて、財務指標内のインタレストカバレッジ指標の係数によって。

指標のグループのマトリックス自体の見出しでは、因子の名前が縦と横の列に配置されます。 次に、マトリックスは、ある要因の主観的な好みの別の要因への変換を表す値で埋められます。 経験的見解表に示す方法に従って。 4 (図 2 のデータを使用)。

表 4. T. Saaty の方法。 好みの分類(図2に基づく)

主に奇数が使用されますが、選択が難しい場合は、2 つの奇数の平均レベルとして偶数を使用することもできます。 このような 4 つの因子のマトリックスの例を図 1 に示します。 2. したがって、同じ因子を比較すると、要素は値 1 を取るため、そのような行列は恒等行列です。 それらが逆対称であることも簡単にわかります。これにより、主対角線の上または下にある値に対してのみそのような行列を埋めることができます。

ペアワイズ比較の行列が逆対称であることを考えると、一方向のみで比較し、対応する値を主対角線の上の行列に入力する必要がありますが、主対角線の下の値は逆になります。

このような行列を 5 つ受け取った後、重み係数が計算されます。列の合計に対する行列の各値の重みが測定され、これらの値からこれらの値の算術平均が取得されます。各行で。 算術平均値が重み係数になります。 ソルベンシー指標のグループのマトリックスの例を図 1 に示します。 3.

説明した計算を行った後、各指標の特定の重みを取得します。 さらに計算しやすくするために、可能な最大スコアを指標の特定の重みと 50 1 の積として定義し、その後整数に丸めます (表 5.6)。

1 この操作は便宜上のみ行われます。数値 50 を使用すると、最小係数を整数値 (この場合は値 2) にすることができます。 すべての係数が同じ数で乗算されるため、分析アプローチの結果が歪められることはありません。 - 約。 編。

回帰分析を使用した指標の重要性の決定

統計調査を実施するために、41 のデータを使用しました。 大企業小売部門から。 これらの企業は社債を発行し、16 社の社債がデフォルトしました。 各企業について、社債発行年の年次報告書に基づいて、スコアリング モデルの選択された 8 つの指標が計算されました。 サンプルは付録 1 に示されています。これには説明指標 y (デフォルトの確率) が含まれており、会社が義務を履行していない場合、値は 1 になります。 右側の選択された 3 つの指標は、定性的な性質のため、ダミー変数 (0 または 1 の値のみを取ることができます) として設定されました。 過去 3 年間の会社の純利益 > O (Nl > 0)、安定した高品質の経営陣 (マネージャー)、および肯定的な信用履歴 (履歴) がある場合、値は 1 になります。 財務指標(最初の 5 つの指標)は、債務不履行債が発行された年の IFRS 基準に基づく年次財務諸表に基づいて計算されました。

研究のモデルとして、線形多変量回帰の構築を選択します。

p = w 0 + w 1 x 1 + w 2 x 2 + ... + w n x n ,

ここで、p は債務不履行の確率を表す従属変数です。
w - 重み係数; x - 指標。

それでは、Excel に初期データを入力して、データ分析 - 回帰関数を使用してみましょう。 スコアリング モデルの 8 つの指標の初期データを調整なしで分析すると、付録 2 に示す結果が得られます。調整後の R^2 は 0.55 です。これは低い値ですが、許容できる値であり、構築された回帰の実際的な重要性を示しています。 データに外れ値が存在することの重要性が低い理由について、たとえば、債務負担がないためにEBIT /利子の点で一部の企業の値が存在しないなど、仮説を立てることができます(簡略化して、研究の目的のために、この場合は0に等しい係数の値が取られました)または負の観点からの債務/ EBITDA指標の負の値 現金流量. この場合、負の指標の影響が誤って認識されます。これは、調査の論理によれば、負債 / EBITDA が高いほどデフォルトの可能性が高くなるためです。 負の指標は、債務負担が低いことを示すものではありません。 また、予測能力は、個々の指標の極端な値が顕著な企業によって影響を受けます。 そのため、Banana-Mama 社の自己資本は 10,000 ルーブルであり、対応する指標の歪みにつながります。財務レバレッジは 181,957 です (業界平均値は 0.7 ~ 1.5 の範囲です)。

表 5. ウエイトを考慮した財務指標

索引 スコアカードの重み 最大スコア 係数範囲
>1 5
現在の流動性比率 0,1072 5 > 1 5
0,75-0,1 4
0,5-0,75 1
0-0,5 0
現在の流動性比率 0,1581 8 < 1 8
1-1,5 6
1,5-2 4
2-2,5 2
> 2,5 0
負債負荷率、純負債/EBITDA 0,1581 8 < 1.5 8
1,5-2 4
> 2 0
0,0790 4 > 1,5 4
1,3-1,5 3
1-1,3 2
< 1 0
売上高利益率、ROS 0,1256 6 > 0,025 6
0,02-0,025 5
0,015-0,02 3
< 0,015 0
0,0418 2 いいえ 2
1 つの報告期間について 1
2 報告期間以上 0
合計 0,6698 33 - 68

次の 6 つの企業を調査から除外しましょう: Gorod スーパーマーケット、Intertrade、M.Video (2013)、Svyaznoy、Banana-Mama、Proviant。 また、ROS インジケーターを同時に使用することは不可能であり、相関が高いため、損失がない (Nl > 0) ことにも注意してください。 事実、会社に損失がある場合、売上高の収益性は自動的にマイナスの値になります。

表 6. ウェイト別の非財務指標

索引 スコアカードの重み 最大スコア 比率の範囲 / 推定方法 重量範囲のポイント数
経営品質 0,099 5 記載されているすべての条件の達成 5
いずれかの条件を満たしていない 2,5
複数の条件を満たさない 0
会社の寿命 0,0528 3 > 5年 3
3~5年 2
1~3年 1
< 1 года 停止要因
肯定的な信用履歴 0,1782 9 貸付金の延滞、未払金の発生がないこと 9
債務再編に関する情報の入手可能性。 買掛金の軽微な遅延 (最大 10%) 4,5
その後の返済を伴うローンとクレジットの遅延の 1 つのケース。 買掛金の大幅な遅延 (総負債の 10 ~ 25%) 0
昨年の会計年度のローンと借入の体系的な遅延の存在; 多額の延滞買掛金 (>25%) 停止要因
合計 17

これらの考慮事項に基づいて、指標 Nl > 0 をモデルから削除します。 35 社の最新のサンプルに対する新しい 7 因子回帰の場合、次の結果が得られます (付録 3)。 調査した 7 つの指標のうち 6 つが有意であることがわかります。 係数の記号は、上記の仮定を正しく反映しています。販売の収益性と経営の質が高いほど、債務不履行の確率は低くなり (y = 1)、逆の場合も同様です。負債の負荷が高いほど、確率は高くなります。デフォルトの。 一見、符号が間違っているのは現在の流動性比率だけです。 ただし、高い流動性の値は、小さい値と同じくらい悪いです。これは、ビジネス効率が低く、利益が失われていることを示しています。 流動性比率が高い企業は、利益が不足し、収益性と事業の収益性が低くなりがちであり、潜在的な投資家の目に魅力的ではないため、財務状況の変化に対して脆弱になります。 最も重要なのは、係数 D (または負債 - 有利子負債の量) / EBITDA、肯定的な信用履歴、および財務レバレッジです。 インタレスト・カバレッジ・レシオは重要ではありません。

上で、T. Saaty メソッドを使用して係数をモデル化するとき、最も重要な指標は債務負担と財務レバレッジの係数であると仮定しました。 係数の最終的な有意性の比較分析を表に示します。 7。

表 7. 係数の有意性の比較分析

T. Saty の方法による専門家の評価に基づく指標 係数 回帰分析に基づく指標 p値
肯定的な信用履歴 0,1782 負債負荷率、純負債/EBITDA 0,014
財務レバレッジ比率 0,1581 肯定的な信用履歴 0,020
負債負荷率、純負債/EBITDA 0,1581 財務レバレッジ比率 0,022
売上高利益率、ROS 0,1256 経営品質 0,037
現在の流動性比率 0,1072 売上高利益率、ROS 0,039
経営品質 0,099 現在の流動性比率 0,047
インタレスト・カバレッジ・レシオ、EBIT / インタレスト 0,0790 インタレスト・カバレッジ・レシオ、EBIT / インタレスト 取るに足らない
過去 3 報告期間の会社の損失 0,0418 過去 3 報告期間の会社の損失 非財務指標として研究された、重要でない

これらの結果は、T. Saty の方法と統計データの一貫性を示しています。 分析的アプローチによる最も重要な 3 つの指標は、その高い重要性を裏付けています。 実践研究、インジケーター自体の順序の分布のみが変更されました。 また、作業の最初の部分で最も重要でない 2 つの指標 - 管理の質と EBIT / 利息 - は、統計調査では重要ではないことが判明しました。

したがって、回帰分析は、作業の分析部分における重み係数の有意性の分類の原則を確認し、構築されたスコアリングモデルの統計的有意性について話すことを可能にします。

開発されたスコアリング モデルの結果の決定

スコアリング モデルの合計最大スコアは 50 です。各指標について、値の範囲を決定する過程で、最大スコアの次のレベルを特定しました。指標の市場価値について。 一部の指標では、最大値に続くレベルが総ポイント数の 75% であり、他の指標では - 50% でした。 それ以降のすべてのレベルは、信用リスクが高いレベルと見なされ、対応する借り手は不良として分類されます。 最も好ましいグループには、信用履歴、財務レバレッジ、負債負荷、および 31 ポイントの売上高利益率と少なくとも他の指標の要件の次の最大レベル - 合計で 12.5。 下位の高信用度は合計 43.5 ポイント。

特徴的な境界間隔を決定するには 高度な信用力、表の値の最大範囲の次の財務および非財務指標のポイント数を計算します。 5およびb。 指標は、受け入れられた係数の値に従って他の範囲に分割されます。 次の分類が得られます (表 8)。

表 8. 結果の分類

表 9. スコアリング モデルの予測能力、%

表に基づく。 8では、会社のデータを条件に代入して、モデルの予測能力を評価します。 付録 4 は、調査対象企業の計算スコアを示しています。 インジケーターの値に応じて、開発されたモデルに従ってそのスコアが表に入力され、すべてのスコアが合計されて積分インジケーター (「合計」列) になりました。 合計点に基づいて企業を 3 つのクラスに分類し、その企業の実際の債務不履行の有無とデータを比較しました。 「真かどうか」の列で、1 はスコアリング モデルの正しい結果を意味し、0 はエラーを意味します。 したがって、次の結果が得られました (表 9)。

スコアリング モデルの予測能力について、(さまざまな情報源で説明されているものと比較して) 平均的な結果が得られました。 ただし、タイプ II エラーの割合が低いことは注目に値します。これにより、モデルの予測値が向上します。 この結果は肯定的であると見なすことができ、研究の有効性を確認します。

結論

この論文では、大規模な小売業企業の信用力を評価するためのスコアリング モデルが提案されました。 このモデルは、借り手の財務状況および非財務状況を包括的に評価することを可能にする一連のパフォーマンス指標に基づいています。

評価の結果に基づいて、借り手には、信用リスクの程度と融資の実現可能性を特徴付ける 3 つの信用度クラスのいずれかが割り当てられます。

私たちは、小売部門の借り手の状態を最も正確に評価できるパフォーマンス指標のシステムをモデル化しました。 小売市場のリーダーを分析し、それらに使用される指標を計算した後、それらの許容値の境界を決定し、それらをランク付けしました 異なるグループ可能な最大スコアのさまざまなパーセンテージで。

最も時間のかかる作業は、調査した指標の重み係数を決定することでした。 1 つの理想的な方法がないため、統合されたアプローチが必要であると結論付けられました。 複雑なアプローチ作業の最初の部分では、重み係数は分析手順を使用して決定され、2 番目の部分では統計的研究を使用して決定されました。

開発されたモデルは、分析に大きなリソース コストを必要としない一方で、予測能力において高い結果を示しました。 開発されたスコアリング システムの試運転は、大規模な小売企業の分野における与信の意思決定の効率を高め、与信プロセスを最適化します。

文学

1. Ayvazyan S.A.、ムヒタリアン BC 応用統計と計量経済学の基礎。 - M.: GU HSE、1998。

2. ガブリロワ A.H. 組織の財政。 - M.: Knorus、2007 年。

3. Korobova G.G.、ペトロフ M.A. 競争環境における銀行の借り手の支払能力とその評価 // 銀行サービス。 -2005年。 -No. 7/8。 -C. 22-24。

4. Kulikov N.I.、Chainikova L.I. 企業の借り手の信用力の評価。 - タンボフ: TSTU 大学、2007 年。

5. 2004 年 3 月 26 日付のロシア連邦中央銀行の規則第 254-P 号「ローン、ローンおよび同等の債務に関する潜在的な損失に対する信用機関による準備金の形成手順について」 - http:// base.garant.ru/584458/。

6. サティ T.L. 紛争状況の数学的モデル / Ed。 I.A. ウシャコフ。 - M.: ソ連のラジオ、1977 年。

7. Sheremet A.D.、Saifulin R.C.、Negashev H.B. 方法論 財務分析. - M.: インフラ M、2001 年。

8. Abdou H.A.、Pointon J. (2011). 「クレジットスコアリング、統計的手法、および評価基準:文献のレビュー」. 会計、財務、管理におけるインテリジェントシステム、Vol。 18、いいえ。 2-3、pp。 59-88。

9. ベイリー M. (2004). 消費者信用の質: 引受、採点、不正防止および回収。 ホワイト ボックス パブリッシング、キングスウッド、ブリストル。

10. クルック J.、エデルマン D.、トーマス L. (2007). 「消費者信用リスク評価における最近の展開」. European Journal of Operational Research、Vol。 183、いいえ。 3、pp。 1447-1465。

11. Gately E. (1996). 財務予測のためのニューラル ネットワーク: 最新の取引システムを設計および適用するためのトップ テクニック。 ニューヨーク: John Wiley & Sons, Inc.

12. Guillen M.、Artis M. (1992). クレジット スコアリング システムのカウント データ モデル: デュレーション、カウント、および遷移モデルの計量経済学に関する量的経済学および計量経済学の欧州会議シリーズ。 パリ。

13. Heffernan S. (2004). 現代の銀行。 John Wiley & Sons, Inc.、チチェスター、ウェスト サセックス。

14.梁Q.(2003)。 「中国における企業の財政難: 信用評価モデルを使用した実証分析」. 一橋商学雑誌 Vol. 38、いいえ。 1、pp。 13-28。

附属書 1。

研究サンプル

会社 y / デフォルト フラグ 現在の流動性比率 EBIT / 金利 / EBIT 対金利比 NI > 0 / 純利益の有無
1 薬局 36.6 0 0,82 1,32 2,41 1,83 0,0496 1 1 1
2 L "エトワール 0 5,04 2,75 10,98 1,64 0,007 1 1 1
3 吠える 0 0,795 0,77 3,13 1,89 0 0 1 1
4 リボン 0 0,75 9,7 2,91 3,1 0,049 1 1 1
5 OK 0 0,67 0,78 1,59 7,01 0,0357 1 1 1
6 オートワールド 0 1,2 0,65 3,09 1,35 0,04 1 1 1
7 Х5 小売グループ 0 0,55 0,53 3,32 2,82 0,027 1 1 1
8 0 0,99 18,97 10,25 1,29 0,01 1 1 0
9 子供の世界 0 0,93 0,83 2,14 3,99 0,032 1 1 1
10 デキシー 0 0,77 1,19 6,1 1,78 0,01 1 1 1
11 インタートレード 0 1,24 20,65 4,92 2,1 0,015 1 1 0
12 カルーセル 0 0,73 0,68 3,175 1,71 0,059 1 1 1
13 ペニー 0 0,68 2,93 7,03 1,82 0 0 1 1
14 コスモスグループ 0 1,64 1,11 2,88 2,65 0,043 1 1 1
15 磁石 0 0,54 1,11 10,2 0,061 1 1 1
16 マグノリア 0 0,27 2,35 3,55 1,02 0,064 1 1 1
17 M.ビデオ (2007) 0 1,31 0,73 1,9 2,58 0,013 1 1 1
18 M.ビデオ (2013) 0 0,95 0 0 0 0,039 1 1 1
19 JSC「NTS」 0 1,18 3,09 5,44 1,05 0,21 1 0 1
20 ロシアの靴 0 0,87 2,34 1,87 5,65 0,1 1 1 1
21 クロスロード (2005) 0 0,54 1,09 3,16 3,92 0,026 1 1 1
22 ピヴドム 0 1,99 3 8 1,1 0,0006 1 0 1
23 家族 0 10 0,28 1,66 6 0,58 1 1 1
24 スヴャズノイ 0 1,07 0 0 0 0,001 1 1 1
25 エレカム 0 1,44 1,82 4,25 1,3 0,01 1 1 1
26 大きい 1 1 15 11 1,52 0,01 1 0 1
27 プレステージエクスプレス 1 8 0,98 12,43 1,02 0,002 1 0 1
28 アルバート プレステージ 1 0,49 1,81 7,6 1,45 0,017 1 1 0
29 1 3 1,164 13 0 0,01 1 0 1
30 バナナママ 1 0,94 181957 -35 -0,6 -0,033 0 1 0
31 白いフリゲート艦 1 7 932 8,76 0,88 -0,4 0 1 1
32 マーサ 1 3,96 20 11 1/17 0,003 1 1 1
33 マトリックス 1 2,38 21 6,82 1 0,001 1 0 0
34 水星
(自画自賛)
1 1,12 9,98 7,32 1,27 0,003 1 1 1
35 ミネスコ 1 0,79 4,39 12 0,12 -0,047 0 1 1
36 モスマート 1 12 5 8 1,5 0 0 0 0
37 ポリッシャ 1 7,93 15 14 1,03 0,003 1 0 1
38 規定 1 0,12 35557 0 0 -0,819 0 0 1
39 第七大陸 1 1,93 0,41 1,52 1,35 0,07 1 0 1
40 テクノシラ 1 14 18 10,36 1 0,002 1 1 1
41 TOAP 1 7 22 10,83 1,04 0,009 0 0 1

注: 会社に債務不履行があった場合、係数の値は 1 になり、債務不履行がなかった場合は 0 になります。

付録 2

41社の8因子回帰

回帰と残差 DF / 自由度の数 SS / 平方和 MS=SS/DF F統計量 有意性 F / 有意性
回帰 / 回帰 8 6,250849408 0,781356176 7,133131961 2.17209Е-05
残差 32 3,505248153 0,109539005 - -
合計 / 合計 40 9,756097561 - - -
使用されるパラメータ tStat/t統計量 P値・有意性
切片/一定 0,354797355 0,281481615 1,260463691 0,216616062
現在の流動性比率 0,034652978 0,01876389 1,846790732 0,074043212
レバレッジ / 財務レバレッジ 1.31819Е-05 4.77939E-06 2,758072506 0,009529947
D / EBITDA / EBITDA有利子負債比率 0,044980795 0,018152923 2,477881708 0,018682248
-0,012377044 0,030936193 -0,40008296 0,691753745
ROS / 売上利益率 -0,530759612 0,375019201 -1,415286499 0,166643428
NI > 0 / 純利益の有無 -0,02891433 0,164713359 -0,175543319 0,861758855
マネージャー / 品質管理 -0.266367tl2 0,134861932 -1,975109717 0,056935374
ヒストリー/信用履歴の質 -0,109402928 0,159841844 -0,684444857 0,498621797

付録 3

35社の7因子回帰

回帰と残差 DFI 自由度数 SS / 平方和 MS=SS/DF F統計量 有意性 F / 有意性 F
回帰 / 回帰 7 5,898901667 0,842700238 9,097165886 9.56Å-06
残差 27 2,501098333 0,092633272 - -
合計 / 合計 34 8,4 - - -
使用されるパラメータ 係数・係数 標準誤差 / 標準誤差 t 統計量/t 統計量 P値/有意性
切片/一定 0,473712463 0,25308461 1,871755309 0,072111654
現在の流動性比率 0,018420061 0,017803477 1,034632774 0,047018946
レバレッジ / 財務レバレッジ 0,017110959 0,009674238 1,768713818 0,022823937
D / EBITDA / EBITDA有利子負債比率 0,046019604 0,021802198 2,110778177 0,014194286
EBIT / 利子 / EBIT 対利子率 -0,004583381 0,032996403 -0,13890548 0,89055573
ROS / 売上利益率 -0,582081686 0,483677061 -1,203451088 0,039247801
マネージャー / 品質管理 -0,174077167 0,138900851 -1,253247659 0,03786026
ヒストリー/信用履歴の質 -0,378981463 0,194742843 -1,946061058 0,020243892

付録 4

スコアリング モデルを使用したサンプルからの企業の評価

会社 現在の流動性比率 レバレッジ / 財務レバレッジ D / EBITDA / EBITDA有利子負債比率 EBIT / 利子 / EBIT 対利子率 ROS / 売上利益率 マネージャー / 品質管理 歴史/肯定的な信用履歴 会社の寿命 クラス 本当かどうか*
薬局 36.6 0 4 6 4 4 6 5 9 3 41 2 1
L "エトワール 0 5 0 0 4 0 5 9 3 26 3 0
吠える 0 4 8 0 4 0 5 9 3 33 2 1
リボン 0 1 0 0 4 6 5 9 3 28 3 0
OK 0 1 8 4 4 6 5 9 3 40 2 1
オートワールド 0 5 8 0 3 6 5 9 3 39 2 1
Х5 小売グループ 0 1 8 0 4 5 5 9 3 35 2 1
子供の世界 0 4 8 4 4 6 5 9 3 43 2 1
デキシー 0 4 6 0 4 0 5 9 3 31 2 1
カルーセル 0 1 8 0 4 6 5 9 3 36 2 1
ペニー 0 1 0 0 4 0 5 9 3 22 3 0
コスモスグループ 0 5 6 0 4 6 5 9 3 38 2 1
磁石 0 5 8 8 4 6 5 9 3 48 1 1
マグノリア 0 0 2 0 2 6 5 9 3 27 3 0
M.ビデオ (2007) 0 5 8 4 4 0 5 9 3 38 2 1
JSC「NTS」 0 5 0 0 2 6 0 9 3 25 3 0
ロシアの靴 0 4 2 4 4 6 5 9 3 37 2 1
クロスロード (2005) 0 1 6 0 4 5 5 9 3 33 2 1
ピヴドム 0 5 0 0 2 0 0 9 3 19 3 0
家族 0 5 8 4 4 6 5 9 3 44 1 1
エレカム 0 5 4 0 2 0 5 9 3 28 3 0
大きい 1 4 0 0 4 0 0 9 3 20 3 1
プレステージエクスプレス 1 5 8 0 2 0 0 9 3 27 3 1
アルバート プレステージ 1 0 4 0 3 0 5 0 3 15 3 1
1 5 6 0 0 0 0 9 3 23 3 1
白いフリゲート艦 1 5 0 0 0 0 5 9 3 22 3 1
マーサ 1 5 0 0 2 0 5 9 3 24 3 1
マトリックス 1 5 0 0 0 0 0 0 3 8 3 1
マーキュリー(自画自賛) 1 5 0 0 2 0 5 9 3 24 3 1
ミネスコ 1 4 0 0 0 0 5 9 3 21 3 1
モスマート 1 5 0 0 3 0 0 0 3 11 3 1
ポリッシャ 1 5 0 0 2 0 0 9 3 19 3 1
第七大陸 1 5 8 4 3 6 0 9 3 38 2 0
テクノシラ 1 5 0 0 0 0 5 9 3 22 3 1
TOAP 1 5 0 0 2 0 0 9 3 19 3 1

※この欄は、スコアリングモデルに基づき、当社が当該企業への融資を適切に判断したかどうかを示しています。

からの直訳での「スコアリング」という用語 英語で「採点」を意味します。 これは、特定の人に融資するためのリスク評価、数学的予測に基づくリスク管理のシステムと方法の名前です。 銀行のスコアリングにより、クレジット履歴やその他のデータからの情報に基づいて、支払いが遅れる可能性を判断できます。 主な基準は、以前は金融機関の従業員が手動で計算していたポイントですが、今では特別なプログラムによって計算されることがますます多くなっています。

スコアリングは、スペシャリストがアプリケーションを検討するのに 1 時間以内しか与えられないエクスプレス レンディングやマイクロファイナンスの分野で効果的に機能します。 の 特別番組潜在的な借り手のデータが入力されます。 システムは情報を統計と比較します。 たとえば、同じ年齢および/または職業の人々がローンを返済しなかったというデータベースに多くの情報がある場合、決定は否定的である可能性があります-銀行は理由を説明せずに拒否する可能性があります.



借り手の信用力の評価- 個人- 以下を含むさまざまな情報の分析に基づいて自動的に:

  • 識別データ. 申請者のパスポートデータ、写真を加工中です。 すでにこの段階で、詐欺師、信用履歴の悪い人が特定されています。
  • 社会的地位. 申請者の性別、年齢、学歴、勤務地が考慮されます。 登録住所と居住地、家族の存在、扶養家族が考慮されます。
  • 財務状態. 理想的には、十分な収入だけでなく、定期的な収入も必要です。 一部の銀行では、考えられる費用も考慮しています。 ユーティリティ, 幼稚園多くの請求者は、扶養家族を請求しない、または収入を誇張することによって、多大な努力を払っています。 少額のローンの場合はこれでうまくいくかもしれませんが、大規模なローンの場合、銀行は通常、データをより徹底的にチェックします。
  • 信用履歴. 個人の信用力を判断する上で、過去のローン情報は決定的な要素の1つです。 未払いのローン、遅延の有無、およびそれらが支払われた時間が決定されます。 ローンが慎重に処理された場合、システムはクライアントが将来同じ行動をする可能性が高くなり、スコアが高くなります。 同じ原理が機能します ;
  • 取引行動. 評価オプションは、金融機関の顧客である申請者が利用できます。 プラスチックカード、預金口座、給与計算プロジェクトの参加者は、多くの場合、高得点を獲得します。 システムは、購入金額、POS のカテゴリを評価します。

すべてのデータは個別にチェックされ、矛盾がないか相互に比較されます。 収入と支出、地位と居住地などの間に関係があること。

公平性. 信用力を評価するための採点システムは、個人の個人的な特徴を考慮せずに、事実と数字で機能します。 申請を受け付けた事務員は、計算アルゴリズムに一切影響を与えることはできません。 融資担当者は、プログラムが借り手を支払能力のある人物と評価した場合、融資の発行を不当に拒否する権利はありません。

効率. 手動モードでの採点は、表形式で実行されます。 別の行で、スペシャリストは独自にデータを入力し、ポイントを割り当て、自分の経験と知識のみに焦点を当てます。 このプロセスは面倒で時間がかかり、申請者は 1 時間以上待たなければなりません。 最新のプログラムは、数百倍も速くスコアを計算します。

金銭的利益. クレジット スコアリング システムを使用する銀行は、多くの場合、より有利な融資条件を提供します。 リスクの計算と潜在的な未払い者の自動排除により、通常は金利に含まれる未払いの割合が大幅に削減されます。 これは、借り手と貸し手の両方に利益をもたらします。

まず第一に、遅滞なく、良好な信用履歴を形成する必要があります。 客観的な理由でタイムリーな支払いが不可能な場合は、できるだけ早く銀行に通知し、一時的な支払不能を証明する必要があります。 ほとんどの貸し手は、支払いの延期、再計算、またはその他のソリューションを提供することで、クライアントのニーズを満たしています。 この場合、支払いの拒否によって履歴が損なわれることはありません。 履歴にすでにマイナスの線がある場合は、タイムリーに支払われたローンによって補うことができます。

信用力のスコア評価を高めるもう 1 つの方法は、預金の存在です。 オープンバンクデポジットは、クライアントが支払う資金を持っていることを明確にします. 同じことは、通常、高いスコアを持つ給与カード所有者にも当てはまります。

スコアを上げるには、アプリケーションへの記入を慎重に検討する必要があります。 信頼できる連絡先情報を提供し、アンケートに電話番号を入力したすべての人に警告することをお勧めします。 銀行員が呼び出しを開始した場合、すべての加入者に電話する必要があります。 そうしないと、その情報が信頼できないものとして認識され、信用が拒否される可能性があります。

採点プログラムが支払不能と判断したためにローンが拒否されたとしても、絶望しないでください。 おそらく、この銀行だけではアルゴリズムの設定があなたにとって不利です。 これを確認するには、当サイトでスコアリングに合格してみてください。

知識ベースであなたの良い仕事を送信するのは簡単です。 以下のフォームを使用してください

研究や仕事で知識ベースを使用する学生、大学院生、若い科学者は、あなたに非常に感謝しています。

ポストする http://www.allbest.ru/

ポストする http://www.allbest.ru/

  • 序章
    • 1.4 ニューラルネットワーク
    • 1.5 チャイド分析
    • 1.6 その他の方法
    • 2.1 問題の説明
    • 3.1 Monge-Kantorovich 問題
    • 3.2 Monge-Kantorovich 問題のスコアリングへの適用
  • 結論
  • 参考文献

序章

スコアリングは、評価を構築し、さまざまなオブジェクトをグループに分類するヒューリスティックな方法です。 これは、同様の社会的指標を持つ人々が同じように行動するという仮定に基づいています. 銀行、マーケティング、保険事業で使用されます。

従来のスコアリングの主な目的は、銀行の顧客を「良い」と「悪い」に分類することです。これに基づいて、貸し手はこの顧客に対して適切なアクションを選択できます。 たとえば、「悪い」顧客は、ローンを返済する経験的確率が低い顧客として定義できます。 しかし、原則として、このような「悪い」クライアントの定義は、銀行にとって望ましくないクライアントの行動に拡張されます。 分類はスコアカードに基づいて実行され、クライアントのスコアスコアが計算されます。 ベイジアン判別スコアリング

スコアリングに専念した文献から、いくつかの作品に注目します。

2008 年、Elizabeth Mays が編集した「クレジット スコアリングのガイド」 - ロシア語で書かれたスコアリングに関する唯一の本。 説明された 一般的な概念、スコアカードを作成する方法を分析し、実際のスコアリングの適用について説明します。 この本は、金融分野の外国人専門家による記事で構成されています。

Samuel Glasson の論文「A Censored Sampling Method for Credit Scoring」、2007 年。打ち切りデータの下でのクレジット スコアリングのための生存分析ツールを調べています。 線形回帰法、特に Buckley-James 法の適用を分析します。 実用的な部分この作業には、クレジットのデフォルトの時間と次の支払いの支払い時間の推定へのこれらの方法の適用が含まれています。

Christina Bolton による論文「ロジスティック回帰とクレジット スコアリングへの応用」、2009 年。クレジット スコアリングの概念は、南アフリカの銀行業務に関連して分析されています。 スコアリング モデルを構築する方法は、ロジスティック回帰の方法に特に重点を置いて検討されます。 このメソッドは、スコアリング モデルを作成するために使用されます。

Mattias Kremple による論文「適応モデルとクレジット スコアリングへの応用」、2011 年。データのドリフトと遅延の状況で予測モデルを構築する方法の研究に重点が置かれています。 紹介された 新しい方法デシジョン ツリー法に基づくスコアリング モデルの構築用。 提示された方法は、実際の財務データの 2 つのセットのドリフトを推定するために適用されます。

上に挙げた作品には、 よくある問題: スコアリング モデルの構築へのメソッドの適用は正当化されません。 これにより、得られたデータの正確性に疑問が生じます。 タスクは、アプリケーションが正当化されるメソッドを構築することです。 この論文では、この問題を解決する方法を紹介します。

スコアリング モデルを構築するには、多くのアプローチがあります。 この作品の第 1 章では、上記の論文で使用されている方法について説明します。 第 2 章の紹介 数学モデルスコアリング モデルを構築するための経験的なベイジアン アプローチをスコアリングおよび分析します。このアプローチは理論的に記述され、ロシアの Sberbank の実際のデータに適用されてスコアリング モデルが構築されます。 第 3 章では、Monge-Kantorovich 問題に基づく方法を紹介します。 使用の理論的実証 この方法. 次に、第 2 章で使用したデータに基づいてスコアリング モデルを構築するために使用されます。

第 1 章 スコアリング モデルの構築方法

1.1 スコアリングの出現と発展の歴史

当初、スコアリングは、ローンを発行するかどうかを決定するプロセスを自動化する目的で開発されました。 スコアリングが導入される前は、誰がどのくらいの金額でローンを発行するかの決定は、ローン担当者によって行われていました。 彼はこれを経験と彼自身の意見に基づいて決定し、彼の信用力に影響を与えるクライアントのパラメーターに導かれました.

1940 年代に、スコアリング システムの導入が始まりました。 1941年、デヴィッド・デュランドが最初の 研究活動彼は、クレジット スコアリングについて、予測システムにおけるさまざまな要因の役割を評価しました。 第二次世界大戦後、クレジット商品の需要が急増し、 伝統的な方法状況下では意思決定がうまく機能しない 多数クライアント。 クレジット カードの導入が一因となったローン需要の急増により、貸し手は自動ローン意思決定システムを実装するようになりました。 コンピューター技術の並行開発がこれに貢献し、大量の財務データの処理を可能にしました。

FICO は、消費者ローンを開発するために 1956 年に設立されました。 60 年代に、スコアリングの分野でコンピューター技術の導入が始まりました。 1963 年に、クレジット スコアリングに判別データ分析を使用することが提案されました。 そして1975年、「米国信用機会均等法第1条」が可決され、ついにスコアリングが認められるようになりました。

クレジット スコアリングの発展における重要なステップは、90 年代初頭の行動スコアリングの出現でした。 その目的は、既存の顧客の支払いを予測することです。

最近、採点システムの開発は、外部環境による規制によって推進されています。 第 2 回バーゼル合意 (2001 年バーゼル銀行監督委員会) の発効に関連して銀行に課せられた自己資本要件の一環として、金融機関は融資ポートフォリオに関連するリスクを注意深く監視する必要があります。 クレジット スコアリング メソッドを使用すると、これを行うことができます。

最初の採点システムが導入されて以来、多くの数学的および統計的手法が使用されてきました。 統計的なものには、判別分析、線形回帰、ロジスティック回帰、決定木があります。 他の方法は数学から生まれました: 数学的プログラミング、ニューラル ネットワーク、遺伝的アルゴリズム、およびエキスパート システムです。 次に、最も一般的な方法を分析し、その長所と短所について説明します。

1.2 線形判別分析と線形回帰

線形判別分析は、オブジェクトを定義済みのカテゴリに分類する方法です。 アイデアは、オブジェクトを最もよく分類する説明変数の線形結合を見つけることです。 最良の除算とは、これらのカテゴリの平均間の最大距離を提供することを意味します。 スコアは、顧客の属性値の線形関数として計算されます。

ここで、クライアントの属性値は、関係を最大化するモデル パラメーターです。

の平均のベクトルはどこにありますか 良い悪い顧客は、共通の共分散行列です。

線形判別法は、2 つの条件が満たされていることを前提としています。 まず、両方のグループの独立変数の共分散行列が一致する必要があります。 第二に、独立変数は正規分布していなければなりません。 多くの場合、スコアリングでは、独立変数は離散的であるか、正規分布していません。 したがって、この方法の適用には問題があります。 しかし、正規性に違反した場合でも、この方法が広く適用できることが示されています。 その利点は使いやすさです。

スコアリング モデルの生成には、同様の線形回帰法も使用されます。 2 つのカテゴリの場合は、線形判別分析の方法と同等であり、1 つの変数 (従属) の他の変数 (独立) への依存性を表します。 一般的には次のようになります。

従属変数;

説明独立変数;

最小二乗法で見つかった未知の回帰係数。

線形スコアリング モデルを適用するには、従属変数と独立変数の間の関係が線形でなければならないという仮定が必要です。 そうしないと、推定精度が著しく低下します。 エラーは独立しており、正規分布している必要があります。

判別分析と同様に、クレジット スコアリングの条件下では、線形回帰を適用するために必要な仮定に違反することがよくあります。 線形回帰は範囲外の確率推定値を与える可能性があり、これは受け入れられません。 たとえば、ロジスティック回帰にはこの欠点がありません。

1.3 ロジスティック回帰とプロビット回帰

これらのタイプの回帰は、データをカテゴリ別に表示できるため、スコアリング モデルの構築により適しています。 ロジスティック回帰モデルは次のように定義されます。

クライアントが「悪い」確率の推定値はどこですか , - 尤度比最大化条件を介して計算される未知の回帰パラメーターのベクトル。

ロジスティック回帰モデルは、対数関数に基づいています。 次に、プロビット回帰は正規分布に基づいており、次のように与えられます。

どこ。 ベクトルは、ロジスティック回帰モデルと同じ方法で見つけられます。

ロジスティック回帰とプロビット回帰は形状が似ている分布を使用するため、これらのモデルを適用した結果も似ています。 プロビット回帰よりも計算が簡単で、使用できるツールが多いため、ロジスティック回帰が好まれます。 バイナリの性質により、スコアリング モデルの構築に使用する場合は、線形回帰よりもロジスティック回帰の方が適しています。 実際には、予測結果の精度の違いは重要ではないことがわかりました。 ただし、スコアリング システムではロジスティック回帰が優勢です。

1.4 ニューラルネットワーク

人工ニューラル ネットワークは、自然界に見られるニューラル ネットワークのシミュレーションです。 この概念は、人間の脳で発生するプロセスをモデル化しようとしたときに生まれました。

多層パーセプトロンとも呼ばれるニューラル ネットワークは、分類問題の解決に特に適しています。 彼らはで広く使用されています さまざまな分野:金融、 コンピュータサイエンス、物理学、医学。 ニューラル ネットワークが人気を博している理由の 1 つは、複雑な状況をユーザーがほとんど負担せずにモデル化できることです。 その性質上、ニューラル ネットワークはデータ内の非線形の状況を自動的に検出し、それに応じて調整します。 また、多層ニューラル ネットワークは普遍的な近似器です。つまり、任意の関数を必要なだけ正確に近似できます。

ニューラル ネットワークはレイヤーで構成され、レイヤーはノードで構成されます。 ネットワークには、入力層、非表示層、出力層の 3 種類の層があります。 入力層は、性別、年齢などのクライアント属性によって形成されます。

m 個の入力を持つ k 番目のノードの出力は、次のように表されます。

ここで、 は活性化関数、 は入力データ ベクトル、 はノード間の接続の強さを示す重みベクトルです。

主な欠点は、予測の精度が高いにもかかわらず、これまたはその決定が行われた理由を理解できないことです。

クレジット スコアリングのコンテキストでは、ニューラル ネットワークが従来の方法と同様に機能することが示されています。

1.5 CHAID分析

この方法は、特に関係が非線形である場合に、データ間の関係を見つけるのに最適です。 決定木を構築するために使用され、判別分析や線形回帰などの従来の方法と多くの共通点があります。

略語 CHAID は、Chi-squared Automated Interaction Detector の略です。

この方法の柔軟性は魅力的ですが、これは従来の方法の代わりに使用する必要があるという意味ではありません。 分布に関する厳密な理論的仮定に遭遇した場合は、従来の方法が適しています。 研究手法として、または従来の方法が失敗した場合、CHAID 分析は卓越したツールです。

CHAID は、大規模なデータセットの分析に特に適した比較的単純なアルゴリズムに基づいて、非バイナリ ツリー (つまり、3 つ以上のブランチを持つことができるツリー) を構築します。 このアルゴリズムは、カイ 2 乗検定の適用に基づいています。

1.6 その他の方法

決定木。

このメソッドは、データをサブセットに分割します。それぞれのサブセットは、元のデータ セットよりも動作がより均一です。 これらの各サブセットは、同じアルゴリズムに従ってさらに分割されます。 分割された結果は、このツリーの「葉」と呼ばれます。 同様の原理で動作する他の方法があります。

この方法の利点は、単純さと直感性です。 この方法は、欠落している観測値を処理できます。 これは、調査前にデータについて事実上何も知られておらず、推測や仮説を立てることが不可能な場合に特に当てはまります。

この方法の主な欠点は、コンピュータ計算の複雑さです。 結果として得られるツリーはかさばるため、モデルを調査するプロセスは面倒です。 状況の変化は、意思決定ツリー全体の改訂につながる可能性があります。

基本的には、メソッドは補助として使用されます。 たとえば、従属変数の動作を最も強く説明する変数を特定する場合などです。

方法k最も近い隣人。 オブジェクト分類のノンパラメトリック法。 データ間の類似性を測定するメトリックに基づきます。

最初に、トレーニング データが入力され、クラスに分割されます。 次に、推定されたデータが入力され、入力されたデータとトレーニング データの間の類似性が決定されます。 メトリックに基づいて、k 個の最近傍が選択されます。 新しい要素は、その隣接要素のほとんどが属するクラスに割り当てられます。

近傍数 k は、補償と分散の間のトレードオフによって決定されます。 クラスが小さいほど、小さい k が選択されます。 この場合、k が大きいほど結果が良くなる必要はありません。

この方法の利点の 1 つは、モデルを変更せずに新しいデータを簡単に追加できることです。 この方法のノンパラメトリックな性質により、特徴空間のリスク関数の非合理性を扱うことができます。

この方法の主な欠点は、k を選択する正式な方法がないことと、結果が期待される頻度であるため、結果の確率論的解釈が不可能なことです。 これらの問題は、ベイジアン近似法を使用して解決できます。

この方法は、スコアリングではほとんど使用されません。 この理由の 1 つは、1 つのオブジェクトを分類するために、すべてのオブジェクトに基づいている必要があるためです。

新しい サポート ベクター マシン、機械学習に基づいて構築され、従来のスコアリング方法よりも悪くないことが証明されました. これは 2 つのプロセスで構成されます。1 つ目は、入力データを特徴空間の高次元データに変換します。 2 つ目は、線形分類器を使用してデータを分類します。 分類器は、例えば、線形判別分析であり得る。

1.7 異なる方法の比較

採点方法については、数多くの比較研究が行われてきました。 ランキング基準は、分類エラーのパーセンテージと ROC 曲線でした。 8 つのデータセットが調査されました。

平均評価

ニューラル ネットワーク

サポート ベクター

ロジスティック回帰

線形判別分析

線形 LS-SVM

拡張ベイズ ツリー

単純ベイズ分類器

放射基底関数

k 最近隣 (k=100)

線形 SVM

二次判別分析

決定木

線形計画

決定木

決定木

k 最近隣 (k=10)

決定木

この表は、ニューラル ネットワークとサポート ベクター マシンが、調査中の 8 つのデータ セットで最適であったことを示しています。 さらに、線形分析や判別分析などの従来の方法は、競争力があることが示されています。 したがって、ほとんどのクレジット スコアリング データはわずかに非線形である可能性が高いということになります。 その結果、線形手法は非線形手法と同等であることが証明されました。

すべての状況に最適なスコアリング モデルはありません。 モデルの選択は、データとモデル作成の目的によって異なります。 また、最善を見積もる方法が、特定の状況で必ずしも最善であるとは限りません。

第 2 章 経験的ベイジアンアプローチ

この章では、経験的ベイジアン アプローチを分析し、それを使用してスコアリング モデルを構築します。 構築は、銀行「ロシアのズベルバンク」の消費者ローンに関する統計に基づいて行われます。

2.1 問題の説明

個人向け融資を行っている銀行があるとします。 顧客は銀行に融資を申し込む。 ローンを発行するかどうかの決定は、クライアントに関する情報に基づいて銀行によって行われます。

銀行は、クライアント自身、信用調査機関、その他の情報源など、さまざまなソースからクライアントに関する情報を受け取ります。 私たちは、クライアント自身から提供された情報を検討します。 銀行は、借り手が記入したアンケートを通じてそれを受け取ります。

アンケートでは、借り手は次のデータを示します:性別、年齢、婚姻状況、子供の有無、月収、不動産の空き状況など。

これらのデータに基づいて、特定の点で類似しているグループにクライアントを分類します。 クライアントごとに、ベイジアン法により、評価を見つけます。これは、クライアントがこのグループに属している場合に、クライアントがローンを返済する経験的確率です。

メソッドを適用するには、データが次の条件を満たす必要があります。

独立性 - クライアントはローンを返済するために共謀しません。

均一性 - データは 1 つから取得されます 人口;

equalprobability - 顧客がグループに分散される可能性が等しくなります。

それらの実装は以下で検証されます。

2.2 スコアリング モデルの構築

確率空間を導入します。 このスペースで、銀行のクライアントを指定しましょう。

銀行の各顧客には、記入済みのアンケートに応じた一連の特徴があります。 例: 結婚しているかどうか、カテゴリに分類された収入レベル、車の所有権、その他の特性。 これらの特性に従って、スペースのパーティションをセットに導入します

したがって、クライアントのセットはグループに分割されます。

確率変数を導入しましょう。

j 番目のグループのクライアントの数。

データから、同時経験確率分布を構築できます。

ここで、イベント A のアプリオリ経験確率は、

条件Aの下でのイベントBの経験的確率、

事後確率と呼ばれる、条件 B の下でイベント A の経験的確率、

イベント B の経験的確率。

この式により、イベント B が発生したという事実を考慮して、イベント A の確率を過大評価することができます。

条件付き確率の定義から、次のように書くことができます。

(1) から表現し、この式に for の式を代入すると、次のようになります。

2.3 モデルをデータに適用する

ロシアのズベルバンクの 1977 年の顧客に関するデータがあり、ローンを返済したかどうかに関する情報も含まれています。

ベイジアン アプローチを適用するには、次の 3 つの仮説が満たされていることを確認する必要があります。

· 独立性について - 顧客はローンの支払いを共謀したり、支払わなかったりしません。

均質性について - データは 1 つの一般集団から取得されます。

· 配布の種類について - データは等確率で配布されます。

独立仮説

この仮説を検証するために、Spearman 順位検定を使用します。 この基準の統計は、次のように定義される順位相関係数です。

2 つの一連の観察結果が示されています。 これらの観察に基づいて、ランクのペアを構築します。 ランクとは、変分系列の観測値が占める場所の数を意味します。 ランクも同じように理解しています。 次に、ランクのペアを最初のコンポーネントの昇順に並べ替えます。 結果のシリーズを示しましょう。

相関係数は次の式で求められます。

基準の臨界領域。 見つけるために、n が大きい場合、分布法則が傾向があるという事実を使用します。 ここから。 標準ガウス法則の分布関数を次に示します。

有意水準では、=1.959964。 クリティカル ゾーンの境界。 見つかった相関係数。

したがって、基準の統計はその臨界領域に収まらず、有意水準 0.05 で独立性の仮説を受け入れることができます。

均質性仮説

仮説は次のように定式化されます。 分布関数 および を使用して、分布 および からそれぞれ 2 つのサンプル および が与えられます。 次に同質性仮説。

この仮説を検証するために、スミルノフ基準を使用します。

この基準の統計は、サンプルに基づいて構築された経験的分布関数です。 重要な領域はフォームで指定されます。 n と m が大きい場合、臨界領域の境界は次のようになります。 コルモゴロフ分布関数です。

したがって、均質性仮説は次の場合に棄却されます。 0.05 の有意水準で。 臨界領域の境界です。 統計。

検定統計量は臨界領域に入らず、有意水準 0.05 で均一性の仮説を受け入れることができます。

分布のタイプに関する仮説

仮説を立ててみましょう。 未知の分布関数を持つ分布からサンプルが与えられます。 が区間 の一様分布の分布関数であることを確認する必要があります。

これを行うには、ピアソンの適合度検定を使用します。

検定統計量は. これは、観測を打つ頻度です i 番目のセグメント、 - i 番目のセグメントに入る確率。 テストされている仮説が真である場合、n が大きい場合、統計は自由度 k-1 のカイ 2 乗分布に従います。

統計が臨界値を超える場合、仮説は棄却されます。

Statistica ソフトウェア パッケージを使用して統計値を計算します - =24.19468、k-1=39。 有意水準におけるクリティカル領域の境界。

したがって、統計値は臨界レベルを超えず、グループごとにクライアントが一様に分布しているという仮説は有意水準 0.05 で受け入れられます。

したがって、データは上記のすべての仮説を満たしているので、評価を見つけ始めることができます。

利用可能なデータには多くのものが含まれています さまざまな特徴クライアント。 構築には、最も重要な 4 つを使用します。 サンプル (1977 要素) が限られているため、それ以上の要素を取得することはできません。

選択された特徴: 借り手の年齢と性別、子供の有無、借り手の総収入に対するローン返済の割合。 特徴的な年齢は3つの値を取ります - 18-29、30-45、46-…; 借り手の性別 2 つの値 - 男性と女性。 子供の存在には 2 つの意味があります。子供がいる場合と子供がいない場合です。 ペイアウトは 5 つの値を取ります - (<5%),(6-10%), (11-16%), (17-22%),(23-55%).

特性のそれぞれの特定の値は、借り手のプロパティと呼ばれます。 特定のクライアントの特定のプロパティの存在に基づいて、すべてのクライアントをセットに分割しましょう。 たとえば、子供がいないクライアントはたくさんいます。

表記法は次のとおりです。

子供、= 子供なし、= 子供がいます。

年齢、=Age1(18-29)、=Age2(30-45)、=Age3(46-…);

性別、=女性、=男性。

借り手の総収入に対するローンの返済率 =In1(<5), =Вып2(6-10), =Вып3(11-16), =Вып4(17-22), =Вып5(23-55).

クライアントの可能なすべてのプロパティの組み合わせとして新しいセットを形成します-可能な限りたとえば、セットは18〜29歳の女性で構成され、子供は支払いません<5% от своего суммарного дохода. Количество таких множеств равно 60.

表 2.1. エンコーディングを設定します。

子供なし

子供を持つ

次の点に注意してください - クライアントのセット全体のパーティションを形成します。

=(0,1), =(, i=1:60) の 2 つの離散確率変数 - and の結合経験分布を構築しましょう。 クライアントの総数に対する確率変数 (X, Y) の値のペアを満たすクライアントの数の比率として構築します。

各可能なペア (X,Y) に対応するクライアントの数を固定します。

表 2.2. 各グループのローンを返済したクライアントと返済しなかったクライアントの数。 0 - ローンを返し、1 - ローンを返さなかった。

同時経験確率分布を構築してみましょう。 これを行うには、各グループのローンを返却したクライアントと返却しなかったクライアントの数を、クライアントの総数で割ります。

表 2.3. 同時経験確率分布。

図 2.1。 X=0 における経験的分布関数。

図 2.2。 X =1 の場合の経験的分布関数。

図 2.3。 X=0 における同時分布のヒストグラム。

図 2.4。 X=1 での同時分布のヒストグラム。

各グループに入る確率の経験的分布を見つけてみましょう。 これを行うには、各グループのクライアント数をクライアントの総数で割ります。 クライアントの総数。

表 2.4. 各グループに入る確率の経験的分布。

図 2.5。 グループ i に入るヒストグラム。

これに基づいて、分類を取得します。

60 リスク グループのクライアント

グループ 1 ~ 5、7 ~ 12、15、17、25、31、32、33、35 ~ 37、39、40、42、54 ~ 56、58 のクライアント - 中リスク

· グループ 6、13、14、16、18-24、26-30、34、38、41、43-53、57、59 のクライアントは信頼できます

第 3 章 Monge-Kantorovich 問題に基づくアプローチ

3.1 Monge-Kantorovich 問題

もんげの問題。

2 つの確率空間 と および非負の可測関数が与えられると、...

類似文書

    多変量統計分析の一分野としての判別分析。 指標分布の正規法則に基づく判別分析。 2 つのトレーニング サンプルが存在する場合の判別分析の適用。 システムstatistikaの問題の解決策。

    タームペーパー、2011 年 1 月 21 日追加

    判別分析モデル。 破産予測の古典的な西洋とロシアのモデルの効率。 業界固有。 サンプルの特性、方法、要因のリスト、分析方法の予測力など、記事の説明。

    要約、2016 年 7 月 24 日追加

    線形回帰分析の基礎。 コブ・ダグラス関数の使用の特徴。 多重線形回帰の適用。 最小二乗法の本質。 誤った相関を回避する方法。 回帰係数の有意性の確認。

    要約、2009 年 10 月 31 日追加

    国の経済分類、経済発展の主要指標の特徴。 分析の統計的手法、判別式の説明、クラスター分析、階乗分析、グラフ分析。 経済安全保障の研究のパラメータ。

    論文、2013 年 10 月 14 日追加

    機能コスト分析の出現の歴史、その方法論、原則、タスク、および実装の段階。 システム解析を駆使し、各部の設計を要素ごとに展開するYu.M. ソボレフ。 機能コスト分析の応用。

    テスト、2012 年 4 月 8 日追加

    経済分析の理論的および方法論的基礎、その主題、目的、タスク。 経済分析の原則の特徴、アプローチ、および実際の使用の特徴。 分析に基づく企業の開発動向の決定。

    タームペーパー、2010 年 12 月 20 日追加

    一方向線形回帰のための最小二乗法の本質と応用。 指定されたモデルの特定のポイント X における弾性係数とその経済分析を見つけます。 線形回帰に基づく損失予測。

    テスト、2009 年 6 月 15 日追加

    企業評価の理論における最も有望な現代の開発の 1 つとしての Olson モデルの本質。 実際の評価におけるEVO、ロシアでの仕事の特徴。 Olson および Feltham-Olson 線形情報力学の特徴。

    テスト、2011 年 4 月 7 日追加

    経済情報の概念、その本質と特徴、分類と種類、特徴と特徴。 経済分析の本質、主題と目的、目標と目的。 分析と他の科学との関係、その組織。

    チート シート、2009 年 4 月 5 日追加

    経済数学モデルを開発するための方法: 問題の説明、変数と制限のシステム。 農業企業の生産構造を最適化するための経済数学的モデルの解の種類、二重推定の分析。

貸出業務の収益性向上は、信用リスク評価の質に直結します。 リスクグループによるクライアントの分類に応じて、銀行はローンを発行するかどうか、どのような与信限度額と利息を設定する必要があるかを決定します。

世界の慣行では、貸付のリスクを評価するための主な方法が 2 つあります。これらは、別々に使用することも、互いに組み合わせて使用​​することもできます。

  • 専門家または融資担当者の主観的な意見;
  • 自動採点システム。

この記事は、現在すべての経済先進国で広く使用されている採点システムを使用する西洋の慣行に専念しています。 スコアリングは、ビジネスにおける数学的および統計的手法の使用の最も成功した例の 1 つですが、このトピックはロシアのマスコミでは不当に無視されています。 この刊行物の目的は、このギャップを埋め、採点の歴史と実践の概要を提供することです。 この記事はかなり幅広い読者を対象としているため、スコアリングの仕組みについて非常に一般的な説明しか提供していません。 1 つまたは別の方法を使用する合法性の理論的根拠と正当化は、ここでは影響を受けません。

スコアリングは主に個人への融資、特に無担保ローンの消費者信用に使用されるため、以下の説明では借り手である個人の信用リスクの評価に焦点を当てます。

信用力の定義とそれを予測するために使用される情報

信用リスクを評価するために、借り手の信用力の分析が行われます。これは、ロシアの銀行業務では、 能力法人または自然人が債務を期限内に完全に返済すること。 欧米の銀行業務では、信用度は次のように解釈されます。 願いに接続されています 機会発行された義務を適時に完済する。 以下では、この意味で「信用度」という用語を使用します。 この定義によると、スコアリングの主なタスクは、クライアントがローンを返済できるかどうかだけでなく、クライアントの信頼性とコミットメントの程度を調べることです。 言い換えれば、スコアリングは、クライアントの信用度、つまり、ローンの「価値」がどの程度かを評価します。

採点銀行は、「過去の」顧客の信用履歴に基づいて、特定の潜在的な借り手が予定どおりにローンを返済する可能性を判断しようとする数学的モデルまたは統計モデルです。

欧米の銀行システムでは、人がローンを申し込むと、銀行は分析のために次の情報を取得する場合があります。

借り手が記入したアンケート。

信用調査機関からのこの借り手に関する情報 - 国の成人人口全体の信用履歴を保存する組織。

銀行の既存の顧客について話している場合、口座の動きに関するデータ。

クレジットアナリストは、クライアントの「特性」(数学用語 - 変数、因子)および「符号」 - 変数が取る値という概念で動作します。 クライアントが記入するアンケートを想像すると、特徴はアンケートの質問(年齢、婚姻状況、職業)であり、兆候はこれらの質問に対する回答です。

最も単純化した形式では、スコアリング モデルは特定の特性の加重合計です。 結果は積分指標 (スコア) です。 それが高いほど、顧客の信頼性が高くなり、銀行は顧客を信用力の高い順に並べることができます。

各クライアントの積分指標は、特定の数値しきい値、または分割線と比較されます。これは、本質的に損益分岐点であり、時間通りに支払うクライアントの平均数の比率から計算されます。一人の債務者の損失を補うために。 この線より上に積分指標を持つクライアントには融資が与えられ、この線より下に積分指標を持つクライアントには融資が与えられません。

これはすべて非常に単純に見えますが、注意が必要なのは、モデルにどの機能を含め、どの重みを一致させるかを決定することです。 この問題にはいくつかのアプローチがありますが、これについては「クライアントの分類方法」セクションで説明します。

スコアリングの哲学は、この人が支払っていない理由の説明を見つけることではありません。 スコアリングは、クライアントの信頼性の低さ、または逆に信頼性に最も密接に関連する特性を強調します。 この借り手がローンを返済するかどうかはわかりませんが、過去に、同じ職業、同じレベルの教育を受け、同じ数の扶養家族を持つこの年齢の人々がローンを返済しなかったことはわかっています。 したがって、私たちはこの人物に信用を与えません。

これは、スコアリングの差別的 (統計的ではなく、社会的な意味で) の性質です。つまり、ある人が信用履歴の悪いグループに正式に近い場合、彼らは彼にローンを提供しません。 したがって、自動採点システムが非常に高度に使用されていても、信頼できないと分類された人が実際には「良い」ことを証明する追加情報を融資担当者が持っている場合、主観的な介入が発生します。逆の場合も同様です。

信用リスクを予測するために最も「価値のある」特性は何ですか? 英国では、次の特徴が最も一般的に使用されています。

  • 子・扶養人数

    職業

    配偶者の職業

    配偶者の収入

    居住地

    住宅費

    電話を持っている

    あなたはこの住所に何年住んでいますか。

    この仕事に就いて何年になりますか?

    この銀行の顧客になって何年になりますか。

    クレジットカード/小切手帳を持っている

    他の国では、債務不履行の確率 (借り手が債務不履行になるか返済が遅れる確率) に最も密接に関連する一連の特性は、国の経済的および社会文化的特性によって異なります。 モデルが開発される顧客母集団が均質であるほど、デフォルトの予測はより正確になります。 したがって、モデルをある国から別の国に、またはある銀行から別の銀行に自動的に転送できないことは明らかです。 同じ銀行内でも、顧客層やローンの種類ごとにモデルが異なります。

    スコアリング開発の歴史

    スコアリングは、本質的に、関心のある母集団全体を異なるグループに分類する方法であり、これらのグループを分離する特性 (クライアントがローンを返すかどうか) がわからない場合に、クライアントに関連する他の特性は私たちにとって興味深いものは知られています。 統計学では、個体群をグループに分類するというアイデアは、1936 年にフィッシャーが植物を例に使用して開発しました。 1941年、デビッド・デュラントはこの手法をローンの「不良」と「良」の分類に初めて適用しました。 これは、ほぼすべての信用アナリストが最前線に出動し、銀行はこれらの専門家を早急に交代させる必要性に直面した第二次世界大戦と一致していました。 銀行は、専門家でなくても分析を実行できるように、アナリストが退職する前に一連のルールを作成して、融資を許可する決定を導くように強制しました。 これはいわば、将来のエキスパート システムのプロトタイプでした。

    50代前半。 サンフランシスコでは、スコアリングの分野で最初のコンサルティング会社である Fair Issac が設立されました。Fair Issac は、今でもスコアリング システムの開発者のリーダーです。

    しかし、スコアリングの普及は、クレジット カードの普及とともに始まりました。 毎日クレジット カードを申し込む人が多いため、銀行はローンを発行するための意思決定プロセスを自動化するしかありませんでした。 しかし、彼らはすぐに融資申請の処理速度だけでなく、リスク評価の質も高く評価しました。 いくつかの調査によると、スコアリング システムの導入後、不良債権のレベルは 50% に減少しました ( チャーチル G.A., ネビン J.R., ワトソン R.R.//ローンの決定におけるクレジット スコアリングの役割。 クレジットの世界。 1977 年 3 月。 マイヤーズ J.H., フォージー E.W.数値信用評価システムの開発//Journal of American Statistical Association. 1963 年 9 月)。

    1974 年、アメリカ合衆国は、人種、肌の色、出身国、年齢、性別、婚姻状況、宗教、社会的利益の受け取り、消費者の保護などの特徴に基づいて融資を拒否することを禁止する、信用機会均等法を可決しました。権利。 英国では、年齢と婚姻状況に関する情報を使用することは法律で許可されていますが、身体の怪我やハンディキャップ (身体障害) を考慮に入れることは禁止されています。 金融機関にとって、採点システムの使用は、これらの反差別法が実施されている証拠となりました。コンピューターには何の偏見もありません。

    貸付における公平性の原則を確立することに加えて、同じ 1974 年に英国で採択された消費者信用法のような米国の信用法は、信用調査サービスの形成にとって重要でした。 そのような局では、これまでに国内の信用機関にローンを申し込んだすべての人々の信用履歴が記録されています。

    信用調査機関は、次の種類のデータを保持しています。

    社会人口学的特徴;

    裁判所の決定(裁判所へのローンの債務請求に関する事件の移送の場合);

    破産に関する情報;

    「あなたは私に、私はあなたに」の原則に基づいて信用機関から受け取った個々の借り手に関するデータ。つまり、銀行は、それ自体が同様の情報を提供する場合にのみ、他の銀行の顧客に関する情報を受け取ることができます。

    事務局が保有する情報の範囲と性質は、各国の法律によって厳しく規制されています。 「Banking Technologies」では、1999 年 9 月にすでに信用調査機関に関する出版物がありました - 「ロシアにおける信用調査機関の設立の問題」。 この記事で説明したビューロー モデルに加えて、Experian、Equifax、TransUnion、Scorex などの多国籍の営利企業も存在することを付け加えておきます。 これらの企業自体がスコアリング システムを使用しており、多くの場合、「生の」情報ではなく、信用機関の自動システムに入力される既製の統合指標を顧客に販売しています。

    信用調査機関の重要性は非常に高く、その存在により、信用調査機関は、以前はこの組織がサービスを提供していなかったクライアントにローンを発行することができます。 さらに、債務不履行の確率を予測する際の以前の信用履歴の価値は、一般的に認識されています。

    現在、スコアリングは、さまざまな種類のローンのリスク評価だけでなく、マーケティング (この特定の顧客グループがこの種類の商品を使用する可能性を判断するため) や、債務者(クライアントが次の支払いを遅らせる場合、どの方法が最も効果的か)、クレジットカード詐欺を特定するとき、クライアントが競合他社に亡命する可能性を判断するときなど。

    クライアントの分類方法

    そのため、お客様に関するさまざまな情報を大量に保有しています。 この情報の海では、かなりの実務経験を持つ融資担当者でさえ、たとえば、離婚して子供がいない男性起業家と 3 人の子供がいる既婚の女性弁護士のどちらがより大きなリスクをもたらすかという質問に答えるときに、ナビゲートするのが難しい場合があります。彼らの収入レベルは同じですか? 完全に異なる特性を持つ顧客を比較し、直感的にではなく、債務不履行の確率に直接関連する形式化された基準に基づいて融資の決定を下せるようにするためには、どの情報を評価できるようにする数学的モデルを構築する必要があります。重要であり、無視することができます。

    モデルを構築するために、まず、信用機関のクライアントのサンプルが作成されます。これについては、彼らが良い借り手であることが証明されているかどうかがすでにわかっています。そのようなサンプルは「トレーニング」と呼ばれることもあります。 その額は数千から数十万に及ぶ可能性がありますが、企業のローン ポートフォリオが数千万の顧客で構成される欧米では問題になりません。 サンプルは、「良い」リスクと「悪い」リスクの 2 つのグループに分けられます。 これは、銀行が融資を決定する際に、最初の段階で、融資を行うか行わないかという 2 つのオプションから選択するという意味で正当化されます。 「良い」/「悪い」の定義は「幼稚」ですが、これらはまさにクレジット アナリストが使用する用語です。

    「悪い」リスクの定義は、銀行のポリシーによって異なる場合があります。西ヨーロッパでは、「悪い」リスクは、通常、次の支払いが 3 か月遅れるクライアントと見なされます。 「悪い」リスクには、ローンの返済が早すぎるクライアントが含まれる場合があり、銀行はクライアントから何も稼ぐ時間がありません。

    したがって、スコアリングは分類タスクであり、利用可能な情報に基づいて、顧客のサンプルを「悪い」と「良い」に最も正確に分割する関数を取得する必要があります。

    しかし、まず、利用可能な情報を分析可能な形式に変換する必要があります。 量的特性と質的特性の両方を扱うのに適した主なアプローチが 2 つあります。

    1. 各機能を個別のバイナリ変数に変換します。 このアプローチは、従属変数と独立変数の間に追加の関係を課すことはありませんが、変数が多数になるという点で不便です。

      各特性を、特定の属性を持つ「悪い」クライアントの数と同じ属性を持つ「良い」クライアントの数の比率に対応する値を取る変数に変換します。 より複雑なオプションは、この比率の対数を取ることです。 したがって、各属性は、その「リスク」のレベルに対応する数値を受け取ります。

    分類方法自体は非常に多様で、次のものが含まれます。

  • 判別分析に基づく統計的手法 (線形回帰、ロジスティック回帰);

    線形計画法のさまざまな変形。

    分類木または再帰分割アルゴリズム (RPA);

    ニューラルネットワーク;

    遺伝的アルゴリズム;

    最近隣法。

    伝統的で最も一般的なのは回帰法で、主に線形です 多変量回帰 :

    R = w o + w1×1+ w2×2 + … + wn×n ,

    どこ R- デフォルトの確率、 w-- 重み係数 バツ-- クライアントの特徴。

    このモデルの欠点は、方程式の左側に 0 から 1 の値を取る確率があるのに対し、右側の変数は - から + の任意の値を取ることができることです。

    ロジスティック回帰この欠点を克服します:

    log(p/(1-p)) = w o + w1×1+ w2×2 + … + wn×n .

    ロジスティック回帰を適用するには、重みを導出するためにはるかに複雑な計算が必要になるため、より強力なコンピューター ベースと改善されたソフトウェアが必要になります。 しかし、現在のコンピューター技術の発展レベルでは、これは問題ではなく、現在、ロジスティック回帰がスコアリング システムのリーダーです。

    ロジスティック回帰の利点は、クライアントを 2 つのグループ (0 - 悪い、1 - 良い)、または複数のグループ (1、2、3、4 リスク グループ) に細分化できることです。

    すべての回帰方法は特性間の相関に敏感であるため、モデル内に高度に相関する説明変数があってはなりません。

    線形計画また、線形スコアリング モデルにもつながります。 悪い顧客と良い顧客を完全に正確に分類することは不可能ですが、エラーを最小限に抑えることが望ましいです。 この問題は、誤差が最小になる重み係数の検索として定式化できます。

    分類木とニューラル ネットワーク顧客をグループに分割するシステムであり、グループ内のリスク レベルは同じであり、他のグループのリスク レベルとは最大限に異なります。 ニューラル ネットワークは主に法人の信用度を判断するために使用され、消費者信用よりも小さなサンプルが分析されます。 しかし、彼らの最も成功したアプリケーションは、異常な状況を検出する能力により、クレジット カード詐欺の検出でした (以下を参照)。 ノートン M.神経質なビジネス//銀行技術。 1995. No. 3. S. 73)。

    遺伝的アルゴリズム自然選択の生物学的プロセスとの類推に基づいています。 貸付の分野では、「変異」、「交差」する一連の分類モデルがあり、その結果、「最強」、つまり最も正確なモデルが選択されます。分類。

    使用する 最近隣法クライアント間の距離を決定するために測定単位が選択されます。 サンプル内のすべてのクライアントは、特定の空間位置を受け取ります。 それぞれの新しいクライアントは、彼の周りに良いクライアントが多いか悪いクライアントが多いかに応じて分類されます。

    実際には、いくつかの方法の組み合わせが使用されており、企業はスコアリング モデルを厳重に管理しているため、どの方法が優れているとは言えません。 科学出版物に基づいておおよその結論を導き出すことしかできません。以下は、L. Thomas 教授によって編集されたさまざまな方法の分類精度の比較表です ( トーマス L.C.クレジットと行動スコアリングの調査//エジンバラ大学。 1999)。

    著者は「良い」リスクの異なる定義を使用し、異なる集団とサンプルで研究を実施したため、比較は水平方向にのみ行う必要があります。 この表は、正しく分類されたクライアントの割合を示しています。 引用されたすべての研究の目的は、さまざまな分類方法の有効性を比較することでした。そのため、これらの数値が一般的なスコアリング システムの有効性を示していると結論付けるべきではありません。商用システムではいくつかの方法が使用されていることが既に述べられているからです。

    テーブル

    ソース:

    ヘンリー W.E.クレジット スコアリングの統計的側面。 博士号 論文。 大学を開く。 1995年。
    ボイル M., クルック J.N., ハミルトン R., トーマス L.C. Credit Scoring and Credit Control//Oxford University Press で遅い支払者に適用されるクレジット スコアリングの方法。 1992年。
    スリニバサン V., キム Y.H.信用供与: 分類手順の比較分析//Journal of Finance。 1987. No. 42.
    Yobas M.B., クルック J.N., ロス P.ニューラルおよび進化的手法を使用したクレジットスコアリング//Working Paper 97/2、クレジットリサーチセンター、エディンバラ大学。
    Desai V.S., コンウェイ D.G., クルック J.N., オーバーストリートニューラル ネットワークと遺伝的アルゴリズムを使用した信用組合環境における信用スコアリング モデル//IMA J. ビジネスおよび産業に適用される数学。 1997 年 8 月。

    それぞれの方法には独自の長所と短所があり、さらに、いずれかの方法の選択は、銀行の戦略と、モデルを開発する際に銀行が優先事項と見なす要件に関連しています。 回帰法は、リスクのレベルを決定するための各特性の重要性を示しているため、クライアントが記入するアンケートを作成する段階で特に重要です。 線形計画法は、多数の変数を操作し、特定の条件をモデル化できます。たとえば、銀行のマーケティング戦略が若者を対象としている場合、若者の積分指標が 60 歳以上の人よりも高いという条件を入力できます。ニューラル ネットワーク分類木は、線形モデルのエラーにつながる可能性のある変数間の非線形関係を明らかにします。

    分類の精度は、小さなサンプルの「スライド試験」方法によってチェックされます (モデルは、ランダムに選択された 1 つのクライアントを除くサンプル全体で構築され、次にこのクライアントでチェックされ、すべてのクライアントが並べ替えられます)。このように)、または十分に大きなサンプルでは、​​2つの部分に分割されます.1つのモデルが構築され、もう1つのモデルがチェックされます。

    スコアリングの使用に関する制限

    スコアリングには主に 2 つの問題があります。 1 つ目は、サンプルの分類は、融資を受けたクライアントに対してのみ行われるということです。 信用を拒否された顧客がどのような行動をとったかはわかりません。

    しかし、原則として、ローンはかなり深刻な理由に基づいて拒否されます。 銀行は、これらの拒否理由を修正し、「refuseniks」に関する情報を保存します。 これにより、ローン申請者の元の人口を再構築することができます。

    2 つ目の問題は、人々は時間とともに変化し、人々の行動に影響を与える社会経済的条件も変化することです。 したがって、最も「新しい」クライアントのサンプルでスコアリング モデルを開発し、システムの品質を定期的にチェックし、品質が低下した場合は新しいモデルを開発する必要があります。 欧米では、平均して1年半に1回、新機種が開発されますが、その時期の経済の安定度によって機種の入れ替え時期は異なります。 ロシアの場合、おそらく最長で 6 か月であり、この期間に 1998 年 8 月のような大規模なショックが発生しない限り、その場合でも可能です。

    社会経済的特性をモデルにどのように組み込むかについて、現在、研究が進行中です。

    ロシアにおけるスコアリングの発展の見通し

    ロシアでは、まず第一に、融資額が少ないことが採点システムの使用を妨げています。 しかし、経済成長に伴い(楽観視しましょう)、状況は変わり始めます。

    西側の金融機関に比べて借り手の数が少ないこと自体は問題ではありません。必要なのは、サンプル サイズに関連する特徴の数を監視することだけです。 V. Stepanov、A. Zayats による記事「Analysis of the state of the bank」(Banking Technologies. 1996. No. 8. P. 58) では、著者は統計的アプローチ (クラスター分析) を使用して銀行をリスク別に分類しました。合計 76 州のグループで、同時に良い結果が得られました - 専門家の評価との一致の 90% 以上。

    もちろん、信用調査機関がないことも、スコアリングの発展には寄与しません。 しかし、一方で欧米では、アンケートで本人が示す情報の正確性を検証するという問題があります。 ロシアでは、この情報のほとんどはパスポートに含まれています。 銀行はパスポートのデータとワークブックのデータを持っていれば十分です。これが分析のソース資料です。

    もう 1 つの不利な要因は、SAS や SPSS などの普遍的な統計パッケージの普及が不十分であることです。 しかし、V. Stepanov と A. Zayats の記事を再度参照すると、Stat-Media パッケージの使用に注目します。 さらに、線形多変量回帰を実行できる手頃な価格のプログラムが他にもあり、これで十分です。

    ロシアでは、銀行が企業に関するより多くの情報を蓄積し、さまざまな複雑さと自動化レベルのリスク スコアリング システムを使用しているという単純な理由から、スコアリングはまず個人ではなく法人に対して使用される可能性があります。 スコアリング システムとスコアリング システムの違いは、最初のシステムでは特定の係数または財務指標の重要性が主観的に決定され、2 つ目のシステムでは係数がリスクのレベルに関連付けられているという事実にあります。

    西側諸国では、法人への融資の場合、スコアリング モデルは消費者ローンほど普及していません。 これは、モデルを開発するために互いに類似した十分な数の企業を採用することが非常に難しいという事実によるものです。企業は、規模、売上高、および経済のセクターが大きく異なります。 企業規模が大きくなればなるほど、類似企業を見つけて比較することは難しくなります。

    近年、中小企業向けのスコアリング モデルの開発に大きな変化が起きています。 中小企業向けのスコアリングの使用は、類似の企業が多数あるからこそ可能であることが判明しました。

    結論として、ロシアでは、スコアリングの導入は客観的な理由よりも、数学的および統計的方法に対する銀行経営者の不信感に関連する主観的な理由によって妨げられていることに注意したいと思います。 クライアントの分析を開始するのにそれほど時間はかかりません - 過去のクライアントの信用履歴と統計パッケージ - そして見返りは莫大です. スコアリング システムの利点の中で、西側の銀行家はまず第一に、ローンのデフォルト率の低下を挙げています。 さらに、意思決定のスピードと公平性、ローンポートフォリオの効果的な管理の可能性、および長期的なスタッフトレーニングの必要がないことが注目されています。

    ロシアでは、スコアリングの導入を徐々に行う必要があります。 まず、借り手の事前評価のための自動システムを作成できます。これにより、明らかに「悪い」リスクが自動的に除外され、信用委員会による検討のために「良い」リスクと「わずかな」リスクが提供されます。 しかし、自動化を導入しなくても、クライアントの個々の特性と、個人および法人の両方の債務不履行の可能性との関係を評価することは可能です。そのような特性に関する知識は、融資担当者にとって重要なサポートとして役立ちます。

    したがって、スコアリングは、米国および西ヨーロッパで広く使用されている自動化された信用リスク評価システムです。 スコアリングのソース材料は、過去の顧客に関するさまざまな情報であり、それに基づいて、さまざまな統計的および非統計的な分類方法を使用して、将来の借り手の信用力に関する予測が行われます。 スコアリング システムにより、銀行の従業員は迅速な融資決定を下し、市場の状況に応じて融資量を調整し、融資業務の収益性とリスク レベルの最適な比率を決定できます。

    記事の作成にあたっては、エジンバラ大学 (英国) のクレジット研究センターの資料が使用されました。

    スコアリングは、銀行が使用する顧客評価システムで、統計的手法に基づいています。 原則として、これは潜在的な借り手のデータが入力されるコンピュータープログラムです。 それに応じて、結果が与えられます-彼にローンを与える価値があるかどうか。 スコアリングという名前は、英語のスコア、つまり「スコア」に由来します。

    スコアには次の 4 種類があります。

    アプリケーションスコアリング(英語からの直訳-「アプリケーションのスコアリング、上訴」)-ローンを発行する際の借り手の信用力の評価。 これは、顧客に知られている最も一般的なタイプのスコアリングです。 これは、借り手の個人データの一次収集、コンピューターによる処理、および結果の結論に基づいています。つまり、ローンを許可するかどうか。

    collection-scoring - 不良債権処理段階での採点システム。 「不良」ローンを返済するための銀行員の優先行動を決定します。 実際、このプログラムを使用すると、最初の警告から債権回収会社にケースを照会するなど、不良債権に対処するための多くの手順を実行できます。 このような処理の過程で、クライアントの約 40% が物忘れに言及し、ローンを返済すると考えられています。

    行動スコアリング、「行動スコアリング」 - 借り手の最も可能性の高い金融行動の評価。 このようなシステムにより、借り手の支払能力の変化を予測し、借り手に設定された制限を調整することができます。 分析の基礎は、クレジットカード取引など、一定期間のクライアントのアクションです。

    不正スコアリング - 潜在的な借り手による不正行為の可能性の統計的評価。 このようなスコアリングは通常、他の種類の顧客調査と組み合わせて使用​​されます。 同時に、ロシアのローン不履行の最大 10% が明らかな詐欺に関連していると考えられており、この数字は増加しています。

    多くの採点システムは、入力されたデータを処理するだけでなく、自己学習も可能です。将来の借り手の評価を調整するために、すでに受け入れられた顧客の行動を考慮に入れます。

    銀行ソフトウェア市場には既製のソリューションがあります。 最も有名な欧米のプログラムは、SAS Credit Scoring、EGAR Scoring、Transact SM (Experian-Scorex)、K4Loans (KXEN)、Clementine (SPSS) です。 ロシアの開発者の中では、Basegroup Labs、Diasoft が際立っており、ウクライナの会社 Neuro-Systems Business はよく知られています。 同時に、多くの銀行が独自のシステムを開発しています。

    スコアリング システムは、意思決定を自動化し、ローン申請の処理時間を短縮し、銀行が信用ポリシーを一元的に実施できるようにすることで、コストを削減し、運用上のリスクを最小限に抑えることを可能にし、金融機関を詐欺からさらに保護します。 同時に、スコアリングには多くの欠点もあります。多くの場合、システムの決定は、借り手のみが提供するデータの分析に基づいています。 さらに、採点システムは過去の経験のみを考慮し、社会経済状況の変化に遅れて反応するため、常に改善および維持する必要があります。