Построение скоринговых моделей на реальных данных. Формирование скоринговой модели оценки кредитоспособности корпоративного заемщика. Какие данные участвуют в построении модели

Дубовицкий В. С.
аналитик крупного российского банка
(г. Москва)
Управление корпоративными финансами
05 (65) 2014

В данной статье описано исследование по разработке скоринговой модели для оценки кредитоспособности крупных торговых предприятий, позволяющей на основе значений отдельных показателей судить о состоятельности заемщика, оценивается ее эффективность. Наиболее объемными блоками в разработке скоринговой модели являются выбор системы оценочных показателей и определение весовых коэффициентов для этих показателей, что будет подробно освещено в данной статье

ВВЕДЕНИЕ

Одно из ключевых направлений бизнеса в банковской сфере - кредитование. Именно кредиты являются основой банковских активов, обеспечивая банку процентный доход. В последнее время в нашей стране происходит бурное развитие банковской сферы, прежде всего кредитных отношений банков с населением, предпринимателями и крупным бизнесом. Кредиты подразумевают не только процентные доходы, но и кредитные риски, связанные с несостоятельностью заемщика и потерей ссуды. Оценка величины кредитного риска является ключевым направлением анализа при принятии решения о кредитовании того или иного заемщика, и от нее во многом зависит благосостояние финансового учреждения.

В наши дни банки используют различные методы анализа, оценивая уровень возможных потерь и вероятность дефолта заемщика. Исходя из этого анализа заемщику присуждается рейтинг качества - «хороший», «средний» или «плохой», согласно Положению ЦБ РФ №254-п «О порядке формирования кредитными организациями резервов на возможные потери по ссудам, по ссудной и приравненной к ней задолженности» от 26 марта 2004 г.

Центральный банк выступает главным регулятором кредитной системы и дает рекомендации по оценке кредитоспособности заемщиков. В соответствии с ними банки выстраивают свои модели оценки - их многообразие и изобретательность их авторов поражают. Такие модели включают комплексную оценку финансового состояния заемщика как главного показателя будущей платежеспособности. Однако все модели нацелены на кредитный рейтинг заемщика, описывающий уровень риска финансовых потерь. Согласно общепринятой классификации, хороший уровень кредитоспособности соответствует хорошему финансовому состоянию компании и низкому риску возможных потерь, средний - среднему финансовому состоянию и средним рискам, плохой - высокой вероятности дефолта заемщика. По хорошему состоянию, вероятнее всего, будет вынесено положительное решение о выдаче ссуды, среднее потребует дополнительных исследований, а плохому заемщику будет отказано.

Оценка кредитного риска в банках всегда занимала весомое положение. Так, согласно исследованиям Bailey и Gately , существующие методы оценки непрестанно совершенствуются, время от времени появляются новейшие методики, такие как оценка при помощи нейронных сетей, что вызвано высоким спросом со стороны кредитных организаций на оптимизацию и улучшение прогнозной способности инструментов для оценки вероятности дефолта потенциальных заемщиков.

Итак, оценка кредитоспособности является ключевой задачей при выдаче кредита. Цель данной работы - создание собственной скоринговой модели для оценки кредитного качества юридических лиц. Она будет разработана для крупных предприятий розничной торговли и позволит оперативно принимать решение о целесообразности финансирования различных заемщиков.

Вначале будет произведен краткий сравнительный анализ существующих подходов к оценке кредитоспособности. На его основании будут приведены аргументы в пользу разработки скоринговой модели, затем будет непосредственно разработана скоринговая модель с использованием различных теоретических методов. Одни из главных задач при разработке - определение сбалансированной системы оценочных показателей с учетом выбранной отрасли и определение весовых коэффициентов для этих показателей.

Далее будет проведено статистическое исследование на основе выборки из 41 торгового предприятия (для 16-ти из них был зафиксирован дефолт) с целью сопоставить результаты по весам показателей с результатами, полученными первоначально. По итогам сравнения будет дано заключение о корректности составленной скоринговой модели. В заключение данной статьи будет представлена оценка эффективности разработанной модели, определена прогнозная способность разработанной модели и сделан вывод о ее состоятельности.

РАЗЛИЧНЫЕ ПОДХОДЫ К ОЦЕНКЕ КРЕДИТОСПОСОБНОСТИ

Все существующие модели оценки кредитоспособности заемщиков можно представить в виде следующей классификации (рис. 1).

Итак, многообразие подходов к анализу кредитоспособности можно систематизировать, разделив все методы на три больших блока:

  • количественные модели;
  • прогнозные модели;
  • качественные модели.

Количественные модели используют соответствующие показатели и позволяют присвоить заемщику на их основе определенный рейтинг, прогнозные опираются на статистику прошлых лет и нацелены на моделирование дальнейшего развития событий и вероятности дефолта заемщика, а качественные модели используют систему разносторонних качественных показателей.

Для определения наиболее эффективного подхода к оценке кредитоспособности сопоставим описанные методы оценки. В табл. 1 приведены сравнительные характеристики рассмотренных ранее моделей оценки кредитов.

Таблица 1. Сводная таблица моделей оценки кредитоспособности

Наименование модели Достоинства модели Недостатки модели
Метод коэффициентов Позволяет комплексно оценить финансовое состояние заемщика Не учитывает качественные показатели, статистику прошлых лет. Неавтоматизированная система требует постоянной интерпретации значений отдельных показателей
Рейтинговые модели Позволяют автоматизировать оценку методом коэффициентов путем вычисления интегрального показателя. Отличаются удобством и простотой использования Учитывают только финансовые показатели, не используют статистику прошлых лет. Требуют перестройки для различных типов компаний
Скоринговые модели Позволяют получить оценку кредитоспособности в балльном эквиваленте и отнести заемщика к одной из трех групп. Просты и удобны в использовании, помогают оценивать нефинансовые качественные показатели. При оценке весовых коэффициентов статистическими методами позволяют учесть данные по уже выданным кредитам, являются экономически обоснованными Не универсальны, требуют перестройки под определенные типы компаний. Требуют большого объема данных для исследования весовых коэффициентов
Модели Cash Flow Позволяют оценить будущие денежные потоки компании и сопоставить их с долговой нагрузкой Не учитывают рыночную конъюнктуру и качественные показатели компании-заемщика. Могут давать несовместимые с реальностью результаты
Модели дискриминантного анализа Позволяют определить вероятность дефолта компании-заемщика на основе статистики за прошлые годы
Модели регрессионного анализа Позволяют определить вероятность дефолта компании-заемщика на основе статистики прошлых лет. При использовании модели на корректных данных можно получить результаты высокой степени достоверности Сугубо эмпирические, результаты сильно зависят от обучающей выборки и при исследовании модели на других данных зачастую не соответствуют реальности. Требуют большого объема данных для исследования весовых коэффициентов
Модели качественного анализа Позволяют провести комплексный анализ компании Отсутствие математических методов, приводящее к субъективной оценке отдельных показателей и к ошибкам, связанным с человеческим фактором. Не учитывают статистику прошлых лет. Нет четких регламентов оценки кредитоспособности для качественных блоков анализа

Опираясь на приведенный сравнительный анализ, можно сделать вывод, что скоринговая модель находится на вершине эволюции количественных Наименование модели Достоинства модели Недостатки модели

Метод коэффициентов Позволяет комплексно оценить финансовое состояние заемщика Не учитывает качественные показатели, статистику прошлых лет. Неавтоматизированная система требует постоянной интерпретации значений отдельных показателей

Рейтинговые модели Позволяют автоматизировать оценку методом коэффициентов путем вычисления интегрального показателя. Отличаются удобством и простотой использования Учитывают только финансовые показатели, не используют статистику прошлых лет. Требуют перестройки для различных типов компаний

Скоринговые модели Позволяют получить оценку кредитоспособности в балльном эквиваленте и отнести заемщика к одной из трех групп. Просты и удобны в использовании, помогают оценивать нефинансовые качественные показатели. При оценке весовых коэффициентов статистическими методами позволяют учесть данные по уже выданным кредитам, являются экономически обоснованными Не универсальны, требуют перестройки под определенные типы компаний. Требуют большого объема данных для исследования весовых коэффициентов

Модели Cash Flow Позволяют оценить будущие денежные потоки компании и сопоставить их с долговой нагрузкой Не учитывают рыночную конъюнктуру и качественные показатели компании-заемщика. Могут давать несовместимые с реальностью результаты

Модели дискриминантного анализа Позволяют определить вероятность дефолта компании-заемщика на основе статистики за прошлые годы Сугубо эмпирические, результаты сильно зависят от обучающей выборки и при исследовании модели на других данных зачастую не соответствуют реальности. Требуют большого объема данных для исследования весовых коэффициентов

Модели регрессионного анализа Позволяют определить вероятность дефолта компании-заемщика на основе статистики прошлых лет. При использовании модели на корректных данных можно получить результаты высокой степени достоверности Сугубо эмпирические, результаты сильно зависят от обучающей выборки и при исследовании модели на других данных зачастую не соответствуют реальности. Требуют большого объема данных для исследования весовых коэффициентов

Модели качественного анализа Позволяют провести комплексный анализ компании Отсутствие математических методов, приводящее к субъективной оценке отдельных показателей и к ошибкам, связанным с человеческим фактором. Не учитывают статистику прошлых лет. Нет четких регламентов оценки кредитоспособности для качественных блоков анализа разное количество баллов. Значения коэффициентов в дальнейшем будут разбиты на диапазоны. Для каждого диапазона (столбец «Диапазон коэффициента» в табл. 2) будет установлена процентная доля (25%, 50%, 75% или 100%) от весового коэффициента в табл. 2. Весовой коэффициент в данном случае является максимальным баллом. В дальнейшем речь пойдет именно о поиске весовых коэффициентов. Таким образом, разбивка коэффициентов на диапазоны является условной (основана на логических соображениях исходя из значений данных показателей для различных компаний отрасли; интервалы взяты таким образом, чтобы во второй интервал после максимального попало порядка 60% ведущих компаний отрасли («Магнит», «Дикси», Х5 Retail Group, «ОК», «Л"Этуаль»), выбранных для определения среднерыночных коэффициентов и ориентиров). Чем выше долговая нагрузка, тем выше вероятность дефолта и тем меньшее количество баллов должен получить показатель. Эмпирические же методы сконцентрированы на поиске весовых коэффициентов и будут представлены двумя подходами - аналитическим (метод Т. Саати) и статистическим (регрессионное исследование) (максимальное количество баллов в данном случае совпадает с весовым коэффициентом). Сами же весовые коэффициенты будут определены позже.

Финансовые показатели скоринговой модели представлены в табл. 2.

Таблица 2. Финансовые показатели скоринговой модели

Группа показателей Показатель Диапазон коэффициента
Ликвидность > 0,75 1
0,5-0,75 0,75
0,25-0,5 0,25
0-0,25 0
Платежеспособность 0-1 1
1-1,5 0,75
1,5-2 0,5
2-2,5 0,25
> 2,5 0
< 1,5 1
1,5-2 0,5
> 2 0
Коэффициент покрытия процентов, EBIT/Interest > 1,5 1
1,3-1,5 0,75
1-13 0,5
< 1 0
Деловая активность Рентабельность продаж, ROS > 0,025 1
0,02-0,025 0,75
0,015-0,02 0,5
< 0,015 0
Убыток компании за три последние отчетных периода Нет 1
За один отчетный период 0,5
0

Допустимые значения коэффициентов определялись на основе средних значений для пяти ведущих торговых предприятий России на основе отчетности МСФО за три года: «Магнит», Х5 Retail Group, «Дикси», «ОК», «М.Видео». Мы рассмотрели важнейшие финансовые показатели для определения финансового состояния заемщика. Однако большое влияние на кредитоспособность компании оказывают также факторы, провоцирующие возникновение рисков в бизнес-процессах заемщика. Прежде всего необходимо учесть качество менеджмента. Это весьма трудный показатель для количественного анализа, т.к. проблематично объективно оценить уровень управления компанией.

Постараемся перейти от качественной к количественной оценке и зададим максимальную оценку этого показателя при выполнении следующих условий:

  • имеется четкая стратегия развития компании на ближайшие годы;
  • неизменен состав топ-менеджмента (генеральный директор и главный бухгалтер занимают должности более двух лет), т.к. о наличии сильной команды менеджеров говорит в числе прочего и ее постоянство;
  • профессиональные компетенции соответствуют высоким требованиям (наличие профильного высшего образования у генерального директора и главного бухгалтера, опыт работы - более пяти лет).

Следующий важный фактор, который будет включен в скоринговую модель, - это срок функционирования компании. Кроме того, необходимо ввести стоп-фактор: при сроке ведения бизнеса меньше одного года данная модель будет неприменима ввиду отсутствия отчетности и возможности понять бизнес компании.

Еще один необходимый показатель - положительная кредитная история. Это один из важнейших нефинансовых показателей, характеризующий, по сути, качество обслуживания будущей ссуды. Было бы необоснованно рассчитывать на своевременный возврат кредитных средств от предприятия, имеющего просрочки другим кредиторам. Представим рассмотренные нефинансовые показатели и распределение баллов по ним в табл. 3.

Таблица 3. Нефинансовые показатели скоринговой модели

Группа Показатели показателей Доля от максимального количества баллов для диапазона
Бизнесс-процессы Качество менеджмента 1
0,5
0
> 5 лет 1
3-5 лет 0,75
1-3 года 0,25
< 1 года Стоп-фактор
1
0,5
0
Наличие систематической просрочки по кредитам и займам за последний финансовый год; существенный объем просрочки по кредиторской задолженности (> 25%) Стоп-фактор

Мы составили систему оценочных показателей, которая, по нашему мнению, должна комплексно и разносторонне оценивать качество заемщика и его способность выполнять свои обязательства. Следующая часть работы при создании любой скоринговой модели наиболее трудоемкая - это определение веса различных оценочных показателей. Оттого, насколько объективно мы оценим важность тех или иных факторов, зависит прогнозная ценность нашей модели. В данной статье будет проведен анализ весов на основе нескольких методов для исключения возможных ошибок.

Весовые коэффициенты вначале будут определены с помощью аналитических процедур, а затем сопоставлены с результатами регрессионного анализа.

АНАЛИТИЧЕСКАЯ ОЦЕНКА ВЕСОВЫХ КОЭФФИЦИЕНТОВ МОДЕЛИ

В качестве инструмента оценки возьмем методику, подробно описанную в книге ТЛ. Саати «Математические модели конфликтных ситуаций» [б]. Данный метод позволяет уйти от многообразия факторов и сравнить на предмет значимости в конкретный момент времени только два из них, в конечном счете определив значимость влияния каждого из факторов на какой-либо общий показатель. Методика основана на составлении матриц парных сравнений, которые строятся для факторов, влияющих на какой-либо общий показатель. Такие матрицы могут быть построены, например, для показателя платежеспособности в разрезе факторов, представленных коэффициентами финансового рычага, долговой нагрузки и покрытия процентов. Задача состоит в том, чтобы построить такие матрицы для всех групп факторов, влияющих на какие-либо общие показатели. В итоге будут созданы две матрицы для табл. 2 - для групп показателей «Платежеспособность» и «Деловая активность», одна матрица для табл. 3 - для показателей бизнес-процессов, а также две матрицы для агрегированных уровней - одна матрица для группы финансовых показателей, состоящей из групп показателей «Ликвидность», «Платежеспособность» и «Деловая активность», и одна для двух агрегированных блоков - финансовых и нефинансовых показателей в целом.

Итого пять попарных матриц сравнения, каждая из которых даст свой коэффициент для входящего в нее показателя. Таким образом, чтобы получить весовой коэффициент для показателя на нижней ступени иерархии, например для коэффициента покрытия процентов, необходимо умножить весовой коэффициент финансовых показателей на весовой коэффициент показателей платежеспособности внутри финансовых показателей и на коэффициент показателя покрытия процентов внутри финансовых показателей.

В заголовках самих матриц для групп показателей в вертикальных и горизонтальных столбцах помещаются наименования факторов. Затем матрицы заполняются значениями, представляющими собой трансформацию субъективных предпочтений одного фактора другому в эмпирический вид согласно методике, представленной в табл. 4 (с использованием данных рис. 2).

Таблица 4. Метод Т. Саати. Классификация предпочтений (на основе рис.2)

В основном применяются нечетные числа, однако при затруднении в выборе можно воспользоваться четными как средним уровнем между двумя нечетными. Пример такой матрицы для четырех факторов показан на рис. 2. Соответственно, когда мы сравниваем один и тот же фактор, элемент принимает значение 1, поэтому такие матрицы являются единичными. Нетрудно заметить, что они также обратно симметричны, что позволяет нам заполнить такую матрицу только для значений, лежащих либо выше, либо ниже главной диагонали.

Учитывая, что матрицы попарных сравнений являются обратно симметричными, следует произвести сравнение только в одну сторону и внести соответствующие значения в матрицу над главной диагональю, а значения под главной диагональю будут обратными.

После получения пяти таких матриц производится расчет весовых коэффициентов: будет измерен вес каждого значения в матрицах относительно общей суммы в столбце, а затем из этих значений в каждой строчке будет взято среднее арифметическое по этим значениям. Среднеарифметические значения и будут представлять собой весовые коэффициенты. Пример матрицы для группы показателей платежеспособности представлен на рис. 3.

Произведя описанные расчеты, получим удельный вес каждого показателя. Для удобства дальнейших расчетов определим максимально возможный балл как произведение удельного веса показателя на 50 1 с последующим округлением до целого числа (табл. 5,6).

1 Данная операция произведена исключительно для удобства, число 50 позволяет минимальному коэффициенту перейти к целочисленному значению (в данном случае значению 2). Поскольку все коэффициенты умножаются на одно и то же число, мы не искажаем результатов аналитического подхода. - Прим. авт.

ОПРЕДЕЛЕНИЕ ЗНАЧИМОСТИ ПОКАЗАТЕЛЕЙ С ПОМОЩЬЮ РЕГРЕССИОННОГО АНАЛИЗА

Для проведения статистического исследования мы использовали данные по 41 крупной компании из сектора розничной торговли. Эти компании выпускали корпоративные облигации, и по 16 облигациям был зафиксирован дефолт. По каждой компании были рассчитаны восемь выбранных показателей скоринговой модели на основе годовой отчетности в год выпуска корпоративных облигаций. Выборка представлена в Приложении 1. В нем задан объясняемый показатель у- вероятность дефолта, принимающий значение 1, если компания не исполнила свои обязательства. Выделенные три показателя справа были заданы дамми-переменными (могут принимать только значения 0 или 1) ввиду их качественной природы. Они принимают значения 1, если за последние три года у компании чистая прибыль > О (Nl > 0), стабильный и качественный руководящий состав (manager) и положительная кредитная история (histor). Финансовые показатели (первые пять показателей) рассчитывались на основе годовой отчетности по стандартам МСФО в год выпуска дефолтных облигаций.

В качестве модели для исследования выберем построение линейной многофакторной регрессии:

p = w 0 + w 1 x 1 + w 2 x 2 + ... + w n x n ,

где р - зависимая переменная, описывающая вероятность дефолта;
w - весовые коэффициенты; х - показатели.

Итак, введем исходные данные в Excel и воспользуемся функцией Data analysis - Regression. При анализе исходных данных по восьми показателям скоринговой модели без корректировок получаем результат, представленный в Приложении 2. Adjusted R^2 равняется 0,55 - невысокое, но приемлемое значение, говорящее о практической значимости построенной регрессии. Можно выдвинуть предположение о причине невысокой значимости наличия выбросов в данных, например, отсутствие значений для некоторых компаний по показателю EBIT / Interest ввиду отсутствия долговой нагрузки (упрощенно в целях исследования в таком случае принималось значение коэффициента, равное 0) или отрицательное значение показателя Debt / EBITDA ввиду отрицательного денежного потока. В данном случае некорректно воспринимается влияние отрицательного показателя, т.к., по логике исследования, чем выше Debt / EBITDA, тем выше вероятность дефолта; отрицательный показатель, в свою очередь, не является показателем низкой долговой нагрузки. Также на прогнозную способность влияют компании с ярко выраженными экстремальными значениями отдельных показателей. Так, у компании «Банана-Мама» собственный капитал составляет 10 000 руб., что приводит к искажению соответствующих показателей - финансовый рычаг равен 181 957 (при среднеотраслевых значениях в диапазоне 0,7-1,5).

Таблица 5. Финансовые показатели с учетом веса

Показатель Вес в системе показателей Максимальный балл Диапазон коэффициента
>1 5
Коэффициент текущей ликвидности 0,1072 5 > 1 5
0,75-0,1 4
0,5-0,75 1
0-0,5 0
Коэффициент текущей ликвидности 0,1581 8 < 1 8
1-1,5 6
1,5-2 4
2-2,5 2
> 2,5 0
Коэффициент долговой нагрузки, Net Debt / EBITDA 0,1581 8 < 1.5 8
1,5-2 4
> 2 0
0,0790 4 > 1,5 4
1,3-1,5 3
1-1,3 2
< 1 0
Рентабельность продаж, ROS 0,1256 6 > 0,025 6
0,02-0,025 5
0,015-0,02 3
< 0,015 0
0,0418 2 Нет 2
За один отчетный период 1
За два отчетных периода и более 0
Итого 0,6698 33 - 68

Исключим следующие шесть компаний из исследования: супермаркет «Город», «Интертрейд», М.Видео» (2013 г.), «Связной», «Банана-Мама», «Провиант». Также отметим невозможность одновременного использования показателей ROS и отсутствия убытков (Nl > 0) ввиду их высокой корреляции. Дело в том, что при наличии убытков у компании рентабельность продаж автоматически принимает отрицательное значение.

Таблица 6. Нефинансовые показатели с учетом веса

Показатель Вес в системе показателей Максимальный балл Диапазон коэффициента / методика оценки Количество баллов для диапазона с учетом веса
Качество менеджмента 0,099 5 Выполнение всех описанных условий 5
Невыполнение одного из условий 2,5
Невыполнение более чем одного условия 0
Срок функционирования компании 0,0528 3 > 5 лет 3
3-5 лет 2
1-3 года 1
< 1 года Стоп-фактор
Положительная кредитная история 0,1782 9 Отсутствие просрочек по кредитам и займам, просроченной кредиторской задолженности 9
Наличие информации о реструктуризации задолженности; незначимые просрочки по кредиторской задолженности (до 10%) 4,5
Единичный случай просрочки по займам и кредитам с последующим погашением; значимые просрочки по кредиторской задолженности (10-25% от общего объема задолженности) 0
Наличие систематической просрочки по кредитам и займам за последний финансовый год; существенный объем просрочки по кредиторской задолженности (>25%) Стоп-фактор
Итого 17

Опираясь на данные рассуждения, удалим показатель Nl > 0 из нашей модели. Для новой семифакторной регрессии на обновленной выборке из 35 компаний получим следующий результат (Приложение 3). Мы видим, что значимы шесть из семи исследуемых показателей. Знаки при коэффициентах верно отражают предположения, высказанные выше: чем выше рентабельность продаж и качество менеджмента, тем ниже вероятность дефолта (у = 1), и наоборот: чем выше долговая нагрузка, тем выше вероятность дефолта. На первый взгляд знак неправилен только у коэффициента текущей ликвидности. Однако большие значения ликвидности так же плохи, как и малые, - они говорят о низкой эффективности бизнеса и недополученной прибыли. Компании с большими коэффициентами ликвидности склонны к недополучению прибыли, низкой рентабельности и доходности бизнеса, что делает их менее привлекательными в глазах потенциальных инвесторов, а следовательно, и более уязвимыми к изменениям финансовых условий. Наиболее значимыми являются коэффициенты D (или Debt - объем процентного долга) / EBITDA, положительная кредитная история и финансовый рычаг; коэффициент покрытия процентов незначим.

Выше при моделировании коэффициентов по методу Т. Саати мы также предполагали, что наиболее значимыми показателями окажутся коэффициенты при долговой нагрузке и финансовом рычаге. Сравнительный анализ итоговых значимостей коэффициентов приведен в табл. 7.

Таблица 7. Сравнительный анализ значимости коэффициентов

Показатель на основе экспертных оценок по методу Т. Саати Коэффициент Показатель на основе регрессионного анализа P-value
Положительная кредитная история 0,1782 Коэффициент долговой нагрузки, Net Debt / EBITDA 0,014
Коэффициент финансового рычага 0,1581 Положительная кредитная история 0,020
Коэффициент долговой нагрузки, Net Debt /EBITDA 0,1581 Коэффициент финансового рычага 0,022
Рентабельность продаж, ROS 0,1256 Качество менеджмента 0,037
Коэффициент текущей ликвидности 0,1072 Рентабельность продаж, ROS 0,039
Качество менеджмента 0,099 Коэффициент текущей ликвидности 0,047
Коэффициент покрытия процентов, EBIT / Interest 0,0790 Коэффициент покрытия процентов, EBIT / Interest Незначим
Убыток компании за последние три отчетных периода 0,0418 Убыток компании за последние три отчетных периода Исследовался как нефинансовый показатель, незначим

Данные результаты говорят о согласованности метода Т. Саати и статистических данных. Три наиболее значимых показателя по аналитическому подходу подтверждают свою высокую значимость и в практическом исследовании, изменилось только распределение очередности самих показателей. Также два наименее значимых по первой части работы показателя - качество менеджмента и EBIT/ Interest - оказались незначимы в статистическом исследовании.

Таким образом, регрессионный анализ подтверждает принципы классификации значимости весовых коэффициентов в аналитической части работы и позволяет говорить о статистической значимости построенной скоринговой модели.

ОПРЕДЕЛЕНИЕ РЕЗУЛЬТАТОВ РАЗРАБОТАННОЙ СКОРИНГОВОЙ МОДЕЛИ

Общее максимальное количество баллов скоринговой модели - 50. Для каждого показателя в процессе определения диапазонов значений мы выявляли следующий после максимального количества баллов уровень, также приемлемый, хоть и с относительно высоким уровнем риска, основываясь на рыночных значениях показателей. Для одних показателей следующий за максимальным уровень составлял 75% от общего количества баллов, для других - 50%. Все последующие уровни будем считать уровнями с высоким кредитным риском и относить соответствующих заемщиков к категории плохих. К наиболее предпочтительной группе отнесем заемщиков, выполняющих максимальные требования по самым значимым (по весовым коэффициентам) показателям: кредитная история, финансовый рычаг и долговая нагрузка, а также рентабельность продаж в сумме 31 балл и выполнение как минимум следующего за максимальным уровня требований по остальным показателям - 12,5 в сумме. Итого 43,5 балла за нижний уровень высокой кредитоспособности.

Для определения пограничного интервала, характеризующего высокую степень кредитоспособности, рассчитаем количество баллов по финансовым и нефинансовым показателям в следующем после максимального диапазоне значений из табл. 5 и б. Показатели разделены по принимаемым значениям коэффициентов на другие диапазоны. Мы получим следующую классификацию (табл. 8).

Таблица 8. Классификация результатов

Таблица 9. Прогнозная способность скоринговой модели, %

Основываясь на табл. 8, произведем оценку прогнозной способности нашей модели, подставляя данные компаний в ее условия. В Приложении 4 приведены рассчитанные скоринговые баллы для исследуемых компаний. В зависимости от значения показателя в таблице проставлялась его балльная оценка согласно разработанной модели, а затем все баллы суммировались в интегральный показатель (столбец «Сумма»). На основании суммы баллов производилось распределение компаний по трем классам, затем данные сравнивались с фактическим наличием или отсутствием дефолта у компании. В столбце «Верно или нет», 1 означает верный результат скоринговой модели, 0 - ошибку. Таким образом, мы получили следующий результат (табл. 9).

Мы получили средний (относительно описанных в различных источниках) результат для прогнозной способности скоринговых моделей. Однако стоит отметить низкий процент ошибок второго рода, что повышает прогнозную ценность нашей модели. Данный результат можно считать положительным и подтверждающим эффективность проведенного исследования.

ЗАКЛЮЧЕНИЕ

В данной работе была предложена скоринговая модель для оценки кредитоспособности крупных розничных торговых предприятий. Модель основывается на комплексе оценочных показателей, позволяющих разносторонне оценить финансовое и нефинансовое состояние заемщика.

По результатам оценки заемщику присуждается один из трех классов кредитоспособности, характеризующий степень кредитного риска и целесообразность кредитования.

Мы смоделировали систему оценочных показателей, позволяющих наиболее точно оценить состояние заемщика из сектора розничной торговли. Произведя анализ лидеров рынка розницы и рассчитав для них используемые показатели, мы определили для них границы приемлемых значений и ранжировали по разным группам с разным процентом от максимально возможного балла.

Наиболее трудоемкой задачей было определение весовых коэффициентов при исследуемых показателях. Был сделан вывод о необходимости комплексного подхода ввиду отсутствия какого-то одного идеального метода. Комплексный подход был реализован следующим образом: в первой части работы весовые коэффициенты определялись с помощью аналитических процедур, а во второй - с помощью статистического исследования.

Разработанная модель показала высокие результаты в прогнозной способности, при этом она не требует больших ресурсных затрат на проведение анализа. Введение в эксплуатацию разработанной скоринговой системы позволит увеличить эффективность принятия кредитных решений в сфере крупных предприятий розничной торговли и оптимизировать кредитный процесс.

Литература

1. Айвазян С.А., Мхитарян B.C. Прикладная статистика и основы эконометрики. - М.: ГУ ВШЭ, 1998.

2. Гаврилова A.H. Финансы организаций. - М.: Кнорус, 2007.

3. Коробова Г.Г., Петров М.А. Состоятельность банковского заемщика и ее оценка в условиях конкуренции // Банковские услуги. -2005. -№7/8. -C. 22-24.

4. Куликов Н.И., Чайникова Л.И. Оценка кредитоспособности предприятия-заемщика. - Тамбов: Университет ТГТУ, 2007.

5. Положение ЦБ РФ №254-П «О порядке формирования кредитными организациями резервов на возможные потери по ссудам, по ссудной и приравненной к ней задолженности» от 26 марта 2004 г. - http://base.garant.ru/584458/.

6. Саати Т.Л. Математические модели конфликтных ситуаций / Под ред. И.А. Ушакова. - М.: Советское радио, 1977.

7. Шеремет А.Д., Сайфулин P.C., Негашев H.B. Методика финансового анализа. - М.: Инфра-М, 2001.

8. Abdou Н.А., Pointon J. (2011). «Credit scoring, statistical techniques and evaluation criteria: a review of the literature». Intelligent Systems in Accounting, Finance & Management, Vol. 18, No. 2-3, pp. 59-88.

9. Bailey M. (2004). Consumer Credit Quality: Underwriting, Scoring, Fraud Prevention and Collections. White Box Publishing, Kingswood, Bristol.

10. Crook J., Edelman D., Thomas L. (2007). «Recent developments in consumer credit risk assessment». European Journal of Operational Research, Vol. 183, No. 3, pp. 1447-1465.

11. Gately E. (1996). Neural Networks for Financial Forecasting: Top Techniques for Designing and Applying the Latest Trading Systems. New York: John Wiley & Sons, Inc.

12. Guillen М., Artis M. (1992). Count Data Models for a Credit Scoring System: the European Conference Series in Quantitative Economics and Econometrics on Econometrics of Duration, Count and Transition Models. Paris.

13. Heffernan S. (2004). Modern Banking. John Wiley & Sons, Inc., Chichester, West Sussex.

14. Liang Q. (2003). «Corporate financial distress diagnosis in China: empirical analysis using credit scoring models». Hitotsubashi Journal of Commerce and Management, Vol. 38, No. 1, pp. 13-28.

ПРИЛОЖЕНИЕ 1.

Выборка для исследования

Компания y / Признак дефолта Коэффициент текущей ликвидности EBIT / Interest/ Отношение EBIT к процентным платежам NI > 0/ Наличие чистой прибыли
1 Аптека 36,6 0 0,82 1,32 2,41 1,83 0,0496 1 1 1
2 Л"Этуаль 0 5,04 2,75 10,98 1,64 0,007 1 1 1
3 Кора 0 0,795 0,77 3,13 1,89 0 0 1 1
4 Лента 0 0,75 9,7 2,91 3,1 0,049 1 1 1
5 ОК 0 0,67 0,78 1,59 7,01 0,0357 1 1 1
6 Автомир 0 1,2 0,65 3,09 1,35 0,04 1 1 1
7 Х5 Retail Group 0 0,55 0,53 3,32 2,82 0,027 1 1 1
8 Город 0 0,99 18,97 10,25 1,29 0,01 1 1 0
9 Детский мир 0 0,93 0,83 2,14 3,99 0,032 1 1 1
10 Дикси 0 0,77 1,19 6,1 1,78 0,01 1 1 1
11 ИнтерТрейд 0 1,24 20,65 4,92 2,1 0,015 1 1 0
12 Карусель 0 0,73 0,68 3,175 1,71 0,059 1 1 1
13 Копейка 0 0,68 2,93 7,03 1,82 0 0 1 1
14 Kosmos Group 0 1,64 1,11 2,88 2,65 0,043 1 1 1
15 Магнит 0 и 0,54 1,11 10,2 0,061 1 1 1
16 Магнолия 0 0,27 2,35 3,55 1,02 0,064 1 1 1
17 М.Видео (2007 г.) 0 1,31 0,73 1,9 2,58 0,013 1 1 1
18 М.Видео (2013 г.) 0 0,95 0 0 0 0,039 1 1 1
19 ОАО «НТС» 0 1,18 3,09 5,44 1,05 0,21 1 0 1
20 Обувь России 0 0,87 2,34 1,87 5,65 0,1 1 1 1
21 Перекресток (2005 г.) 0 0,54 1,09 3,16 3,92 0,026 1 1 1
22 Пивдом 0 1,99 3 8 1,1 0,0006 1 0 1
23 Семья 0 10 0,28 1,66 6 0,58 1 1 1
24 Связной 0 1,07 0 0 0 0,001 1 1 1
25 Элекам 0 1,44 1,82 4,25 1,3 0,01 1 1 1
26 Макро 1 1 15 11 1,52 0,01 1 0 1
27 Престиж-экспресс 1 8 0,98 12,43 1,02 0,002 1 0 1
28 Арбат-Престиж 1 0,49 1,81 7,6 1,45 0,017 1 1 0
29 Орхидея 1 3 1,164 13 0 0,01 1 0 1
30 Банана-Мама 1 0,94 181957 -35 -0,6 -0,033 0 1 0
31 Белый фрегат 1 7 932 8,76 0,88 -0,4 0 1 1
32 Марта 1 3,96 20 11 1/17 0,003 1 1 1
33 Матрица 1 2,38 21 6,82 1 0,001 1 0 0
34 Меркурий
(Самохвал)
1 1,12 9,98 7,32 1,27 0,003 1 1 1
35 Миннеско 1 0,79 4,39 12 0,12 -0,047 0 1 1
36 Мосмарт 1 12 5 8 1,5 0 0 0 0
37 Полесье 1 7,93 15 14 1,03 0,003 1 0 1
38 Провиант 1 0,12 35557 0 0 -0,819 0 0 1
39 Седьмой континент 1 1,93 0,41 1,52 1,35 0,07 1 0 1
40 Техносила 1 14 18 10,36 1 0,002 1 1 1
41 ТОАП 1 7 22 10,83 1,04 0,009 0 0 1

Примечание: если у компании был зафиксирован дефолт, то коэффициенту принимает значение 1, и 0, если дефолта не было.

ПРИЛОЖЕНИЕ 2.

Регрессия по восьми факторам для 41 компании

Регрессия и остаток DF / Число степеней свободы SS / Сумма квадратов MS = SS / DF F-статистика Significance F / Значимость
Regression / Регрессия 8 6,250849408 0,781356176 7,133131961 2,17209Е-05
Residual / Остаток 32 3,505248153 0,109539005 - -
Total / Итого 40 9,756097561 - - -
Используемые параметры tStat/ t-статистика P-vaiue / Значимость
Intercept / Константа 0,354797355 0,281481615 1,260463691 0,216616062
Коэффициент текущей ликвидности 0,034652978 0,01876389 1,846790732 0,074043212
Leverage / Финансовый рычаг 1,31819Е-05 4,77939Е-06 2,758072506 0,009529947
D / EBITDA / Отношение процентного долга к EBITDA 0,044980795 0,018152923 2,477881708 0,018682248
-0,012377044 0,030936193 -0,40008296 0,691753745
ROS / Рентабельность продаж -0,530759612 0,375019201 -1,415286499 0,166643428
NI > 0 / Наличие чистой прибыли -0,02891433 0,164713359 -0,175543319 0,861758855
Manager / Качество менеджмента -0,266367tl2 0,134861932 -1,975109717 0,056935374
Histor/ Качество кредитной истории -0,109402928 0,159841844 -0,684444857 0,498621797

ПРИЛОЖЕНИЕ 3.

Регрессия по семи факторам для 35 компаний

Регрессия и остаток DFI Число степеней свободы SS / Сумма квадратов MS = SS / DF F-статистика Significance F / Значимость F
Regression / Регрессия 7 5,898901667 0,842700238 9,097165886 9,56Е-06
Residual / Остаток 27 2,501098333 0,092633272 - -
Total / Итого 34 8,4 - - -
Используемые параметры Coefficients / Коэффициенты Standard Error / Стандартная ошибка t Stat/ t-статистика P-value / Значимость
Intercept / Константа 0,473712463 0,25308461 1,871755309 0,072111654
Коэффициент текущей ликвидности 0,018420061 0,017803477 1,034632774 0,047018946
Leverage / Финансовый рычаг 0,017110959 0,009674238 1,768713818 0,022823937
D / EBITDA / Отношение процентного долга к EBITDA 0,046019604 0,021802198 2,110778177 0,014194286
EBIT / Interest / Отношение EBIT к процентным платежам -0,004583381 0,032996403 -0,13890548 0,89055573
ROS / Рентабельность продаж -0,582081686 0,483677061 -1,203451088 0,039247801
Manager / Качество менеджмента -0,174077167 0,138900851 -1,253247659 0,03786026
Histor / Качество кредитной истории -0,378981463 0,194742843 -1,946061058 0,020243892

ПРИЛОЖЕНИЕ 4.

Оценка компаний из выборки по скоринговой модели

Компания У Коэффициент текущей ликвидности Leverage / Финансовый рычаг D / EBITDA / Отношение процентного долга к EBITDA EBIT / Interest / Отношение EBIT к процентным платежам ROS / Рентабельность продаж Manager / Качество менеджмента Histor / Положительная кредитная история Срок функционирования компании Сумма Класс Верно или нет*
Аптека 36,6 0 4 6 4 4 6 5 9 3 41 2 1
Л"Этуаль 0 5 0 0 4 0 5 9 3 26 3 0
Кора 0 4 8 0 4 0 5 9 3 33 2 1
Лента 0 1 0 0 4 6 5 9 3 28 3 0
ОК 0 1 8 4 4 6 5 9 3 40 2 1
Автомир 0 5 8 0 3 6 5 9 3 39 2 1
Х5 Retail Group 0 1 8 0 4 5 5 9 3 35 2 1
Детский мир 0 4 8 4 4 6 5 9 3 43 2 1
Дикси 0 4 6 0 4 0 5 9 3 31 2 1
Карусель 0 1 8 0 4 6 5 9 3 36 2 1
Копейка 0 1 0 0 4 0 5 9 3 22 3 0
Kosmos Group 0 5 6 0 4 6 5 9 3 38 2 1
Магнит 0 5 8 8 4 6 5 9 3 48 1 1
Магнолия 0 0 2 0 2 6 5 9 3 27 3 0
М.Видео (2007 г.) 0 5 8 4 4 0 5 9 3 38 2 1
ОАО «НТС» 0 5 0 0 2 6 0 9 3 25 3 0
Обувь России 0 4 2 4 4 6 5 9 3 37 2 1
Перекресток (2005 г.) 0 1 6 0 4 5 5 9 3 33 2 1
Пивдом 0 5 0 0 2 0 0 9 3 19 3 0
Семья 0 5 8 4 4 6 5 9 3 44 1 1
Элекам 0 5 4 0 2 0 5 9 3 28 3 0
Макро 1 4 0 0 4 0 0 9 3 20 3 1
Престиж-экспресс 1 5 8 0 2 0 0 9 3 27 3 1
Арбат-Престиж 1 0 4 0 3 0 5 0 3 15 3 1
Орхидея 1 5 6 0 0 0 0 9 3 23 3 1
Белый фрегат 1 5 0 0 0 0 5 9 3 22 3 1
Марта 1 5 0 0 2 0 5 9 3 24 3 1
Матрица 1 5 0 0 0 0 0 0 3 8 3 1
Меркурий (Самохвал) 1 5 0 0 2 0 5 9 3 24 3 1
Миннеско 1 4 0 0 0 0 5 9 3 21 3 1
Мосмарт 1 5 0 0 3 0 0 0 3 11 3 1
Полесье 1 5 0 0 2 0 0 9 3 19 3 1
Седьмой континент 1 5 8 4 3 6 0 9 3 38 2 0
Техносила 1 5 0 0 0 0 5 9 3 22 3 1
ТОАП 1 5 0 0 2 0 0 9 3 19 3 1

* Столбец показывает, верное ли решение мы получили по кредитованию компании согласно скоринговой модели.

Термин «скоринг» в дословном переводе с английского языка означает «подсчет очков». Так называют систему и метод оценки рисков по кредитованию конкретного лица, управления рисками на основе математического прогноза. Банковский скоринг позволяет определить вероятность просрочки выплат, основываясь на информации из кредитной истории и на некоторых других данных. Основным критерием являются баллы, которые раньше начислялись сотрудниками кредитно-финансовых учреждений вручную, а сейчас все чаще рассчитываются специальной программой.

Скоринг эффективно работает в сфере экспресс-кредитования, микрофинансирования, где на рассмотрение заявки у специалиста есть не более часа. В специальную программу заводятся данные потенциального заемщика. Система сравнивает информацию со статистикой. Например, если в базе данных много сведений о том, что люди такого же возраста и/или профессии не возвращали кредиты, то решение может быть отрицательным - банк может отказать без объяснения причин.



Оценка кредитоспособности заемщика − физического лица − в автоматическом режиме основывается на анализе различной информации, среди которой:

  • идентификационные данные . Обрабатываются данные паспорта, фото заявителя. Уже на этом этапе определяются мошенники, лица, имеющие плохую кредитную историю;
  • социальное положение . Учитывается пол, возраст заявителя, его образование и место работы. Принимается во внимание адрес регистрации и проживания, наличие семьи, иждивенцев;
  • финансовое положение . В идеальном варианте необходимо иметь не только достаточный, но и регулярный доход. Некоторые банки учитывают также возможные траты: оплату коммунальных услуг, детского сада и т. д. Многие заявители идут на хитрости, не заявляя об иждивенцах или завышая суммы доходов. При небольших займах это может сработать, но при крупных кредитах банки обычно проверяют данные намного тщательнее;
  • кредитная история . В оценке кредитоспособности физического лица информация по предыдущим займам имеет одно из решающих значений. Определяются непогашенные кредиты, наличие просрочек и время, в течение которого они были выплачены. Если ссуды обслуживались аккуратно, то система выдаст высокую вероятность такого же поведения клиента в будущем, увеличив скоринговый балл. Такой же принцип работает и в обратную сторону;
  • транзакционное поведение . Параметр оценки доступен для заявителей, являющихся клиентами кредитно-финансового учреждения. Держатели пластиковых карт, депозитных счетов, участники зарплатных проектов чаще получают высокую скоринговую оценку. Системой оцениваются суммы, на которые совершаются покупки, категории точек продаж.

Все данные проверяются по отдельности и сравниваются между собой на наличие противоречий. Должна быть связь между доходами и расходами, должностью и местом проживания и т. д.

Непредвзятость . Скоринговая система оценки кредитоспособности оперирует фактами и цифрами, не учитывая личностные особенности человека. Сотрудник офиса, принимающий заявку, не может никаким образом повлиять на алгоритм подсчета. Кредитный эксперт не вправе безосновательно отказать в выдаче ссуды, если программа оценила заемщика как платежеспособное лицо.

Оперативность . Подсчет баллов в ручном режиме выполняется в форме таблицы. В отдельные строки специалист самостоятельно вводит данные и присваивает баллы, ориентируясь только на собственный опыт и знания. Процесс трудоемкий и долгий, заявителям приходится ждать по часу и более. Современные программы подсчитывают скоринговый балл в сотни раз быстрее.

Финансовая выгода . Банки, использующие скоринговую систему оценки кредитоспособности, часто предлагают более выгодные условия предоставления ссуд. Просчет рисков и автоматический отсев возможных неплательщиков значительно снижает долю невозврата, которую обычно закладывают в процентную ставку. Это выгодно и заемщику, и кредитору.

В первую очередь необходимо сформировать хорошую кредитную историю, без просрочек. Если своевременные выплаты невозможны по объективным причинам, необходимо как можно раньше сообщить об этом в банк и доказать временную неплатежеспособность. Большинство кредиторов идут навстречу клиентам, предоставляя отсрочки платежа, делая перерасчет или предлагая другие решения. В этом случае история не будет испорчена отказами выплат. Если негативные строчки в истории уже есть, их можно компенсировать своевременно выплаченными кредитами.

Еще один способ, позволяющий повысить скоринговую оценку кредитоспособности, - наличие депозита. Открытый вклад в банке дает понять, что у клиента есть средства для выплаты. То же самое относится к держателям зарплатных карт, которые обычно имеют высокий балл.

Чтобы повысить оценку, необходимо внимательно отнестись к заполнению заявления. Рекомендуется указывать достоверные контактные данные и предупредить всех, чьи телефоны вы вписываете в анкету. Если сотрудник банка начнет прозвон, он должен дозвониться до всех абонентов. В противном случае информацию могут признать недостоверной и отказать из-за этого в кредитовании.

Если вам отказали в ссуде по причине того, что программа скоринга сочла вас некредитоспособным, не стоит отчаиваться. Возможно, настройки алгоритма неблагоприятны для вас только в этом банке. Чтобы проверить это, попробуйте пройти скоринг в нашего сайта.

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Размещено на http://www.allbest.ru/

  • Введение
    • 1.4 Нейронные сети
    • 1.5 CHAID анализ
    • 1.6 Другие методы
    • 2.1 Постановка задачи
    • 3.1 Задача Монжа-Канторовича
    • 3.2 Применение задачи Монжа-Канторовича к скорингу
  • Заключение
  • Список литературы

Введение

Скоринг - это эвристический способ построения рейтингов и классификации различных объектов на группы. Он основывается на предположении о том, что люди со схожими социальными показателями ведут себя одинаково. Он применяется в банковской сфере, маркетинге, страховом деле.

Основной целью традиционного скоринга является классификация клиентов банка на “хороших” и “плохих”, исходя из которой кредитор может выбирать соответствующие действия по отношению к данному клиенту. “Плохого” клиента, к примеру, можно определить как клиента с низкой эмпирической вероятностью возвращения кредита. Но, как правило, такое определение “плохого” клиента расширяется до любого нежелательного банку поведения клиента. Классификация осуществляется на основе скоринговой карты с помощью которой рассчитывается скоринговый балл клиента. скоринг дискриминантный байесовский

Из литературы, посвященной скорингу, отметим несколько работ.

“Руководство по кредитному скорингу” под редакцией Элизабет Мейз, 2008 г. - единственная книга о скоринге на русском языке. Описываются общие понятия, разбираются методы построения скоринговой карты, обсуждается применение скоринга на практике. Книга состоит из статей написанных зарубежными специалистами в области финансов.

Диссертационная работа Сэмюэла Глассона “Метод цензурированной выборки для кредитного скоринга”, 2007 г. В ней исследуются инструменты анализа выживаемости, применительно к кредитному скорингу, в условиях цензурированных данных. Разбирается применение метода линейной регрессии и в частности метода Бакли-Джеймса. Практическая часть работы содержит в себе применение этих методов к оценке времени кредитного дефолта и времени выплаты очередного платежа.

Диссертационная работа Кристины Болтон “Логистические регрессии и их применение в кредитном скоринге”, 2009 г. Разбирается концепция кредитного скоринга применительно к банковскому делу в Южной Африке. Рассматриваются методы построения скоринговой модели с особым акцентом на метод логистической регрессии. Применяется этот метод для создания скоринговой модели.

Диссертационная работа Маттиаса Кремпля “Адаптивные модели и их применение в кредитном скоринге”, 2011. Акцент ставится на изучении методов построения предсказывающих моделей в условиях дрейфа и задержки данных. Представлен новый метод для построения скоринговых моделей, базирующийся на методе дерева принятия решений. Представленный метод применяется для оценки дрейфа в двух наборах реальных финансовых данных.

В приведённых выше работах имеется общая проблема: применение методов к построению скоринговых моделей не обосновано. Отсюда вытекает сомнение в правильности полученных данных. Задача состоит в построении метода, применение которого было бы обосновано. В данной работе представляется метод, решающий эту задачу.

Существует множество подходов к построению скоринговой модели. В главе 1 данной работы описаны методы применяемые в вышеприведённых диссертациях. В главе 2 вводится математическая модель скоринга и разбирается эмпирический Байесовский подход к построению скоринговой модели: подход описывается теоретически, а после применяется к реальным данным банка “Сбербанк России” для построения скоринговой модели. В главе 3 вводится метод, основывающийся на задаче Монжа-Канторовича. Приведено теоретическое обоснование использования данного метода. Затем он применяется для построения скоринговой модели на данных используемых в главе 2.

Глава 1. Методы построения скоринговых моделей

1.1 История появления и развития скоринга

Изначально скоринг разрабатывался с целью автоматизации процесса решения о выдаче кредита. До внедрения скоринга, решение о том, кому выдать кредит в каком размере, принималось кредитным экспертом. Он решал это, опираясь на опыт и собственное мнение, руководствуясь параметрами клиента, влияющими на его кредитоспособность.

В 1940-х годах началось внедрение скоринговых систем. В 1941 Давид Дюран опубликовал первую исследовательскую работу по кредитному скорингу, в которой оценивал роль различных факторов в прогнозирующей системе. После окончания Второй мировой войны, резко вырос спрос на кредитные продукты, и стало ясно, что традиционные методы принятия решения плохо работают в условиях большого числа клиентов. Взрыв спроса на кредиты, отчасти обусловленный введением кредитных карт, мотивировал кредиторов внедрять автоматизированные системы принятия решения о выдаче кредитов. Параллельное развитие вычислительной техники, способствовало этому и давало возможность обрабатывать большие массивы финансовых данных.

В 1956 году была создана компания FICO, занимавшаяся разработками в области потребительских кредитов. В 60-х годах началось внедрение компьютерных технологий в область скоринга. В 1963 году было предложено использование дискриминантного анализа данных для кредитного скоринга. И, наконец, в 1975 с принятием "US Equal Credit Opportunity Act I", скоринг был окончательно признан.

Важным шагом в развитии кредитного скоринга было появление скоринга поведения (behavior scoring) в начале 90-х. Его целью является предсказание выплат уже имеющихся клиентов.

В недавнее время развитие скоринговых систем было обусловлено регулированием со стороны внешней среды. Как часть требований к достаточности капитала, предъявляемых банкам в связи с вступлением в силу второго Базельского соглашения (Basel Committee for Banking Supervision 2001), учреждения должны внимательно следить за рисками, связанными с их кредитными портфелями. Методы кредитного скоринга позволяют это делать.

С момента введения первой скоринговой системы, использовалось множество математических и статистических методов. Среди статистических можно назвать: дискриминантный анализ, линейную регрессию, логистическую регрессию и дерево принятия решений. Другие методы пришли из математики: математическое программирование, нейронные сети, генетические алгоритмы и экспертные системы. Далее мы разберём наиболее распространённые методы и поговорим об их достоинствах и недостатках.

1.2 Линейный дискриминантный анализ и линейная регрессия

Линейный дискриминантный анализ - метод для классификации объектов на заранее определённые категории. Идея в том, чтобы найти такую линейную комбинацию объясняющих переменных, которая наилучшим образом разделила бы объекты на категории. Под разделением наилучшим образом имеется ввиду такое, при котором обеспечивается максимальная дистанция между средними данных категорий. Скоринговый балл рассчитывается как линейная функция от значений атрибутов клиента:

Здесь, - значения атрибутов клиента, - параметры модели, которые максимизируют отношение

где - вектор средних для хороших и плохих клиентов, - общая ковариационная матрица.

Линейный дискриминантный метод предполагает выполнение двух условий. Во-первых, ковариационные матрицы независимых переменных для обеих групп должны совпадать. Во-вторых, независимые переменные должны быть распределены нормально. Часто, в скоринге, независимые переменные дискретные или распределены не нормально. Отсюда, возникают проблемы в применении этого метода. Однако было показано, что даже в случае нарушения нормальности, данный метод широко применим. Его преимуществом можно назвать простоту применения.

Схожий метод линейной регрессии, также используется для формирования скоринговой модели. В случае двух категорий, он эквивалентен методу линейного дискриминантного анализа и выражает зависимость одной переменный (зависимой) от других (независимых). В общем виде представляется так:

Зависимая переменная;

Объясняющие независимые переменные;

Неизвестные коэффициента регрессии, которые находятся методом наименьших квадратов;

Для применения модели линейного скоринга требуется выполнение следующего предположения: связь между зависимой и независимыми переменными должна быть линейной. В противном случае, точность оценки значительно ухудшается. Ошибки же должны быть независимы и распределены нормально.

Как и в случае дискриминантного анализа, в условиях кредитного скоринга, предположения, требуемые для применения линейной регрессии, нередко нарушаются. Линейная регрессия может дать оценку вероятности вне диапазона , что является неприемлемым. К примеру, логистическая регрессия лишена этого недостатка.

1.3 Логистическая регрессия и пробит-регрессия

Данные виды регрессии больше подходят для построения скоринговой модели, так как допускают категорийное представление данных. Модель логистической регрессии задаётся следующим образом:

где - оценка вероятности того, что клиент “плохой”, - вектор неизвестных параметров регрессии, который вычисляется через условие максимизации отношения правдоподобия.

Модель логистической регрессии базируется на функции логарифм. В свою очередь, пробит-регрессия базируется на нормальном распределении и задаётся следующим образом:

где. Вектор находится также как и в модели логистической регрессии.

Так как логистическая регрессия и пробит-регрессия используют схожие по форме распределения, результаты применения данных моделей также схожи. Логистическая регрессия пользуется большим предпочтением, так как вычисления проще, чем в пробит-регрессии и имеется больше инструментов для работы с ней. За счёт своей бинарной природы, логистическая регрессия предпочтительней линейной регрессии в использовании для построения скоринговых моделей. На практике же было выяснено, что разница в точности предсказываемых результатов незначительна. Тем не менее, наблюдается преобладание логистической регрессии в скоринговых системах.

1.4 Нейронные сети

Искусственные нейронные сети являются симуляцией нейронных сетей имеющихся в природе. Возникло это понятие при попытке смоделировать процессы, происходящие в мозге человека.

Нейронные сети, также называемые многослойным перцептроном, особенно подходят для решения задачи классификации. Они широко используются в различных сферах: финансах, компьютерных науках, физике и медицине. Популярность нейронных сетей отчасти обуславливается возможностью моделировать сложные ситуации без особых затрат со стороны использующего этот метод. По своей природе нейронные сети автоматически обнаруживают любую нелинейную ситуацию в данных и подстраиваются под неё. Также многослойные нейронные сети являются универсальными аппроксиматорами, то есть могут аппроксимировать любую функцию сколь угодно точно.

Нейронные сети состоят из слоев которые, в свою очередь, состоят из узлов. Есть 3 типа слоёв в сетях: входной, скрытые, выходной. Входной слой образуют атрибуты клиента, такие как пол, возраст и т.п.

Выход для k-го узла с m входами представляется так:

где - активационная функция, - вектор входных данных, - весовой вектор который обозначает силу связи между узлами.

Основным недостатком является то, что не смотря на возможность добиться высокой точности прогноза, понять причины, по которым было принято то или иное решение, невозможно.

В контексте кредитного скоринга было показано, что нейронные сети работают не хуже традиционных методов.

1.5 CHAID анализ

Данный метод отлично подходит для нахождения связей между данными, особенно если связи нелинейные. Он применяется для построения деревьев принятия решений, и имеет много общего с классическими методами, такими как дискриминантный анализ и линейная регрессия.

Аббревиатура CHAID расшифровывается как Chi-squared Automated Interaction Detector.

Гибкость данного метода делает его привлекательным для использования, но это не означает, что его стоит использовать вместо традиционных методов. В случае, когда встречаются строгие теоретические предположения о распределении, традиционные методы предпочтительней. Как техника исследования или в случае, когда традиционные методы не срабатывают, CHAID анализ является непревзойдённым инструментом.

CHAID строит не бинарные деревья (т.е. деревья у которых может быть более двух ветвей) на основе относительно простого алгоритма, который особенно хорошо подходит для анализа больших массивов данных. Алгоритм основывается на применении теста хи-квадрат.

1.6 Другие методы

Дерево принятия решений.

Метод разделяет данные на подмножества, каждое из которых более однородно в своем поведении, нежели исходное множество данных. Каждое из этих подмножеств делится далее, по такому же алгоритму. Результат деления именуется «листом» это дерева. Имеются и другие методы, работающие по схожему принципу.

Достоинства этого метода - простота и интуитивность. Метод способен работать с отсутствующими наблюдениями. Особенно он применим в случае, когда о данных до их исследования практически ничего неизвестно и нельзя построить какие-либо догадки или гипотезы.

Главный недостаток этого метода - сложность компьютерных расчетов. Вследствие громоздкости получаемых деревьев, процесс изучения модели трудоёмкий. Изменения в ситуации может привести к пересмотру всего дерева решений.

В основном метод используется как вспомогательный. К примеру для определения переменных, которые наиболее сильно объясняют поведение зависимой переменной.

Метод k ближайших соседей. Непараметрический метод классификации объектов. Основывается на метрике, определяющей схожесть между данными.

Первоначально вводятся тренировочные данные, разделенные на классы. Затем вводятся оцениваемые данные и определяется схожесть между введёнными и тренировочными данными. На основе метрики выбирается k ближайших соседей. Новый элемент относят к тому классу, к которому принадлежит большинство его соседей.

Количество соседей k определяется компромиссом между компенсацией и дисперсией. Чем меньше класс, тем меньше выбирается k. При этом необязательно, что при больших k результат будет лучше.

Одно из преимуществ данного метода - легко добавить новые данные, не изменяя при этом модель. Непараметрическая сущность этого метода позволяет работать с иррациональностями в функциях риска на пространстве признаков.

Отсутствие формального метода для выбора k и невозможность вероятностной интерпретации результата, так как результатом являются ожидаемые частоты, являются главными недостатками метода. Данные сложности могут быть решены использованием методом Байесовской аппроксимации.

Данный метод мало используется в скоринге. Одной из причин этого является то, что для классификации одного объекта необходимо иметь базу по всем объектам.

Более новый метод опорных векторов , построенный на машинном обучении, показал себя не хуже традиционных скоринговых методов. Он состоит из двух процессов: первый преобразует входные данные к данным высокой размерности в пространстве признаков; второй классифицирует данные с помощью линейного классификатора. Классификатором может выступать, например, линейный дискриминантный анализ.

1.7 Сравнение различных методов

Был проведён ряд сравнительных исследований для скоринговых методов. Критериями для ранжирования служили процент ошибок при классификации и ROC-кривая. Исследовались 8 наборов данных.

Средняя оценка

Нейронные сети

Опорных векторов

Логистическая регрессия

Линейный дискриминантный анализ

Линейные LS-SVM

Расширенное дерево Байеса

Наивный байесовский классификатор

Радиально базисные функции

k-ближайших соседей (k=100)

Линейный SVM

Квадратичный дискриминантный анализ

Дерево принятия решений

Линейное программирование

Дерево принятия решений

Дерево принятия решений

k-ближайших соседей (k=10)

Дерево принятия решений

Из таблицы видно, что нейронные сети и метод опорных векторов явились наилучшими на исследуемых 8 наборах данных. Кроме того традиционные методы, такие как линейный и дискриминантный анализ показали себя конкурентоспособными. Отсюда следует, что, вероятно, большинство данных для кредитного скоринга лишь немного нелинейны. Вследствие чего линейные методы показали себя на уровне с нелинейными.

Не существует оптимальной скоринговой модели для любой ситуации. Выбор модели зависит от данных и цели, на которую направленно создание модели. Кроме того, метод, оценивающий наилучшим образом, не обязательно будет лучшим в данной ситуации.

Глава 2. Эмпирический Байесовский подход

В данной главе разберём эмпирический Байесовский подход и с помощью него построим скоринговую модель. Построение будем вести исходя из статистики по потребительским кредитам банка “Сбербанк России”.

2.1 Постановка задачи

Предположим, имеется некий банк, занимающийся кредитованием частных лиц. В банк за получением кредита обращаются клиенты. Решение о выдаче кредита банк выносит на основе информации о клиенте.

Информацию о клиенте банк получает из разных источников: от самого клиента, от кредитного бюро и из других источников. Мы будем рассматривать информацию, предоставляемую самим клиентом. Банк получает её через заполненную заемщиком анкету.

В анкете заемщик указывает следующие данные: пол, возраст, семейное положение, наличие детей, ежемесячный доход, наличие недвижимости и прочее.

На основании этих данных разобьём клиентов на группы, в которых они схожи по определённым признакам. Для каждого клиента Байесовским методом найдём рейтинг - эмпирическая вероятность того, что клиент вернёт кредит при условии, что он принадлежит данной группе.

Для применения метода необходимо, чтобы данные удовлетворяли следующим условиям:

· независимость - клиенты не имеют сговора по выплате кредита;

· однородность - данные взяты из одной генеральной совокупности;

· равновероятность - клиенты равновероятно распределяются по группам.

Их выполнение проверяется ниже.

2.2 Построение скоринговой модели

Введем вероятностное пространство. Обозначим в этом пространстве - клиент банка.

Каждый клиент банка имеет набор характеристик согласно заполненной анкете. Например: в браке или нет, уровень дохода, разбитый по категориям, наличие машины и прочие характеристики. Согласно этим характеристикам введём разбиение пространства на множества

Таким образом, множество клиентов разбито на группы.

Введём случайные величины.

Количество клиентов в j-й группе.

Исходя из данных, мы можем построить совместное эмпирическое распределение вероятностей.

где - априорная эмпирическая вероятность события A,

Эмпирическая вероятность события B при условии А,

Эмпирическая вероятность события A при условии B, которую называют апостериорной вероятностью,

Эмпирическая вероятность события B.

Данная формула позволяет переоценить вероятность события A, учитывая тот факт, что произошло событие B.

Из определения условной вероятности можем записать:

Выразив из (1) и подставив в эту формулу выражение для, получим:

2.3 Применение модели к данным

В нашем распоряжении имеются данные о 1977 клиентах банка “Сбербанк России” включаю информацию о том, вернули они кредит или нет.

Для применения Байесовского подхода необходимо убедиться в выполнении 3-х гипотез:

· о независимости - клиенты не имеют сговора по выплате или не выплате кредита;

· об однородности - данные взяты из одной генеральной совокупности;

· о виде распределения - данные распределены равновероятно.

Гипотеза о независимости

Для проверки этой гипотезы воспользуемся ранговым критерием Спирмена. Статистикой данного критерия является коэффициент ранговой корреляции, определяемый следующим образом.

Даны два ряда наблюдений: и. На основании этих наблюдений построим пары рангов. Под рангом понимаем номер места, занимаемого наблюдением в вариационном ряду. Аналогично понимаем ранг. Затем, переставляем пары рангов в порядке возрастания первой компоненты. Получившийся ряд обозначим.

Коэффициент корреляции находится по формуле:

Критическая область критерия. Для нахождения воспользуемся тем, что закон распределения стремится к, при больших n. Отсюда. Здесь - функция распределения стандартного Гауссова закона.

При уровне значимости, =1.959964. Граница критической зоны. Найденный коэффициент корреляции.

Таким образом, статистика критерия не попадает в его критическую область, и мы можем принять гипотезу о независимости при уровне значимости 0.05.

Гипотеза об однородности

Формулируется гипотеза следующим образом. Даны две выборки и из распределений и соответственно, с функциями распределений и. Тогда гипотеза об однородности.

Для проверки данной гипотезы воспользуемся критерием Смирнова.

Статистикой данного критерия является, где - эмпирические функции распределения, построенные по выборкам и. Критическая область задаётся в виде. При больших n и m границу критической области можно принять равной, где. - функция распределения Колмогорова.

Таким образом, гипотеза об однородности отвергается, в случае если. При уровне значимости 0.05 . - граница критической области. Статистика.

Статистика критерия не попадает в критическую область, и мы можем принять гипотезу об однородности при уровне значимости 0.05.

Гипотеза о виде распределения

Сформулируем гипотезу. Нам дана выборка из распределения с функцией распределения, которая неизвестна. Необходимо проверить, что - функция распределения равномерного распределения на отрезке .

Для этого воспользуемся критерием согласия Пирсона.

Статистикой критерия является. Здесь - частота попадания наблюдений в i-й отрезок, - вероятность попадания в i-й отрезок. Если проверяемая гипотеза верна, при больших n статистика подчиняется распределению хи-квадрат с k-1 степенью свободы.

Гипотеза отвергается в случае, если статистика превышает критическое значение.

Значение статистики посчитаем с помощью программного пакета Statistica - =24,19468, k-1=39. Граница критической области при уровне значимости.

Таким образом значение статистики не превышает критического уровня и гипотеза о равномерном распределении клиентов по группам принимается при уровне значимости 0.05.

Итак, данные удовлетворяют всем гипотезам, приведённым выше, и мы можем приступить к нахождению рейтингов.

Имеющиеся данные содержат множество различных характеристик клиентов. Для построения будем использовать 4 из них, наиболее значимых. Взять большее количество элементов нам не позволяет ограниченность нашей выборки (1977 элементов).

Выбранные характеристики: возраст и пол заёмщика, наличие детей, выплаты по кредиту в % от суммарного дохода заёмщика. Характеристика возраст принимает 3 значения - 18-29, 30-45, 46-…; пол заёмщика два значения - мужской и женский; наличие детей два значения - есть дети, и нет детей; выплаты принимают 5 значений - (<5%),(6-10%), (11-16%), (17-22%),(23-55%).

Каждое конкретное значение характеристики назовём свойством заёмщика. Разобьём всех наших клиентов на множества, опираясь на наличие конкретного свойства у данного клиента. К примеру, - множество клиентов у которых нет детей.

Приведём эти обозначения:

Дети, = Нет детей, = Есть дети;

Возраст, =Возр1(18-29), =Возр2(30-45), =Возр3(46-…);

Пол, =Женский, =Мужской;

Выплаты по кредиту в % от суммарного дохода заемщика, =Вып1(<5), =Вып2(6-10), =Вып3(11-16), =Вып4(17-22), =Вып5(23-55).

Образуем новые множества, как комбинацию всех возможных свойств клиента - по всевозможным К примеру, множество состоит из женщин в возрасте 18-29 лет без детей, выплачивающих <5% от своего суммарного дохода. Количество таких множеств равно 60.

Таблица 2.1. Кодировка множеств.

Нет детей

Есть дети

Заметим, что - образуют разбиение всего множества клиентов:

Построим совместное эмпирическое распределение двух дискретных случайных величин - и, где ={0,1}, ={, i=1:60}. Строить его будем как отношение количества клиентов удовлетворяющих паре значений случайных величин (X,Y) к общему количеству клиентов.

Зафиксируем количество клиентов соответствующих каждой возможной паре (X,Y).

Таблица 2.2. Количество клиентов вернувших и не вернувших кредит в каждой группе. 0 - вернули кредит, 1 - не вернули кредит.

Построим совместное эмпирическое распределение вероятностей. Для этого разделим количество клиентов вернувших и не вернувших кредит в каждой из групп на общее количество клиентов.

Таблица 2.3. Совместное эмпирическое распределение вероятностей.

Рисунок 2.1. Эмпирическая функция распределения при X=0.

Рисунок 2.2. Эмпирическая функция распределения при X =1.

Рисунок 2.3. Гистограмма совместного распределения при X=0.

Рисунок 2.4. Гистограмма совместного распределения при X=1.

Найдём эмпирическое распределение вероятностей попадания в каждую из групп. Для этого разделим количество клиентов в каждой группе на общее количество клиентов. Общее количество клиентов.

Таблица 2.4. Эмпирическое распределение вероятностей попадания в каждую группу.

Рисунок 2.5. Гистограмма попадания в группу i.

Исходя из этого, получаем классификацию:

· Клиенты из группы 60 рисковые

· Клиенты из групп 1-5, 7-12, 15, 17, 25, 31, 32, 33, 35-37, 39, 40, 42, 54-56, 58 - среднерисковые

· Клиенты из групп 6, 13, 14, 16, 18-24, 26-30, 34, 38, 41, 43-53, 57, 59 - надежные

Глава 3. Подход, основанный на задаче Монжа-Канторовича

3.1 Задача Монжа-Канторовича

Задача Монжа.

Даны два вероятностных пространства и и неотрицательная измеримая функция на, ...

Подобные документы

    Дискриминантный анализ как раздел многомерного статистического анализа. Дискриминантный анализ при нормальном законе распределения показателей. Применение дискриминантного анализа при наличии двух обучающих выборок. Решение задачи в системе statistika.

    курсовая работа , добавлен 21.01.2011

    Модели дискриминантного анализа. Эффективность классических западных и российских моделей предсказания банкротства. Отраслевая специфика. Описание статей, включающее характеристики выборки, метод, список факторов и прогнозную силу метода анализа.

    реферат , добавлен 24.07.2016

    Основы линейного регрессионного анализа. Особенности использования функции Кобба-Дугласа. Применение множественной линейной регрессии. Сущность метода наименьших квадратов. Пути избегания ложной корреляции. Проверка значимости коэффициентов регрессии.

    реферат , добавлен 31.10.2009

    Экономическая классификация стран, характеристика основных показателей экономического развития. Статистические методы анализа, описание дискриминантного, кластерного, факторного и графического анализа. Параметры исследование экономической безопасности.

    дипломная работа , добавлен 14.10.2013

    История появления функционально-стоимостного анализа, его методика, принципы, задачи и этапы проведения. Использование системного анализа и поэлементной отработки конструкции каждой детали Ю.М. Соболевым. Применение функционально-стоимостного анализа.

    контрольная работа , добавлен 08.04.2012

    Теоретические и методологические основы экономического анализа, его предмет, объект, задачи. Характеристика принципов экономического анализа, подходы и особенности их использования на практике. Определение тенденций развития предприятия на основе анализа.

    курсовая работа , добавлен 20.12.2010

    Сущность и применение метода наименьших квадратов для однофакторной линейной регрессии. Нахождение коэффициента эластичности для указанной модели в заданной точке X и его экономический анализ. Прогноз убыточности на основании линейной регрессии.

    контрольная работа , добавлен 15.06.2009

    Сущность модели Ольсона как одной из наиболее перспективных современных разработок в теории оценки стоимости компании. ЕВО в практической оценке, особенности ее работы в России. Особенности линейной информационной динамики Ольсона и Фельтхама-Ольсона.

    контрольная работа , добавлен 07.04.2011

    Понятие экономической информации, ее сущность и особенности, классификация и разновидности, характеристика и отличительные черты. Сущность, предмет и объекты экономического анализа, цели и задачи. Взаимосвязь анализа с другими науками, его организация.

    шпаргалка , добавлен 05.04.2009

    Методы разработки экономико-математической модели: постановка задачи, система переменных и ограничений. Виды решения экономико-математической модели оптимизации производственной структуры сельскохозяйственного предприятия, анализ двойственных оценок.

Повышение доходности кредитных операций непосредственно связано с качеством оценки кредитного риска. В зависимости от классификации клиента по группам риска банк принимает решение, стоит ли выдавать кредит или нет, какой лимит кредитования и проценты следует устанавливать.

В мировой практике существует два основных метода оценки риска кредитования, которые могут применяться как отдельно, так и в сочетании с друг другом:

  • субъективое заключение экспертов или кредитных инспекторов;
  • автоматизированные системы скоринга.

Данная статья посвящена западной практике использования скоринг-систем, которые в настоящее время широко применяются во всех экономически развитых странах. Хотя скоринг является одним из наиболее успешных примеров использования математических и статистических методов в бизнесе, в российской печати эта тема незаслуженно обойдена вниманием. Цель данной публикации -- восполнить этот пробел и дать общий обзор истории и практики применения скоринга. Так как статья рассчитана на достаточно широкий круг читателей, в ней дается только самое общее описание того, как работает скоринг. Теоретические основы и обоснования правомерности использования того или иного метода здесь не затрагиваются.

Поскольку скоринг используется главным образом при кредитовании физических лиц, особенно в потребительском кредите при необеспеченных ссудах, далее речь пойдет об оценке кредитного риска заемщиков -- физических лиц.

Определение кредитоспособности и информация, используемая для ее прогнозирования

Для оценки кредитного риска производится анализ кредитоспособности заемщика, под которой в российской банковской практике понимается способность юридического или физического лица полностью и в срок рассчитаться по своим долговым обязательствам. В западной банковской практике кредитоспособность трактуется как желание , соединенное с возможностью своевременно погасить выданное обязательство. Далее мы будем использовать термин «кредитоспособность» именно в этом значении. В соответствии с таким определением основная задача скоринга заключается не только в том, чтобы выяснить, в состоянии клиент выплатить кредит или нет, но и степень надежности и обязательности клиента. Иными словами, скоринг оценивает, насколько клиент creditworthy, т. е. насколько он «достоин» кредита.

Скоринг представляет собой математическую или статистическую модель, с помощью которой на основе кредитной истории «прошлых» клиентов банк пытается определить, насколько велика вероятность, что конкретный потенциальный заемщик вернет кредит в срок.

В западной банковской системе, когда человек обращается за кредитом, банк может располагать следующей информацией для анализа:

анкета, которую заполняет заемщик;

информация на данного заемщика из кредитного бюро -- организации, в которой хранится кредитная история всего взрослого населения страны;

данные движений по счетам, если речь идет об уже действующем клиенте банка.

Кредитные аналитики оперируют следующими понятиями: «характеристики» клиентов (в математической терминологии -- переменные, факторы) и «признаки» -- значения, которые принимает переменная. Если представить себе анкету, которую заполняет клиент, то характеристиками являются вопросы анкеты (возраст, семейное положение, профессия), а признаками -- ответы на эти вопросы.

В самом упрощенном виде скоринговая модель представляет собой взвешенную сумму определенных характеристик. В результате получается интегральный показатель (score); чем он выше, тем выше надежность клиента, и банк может упорядочить своих клиентов по степени возрастания кредитоспособности.

Интегральный показатель каждого клиента сравнивается с неким числовым порогом, или линией раздела, которая, по существу, является линией безубыточности и рассчитывается из отношения, сколько в среднем нужно клиентов, которые платят в срок, для того, чтобы компенсировать убытки от одного должника. Клиентам с интегральным показателем выше этой линии выдается кредит, клиентам с интегральным показателем ниже этой линии -- нет.

Все это выглядит очень просто, однако сложность заключается в определении, какие характеристики следует включать в модель и какие весовые коэффициенты должны им соответствовать. К этой проблеме имеется несколько подходов, которые будут рассмотрены в разделе «Методы классификации клиентов».

Философия скоринга заключается не в поиске объяснений, почему этот человек не платит. Скоринг выделяет те характеристики, которые наиболее тесно связаны с ненадежностью или, наоборот, с надежностью клиента. Мы не знаем, вернет ли данный заемщик кредит, но мы знаем, что в прошлом люди этого возраста, этой же профессии, с таким же уровнем образования и с таким же числом иждивенцев кредит не возвращали. Поэтому мы давать кредит этому человеку не будем.

В этом заключается дискриминационный (не в статистическом, а в социальном значении этого слова) характер скоринга, т. е. если человек по формальным признакам близок к группе с плохой кредитной историей, то ему кредит не дадут. Поэтому даже при очень высокой степени использования автоматизированных систем скоринга осуществляется субъективное вмешательство в случае, когда кредитный инспектор располагает дополнительной информацией, доказывающей, что человек, классифицированный как ненадежный, на самом деле «хороший», и наоборот.

Какие же характеристики являются наиболее «ценными» для прогнозирования кредитного риска? В Великобритании наиболее часто используются следующие характеристики:

  • Количество детей/иждивенцев

    Профессия

    Профессия супруга(и)

    Доход супруга(и)

    Район проживания

    Стоимость жилья

    Наличие телефона

    Сколько лет живет по данному адресу

    Сколько лет работает на данной работе

    Сколько лет является клиентом данного банка

    Наличие кредитной карточки/чековой книжки

    В других странах набор характеристик, которые наиболее тесно связаны с вероятностью дефолта -- вероятностью, что заемщик не вернет кредит или задержится с выплатой, будет отличаться в силу национальных экономических и социально-культурных особенностей. Чем более однородна популяция клиентов, на которой разрабатывается модель, тем точнее прогнозирование дефолта. Поэтому очевидно, что нельзя автоматически перенести модель из одной страны в другую или из одного банка в другой. Даже внутри одного банка существуют различные модели для различных групп клиентов и различных видов кредита.

    История развития скоринга

    Скоринг, по существу, является методом классификации всей интересующей нас популяции на различные группы, когда нам неизвестна характеристика, которая разделяет эти группы (вернет клиент кредит или нет), на зато известны другие характеристики, связанные с интересующей нас. В статистике идеи классификации популяции на группы были разработаны Фишером в 1936 г. на примере растений. В 1941 г. Дэвид Дюран впервые применил данную методику к классификации кредитов на «плохие» и «хорошие». По времени это совпало со Второй мировой войной, когда почти все кредитные аналитики были призваны на фронт, и банки столкнулись с необходимостью срочной замены этих специалистов. Банки заставили своих аналитиков перед уходом написать свод правил, которыми следовало руководствоваться при принятии решения о выдаче кредита, чтобы анализ мог проводиться неспециалистами. Это и был как бы прообраз будущих экспертных систем.

    В начале 50-х гг. в Сан-Франциско образовалась первая консалтинговая фирма в области скоринга -- Fair Issac, которая до сих пор является лидером среди разработчиков скоринговых систем.

    Но широкое применение скоринга началось с распространением кредитных карточек. При том количестве людей, которые ежедневно обращались за кредитными карточками, банкам ничего другого не оставалось, как автоматизировать процесс принятия решений по выдаче кредита. Однако очень скоро они оценили не только быстроту обработки заявлений на выдачу кредита, но и качество оценки риска. По данным некоторых исследований, после внедрения скоринг-систем уровень безнадежного долга сокращался до 50% (Churchill G. A. , Nevin J. R. , Watson R. R. //The role of credit scoring in the loan decision. Credit World. March/1977; Myers J. H. , Forgy E. W. The development of numerical credit evaluation systems//Journal of American Statistical Association. September/1963).

    В 1974 г. в США был принят Закон о предоставлении равных возможностей на получение кредита, который запрещал отказывать в выдаче кредита на основании следующих характеристик: раса, цвет кожи, национальное происхождение, возраст, пол, семейное положение, религия, получение социальных пособий, отстаивание прав потребителей. В Великобритании законодательство допускает использование информации о возрасте и семейном положении, но зато запрещает принимать во внимание какие-либо физические увечья и недостатки (инвалидность). Для кредитных организаций использование скоринговых систем стало доказательством исполнения этих антидискриминационных законов -- у компьютера нет предубеждений.

    Помимо установления принципов равноправия в области кредитования, кредитное законодательство США, как и Закон о потребительском кредите, принятый в Великобритании в том же 1974 г., имели важное значение для формирования службы кредитных бюро. В таких бюро записывается кредитная история всех людей, когда-либо обращавшихся за ссудой в любую кредитную организацию страны.

    В кредитных бюро содержатся следующие виды данных:

    социально-демографические характеристики;

    судебные решения (в случае передачи дел о востребовании задолженности по кредиту в суд);

    информация о банкротствах;

    данные об индивидуальных заемщиках, получаемые от кредитных организаций по принципу «ты -- мне, я -- тебе», т. е. банк может получать информацию о клиентах других банков, только если сам поставляет аналогичную информацию.

    Объем и характер информации, хранящейся в бюро, строго регулируется законодательством каждой страны. В «Банковских технологиях» уже была публикация о кредитных бюро в сентябре 1999 г. -- «Вопросы учреждения кредитного бюро в России». Хотелось бы добавить, что помимо рассмотренных в статье моделей бюро существуют и транснациональные коммерческие компании, такие как Experian, Equifax, TransUnion, Scorex. Эти компании сами используют скоринговые системы, и во многих случаях продают клиентам не «сырую» информацию, а уже готовый интегральный показатель, который вводится в автоматизированную систему кредитной организации.

    Значение кредитных бюро чрезвычайно велико, их существование позволяет кредитным организациям выдавать ссуды клиентам, которые ранее в этой организации не обслуживались. Кроме того, общепризнанной является ценность предыдущей кредитной истории для прогнозирования вероятности дефолта.

    В настоящее время скоринг становится все более популярным не только при оценке риска при различных видах кредита, но и в других областях: в маркетинге (для определения вероятности, что именно эта группа клиентов будет пользоваться этим видом продукции), при работе с должниками (если клиент задерживается с очередным платежом, какой метод воздействия будет наиболее эффективным), при выявлении мошенничества с кредитными карточками, при определении вероятности, что клиент может перебежать к конкуренту и т. п.

    Методы классификации клиентов

    Итак, в нашем распоряжении имеется большой объем разнообразной информации о клиентах. В этом океане сведений даже кредитному инспектору со значительным опытом работы иногда сложно сориентироваться при ответе, скажем, на вопрос -- какой клиент представляет больший риск: разведенный бездетный мужчина-предприниматель или замужняя женщина-адвокат с тремя детьми, при том что уровень дохода у них одинаков? Чтобы иметь возможность сравнивать клиентов с совершенно разными признаками и принимать решения о кредитовании не интуитивно, а на основе формализованных критериев, непосредственно связанных с вероятностью дефолта, необходимо построить математическую модель, которая позволит оценить, какая информация является существенной, а какой можно пренебречь.

    В целях построения модели сначала производится выборка клиентов кредитной организации, о которых уже известно, хорошими заемщиками они себя зарекомендовали или нет, иногда такая выборка называется «обучающей». Она может варьироваться от нескольких тысяч до сотни тысяч, что не является проблемой на Западе, где кредитный портфель компаний может состоять из десятков миллионов клиентов. Выборка подразделяется на две группы: «хорошие» и «плохие» риски. Это оправдано в том смысле, что банк при принятии решения о кредитовании на первом этапе выбирает из двух вариантов: давать кредит или не давать. При всей «детскости» определений «хороший»/«плохой», это именно те термины, которые используются кредитными аналитиками.

    Определение «плохого» риска может быть разным в зависимости от политики банка, в Западной Европе «плохим» риском обычно считается клиент, задерживающийся с очередной выплатой на три месяца. Иногда к «плохим» рискам относятся клиенты, которые слишком рано возвращают кредит, и банк не успевает ничего на них заработать.

    Таким образом, скоринг представляет собой классификационную задачу, где исходя из имеющейся информации необходимо получить функцию, наиболее точно разделяющее выборку клиентов на «плохих» и «хороших».

    Но предварительно необходимо преобразовать имеющуюся информацию в форму, поддающуюся анализу. Существует два основных подхода, которые пригодны для работы как с количественными, так и с качественными характеристиками:

    1. Преобразовать каждый признак в отдельную двоичную переменную. Этот подход неудобен в том плане, что приводит к большому количеству переменных, хотя он не навязывает никаких дополнительных отношений между зависимой и независимыми переменными.

      Преобразовать каждую характеристику в переменную, которая будет принимать значения, соответствующие отношению числа «плохих» клиентов с данным признаком к числу «хороших» клиентов с этим же признаком. Более усложненный вариант -- взять логарифм этого отношения. Таким образом, каждый признак получает числовую величину, соответствующую уровню его «рискованности».

    Методы собственно классификации весьма разнообразны и включают в себя:

  • статистические методы, основанные на дискриминантном анализе (линейная регрессия, логистическая регрессия);

    различные варианты линейного программирования;

    дерево классификации или рекурсионно-партиционный алгоритм (РПА);

    нейронные сети;

    генетический алгоритм;

    метод ближайших соседей.

    Традиционными и наиболее распространенными являются регрессионные методы, прежде всего линейная многофакторная регрессия :

    р = w o + w 1 x 1 + w 2 x 2 + … + w n x n ,

    где р -- вероятность дефолта, w -- весовые коэффициенты, x -- характеристики клиента.

    Недостаток данной модели заключается в том, что в левой части уравнения находится вероятность, которая принимает значения от 0 до 1, а переменные в правой части могут принимать любые значения от - Ґ до + Ґ .

    Логистическая регрессия позволяет преодолеть этот недостаток:

    log (p/(1-p)) = w o + w 1 x 1 + w 2 x 2 + … + w n x n .

    Для применения логистической регрессии необходимы гораздо более сложные расчеты для получения весовых коэффициентов и, следовательно, более мощная компьютерная база и усовершенствованное компьютерное обеспечение. Но при современном уровне развития компьютерной техники это не является проблемой, и в настоящее время логистическая регрессия является лидером скоринговых систем.

    Преимущество логистической регрессии еще и в том, что она может подразделять клиентов как на две группы (0 -- плохой, 1 -- хороший), так и на несколько групп (1, 2, 3, 4 группы риска).

    Все регрессионные методы чувствительны к корреляции между характеристиками, поэтому в модели не должно быть сильно коррелированных независимых переменных.

    Линейное программирование также приводит к линейной скоринговой модели. Провести абсолютно точную классификацию на плохих и хороших клиентов невозможно, но желательно свести ошибку к минимуму. Задачу можно сформулировать как поиск весовых коэффициентов, для которых ошибка и будет минимальной.

    Дерево классификации и нейронные сети представляют собой системы, которые разделяют клиентов на группы, внутри которых уровень риска одинаков и максимально отличается от уровня риска других групп. Нейронные сети используются главным образом при определении кредитоспособности юридических лиц, где анализируются выборки меньшего размера, чем в потребительском кредите. Но наиболее успешной областью их применения стало выявление мошенничества с кредитными карточками благодаря их способности выявлять нестандартные ситуации (см.: Нортон М. Нервный бизнес//Банковские технологии. 1995. № 3. С. 73).

    Генетический алгоритм основан на аналогии с биологическим процессом естественного отбора. В сфере кредитования это выглядит следующим образом: имеется набор классификационных моделей, которые подвергаются «мутации», «скрещиваются», и в результате отбирается «сильнейший», т. е. модель, дающая наиболее точную классификацию.

    При использовании метода ближайших соседей выбирается единица измерения для определения расстояния между клиентами. Все клиенты в выборке получают определенное пространственное положение. Каждый новый клиент классифицируется исходя из того, каких клиентов -- плохих или хороших -- больше вокруг него.

    На практике используется комбинация нескольких методов, и компании хранят свои скоринговые модели в строжайшем секрете, поэтому сложно сказать, какой метод лучше. Можно только делать приблизительные заключения, основываясь на научных публикациях, ниже приводится сравнительная таблица точности классификации для различных методов, составленная профессором Л. Томасом (Thomas L. C. A Survey of Credit and Behavioural Scoring//University of Edinburgh. 1999).

    Сравнение следует производить только горизонтально, потому что авторы использовали разные определения «хороших» рисков и проводили исследования на различных популяциях и выборках. Таблица показывает процент правильно классифицированных клиентов. Цель всех приведенных исследований заключалась в сравнении эффективности различных методов классификации, поэтому не следует делать вывод, что данные цифры показывают эффективность скоринговых систем в целом, так как уже говорилось, что коммерческие системы используют несколько методов.

    Таблица

    Источники:

    Henley W. E. Statistical aspects of credit scoring. Ph.D. thesis. Open University. 1995.
    Boyle M. , Crook J. N. , Hamilton R. , Thomas L. C. Methods for credit scoring applied to slow payers in Credit Scoring and Credit Control//Oxford University Press. 1992.
    Srinivasan V. , Kim Y. H. Credit granting: a comparative analysis of classification procedures//Journal of Finance. 1987. № 42.
    Yobas M. B. , Crook J. N. , Ross P. Credit scoring using neural and evolutionary techniques//Working Paper 97/2, Credit research Centre, University of Edinburgh.
    Desai V. S. , Convay D. G. , Crook J. N. , Overstreet G. A. Credit scoring models in the credit union environment using neural networks and genetic algorithms//IMA J. Mathematics applied in business and industry. 8/1997.

    У каждого из методов имеются свои преимущества и недостатки, кроме того, выбор того или иного метода связан со стратегией банка и с тем, какие требования банк считает приоритетными при разработке моделей. Регрессионные методы показывают значимость каждой характеристики для определения уровня риска, и поэтому особенно важны на этапе разработки анкеты, которую заполняют клиенты. Линейное программирование может оперировать большим количеством переменных и моделировать определенные условия: например, если маркетинговая стратегия банка направлена на молодежь, можно ввести условие, чтобы интегральный показатель молодых людей был выше, чем тех, кому за 60. Нейронные сети и деревья классификации выявляют нелинейные связи между переменными, которые могут привести к ошибке в линейных моделях.

    Точность классификации проверяется либо методом «скользящего экзамена» для небольших выборок (модель строится на всей выборке за исключением одного клиента, выбранного наугад, затем проверяется на этом клиенте, и так перебираются все клиенты), либо при достаточно большой выборке она подразделяется на две части: на одной модель строится, на другой -- проверяется.

    Ограничения, связанные с применением скоринга

    В скоринге существует две основные проблемы. Первая заключается в том, что классификация выборки производится только на клиентах, которым дали кредит. Мы никогда не узнаем, как бы повели себя клиенты, которым в кредите было отказано: вполне возможно, что какая-то часть оказалась бы вполне приемлемыми заемщиками.

    Но, как правило, отказ в кредите производится на основании достаточно серьезных причин. Банки фиксируют эти причины отказа и сохраняют информацию об «отказниках». Это позволяет им восстанавливать первоначальную популяцию клиентов, обращавшихся за кредитом.

    Вторая проблема заключается в том, что люди с течением времени меняются, меняются и социально-экономические условия, влияющие на поведение людей. Поэтому скоринговые модели необходимо разрабатывать на выборке из наиболее «свежих» клиентов, периодически проверять качество работы системы и, когда качество ухудшается, разрабатывать новую модель. На Западе новая модель разрабатывается в среднем раз в полтора года, период между заменой модели может варьироваться в зависимости от того, насколько стабильной была экономика в это время. Для России, вероятно, максимальным периодом будет полгода, да и то при условии, что в этот период не произойдет никаких кардинальных потрясений типа событий августа 1998 г.

    В настоящее время ведутся исследования того, как вводить социально-экономические характеристики в модель с тем, чтобы она служила дольше.

    Перспективы развития скоринга в России

    В России использование скоринг-систем тормозится, прежде всего, низкими объемами кредитования. Но с экономическим ростом (будем оптимистами) ситуация начнет меняться.

    Само по себе небольшое по сравнению с западными кредитными организациями количество заемщиков препятствием не является, необходимо только следить за количеством характеристик по отношению к величине выборки. В статье В. Степанова, А. Заяца «Анализ состояния банка» (Банковские технологии. 1996. № 8. С. 58) авторы применили статистический подход -- кластерный анализ -- для классификации банков по группам рисков всего на 76 состояниях и при этом получили хороший результат -- более 90% совпадений с оценкой эксперта.

    Отсутствие кредитных бюро, безусловно, также не способствует развитию скоринга. Но, с другой стороны, на Западе существует проблема проверки достоверности информации, которую человек указывает о себе в анкете. В России большая часть такой информации содержится в паспорте. Банкам достаточно иметь паспортные данные и данные трудовой книжки -- вот и исходный материал для анализа.

    Еще один неблагоприятный фактор -- недостаточная распространенность таких универсальных статистических пакетов, как SAS и SPSS. Но, обращаясь опять к статье В. Степанова и А. Заяца, отметим использование пакета Stat-Media. Кроме того, существуют и другие программы, доступные по цене, которые могут делать линейную многофакторную регрессию, а для начала этого вполне достаточно.

    Вполне вероятно, что в России скоринг сначала будет применяться не для физических лиц, а для юридических просто потому, что у банков накоплено гораздо больше информации о предприятиях, при этом используются балльные системы оценки риска различной сложности и с различным уровнем автоматизации. Отличие балльной системы от скоринговой заключается в том, что в первой значимость того или иного коэффициента или финансового показателя определяется субъективно, а во второй производится привязка коэффициентов к уровню риска.

    На Западе при кредитовании юридических лиц скоринг-модели распространены не настолько широко, как в потребительском кредите. Это связано с тем, что для разработки модели очень трудно набрать достаточное количество компаний, сходных друг с другом: компании сильно отличаются по размеру, обороту, секторам экономики. Чем крупнее предприятие, тем труднее подобрать аналогичные предприятия для сравнения.

    В последние годы большие сдвиги произошли в разработке скоринг-моделей для малого бизнеса. Применение скоринга для малого и среднего бизнеса оказалось возможным именно в силу большого количества сходных между собой предприятий.

    В заключение хотелось бы отметить, что в России внедрение скоринга тормозится не столько объективными, сколько субъективными причинами, связанными с недоверчивым отношением банковских менеджеров к математическим и статистическим методам. Не так уж много требуется, чтобы начать анализировать своих клиентов -- кредитная история прошлых клиентов и статистический пакет, -- а отдача будет колоссальной. Среди преимуществ скоринговых систем западные банкиры указывают, в первую очередь, снижение уровня невозврата кредита. Далее отмечается быстрота и беспристрастность в принятии решений, возможность эффективного управления кредитным портфелем, отсутствие необходимости длительного обучения персонала.

    В России внедрение скоринга должно осуществляться постепенно. Для начала можно сделать автоматизированную систему предварительной оценки заемщиков, которая будет автоматически отсеивать заведомо «плохие» риски, а на рассмотрение кредитного комитета предлагать риски «хорошие» и «пограничные». Но даже не вводя автоматизацию, можно оценить связь отдельных характеристик клиента с вероятностью дефолта как для физических, так и для юридических лиц -- знание таких характеристик может послужить существенной поддержкой кредитным инспекторам.

    Итак, скоринг представляет собой автоматизированные системы оценки кредитного риска, которые широко используются в США и Западной Европе. В качестве исходного материала для скоринга используется разнообразная информация о прошлых клиентах, на основе которой с помощью различных статистических и нестатистических методов классификации делается прогноз о кредитоспособности будущих заемщиков. Скоринг-системы позволяют банковским работникам быстро принимать решения о кредитовании, регулировать объемы кредитования в зависимости от ситуации на рынке и определять оптимальное соотношение между доходностью кредитных операций и уровнем риска.

    При подготовке статьи были использованы материалы Центра изучения кредита при Эдинбургском университете (Великобритания).

    Скоринг - используемая банками система оценки клиентов, в основе которой заложены статистические методы. Как правило, это компьютерная программа, куда вводятся данные потенциального заёмщика. В ответ выдается результат - стоит ли предоставлять ему кредит. Название скоринг происходит от английского слова score, то есть «счет».

    Существуют четыре вида скоринга:

    application-scoring (дословный перевод с английского - «скоринг заявки, обращения») - оценка кредитоспособности заемщиков при выделении кредита. Это самый распространенный и известный клиентам вид скоринга. В его основе лежат первичный сбор анкетных данных заемщика, их обработка компьютером и вывод результата: предоставлять заем или нет;

    collection-scoring - система скоринга на стадии работы с невозвращенными займами. Определяет приоритетные действия сотрудников банка для возврата «плохих» кредитов. Фактически программа позволяет предпринять ряд шагов по работе с невозвращенными долгами, например от первичного предупреждения до передачи дела коллекторскому агентству. Считается, что в процессе такой обработки порядка 40% клиентов ссылаются на забывчивость и возвращают кредит;

    behavioral-scoring, «скоринг поведения» - оценка наиболее вероятных финансовых действий заемщика. Такая система дает возможность прогнозировать изменение платежеспособности заемщика, корректировать установленные для него лимиты. Основой анализа могут служить действия клиента за определенный период, например операции по кредитной карте;

    fraud-scoring - статистическая оценка вероятности мошеннических действий со стороны потенциального заемщика. Такой скоринг, как правило, используется совместно с другими видами исследования клиентов. При этом считается, что до 10% невозвратов по кредитам связаны в России с откровенным мошенничеством и этот показатель растет.

    Многие скоринговые системы не только обрабатывают введенные данные, но и способны к самообучению: они учитывают модель поведения уже принятых на обслуживание клиентов, чтобы корректировать свою оценку будущих заемщиков.

    На рынке программного обеспечения для банков существуют готовые решения. Самые известные западные программы - SAS Credit Scoring, EGAR Scoring, Transact SM (Experian-Scorex), K4Loans (KXEN), Clementine (SPSS). Среди российских разработчиков выделяются Basegroup Labs, «Диасофт», известна украинская компания "Бизнес Нейро-Системы". В то же время многие банки разрабатывает свои собственные системы.

    Скоринговые системы позволяют снизить издержки и минимизировать операционный риск за счет автоматизации принятия решения, сокращают время обработки заявок на предоставление кредита, дают возможность банкам проводить свою кредитную политику централизованно, обеспечивают дополнительную защиту финансовых организаций от мошенничества. В то же время скоринг имеет и ряд недостатков: часто решение системы основано на анализе данных, предоставленных исключительно самим заемщиком. Кроме того, скоринговые системы необходимо постоянно дорабатывать и поддерживать, т. к. они учитывают только прошлый опыт и реагируют на изменения социально-экономической ситуации с запозданием.