Многофакторная логистическая регрессия

Материалы » Скоринговые системы в кредитовании физических лиц » Многофакторная логистическая регрессия

Логика построения уравнения логистической регрессии аналогична построению линейной дискриминантной функции:

log(p/(1-p)) = w0 + w1x1 + w2x2 + . + wnxn,

где р - вероятность дефолта (невозврата кредита),

w - весовые коэффициенты,

х - характеристики клиента.

В результате распознавания или классификации по предъявляемому объекту - потенциальному заемщику уравнение логистической регрессии дает оценку вероятности дефолта (невозврата) кредита. Если разработчиками скоринговой системы заранее установлено определенное пороговое значение этой вероятности для разделения двух классов объектов (например, "надежный заемщик" и "проблемный заемщик"), такая конструкция будет способна в автоматическом режиме формировать вывод о допустимости или недопустимости выдачи кредита. Все регрессионные методы чувствительны к корреляции между характеристиками, поэтому в модели не должно быть сильно коррелированных независимых переменных.

Кластерный анализ <8> - это совокупность методов, позволяющих классифицировать многомерные наблюдения, объекты (заявки потенциальных заемщиков), каждый из которых описывается набором характеристик (факторов) X1, X2, ., Xm. Целью кластерного анализа является образование групп, классов сходных между собой объектов, которые принято называть кластерами. Слово "кластер" (cluster) в переводе с английского означает: сгусток, пучок, группа. Как родственные понятия в литературе используются: класс, таксон, сгущение. В скоринговых системах в качестве классов выступают в простейшем случае два: "надежные заемщики" и "проблемные заемщики". В кластерном анализе используется политетический подход, когда все группировочные признаки одновременно учитываются при отнесении субъектов наблюдения в тот или иной класс. (При комбинационных методах группировки, когда применяется монотетический подход, формирование классов идет последовательно, по признакам.) Как правило, четкие границы каждого класса не указаны, но количество их известно. При разработке скоринговых систем кластерный анализ на основе обучающей выборки позволяет построить меру (расстояние) между двумя основными классами объектов и определить "центры" каждого класса в пространстве характеристик Х1, Х2, ., Xm, то есть сформировать ключевое правило собственно для задачи скоринга: по предъявляемому объекту вычисляются расстояния до каждого из классов ("надежные заемщики" и "проблемные заемщики"), и классифицируемый объект относится к классу, расстояние до которого оказывается минимальным. Содержательным моментом является выбор вида меры (расстояния между объектами) в пространстве признаков Х1, Х2, ., Xm (они, как было показано выше, могут иметь нечисловой характер). Данный выбор должен быть осуществлен исходя из минимизации ошибок классификации объектов (заемщиков).

В методе деревьев решений сегментация (классификация) объектов осуществляется путем последовательного дробления факторного пространства Х1, Х2, ., Xm на вложенные прямоугольные области. Первый шаг - разделение по самому значимому фактору (характеристике). Последующие шаги - повторение процедуры до тех пор, пока никакой вариант последующей сегментации не даст значимого различия между соотношением объектов разных классов по сравнению с полученными ранее сегментами. Количество разветвлений, факторы, по которым в узлах дерева решений осуществляется ветвление, и пороговые значения факторов в узлах дерева решений определяются в методе автоматически.

Идея нейронных сетей возникла в результате попыток смоделировать поведение живых существ, воспринимающих действия внешней среды и обучающихся на собственном опыте. Нейронные сети дают возможность по обучающей выборке объектов (массиву данных по заемщикам с закрытыми кредитными договорами и с известным результатом погашения кредита) конструировать структуру, состоящую из нейронов и связей и предназначенную для отнесения предъявляемого объекта (потенциального заемщика) к одному из вышеназванных классов ("надежные заемщики" или "проблемные заемщики"). Применительно к скоринговым системам нейросеть рассматривается как черный ящик, содержание которого (нейроны, количество слоев нейронов, расположение нейронов по слоям, вес нейронов и т.д.) не имеет какой-либо смысловой трактовки или явного смысла.

Статьи по теме:

Алгоритм и условия успешной реализации реинжиниринга страховой компании
Алгоритма реинжиниринга: Шаг 1. Анализ сильных и слабых сторон предприятия, потенциала предприятия (в том числе кадрового состава, его квалификации и опыта), оценка потенциальных и реальных рынков по наиболее перспективным для компании н ...

Понятие и особенности ипотечного кредита
ипотечный сбербанк кредитование правовой Ипотека – это обременение имущественных прав собственности на объект недвижимости. Ипотечное кредитование – это кредитование под залог недвижимости, то есть кредитование с использованием ипотеки ...

Основные направления стратегического управления коммерческим банком
Банковскую политику можно определить как стратегию и тактику банка в области организации и осуществления его операций и оказания услуг с целью обеспечения его рентабельности, устойчивости и ликвидности. К числу основных элементов банковск ...