Многофакторная логистическая регрессия

Материалы » Скоринговые системы в кредитовании физических лиц » Многофакторная логистическая регрессия

Логика построения уравнения логистической регрессии аналогична построению линейной дискриминантной функции:

log(p/(1-p)) = w0 + w1x1 + w2x2 + . + wnxn,

где р - вероятность дефолта (невозврата кредита),

w - весовые коэффициенты,

х - характеристики клиента.

В результате распознавания или классификации по предъявляемому объекту - потенциальному заемщику уравнение логистической регрессии дает оценку вероятности дефолта (невозврата) кредита. Если разработчиками скоринговой системы заранее установлено определенное пороговое значение этой вероятности для разделения двух классов объектов (например, "надежный заемщик" и "проблемный заемщик"), такая конструкция будет способна в автоматическом режиме формировать вывод о допустимости или недопустимости выдачи кредита. Все регрессионные методы чувствительны к корреляции между характеристиками, поэтому в модели не должно быть сильно коррелированных независимых переменных.

Кластерный анализ <8> - это совокупность методов, позволяющих классифицировать многомерные наблюдения, объекты (заявки потенциальных заемщиков), каждый из которых описывается набором характеристик (факторов) X1, X2, ., Xm. Целью кластерного анализа является образование групп, классов сходных между собой объектов, которые принято называть кластерами. Слово "кластер" (cluster) в переводе с английского означает: сгусток, пучок, группа. Как родственные понятия в литературе используются: класс, таксон, сгущение. В скоринговых системах в качестве классов выступают в простейшем случае два: "надежные заемщики" и "проблемные заемщики". В кластерном анализе используется политетический подход, когда все группировочные признаки одновременно учитываются при отнесении субъектов наблюдения в тот или иной класс. (При комбинационных методах группировки, когда применяется монотетический подход, формирование классов идет последовательно, по признакам.) Как правило, четкие границы каждого класса не указаны, но количество их известно. При разработке скоринговых систем кластерный анализ на основе обучающей выборки позволяет построить меру (расстояние) между двумя основными классами объектов и определить "центры" каждого класса в пространстве характеристик Х1, Х2, ., Xm, то есть сформировать ключевое правило собственно для задачи скоринга: по предъявляемому объекту вычисляются расстояния до каждого из классов ("надежные заемщики" и "проблемные заемщики"), и классифицируемый объект относится к классу, расстояние до которого оказывается минимальным. Содержательным моментом является выбор вида меры (расстояния между объектами) в пространстве признаков Х1, Х2, ., Xm (они, как было показано выше, могут иметь нечисловой характер). Данный выбор должен быть осуществлен исходя из минимизации ошибок классификации объектов (заемщиков).

В методе деревьев решений сегментация (классификация) объектов осуществляется путем последовательного дробления факторного пространства Х1, Х2, ., Xm на вложенные прямоугольные области. Первый шаг - разделение по самому значимому фактору (характеристике). Последующие шаги - повторение процедуры до тех пор, пока никакой вариант последующей сегментации не даст значимого различия между соотношением объектов разных классов по сравнению с полученными ранее сегментами. Количество разветвлений, факторы, по которым в узлах дерева решений осуществляется ветвление, и пороговые значения факторов в узлах дерева решений определяются в методе автоматически.

Идея нейронных сетей возникла в результате попыток смоделировать поведение живых существ, воспринимающих действия внешней среды и обучающихся на собственном опыте. Нейронные сети дают возможность по обучающей выборке объектов (массиву данных по заемщикам с закрытыми кредитными договорами и с известным результатом погашения кредита) конструировать структуру, состоящую из нейронов и связей и предназначенную для отнесения предъявляемого объекта (потенциального заемщика) к одному из вышеназванных классов ("надежные заемщики" или "проблемные заемщики"). Применительно к скоринговым системам нейросеть рассматривается как черный ящик, содержание которого (нейроны, количество слоев нейронов, расположение нейронов по слоям, вес нейронов и т.д.) не имеет какой-либо смысловой трактовки или явного смысла.

Статьи по теме:

Обзор и анализ информационных технологий мировых валютных рынков
Валютные рынки – рынки, где совершается купля-продажа иностранных валют на национальную по курсу, складывающемуся на основе спроса и предложения. У каждой страны есть свои деньги. Они служат средством обмена или средством платежа, единице ...

Роль ЦБ России в регулировании эффективности функционирования коммерческих банков
Инструкция ЦБР № 110-И устанавливает числовые значения и методику расчета следующих обязательных нормативов банков (далее обязательные нормативы): достаточности собственных средств (капитала) банка; ликвидности банков; максимального ра ...

Понятие и сущность добровольного страхования от несчастных случаев на производстве
Добровольное страхование от несчастных случаев заключается с физическими или юридическими лицами на случай причинения вреда жизни или здоровью самого страхователя или застрахованного лица в результате наступления несчастного случая. В дог ...