Многофакторная логистическая регрессия

Материалы » Скоринговые системы в кредитовании физических лиц » Многофакторная логистическая регрессия

Логика построения уравнения логистической регрессии аналогична построению линейной дискриминантной функции:

log(p/(1-p)) = w0 + w1x1 + w2x2 + . + wnxn,

где р - вероятность дефолта (невозврата кредита),

w - весовые коэффициенты,

х - характеристики клиента.

В результате распознавания или классификации по предъявляемому объекту - потенциальному заемщику уравнение логистической регрессии дает оценку вероятности дефолта (невозврата) кредита. Если разработчиками скоринговой системы заранее установлено определенное пороговое значение этой вероятности для разделения двух классов объектов (например, "надежный заемщик" и "проблемный заемщик"), такая конструкция будет способна в автоматическом режиме формировать вывод о допустимости или недопустимости выдачи кредита. Все регрессионные методы чувствительны к корреляции между характеристиками, поэтому в модели не должно быть сильно коррелированных независимых переменных.

Кластерный анализ <8> - это совокупность методов, позволяющих классифицировать многомерные наблюдения, объекты (заявки потенциальных заемщиков), каждый из которых описывается набором характеристик (факторов) X1, X2, ., Xm. Целью кластерного анализа является образование групп, классов сходных между собой объектов, которые принято называть кластерами. Слово "кластер" (cluster) в переводе с английского означает: сгусток, пучок, группа. Как родственные понятия в литературе используются: класс, таксон, сгущение. В скоринговых системах в качестве классов выступают в простейшем случае два: "надежные заемщики" и "проблемные заемщики". В кластерном анализе используется политетический подход, когда все группировочные признаки одновременно учитываются при отнесении субъектов наблюдения в тот или иной класс. (При комбинационных методах группировки, когда применяется монотетический подход, формирование классов идет последовательно, по признакам.) Как правило, четкие границы каждого класса не указаны, но количество их известно. При разработке скоринговых систем кластерный анализ на основе обучающей выборки позволяет построить меру (расстояние) между двумя основными классами объектов и определить "центры" каждого класса в пространстве характеристик Х1, Х2, ., Xm, то есть сформировать ключевое правило собственно для задачи скоринга: по предъявляемому объекту вычисляются расстояния до каждого из классов ("надежные заемщики" и "проблемные заемщики"), и классифицируемый объект относится к классу, расстояние до которого оказывается минимальным. Содержательным моментом является выбор вида меры (расстояния между объектами) в пространстве признаков Х1, Х2, ., Xm (они, как было показано выше, могут иметь нечисловой характер). Данный выбор должен быть осуществлен исходя из минимизации ошибок классификации объектов (заемщиков).

В методе деревьев решений сегментация (классификация) объектов осуществляется путем последовательного дробления факторного пространства Х1, Х2, ., Xm на вложенные прямоугольные области. Первый шаг - разделение по самому значимому фактору (характеристике). Последующие шаги - повторение процедуры до тех пор, пока никакой вариант последующей сегментации не даст значимого различия между соотношением объектов разных классов по сравнению с полученными ранее сегментами. Количество разветвлений, факторы, по которым в узлах дерева решений осуществляется ветвление, и пороговые значения факторов в узлах дерева решений определяются в методе автоматически.

Идея нейронных сетей возникла в результате попыток смоделировать поведение живых существ, воспринимающих действия внешней среды и обучающихся на собственном опыте. Нейронные сети дают возможность по обучающей выборке объектов (массиву данных по заемщикам с закрытыми кредитными договорами и с известным результатом погашения кредита) конструировать структуру, состоящую из нейронов и связей и предназначенную для отнесения предъявляемого объекта (потенциального заемщика) к одному из вышеназванных классов ("надежные заемщики" или "проблемные заемщики"). Применительно к скоринговым системам нейросеть рассматривается как черный ящик, содержание которого (нейроны, количество слоев нейронов, расположение нейронов по слоям, вес нейронов и т.д.) не имеет какой-либо смысловой трактовки или явного смысла.

Статьи по теме:

Правовые основы деятельности и краткая характеристика ГОСБ 1811
Георгиевское отделение Сберегательного банка 1811 расположено по адресу: г. Георгиевск Ставропольского края, ул. Калинина,14. ГОСБ 1811 образовано в 1935 году в виде сберегательной кассы, а затем преобразовано в сберегательный банк. В 19 ...

Учет нераспределенной прибыли
учет собственный капитал банк Собственный капитал банка - основа наращивания объемов его активных операций. Поэтому для каждого банка чрезвычайно важно находить источники его увеличения. Ими могут быть: ü нераспределенная прибыль п ...

Общая характеристика ЗАСО «ТАСК»
Закрытое акционерное страховое общество «ТАСК» создано в 1991 году по инициативе Белорусской железной дороги, являющейся основным учредителем. В число учредителей также входит ОАО «Белпромстройбанк». Доля государственной собственности в и ...