Журнал «Компьютерра» № 4 за 31 января 2006 года - Компьютерра Журнал 619 11 стр.


В компании «Франклин & Грант», специалисты которой занимаются созданием математических моделей и их программной реализацией для решения финансовых задач, утверждают, что в России вообще не существует кредитных историй достаточной длины для обучения системы. Что уж говорить о новых типах кредитных продуктов, появляющихся в стране. Например, об ипотеке, собирать данные по которой для настройки системы нужно еще лет десять.

В ХКФБ проблему решили довольно оригинально, использовав для обучения своей системы скоринга базу данных о 4,2 млн. заемщиков из стран Центральной Европы. В этом случае «веса» различных исходных параметров получились достаточно схожими с российскими, и после небольшой коррекции под национальную специфику и текущий банк система стала работоспособной.

Если имеются выборки сравнительно небольшого размера, разумно использовать иные методы анализа, такие как метод ближайших соседей или дерево классификаций. В первом случае новому заемщику, исходя из каких-либо его характеристик, система ставит в соответствие определенную точку с соответствующими координатами. В зависимости от того, каких точек по соседству с данной большинство: «плохих» или «хороших» (которым соответствуют люди, отдавшие или не отдавшие кредит), принимается решение о выдаче денег. При использовании деревьев классификаций система обучается следующим образом. На основе имеющихся данных строится дерево. При построении все известные ситуации обучающей выборки сначала попадают в верхний узел, а потом распределяются по узлам (рис. 1). Критерий разбиения — это различные значения входного фактора.

Скоринг на практике

На сегодняшний день системы скоринга строятся на базе «универсальных» аналитических комплексов (SAS, KXEN), реализуются или в виде отдельных приложений, или как модули многофункциональных банковских комплексов (Invoretail, SOWK). В частности, анализ платежеспособности заемщика применяется в последних версиях системы RS-Loans (компания R-Style Softlab), комплексном решении по автоматизации кредитного бизнеса банков. В такой реализации скоринга есть ощутимое преимущество: ведь оценка уже интегрирована в сам процесс выдачи кредита. RS-Loans, по сути, моделирует от начала до конца бизнес-процесс кредитования в виде прохождения документов по цепочке «заявка — кредитный комитет — кредитный договор» с использованием нескольких функциональных элементов: «Кредитный договор», «Клиент», «Договор обеспечения», «Объект обеспечения», «Банковская карта», «Счет», «Операции», «График погашения», «Филиал» и т. д.

В системе предусматривается разделение всех пользователей по двум основным должностям. Первая группа — кредитные инспекторы, которые занимаются сбором и оформлением документов, инициализацией операций и т. д. Вторая группа — кредитные бухгалтеры, чьи обязанности ограничиваются бухгалтерским отражением кредитной деятельности. При надобности в систему можно добавить новые должности, наделив их необходимым набором прав. Производительность кредитного отдела система повышает прежде всего за счет наличия процедур массовой обработки договоров: начисления процентов, выноса на просрочку, расчета групп риска, формирования резервов и т. д.

Задача скоринг-функционала — рассчитать максимальный размер кредита, который можно выдать клиенту, базируясь на его анкетных данных. В системе уже есть стандартный набор показателей, который банк-заказчик системы может дополнить собственными. Не секрет, что большинство банков использует собственные критерии оценки заемщика, в том числе довольно экзотичные, тщательно храня в тайне значимость тех или иных факторов для анализа. Иногда «для отвода глаз» в анкете даже присутствуют вопросы, ответы на которые никак не учитываются в ходе анализа. Расчет максимального размера кредита в RS-Loans для разных типов кредитования может рассчитываться по различным критериям. Так, при ипотеке, как правило, применяется схема, согласно которой максимальный размер кредита устанавливается исходя из платежеспособности заемщика и оценочной стоимости покупаемой недвижимости, а окончательная сумма выдаваемого кредита формируется с учетом наименьшего из полученных значений. В RS-Loans включен программный инструментарий для ввода аналогичных правил.

Скоринговые методики в системе имеют несколько вариантов применения. Пусть, например, покупатель желает приобрести в кредит какую-нибудь бытовую технику. При этом он имеет некоторые денежные средства, которые готов вложить. При обращении клиента к сотруднику банка последний вводит в БД информацию о заемщике + данные для скоринговых расчетов. Образец типовой анкеты в виде xls-файла поставляется в банк вместе с системой (см. таблицу). Этот образец служит основой для дальнейшей корректировки под требования конкретного банка — например, для исправления значений баллов за определенные клиентские характеристики или формирования новых шаблонов документов. В зависимости от ответов на вопросы система вычисляет максимальный размер кредита. Дальше бизнес-процесс и действия сотрудника зависят от опций схемы розничного кредитования, с учетом программной и аппаратной специфики банка, наличия выделенных каналов связи и полномочий сотрудника (наличия права подписи, например).

Этот процесс может работать по трем основным сценариям. Первый вариант используется, если в торговом центре («провайдере» услуг потребительского кредитования) есть выделенный канал для стабильной связи с главной БД RS-Loans. В этом случае данные анкеты автоматически загружаются в систему, быстро возвращается информация по платежеспособности клиента, максимальному размеру кредита и сопутствующая отчетность. Допускается введение в схему процедур проверки достоверности указанных заемщиком сведений. На основе полученного отчета сотрудник отказывает в кредите либо заключает договор на определенную сумму. Затем он заносит в систему информацию о своих действиях, подтверждаемых соответствующими документами. Вариант с единой БД и выделенным каналом наиболее удобен, так как в этом случае имеется возможность консолидировать и обрабатывать данные о заемщиках в одном месте или централизованно изменять методики скоринга. Допускается в этом варианте и использование Интернета для заполнения заявки непосредственно в HTML. Недостаток у такой схемы только один — доступ к базе по выделенному каналу не всегда возможен.

Если в торговом центре есть средства связи, но нет выделенного канала, передача данных идет по модему (GPRS— или обычному — неважно). Поскольку терминалы сотрудников, работающих с RS-Loans, могут действовать и через удаленное соединение, схема работы в этом случае практически аналогична предыдущей. По-прежнему будет использоваться единая база данных. Но есть другой вариант. Сотрудник банка может переслать анкетные данные напрямую или через Интернет в режиме безопасного соединения на сервер с БД RS-Loans. Серверный обработчик событий автоматически загрузит базу и сформирует необходимые отчеты и документы для обратной пересылки в торговый центр. Дополнительные сложности появляются в том случае, если прямая связь между местом продажи и главной БД RS-Loans отсутствует. Тогда приходится вести локальную БД клиентов, синхронизировать ее с центральной базой, обновлять и согласовывать «черный список» клиентов.

Первая модель

В модели Дюрана фигурируют группы факторов для определения степени кредитного риска и указаны коэффициенты для различных факторов, характеризующих кредитоспособность клиента:

1) Пол: женский (0,4 балла), мужской (0).

2) Возраст: 20 лет и меньше (0), 21 год (0,1), 22 года (0,2), 23 года и выше (0,3).

3) Срок проживания на одном месте: по 0,042 балла за каждый год, но не больше чем 0,42 в сумме.

4) Профессия: 0,55 — за профессию с низким риском, 0 — за профессию с высоким риском, 0,16 — другие профессии.

5) Финансовые показатели: наличие банковского счета (0,45), наличие недвижимости (0,35), наличие страхового полиса (0,19).

6) Работа: предприятия в общественной отрасли (0,21), другие (0).

7) Занятость: по 0,059 балла за каждый год стажа на последнем месте работы.

Сам Дюран определял сумму в 1,25 балла как порог кредитоспособности.

Примеры систем

Практически все системы розничного кредитования поддерживают интеграцию с отдельными скоринговыми приложениями. Наиболее известны на российском рынке продукты компаний BaseGroup Labs и EGAR. BaseGroup Labs предлагает заказчикам систему

Deductor:Loans, последняя версия которой, кстати, была презентована в нынешнем январе. ПО построено на базе аналитической платформы Deductor, включающей инструменты для решения задач многомерного анализа (OLAP), бизнес-аналитики (business intelligence), «раскопок данных» (data mining) и др.

В состав Deductor:Loans входит модуль LoansBase.Generator, позволяющий генерировать «образцы» кредитных историй. Этот программный инструмент формирует набор примеров с разными анкетными портретами заемщиков по статистическим алгоритмам с учетом заданных распределений случайных величин. В качестве распределений можно использовать статистические данные по региону или экспертные оценки типов заемщиков. Искусственная кредитная история, по мнению разработчиков, является оптимальным вариантом обучающей выборки в тех случаях, когда реальной кредитной истории не существует или ее объем недостаточен. А такие проблемы особенно часто проявляются при потребительском кредитовании, где постоянно появляются новые виды кредитных продуктов. Причем «новички» отличаются от прежних видов кредитных программ суммой кредита или требованиями поручительства. В такой ситуации появляются и исчезают некоторые входные данные, что делает уже построенную скоринговую модель неприемлемой.

3) Срок проживания на одном месте: по 0,042 балла за каждый год, но не больше чем 0,42 в сумме.

4) Профессия: 0,55 — за профессию с низким риском, 0 — за профессию с высоким риском, 0,16 — другие профессии.

5) Финансовые показатели: наличие банковского счета (0,45), наличие недвижимости (0,35), наличие страхового полиса (0,19).

6) Работа: предприятия в общественной отрасли (0,21), другие (0).

7) Занятость: по 0,059 балла за каждый год стажа на последнем месте работы.

Сам Дюран определял сумму в 1,25 балла как порог кредитоспособности.

Примеры систем

Практически все системы розничного кредитования поддерживают интеграцию с отдельными скоринговыми приложениями. Наиболее известны на российском рынке продукты компаний BaseGroup Labs и EGAR. BaseGroup Labs предлагает заказчикам систему

Deductor:Loans, последняя версия которой, кстати, была презентована в нынешнем январе. ПО построено на базе аналитической платформы Deductor, включающей инструменты для решения задач многомерного анализа (OLAP), бизнес-аналитики (business intelligence), «раскопок данных» (data mining) и др.

В состав Deductor:Loans входит модуль LoansBase.Generator, позволяющий генерировать «образцы» кредитных историй. Этот программный инструмент формирует набор примеров с разными анкетными портретами заемщиков по статистическим алгоритмам с учетом заданных распределений случайных величин. В качестве распределений можно использовать статистические данные по региону или экспертные оценки типов заемщиков. Искусственная кредитная история, по мнению разработчиков, является оптимальным вариантом обучающей выборки в тех случаях, когда реальной кредитной истории не существует или ее объем недостаточен. А такие проблемы особенно часто проявляются при потребительском кредитовании, где постоянно появляются новые виды кредитных продуктов. Причем «новички» отличаются от прежних видов кредитных программ суммой кредита или требованиями поручительства. В такой ситуации появляются и исчезают некоторые входные данные, что делает уже построенную скоринговую модель неприемлемой.

LoansBase.Generator формирует таблицу, содержащую входные факторы из анкеты заемщика, которые влияют на принятие решения о выдаче денег. Гипотезы о влиянии отдельных факторов выдвигаются, как правило, экспертами банка. Субъективность последних и является главным недостатком подхода с искусственной кредитной историей.

После создания истории начинается итеративное построение скоринговых моделей. На каждой итерации устраняются противоречия и корректируются правила. В Deductor:Loans отсутствуют балльные скоринговые методики. Вместо «классики» используются деревья решений и нейронные сети. Эти методы, кстати, делают возможной работу с выборкой, содержащей от пятисот до тысячи элементов. Деревья решений строят модель в виде правил, видоизменяются при внесении в выборку новых примеров, игнорируют несущественные признаки. Нейронные сети предназначены для выявления нелинейных зависимостей между входными и выходными факторами, позволяя дополнить скоринг оценкой вероятности возврата кредита. То есть, грубо говоря, на выходе системы получается не бинарное решение: «отдаст/не отдаст» — «1/0», а «0,53», например. То есть 53 шанса из 100, что кредит будет возвращен.

У компании EGAR можно отметить три продукта, автоматизирующих кредитный скоринг. Первый — EGAR Application Scoring — сочетает анализ исторических данных с применением макроэкономических показателей, что реализуется в модулях ретроспективного скоринга и макроскоринга соответственно. Алгоритмы, используемые при анализе розничных заемщиков, в большинстве своем аналогичны вышеописанным, но есть и ряд других подходов — например, байесовские сети. Банк, внедривший EGAR Application Scoring, получает возможность рассчитывать риски невозврата и досрочного погашения и управления просроченными кредитами с помощью определения лимитов и сроков погашения задолженности. Также система анализирует кредитные сделки с созаемщиками и поручителями и учитывает залоговое качество обеспечения кредита, беря в расчет временной фактор. Кстати, EGAR не только продает систему, но и сдает ее в аренду.

EGAR Behavior & Collection Scoring предназначен для оценки рисков уже выданных кредитов. ПО учитывает график погашения задолженности заемщиком и движение его средств на других счетах. В функциональность системы также включены средства оценки эффективности мер для ликвидации просроченной задолженности (скоринг взысканий).

Третья скоринговая разработка компании — EGAR Market Scoring — предназначена для оценки кредитоспособности юридических лиц. Этот вид скоринга относительно меньше востребован, и соответствующие ИТ-решения представлены на рынке в меньшей степени, нежели ПО, ориентированное на ритейл. И все же о скоринге компаний-заемщиков стоит упомянуть хотя бы на отдельном примере.

EGAR Market Scoring рассчитывает вероятность банкротства заемщика за период кредитной сделки. На основании этих расчетов кредитор может обосновать условия кредитования компании. В качестве входных параметров используются квартальные финансовые отчеты за год и дополнительная информация о бизнесе. На первой стадии оценки система вычисляет финансовые показатели и на их основе выводит базовую среднегодовую вероятность дефолта. Вторая стадия — дополнительная экспертная оценка с выводом поправочного коэффициента к базовой вероятности. Решение о выдаче кредита или предложении альтернативных условий сделки зависит от суммы предполагаемого кредита, залога, надежности обеспечения, длины сделки, кредитной маржи и общих параметров портфеля. Формула для базовой оценки получена из временных рядов котировок акций и облигаций российского рынка ценных бумаг и финансовых показателей сотни открытых компаний. Длина базы составляет два-три последних года.

Оценка может производиться по двум моделям. Первая — Credit Grades — использует идею Роберта Мертона о соответствии рыночной капитализации компании и опциона на покупку компании, цена которого соответствует вероятности неисполнения, то есть банкротства компании на установленном временном периоде. Вторая — модель Bonds Spreads — устанавливает соответствие вероятности невозврата кредита и разности в доходностях между опорными и корпоративными облигациями.

В заключение следует сказать, что автоматизация оценки рисков не заменит «налогопослушности» граждан и солидных зарплат, ежемесячно зачисляемых на счет каждому трудящемуся члену общества. И пока вы сами официально получаете сто долларов, а тратите, скажем, семьсот, нет смысла возмущаться: а почему это мне не дают кредит под пять-шесть процентов годовых, как «у них»? Для собственного спокойствия можете считать высокие проценты по кредитам своего рода подоходным налогом, часть которого достается государству. Ведь гораздо приятнее отдавать деньги, вспоминая симпатичную девушку, которую вы сами и выбрали, предварительно сравнив ее предложение с другими, а не безликому налоговому органу с двадцатизначным номером расчетного счета и кучей странных аббревиатур, вроде КПП, БИК и прочих ОКАПО. Попомните наше слово: внуки еще будут завидовать, слушая рассказы дедушки с бабушкой о временах, когда кредиты были дорогими…

КАФЕДРА ВАННАХА: «Черный ящик» Луки Пачоли

Автор: Ваннах Михаил

Один «черный ящик» знают все. Его часто ищут среди обломков аэропланов. И хоть это вовсе не ящик, а шар, и не черный, а оранжевый, он таит в себе информацию о том, что на самом деле происходило с погибшей машиной. Кое-кто может помнить и о другом «черном ящике». Абстрактном объекте, иллюстрирующем некоторые положения кибернетики, который представляет собой закрытую систему, изучаемую только по состоянию ее входов и выходов. А вот работы Луки Пачоли объединяют в себе оба понятия «черного ящика». И оба лежат в основе нашей индустриальной цивилизации, хотя жил талантливый итальянец задолго и до кибернетики, и до аэропланов.

Лука Пачоли (Pacioli) родился в 1445 году во флорентийском Городе Святого гроба на правом берегу Тибра. В детстве помогал местному торговцу Фолько де Бельфольчи; слушал рассказы дяди — армейского капитана Бенедетто. На учение попал к Пьеро делла Франческо (1416—92), прославленному художнику и математику. Из двух сторон дарования своего наставника юноша безоговорочно отдал сердце науке.

В девятнадцать лет Лука устраивается учителем в дом венецианского купца Антонио ди Ромпиази. Воспитывая трех его сыновей, учится сам, особенно охотно — у знаментиого математика Доменико Брагадино. И там же, в Венеции, путешествуя на кораблях, перевозящих товары, помогая отцу учеников вести конторские книги, он делает первые шаги к тому, что стало основой нашей цивилизации. В 1470 году Пачоли пишет первую, рассчитанную на воспитанников, книгу — учебник коммерческой математики. Тогда же он оставляет работу учителя и переселяется в Рим. По просьбе делла Франческо Луку радушно принимает великий Леон Батиста Альберти (1404—72), архитектор, ученый, писатель, музыкант. «Красота, — учил Альберти, — есть некое согласие и созвучие частей в том, частями чего они являются, — отвечающие строгому числу, ограничению и размещению, которых требует гармония, то есть абсолютное и первичное начало природы». Слова эти запали в душу Луки Пачоли.

Назад Дальше