В №11 за 2003 год в журнале «Банковские технологии» была опубликована полная версия этой статьи. В ней более подробно освещена тема кредитных бюро, описано чем отличается кредитный скоринг на основе технологии data mining от систем на основе других технологий, а также состояние рынка создания систем кредитного скоринга на данный момент.

Технология data mining для кредитного скоринга

Ни для кого не секрет, что в последнее время кредитование становится все более интересной и привлекательной услугой для российских граждан. В этой статье мы расскажем Вам о том, как аналитическая технология data mining поможет банку работать на этом перспективном рынке более эффективно.

Итак, российские граждане все чаще берут кредиты на потребительские нужды – покупку бытовой техники, покупку товаров длительного пользования, берут кредиты на приобретение автомобиля и квартиры, открывают кредитные карты и т.д. Объем этого рынка постоянно растет, причем довольно быстрыми темпами. Так, например, по данным Центрального Банка России, за период с сентября 2002 по июль 2003 года, объем выданных физическим лицам кредитов вырос на 72% – со 132 до 227 млрд. рублей.


Понятно, что такой объемный и к тому же быстрорастущий рынок крайне привлекателен для российских банков. Поэтому и неудивительно, что конкуренция на нем в последнее время заметно обострилась – банки в борьбе за свою долю предлагают разнообразные продукты, снижают (или делают вид что снижают) процентные ставки, предлагают клиентам более привлекательные условия кредитования. Лидерам приходится потесниться (можно привести пример ухода пионера потребительского кредитования, банка «Русский Стандарт», из сети магазинов «Техносила», и появления на его месте чешской компании «Home Credit Finance»), на рынок в больших количествах приходят новые игроки.

Поэтому, именно в результате такой острой конкуренции сделать бизнес розничного кредитования успешным и прибыльным не так просто – и это проблема очень многих российских банков, работающих на данном рынке. Главный вопрос – кому давать кредит, а кому нет? Давать его всем, понятно, нельзя – иначе мошенники, да и просто некредитоспособные граждане, вскоре такой бизнес разрушат. Об опасности мошенников написано уже довольно много (пожалуй, один из самых известных примеров – это похищение около 100,000 долларов у «Русского Стандарта»), и банки достаточно хорошо эту проблему понимают – поэтому не будем повторяться. Если раньше риск невозврата еще покрывался величиной процентной ставки, и о нем можно было особенно не задумываться, то сейчас ситуация совершенно иная. Вводить же очень жесткие ограничения для получателей кредита – значит упустить прибыль, которая могла быть при более грамотных ограничениях.

Итак, для того, чтобы работа на рынке кредитования частных лиц оказалась успешной и приносила финансовую отдачу, необходима эффективная система оценки рисков, которая позволила бы заранее отсекать ненадежных заемщиков, и при этом не отказывать надежным; система, которая обоснованно определяла бы размер первоначального взноса в потребительском кредите или лимит по кредитной карте. Именно такая система создает тот необходимый запас прочности банка, который позволяет ему выводить на рынок более привлекательные для заемщиков продукты – например, снижать ставки (если риск невозврата ниже, то ставку тоже можно понизить), повышать лимиты и т.д. Чаще всего в качестве таких систем выступают системы кредитного скоринга, которые каждому заемщику сопоставляют определенный балл, отражающий степень его кредитоспособности. В зависимости от полученного балла принимается решение о выдаче кредита, устанавливаются лимиты и т.д.

Западные банки этими системами пользуются уже давно. Лидером в области разработки скоринговых систем является американская консалтинговая компания Fair Isaac Corporation (со своей системой FICO®), обслуживающая 7 из 10 крупнейших банков в мире, 97 из 100 крупнейших банков Америки и все 50 крупнейших эмитентов кредитных карт.

Однако, в российских банках есть определенные трудности с адекватными скоринговыми системами. Применять западные методики попросту нельзя, поскольку они основаны на анализе западных заемщиков, которые все-таки заметно отличаются от российских. Например, западные методики рекомендуют повышать рейтинг с возрастом – в российской действительности это означает, что пенсионер окажется более кредитоспособным чем, например, молодой специалист. Собственных же, российских, методик скоринга крайне мало. Одна из главных причин этого – отсутствие кредитных бюро, в которых бы накапливалась информация о заемщиках различных банков; на основе анализа этой информации такие системы и строятся. Конечно, можно ждать, пока появятся кредитные бюро, но судя по тому, сколько времени данный вопрос обсуждается без видимых результатов, случится это еще очень нескоро. По крайней мере, клиенты и конкуренты столько ждать точно не будут.

Единственный выход из этой ситуации – разработка системы скоринга «под себя», на основе тех данных о выданных кредитах, которые уже накоплены в банке – а если банк имеет хоть какой-то опыт кредитования частных лиц, то такие данные у него, несомненно, должны быть.

Любая система скоринга должна строиться на основе анализа данных о выданных кредитах. Выбор наиболее подходящей технологии анализа – ключ к построению точной и адекватной системы. Иногда банки для оценки кредитоспособности привлекают квалифицированных кредитных офицеров. У такого подхода есть несколько недостатков – во-первых, их мнение, хотя и квалифицированное, все же субъективно; во-вторых, люди просто не могут оперативно обрабатывать большие объемы информации и не справятся даже с более-менее серьезным потоком заявок; в-третьих, действительно хорошие специалисты встречаются довольно нечасто и поэтому стоят немалых денег. Именно поэтому банки все больше интересуются объективными системами оценки риска, которые позволили бы по возможности минимизировать участие экспертов и влияние человеческого фактора в принятии решений.

Технология data mining – одна из таких объективных технологий, которая уже отлично зарекомендовала себя в методиках скоринга ведущих западных банков. Ее применяют такие банки как Chase Manhattan Bank, Bank of America, HSBC, Citigroup и многие другие. В чем суть этой технологии, как она работает и в чем ее преимущества?

В основе технологии data mining лежат алгоритмы поиска закономерностей между различными факторами в больших объемах данных. Технология устроена так, что она пытается установить зависимости между всеми факторами; но поскольку даже при небольшом числе факторов, количество их всевозможных комбинаций растет экспоненциально, в data mining применяются алгоритмы априорного отсечения слабых зависимостей. Говоря в терминах анализа кредитоспособности, data mining, на основе данных о выданных кредитах, выявляет те факторы, которые существенно влияют на кредитоспособность заемщика, и вычисляет силу этого влияния. Например, может выясниться, что участие в капитале юридических лиц – более важный фактор, чем владение подержанной иномаркой и менее важный, чем владение недвижимостью. Соответственно, чем сильнее определенный фактор влияет на кредитоспособность, тем больший балл ему присваивается в методике скоринга. Чем больше данные держателя кредитной карты похожи на данные «кредитоспособного гражданина», тем больший лимит по кредиту он может получить, тем более хорошие условия ему могут быть предоставлены и т.д.

В чем же преимущества методики оценки кредитоспособности, основанной на технологии data mining, перед другими методиками?

Объективность. Как уже упоминалось выше, data mining находит объективные закономерности между различными факторами, таким образом позволяя минимизировать влияние субъективного человеческого фактора на принятие решений.


Автоматизация. В отличие от экспертных методик, методика на основе data mining может быть достаточно эффективно автоматизирована и способна обрабатывать большие потоки заявок в режиме реального времени. На вход поступает анкета заемщика, система сразу же выдает решение – кредитный рейтинг, лимит кредита и т.д.

Точность. В отличие от статистических методов анализа данных, технология data mining осуществляет более глубокий анализ, выявляя такие зависимости, которые обычной статистикой не обнаруживаются. А это значит, что методика на основе data mining учитывает больше важных факторов и, следовательно, дает более точные рекомендации. В частности, это подтверждается успешным опытом применения технологии ведущими западными банками, о котором говорилось чуть выше.

Адаптируемость. Со временем кредитная ситуация меняется, поэтому необходимо постоянно отслеживать все изменения в поведении заемщиков. Методика, основанная на технологии data mining, учитывает все эти изменения – так как периодически производит анализ новых данных. Таким образом, эта методика, в отличие от остальных, не является жестко и навсегда заданной, а постоянно адаптируется под изменяющиеся условия. Это также позволяет принимать более обоснованные и точные кредитные решения.

Гибкость. Иногда возникает необходимость внести изменения в анкету заемщика, претендующего на кредит – например, добавить дополнительные пункты, какие-то убрать, изменить варианты ответов на вопрос и т.д. Хорошая методика не должна при этом требовать привлечения квалифицированных экспертов для ее адаптации под новую структуру данных. Например, довольно популярные системы оценки кредитоспособности, основанные на нейронных сетях, этому требованию не отвечают. Дело в том, что само по себе построение адекватной нейросети, рассчитанной на определенный набор входных данных – это скорее искусство, чем технология. Поэтому адаптация методики при добавлении хотя бы одного вопроса в анкету потребует довольно серьезных усилий. В методике же, основанной на технологии data mining, такого ограничения нет – она довольно гибко настраивается на меняющуюся структуру данных, при этом не требует привлечения для этого квалифицированных экспертов.

Объяснимость. Еще одна важная характеристика хорошей методики – возможность объяснить, почему данный заемщик получил определенный кредитный рейтинг (например, почему ему следует отказать в выдаче кредита) или почему ему следует установить именно такой лимит по карте и т.д. У систем оценки, основанных на нейросетях, с этой характеристикой тоже трудности. Вообще, нейросеть – это «черный ящик», внутреннее содержание которого (так называемые веса нейронов) не имеет определенного смысла в терминах оценки риска. Именно поэтому такие методики и не позволяют объяснить специалисту, почему данному заемщику следует отказать в кредите. Методики же, построенные на технологии data mining, наоборот, изначально устроены так, что объяснение рекомендаций заложено в их основу. Дело в том, что сама технология выявляет факторы, влияющие на риск, поэтому, определить, что заемщик недобрал необходимые баллы потому что, например, у него слишком старая иномарка, нет собственной квартиры и отсутствует кредитная история, она сможет автоматически.

Все эти преимущества технологии data mining объясняют ее огромный успех в ведущих западных банках, которые строят свои методики оценки кредитоспособности и управления рисками на ее основе. А что в России?

Data mining в других отделах банка >>