ЦБ научился находить МФО без лицензии при помощи машинного обучения

Аналитики Yandex Data Factory построили для Центробанка специализированную модель поиска сайтов организаций, предлагающих потребительские займы. Она находит релевантные страницы из миллиардов, хранящихся в поисковом индексе Яндекса, и с помощью технологии машинного обучения «Матрикснет» оценивает их вероятный юридический статус.

Об этом на заседании Экспертного совета по защите прав потребителей финансовых услуг и миноритарных акционеров ЦБ РФ рассказал исполнительный директор Yandex Data Factory Александр Хайтин. Заказчиком сервиса выступило Главное управление микрофинансовых рынков и методологии финансовой доступности Банка России.
 
В области потребительских займов высока активность нелегальных кредиторов. Люди, обращающиеся к ним, почти гарантированно становятся жертвами мошенничества. ЦБ РФ ведет реестр организаций микрофинансирования, в который попадают проверенные участники рынка.


По ключевым словам, связанным с темой потребительских займов и микрофинансирования, Яндексом было отобрано около 7 млн сайтов и страниц в социальных сетях. Специалисты ЦБ РФ определили категории почти 8000 из них, и на основе этой разметки аналитики Yandex Data Factory обучили специализированную модель поиска. Она нашла и классифицировала 12 445 релевантных страниц по нескольким категориям: предложение займов организацией с действующей лицензией, с отозванной лицензией, организацией никогда не получавшей лицензию, а также организацией, наличие лицензии у которой определить не удалось. В итоге было обнаружено более 2500 подозрительных организаций. Модель правильно определяет категорию в 71% случаев и в 98% верно определяет, есть ли у организации лицензия ЦБ РФ или ее наличие невозможно установить. Вероятность, что специалисты пропустят нарушителей крайне низкая.

Сотрудники Банка России получают информацию в формате таблицы, с которой просто и удобно работать. В регулярно обновляющихся отчетах указаны веб-сайты организаций, предлагающих потребительские займы, регион, в котором они осуществляют свою деятельность, категория из разработанной классификации. Специалисты ЦБ уточняют классификацию и отправляют эти уточнения Yandex Data Factory, благодаря чему поисковая модель дообучается для улучшения качества работы.

Комментарии 0

Добавить комментарий

Пожалуйста, войдите или зарегистрируйтесь, чтобы оставить комментарий.