大发五分快三平台秦苍科技数据科学家沈赟:AI在消费金融产品优化以及风险控制中的应用(附PPT+视频) | 硬创公开课 | 雷锋网

  • 时间:
  • 浏览:0
  • 来源:UU快3赔率高平台-UU快三平台

中国消费金融市场的用户大致都须要划分为并是不是类型:1.白领和自雇人群;2.蓝领;3学生;4.农民大发五分快三平台。其中,前两者为主力消费人群,市场规模十分广阔。白领和自雇人群往往拥有央行征信报告,主要使用银行信用卡,以及BAT和京东等大型企业提供的消费金融产品。而多达2.5亿的蓝领则主要为薄文件人群(央行征信报告都都可不还还都可以分类整理到的数据非常少),亲戚让大发五分快三平台我们我们我们 具有很强的消费冲动,是互联网金融产品的主要目标。而大发五分快三平台肯大发五分快三平台能传统银行放款周期过长,无法满足亲戚让我们我们我们 的需求;即时高效的互联网消费金融产品也就成了亲戚让我们我们我们 的最佳选者。

没办法 ,互联网消费金融企业如何都可不还还都可以抓住这俩 市场机遇,从广大薄文件人群中寻找优质客户、提高用户黏性,一并降低风险,将收益最大化呢?本期硬创公开课,雷锋网邀请到了秦苍科技数据科学家沈赟博士,为亲戚让我们我们我们 分享AI在消费金融产品优化以及风险控制中的应用。

内容介绍:

本次公开课涵盖以下内容:

1. 根据用户多维弱变量数据的综合信用评分

2. 社交网络算法应用于金融反欺诈

3.基于机器学习模型的额度策略

4 基于机器学习的金融产品设计

5.人工智能应用的前沿探索:用户生命周期管理

嘉宾介绍

沈赟博士,秦苍科技数据科学家,具有9年金融领域机器学习研究开发经验。拥有德国柏林工业大学电子信息科学与技术博士学位、上海交通大学计算机科学与技术硕士学位、德国柏林工业大学电子信息科学与技术硕士学位、上海交通大学计算机科学与技术本科学位。

曾在Journal of Machine Learning Research, Neural Computation, SIAM Journal on Control and Optimization等机器学习、神经网络以及应用数学等领域的顶级期刊和会议上发表多篇学术论文。

曾任职德国LOBSTER Data 量化分析师,分析出理 高频Nasdaq数据,辅助完成产品上线。现担任秦苍科技数据科学家,率领团队构建基于机器学习的信用评分、额度策略、反欺诈以及用户生命周期内的自动化动态调频系统等。成功打造了基于用户数据1秒内完成信用评分的评分机制,相比传统模型提高了25%AUC。

(本期公开课删改视频,共51分钟)

以下为雷锋网(公众号:雷锋网)对嘉宾分享内容的实录精编。

风险控制

信用评分

风险控制是消费金融领域的一大核心现象,信用评分机制则是控制风险的有效手段。信用评分机制都须要复杂为分类现象,即根据用户历史上的行为,来判断他是“好人”还是“坏人”。假如有一天一个多多 用户逾期几只月,没办法 亲戚让我们我们我们 就认定他是“坏人”,若没办法 逾期行为,则为“好人”。

亲戚让我们我们我们 采用了机器监督学习中的经典分类算法来进行用户信用评分。评分过程都须要分为以下几步:

数据导入和清洗。肯能数据分类整理过程中肯能会分类整理到脏数据,此外,亲戚让我们我们我们 还须要剔除次责不可用、不可计算的数据,以及空数据。

形状提取。分类整理数据时,亲戚让我们我们我们 通常会分类整理多达一万多个数据点,有些通过形状提取的办法提取几百个形状点。

模型选者。在模型中,亲戚让我们我们我们 会运用到有些机器学习算法,比如逻辑回归、随机森林、AdaBoost、XgBoost、神经网络等。选者模型时,亲戚让我们我们我们 会采取cross validation的办法,一并运用基于ROC的AUC来决策模型的好坏。

决策。决策并且,亲戚让我们我们我们 都须要观察用户表现,重新提取数据训练模型,形成正向反馈循环。也有些说,随着分类分类整理到更多、更新的数据,亲戚让我们我们我们 的模型将不断迭代和进化。

从应用结果来看,AI决策相比传统手工开发的算法决策,都须要把决策时间从分钟级别缩短至0.1秒,一并降低25%的坏账率,每年为企业节约高达上千万的成本。

在亲戚让我们我们我们 熟知的,使用强度神经网络出理 图像识别和云识别的现象中,一般而言,分类整理的数据很多,训练出的模型就越好。但金融领域不同,金融数据具有非常强的时间效应,越靠近现在的数据越具备预测效力。并就有说拥有的数据很多,模型效果就越好。有些,不断定期更新模型至关重要。

模型是基于历史数据训练出来的,在未来不处于异常事件的前提下,都须要保持预测效力;一旦冒出 异常事件,模型的效力就有肯能下降。为了保证系统预测的稳定性,亲戚让我们我们我们 会一并开发多个模型彼此竞赛。

比方说,亲戚让我们我们我们 训练出了一个多多 模型,分配给亲戚让我们我们我们 不同的流量:模型2流量最高,模型1次之;模型3最低。一段时间后,亲戚让我们我们我们 都须要分类分类整理到各个模型的表现,根据其准确率动态调节流量。肯能某个模型表现好,就多分配有些流量,反之则减少流量。肯能这俩 模型的效力长时间内持续下降,就将逐渐被淘汰,与此同时会有新的模型加入竞争。总而言之,多模型并行,择优进化,对于保持系统的稳定性十分重要。

通过社交网络分析反欺诈

消费金融产品风险控制中,一个多多多非常重要的次责是反欺诈。亲戚让我们我们我们 反欺诈的主要手段是社交网络分析。用于社交网络分析的数据通常基于手机号码,比方说手机紧急联系人、通联纪录、通讯录等。

里边是一张社交网络关系形状示意图,图中每个点代表一个多多 用户,通过线段连接的一个多多 点互为手机联系人。其涵盖些用户都须要通过一个多多 一并的节点联系到一并,没办法 亲戚让我们我们我们 就将其看作一个多多 团。以团为单位,都须要提取到有些社交网络形状:

团内有些用户的表现,比方说逾期率、通过量等。这俩 形状判断的核心思想都须要归纳为“近朱者赤,近墨者黑”。

团并是不是的形状,比方说节点数、团内用户的连接紧密程度等。

团内用户的属性,比方说团内的女人不人数、地区分布、平均借款额度等。一般而言,团内女人不人数占比越大,团内用户是“好人”的概率就越大。

从社交网络中提取的形状主要可应用于两大方面:

一、将形状数据加入信用评分模型,提升其准确度。根据以往的经验,加入什么数据后,AUC值都须要提升3-5%。

二、通过无监督的聚类办法来预防欺诈。亲戚让我们我们我们 将某个地区的所有用户进行形状分析后,投影到二维平面,通常都须要发现两到一个多多 异常点,亲戚让我们我们我们 距离有些用户非常远。这并且就会触发亲戚让我们我们我们 的调查机制,调查这俩 用户是是不是真的处于欺诈行为。实践检验,这俩 异常值检测的办法可达到300%左右的准确率,证明对于预防欺诈,社交网络形状分析虽然行之有效。

产品优化

优化金融产品参数

消费金融产品主要指分期借贷,亲戚让我们我们我们 都须要把它想象成信用卡,其主要参数有额度、利率和期数。设计什么参数时,亲戚让我们我们我们 主要须要考虑一个多多 方面:

产品的接受度。亲戚让我们我们我们 向用户推荐产品时,用户是是不是会接受?一般而言,产品额度越大、利率越低,用户接受的肯能性就越大。

风险控制。随着用户接受度提高,风险也在增加。肯能亲戚让我们我们我们 向用户提供的额度超出其偿还能力,资金就很肯能收不回来。

产品的接受度和风险彼此冲突,亲戚让我们我们我们 须要寻找折中方案。

下面介绍一个多多 亲戚让我们我们我们 开发的基于贝叶斯算法的框架。在消费金融场景中,简单来说,都须要把用户划分为“好人”和“坏人”。在给定用户表现和金融产品参数的前提下,基本都须要选者这款产品都都可不还还都可以带来的受益。但同一个多多 用户在不一并期的表现是不一样的。比方说,用户这段时间经济情况较好,都都可不还还都可以及时还款;一段时间后他经济情况变坏了,就很有肯能还不上。用户是“好人”还是“坏人”,是个概率性现象。

里边的公式中,p代表在给定某个金融产品和用户的前提下,这俩 用户是“好人”还是“坏人”的概率。统筹考虑所有情况后,就能得出这俩 用户身上的期望收益。

亲戚让我们我们我们 希望通过调整产品参数将收益最大化,一并也须要关注用户逾期的风险。在给定某个产品的前提下,亲戚让我们我们我们 希望用户是“好人”的概率大于某个值,比如0.6肯能0.8。一个多多多都须要间接控制用户肯能带来的损失。

上图展示了亲戚让我们我们我们 对“用户是‘好人’还是‘坏人’”的概率估计情况。其中x轴代表额度,y轴代表期数,z轴代表用户是“好人”的概率,每一个多多 曲面对应一位用户。从图中都须要看出,有些用户对于额度和期数不太敏感。虽然随着额度和期数增加,亲戚让我们我们我们 是“好人”的概率有所下降,但始终高于某个数值。有些用户则对额度和期数非常敏感。通过血块提取用户形状,亲戚让我们我们我们 都须要不断对模型进行优化,为每个用户量身打造共要的金融产品。

没办法 ,这俩 模型的效力究竟如何呢?上图进行了展示。图中x轴代表风险阈值,左端表示阈值非常低,亲戚让我们我们我们 都须要冒巨大的风险;右端表示阈值非常高,放款策略趋于保守。y轴则代表亲戚让我们我们我们 针对某个用户预测的放款金额,与其历史放款金额的比例关系。若比例大于1,有些明预测的放款金额高于历史放款金额,同理反推。从图中都须要看出:

在同一风险阈值下,“好人”(黑色)获得的额度一个多劲高于“坏人”(橙色)。

随着风险阈值提高,用户获得的放款额度逐渐下降。

在给定风险阈值的前提下,“好人”获得的预期额度一个多劲高于历史额度,“坏人”则恰恰相反。

结果和预期删改相符,这证明了亲戚让我们我们我们 基于贝叶斯算法的分析框架虽然行之有效。

延长用户生命周期

企业一个多劲希望用户能尽肯能长时间地使用另一方的产品。有些新用户借款并如期还款后,企业时会向其推荐有些金融产品。没办法 ,如何最大限度地留住客户,延长其生命周期呢?

在用户的整个还款周期中,亲戚让我们我们我们 都须要通过用户在每一个多多 还款节点的表现,判断其是“好人”还是“坏人”,并作出相应调整。肯能用户还款表现好,可适当提升额度或降低利息,鼓励其使用亲戚让我们我们我们 的有些产品。若用户表现差,则都须要降低额度和提高利息,以防控风险。极端情况下,将启动调查或催收机制。

借助什么手段,企业都须要提升用户黏性,并将收益最大化。

马尔科夫决策过程-增强学习

为实现这俩 目的,亲戚让我们我们我们 采用了强度学习以及运筹学中非常经典的马尔科夫决策过程进行建模。企业关注的是用户在整个生命周期中带来的次责收益,有些不同于前面提到产品参数优化。产品参数优化是单步决策,而收益最大化是多步决策现象,须要在每一步决策中不断优化亲戚让我们我们我们 的策略。

上图中的公式中,r是一个多多 reward函数,它取决于st和θt一个多多 变量。st和θt分别代表当前账期下用户的表现(逾期或提前还款等)以及企业的决策(提额或降息等)。π则代表企业在每个账期中的单步策略累计而成的整体策略。通过这俩 公式,亲戚让我们我们我们 都须要得到预期的最大收益。

昨天阿尔法go再次战胜了中国著名棋手柯洁。阿尔法go用到的一个多多 核心算法叫做增强学习,增强学习的本质虽然也是马尔科夫决策过程。它用到了不断迭代的online learning算法来出理 多步决策现象。

马尔科夫决策应用到消费金融场景,过程大致如下:新用户进来后,系统会抽取他的另一方形状,一并根据其当前还款情况,以及在这俩 时间点上带来的利润肯能损失,优化value function和state representation。value function和state representation是通过分析和学习用户历史数据得来的,加入新的数据后,系统会不断校正value值。肯能某一步决策对亲戚让我们我们我们 不利,没办法 其value值就会降低,反之则value值提高。没办法 不断循环往复。

总结

前面提到,AI在消费金融风险控制以及产品优化方面,都都可不还还都可以发挥巨大重要。但须要强调的是,现在AI概念非常热门,亲戚让我们我们我们 都希望学到最新的算法;但要把AI算法落地到实际生产和业务中,还是应该立足业务并是不是,不断挖掘数据优化模型。选者什么模型不重要,模型好坏最终还是要看它是是不是都都可不还还都可以给业务带来增长。最理想的情况是,企业都都可不还还都可以通过模型优化业务流程,获取更多数据,有些利用新的数据进一步优化模型,形成良性循环。

QA:

1.除了风险控制,未来AI还都须要应用到消费金融的什么环节,将给行业带来如何的改变?

前面肯能提到了产品形状优化。通过优化产品参数和形状,来提升用户黏性,将收益最大化,这对于企业来说非常重要。除此之外,AI还都须要用于产品推广,比如通过现有的社交网络,向有些用户推荐适合亲戚让我们我们我们 的金融产品。

2.在目前技术条件下,AI风控相比传统风控处于什么不足英文?未来如何提高?

AI技术立足于大数据。肯能亲戚让我们我们我们 都都可不还还都可以获取足够多、足够新的,具有表征能力的数据, AI风控一定都都可不还还都可以打败传统风控。但好多好多 并且,企业获取的数据往往不足英文充分。这并且,基于长期经验积累的传统风控往往都都可不还还都可以提供行之有效的风险控制手段,虽然亲戚让我们我们我们 的方案不一定是最优的。肯能未来AI都都可不还还都可以进化到拥有学习和推理能力,没办法 它删改都都可不还还都可以取代传统风控,不过短期内还先要实现。

3.随着人工智能发展趋于性性性性成熟期的句子期的句子图片 是什么的句子是什么,未来消费金融行业必然会大规模引进这项技术,这是是不是会带来风险评估同质化的现象?企业该如何进行产品的差异化开发?

这俩 现象虽然处于,未来同一个多多 行业用到的AI算法大多类事。但每个企业分类整理到的数据端不同。肯能企业都都可不还还都可以分类整理到足够新、足够可靠的数据,其风险控制能力将显著提升。有些,现象的本质在于如何获取尽肯能多的优质数据。

4.人工智都须要否代替另一方征信的作用?

我另一方认为是都须要的。央行的征信系统都都可不还还都可以做到多好,取决于大型机构,比如银行和BAT等大企业,我我应该 在多大程度上贡献数据。肯能什么机构我我应该 将数据删改共享出来,没办法 央行的征信系统都须要做到非常完善,但其中处于非常大的阻力。企业们还是更我我应该 基于另一方分类整理到的数据,尽肯能把风控模型做到最好。肯能央行无法分类整理到足够多的数据,其征信系统不见得一定比企业的风险控制系统更好。

5.入门应该如何学习AI

另一方认为都须要分一个多多 层面:首先都须要上网搜索有些教程,比如说雷锋网硬闯公开课上的教程;另外还都须要通过实现现有的、开发好的AI守护进程,提升另一方的动手能力。总之,学习和实践相结合。

雷锋网原创文章,未经授权禁止转载。详情见转载须知。