当前位置：首页 > 网络应用技术

Python预测贷款（2023年最新股票）

时间：2023-03-06 16:07:00 网络应用技术

　　简介：今天，首席CTO Note将与您分享Python预测贷款的数量。如果您可以解决您现在面临的问题，请不要忘记注意此网站。让我们现在开始！

　　分两个部分计算贷款，最后添加。

　　投资组合贷款的权益应分别计算出商业贷款和公积金贷款。计算出的公式是“利息=借贷本金×借贷利率×借贷期”。在线贷款计算公式实现了一个可以计算住房贷款的还款计划，支持等效本金和同等的本金和利息的Python计算器。

　　它可以通过importCSV进行编程；进口;何时：Choice = Intfor详细信息，请参阅在线编程共享。

　　项目简介：

　　P2P贷款业务具有低阈值和低渠道成本的特征。预防风险和控制对于贷款企业非常重要。

　　从大量借款人的数据集中，分析了易于违约且不容易违反的人的肖像特征

　　在同一时间使用机器学习算法来实现自动识别风险组（准确率为89.86％），并加快手动审查的效率。

　　特定项目的内容：

　　1.使用Python Pandas工具进行数据清洁，缺失值，异常值处理和功能指标。

　　2.使用Python Matplotlib可视化工具分析勘探数据，以显示用户的关键功能，例如月收入和信用卡

　　透支情况对默认率的影响。

　　3.使用机器学习随机森林进行建模，使用学习曲线，网格搜索，交叉验证，最后进行评估

　　它分为84.9％，准确率为89.86％，召回率为80.70％，AUC面积为0.9337数据预测模型。

　　该数据培训中使用的模型是一种随机的森林分类算法。通过训练有素的数据集，使用学习曲线，网格搜索和交叉验证。最后，得分为84.9％，准确率为89.86％，召回率为80.70％，AUC面积为0.9337数据预测模型。

　　数据预处理的基本程序和想法：

　　1.首先，有多少个特征，这些特征是连续的，哪些是类别。

　　2.检查是否缺少值，并弥补适当的特征特征选择方法以完成数据。

　　3.标准化连续数字特性，因此平均值为0，方差为1。

　　4.针对类别特征的一式编码。

　　5.转换为类别数据的连续数据以获得双重值。

　　6.为了防止过度拟合或其他原因，请选择是否应正规化数据。

　　7.在发现数据的初步探索后，效果不好。您可以尝试使用多项式方法来查找非线性关系。

　　8.分析是否需要根据实际问题来转换功能。

　　导入数据集并查看数据的基本情况。可以看出，繁荣的原始数据量相对较大。一个有113,937个样本，80个功能和1个标签。

　　1.1。有许多功能，首先删除了许多无用的功能。

　　1.2查看缺乏数据，您可以看到40个功能缺乏数据，缺少率在0.000219-0.882909范围内。处理以下缺少的数据。

　　1.2.1删除功能具有更多缺失值

　　以下两个特征的缺乏速率太高，与我们的相关性不大，并直接删除。

　　1.2.2获取数据类型是分类变量的所有特征，并使用未知来填充

　　1.2.3特殊变量使用计算公式进行填充

　　1.2.4重复复制的含义

　　1.2.5删除缺少率较低的数据的数据

　　处理丢失的数据后，样本量为106290，功能量为55

　　1.3数据过滤

　　1.3.1自2009年7月以来，Prosper调整了客户的评估方法。这次我们仅在2009-07-01之后分析贷款。

　　过滤数据后，样品量变为82931，功能量为54

　　2.1单个变量分析

　　0是非违约的数量，违约数为1。2009.07之后，违规率为22.90％。

　　2.1.1不同地区贷款的分布

　　从数字可以看出，加利福尼亚州的贷款数量远高于其他州。由于繁荣的总部位于加利福尼亚州，这与实际情况是一致的。最高排名是德克萨斯州，纽约，佛罗里达州和伊利诺伊州有超过5,000个贷款数据。根据2015年美国各个州的GDP排名，这五个州仅是前五名，该订单是相同的。在美国发达的地区。

　　2.1.2贷方的收入状况分配

　　在美国，年薪超过25,000美元是一名技术白领工人或一定程度的教育。50,000美元已经接近金领类，例如：大学教授，医生等。从这个数字可以看出，繁荣平台的用户收入水平相对较高，这有利于用户偿还，这有利于平台和投资者的风险控制。

　　2.1.3贷方的专业分配

　　从数字可以看出，除了那些不愿透露特定职业的人外，大多数用户是教授，程序员，公司高管和其他具有一定社会地位的人。这些人接受了高等教育，并有一定的信用保证。此外，这与我之前看到的收入是一致的。

　　2.1.4债务收入比率分配的贷款

　　大多数用户的债务收入比率约为0.2，并且占0.5的部分部分，即繁荣平台用户的还款能力仍然更加乐观

　　2.1.5使用信用卡用于贷款

　　银行卡的化代表信用卡的比率和信用卡金额，这可以反映用户的资本需求。Prosper用户大多在0.5?1之间，表明用户每月都有信用卡可以偿还，从而降低了其还款功能。

　　2.2有关贷款违约利率影响的关键因素

　　2.2.1借款人的收入收入对默认利率的影响

　　可以从数字中看到：

　　1.一般来说，违反合同越低，较低

　　2.贷款主要集中于中等收入组

　　2.2.2债务收入的债务收入对违约率的影响

　　从上图可以看出：

　　1.当债务收入比率小于0.6时，违约数量大大低于非违规数量。

　　2.当债务收入比率大于0.6时，两者之间的差距并不明显，甚至违反合同的数量大于非违规数量，这表明债务收入的可能性越大违反合同。

　　2.2.3借款人银行卡的影响对默认利率

　　1.通常，随着信用卡的透支比率越来越高，默认率越来越高

　　2. Suuperuse的违约率已达到37.5％。这部分人群需要严格监视。No使用人群也具有31％的默认率。一开始，信用卡透支率为0和NA的数据被归类为无用。

　　2.2.4 CreditScor对CreditsCorrange对默认利率的影响

　　从上图可以看出：

　　1.随着信用评分CreditsCore的上升，其默认利率正在下降

　　2.大多数贷款的信用分为650-800，默认利率为0.06-0.02

　　2.2.5拖欠7年对过去7年中违约率的影响

　　在过去的七年中，Delinquieslast7Years已经能够衡量一个人的信用报告，而那些违约的人在借贷时违反合同的可能性更大。

　　从上图可以看出：

　　1.一般来说，过去7年中违约的数量越多，默认率就越高

　　2.在过去7年中没有违反的人数比其他清算人数相对较高。取决于以下分析

　　3.1数据转换

　　3.1.1类变量执行愚蠢变量

　　样品量变为82931，特征量为127

　　3.1.2标签变量执行两个类别

　　贷款的样本量已成为26365，特征金额为127

　　非默认率为：0.7709084012895885;默认率为0.22909159871041151

　　3.2此时，数据预处理工作将结束，以保存预处理数据。

　　介绍预处理的繁荣借贷数据集

　　4.1手册选择功能检查建模效果

　　准确率为0.7695

　　4.2使用模型自己选择特征

　　准确率为0.7780

　　4.3使用学习曲线选择最佳的n_estimators

　　在0-200/20中的研究，获得最佳的n_estimators = 161，得分= 0.8508

　　在151-171/20中的研究，获得最佳的N_estimators = 163，得分= 0.8511

　　4.4使用网格搜索其他参数

　　在0-60/5之内学习，获得最佳的max_depth = 41

　　在0-60/5中学习，获得最佳的max_features = 16

　　因为这里需要更详细的较高参数，需要时间

　　4.4最终模型效果

　　最终准确性0.8490528905289052

　　混乱矩阵：

　　[[5552 554]

　　[1175 4914]]

　　准确率：[0.82533076 0.89868325]

　　召回率：[0.90926957 0.80702907]

　　ROC和AUC面积为0.9337

　　4.5查看每个特征的重要性

　　4.6数据预测

　　预测的违约率为0.0427

　　能。

　　在[实用工具]中选择[贷款利率]，然后查看您的贷款是每月还款还是还款，输入您借入的[本金]]，然后输入[总安装期]，在底部计算，即使您自动计算平台的实际年利率。

　　贷款的算法是固定的。您首先需要弄清楚校园贷款是否等同于本金，利息或同等黄金之类的东西。然后，您可以找到Python编写的相关副本。

　　结论：以上是首席CTO注释汇编的Python预测贷款的相关内容。希望它对您有所帮助！如果您解决了问题，请与更多关心此问题的朋友分享?

上一篇：什么是人工智能要做的（2023年的最新共享）

下一篇：Django的静修是什么？

Python预测贷款（2023年最新股票）相关文章