公开数据集
数据结构 ? 5.3M
Data Structure ?
* 以上分析是由系统提取分析形成的结果,具体实际数据为准。
README.md
Data Set Information:
本研究针对的是欧元客户并比较六种数据挖掘方法对违约概率的预测准确性。从风险管理的角度来看,估计违约概率的预测准确度结果将比可信或不可信客户的二元分类结果更有价值。由于实际违约概率未知,本研究提出了一种新的排序平滑方法?估计违约的实际概率。以实际违约概率为响应变量(Y),违约预测概率为自变量(X),简单线性回归结果(Y=A+BX)表明,人工神经网络生成的预测模型具有最高的确定系数;其回归截距(A)接近于零,回归系数(B)接近于一。因此,在六种数据挖掘技术中,人工神经网络是唯一能够准确估计实际违约概率的技术。
Attribute Information:
本研究采用了一个二元变量,默认支付(Yes=1,No=0)作为响应变量。本研究回顾了文献,并使用以下23个变量作为解释变量:
X1:授信金额(新台币):包括个人消费信贷和家庭(补充)信贷。
X2:性别(1=男性;2=女性)。
X3:教育(1=研究生院;2=大学;3=高中;4=其他)。
X4:婚姻状况(1=已婚;2=单身;3=其他)。
X5:年龄(年)。
X6-X11:过去付款的历史记录。我们跟踪了过去的每月付款记录(2005年4月至9月),如下所示:X6=2005年9月的还款状态;X7=2005年8月的还款情况。;X11=2005年4月的还款状态。还款状态的衡量尺度为:-1=按时支付;1=延迟付款一个月;2=延迟付款两个月。;8=延迟付款八个月;9=延迟付款九个月及以上。
X12-X17:账单金额(新台币)。X12=2005年9月账单金额;X13=2005年8月账单金额。;X17=2005年4月账单金额。
X18-X23:以前付款的金额(新台币)。X18=2005年9月支付的金额;X19=2005年8月支付的金额。;X23=2005年4月支付的金额。
Relevant Papers:
Yeh, I. C., & Lien, C. H. (2009). The comparisons of data mining techniques for the predictive accuracy of probability of default of credit card clients. Expert Systems with Applications, 36(2), 2473-2480.
Citation Request:
Yeh, I. C., & Lien, C. H. (2009). The comparisons of data mining techniques for the predictive accuracy of probability of default of credit card clients. Expert Systems with Applications, 36(2), 2473-2480.
Name: I-Cheng Yeh
email addresses: (1) icyeh '@' chu.edu.tw (2) 140910 '@' mail.tku.edu.tw
institutions:
(1) Department of Information Management, Chung Hua University, Taiwan.
(2) Department of Civil Engineering, Tamkang University, Taiwan.
other contact information: 886-2-26215656 ext. 3181
帕依提提提温馨提示
该数据集正在整理中,为您准备了其他渠道,请您使用
- 分享你的想法
全部内容
数据使用声明:
- 1、该数据来自于互联网数据采集或服务商的提供,本平台为用户提供数据集的展示与浏览。
- 2、本平台仅作为数据集的基本信息展示、包括但不限于图像、文本、视频、音频等文件类型。
- 3、数据集基本信息来自数据原地址或数据提供方提供的信息,如数据集描述中有描述差异,请以数据原地址或服务商原地址为准。
- 1、本站中的所有数据集的版权都归属于原数据发布者或数据提供方所有。
- 1、如您需要转载本站数据,请保留原数据地址及相关版权声明。
- 1、如本站中的部分数据涉及侵权展示,请及时联系本站,我们会安排进行数据下线。