浅析信用评分模型摘要本文对信用评分领域中主要的模型和方法做了细致的概述和优缺点比较这些模型包括判别分析模型决策树分析回归分析和神经网络模型关键词信用评分判别分析模型决策树分析回归分析法神经网络法一信用评分概况信用评分模型作为信用风险的基础和核心无论是对于建立征信体系还是对于机构的信贷资产管理都有着不可替代的作用其主要目的在于尽量将能够预测借款人未来行为的指标加以整合并统一成可以比较的单一指标以显示借款人在未来特定时间内违约的可能性所有的信用评分模型无论采用什么理论或方法其最终目的都是将贷款者的信用级别分类为达到分类目的当前对个人信用评分模型的定义有多种较为权威的种观点认为信用评分是预测贷款申请人或现有借款人违约可能性的一种方法这一观点指出了信用评分的作用和目的不过随着信用评分模型的不断发展信用评分已不仅是一种统计方法也包含了运筹学如规划法非线性模糊数学如神经网络方法等此外信用评分的实际操作应用也与决策原则紧密相关决策原则事实上决定了信用评分模型实现其目的和作用的程度因此对个人信用评分模型这一数学工具在金融和业中的应用来说较为全面和恰当的定义应是信用评分是运用数学优化理论包括统计方法运筹方法等依照即定原则或策略损失最小原则或风险溢价原则在数据分析决策阶段区分不同违约率水平客户的方法二各类信用评分模型概述判别分析模型判别分析法是对研究对象所属类别进行判别的一种统计分析方法进行判别分析必须已知观测对象的分类和若干表明观测对象特征的变量值判别分析就是要从中筛选出能提供较多信息变量并建立判别函数使推导出的判别函数对观测样本分类时的错判率最小这种方法的理论基础是样本由两个分布有显著差异的子样本组成并且它们拥有共同的属性它起源于年引进的线性判别函数这个函数的目的是寻找一个变量的组合把两个拥有一些共同特征的组区分开来判别分析方法的优点适用于二元或多元性目标变量能够判断区分个体应该属于多个不同小组中的哪一组自身也存在不可避免的缺点该模型假设前提是自变量的分布都是正态分布的而实践中的数据往往不是完全的正态分布从而导致统计结果的不可靠性决策树方法决策树模型是对总体进行连续的分割以预测一定目标变量的结果的统计技术决策树构造的输入是一组带有类别标记的例子构造的结果是一棵二叉或多叉树构造决策树的方法是采用自上而下的递归构造在实际中为进行个人信用分析选取个人信用作为目标属性其他属性作为独立变量所有客户被划分为两类即好客户的和坏客户将客户信用状况转换为是否好客户值为或而后利用数据集合来生成一个完整的决策树在生成的决策树中可以建立一个规则基一个规则基包含一组规则每一条规则对应决策树的一条不同路径这条路径代表它经过节点所表示的条件的一条链接通过创立一个对原始祥本进行最佳分类判别的决策树采用递归分割方法使期望误判损失达到最小决策树模型的优点浅层的决策树视觉上非常直观容易解释对数据的结构和分布不需做任何假设可以容易地转化成商业规则它的缺点在于深层的决策树视觉上和解释上都比较困难决策树对样本量的需求比较大决策树容易过分微调于样本数据而失去稳定性和抗震荡性回归分析法回归分析法是目前为止应用最为广泛的一种信用评分模型这其中以著名的回归为代表除此之外线性回归分析回归等方法亦属于此类最早使用回归分析的他采用线性回归模型制定了一个类似于信用卡的评分卡他的研究表明消费者行为特征比表资料更能够预测未来违约可能性的大小同规划方法中一样假设已经通过一定的方法从样本变量中提取出了若干指标作为特征向量回归分析的思想就是将这些指标变量拟合成为一个可以预测申请者违约率的被解释变量自然就是违约率回归分析中应用最广泛的模型当属线性回归模型它是对大量的数据点中表现出来的数量关系模拟出一条直线回归分析的目标就是使目标变量值和实际的目标变量值之间的误差最小因此最早将回归方法应用于信用评分研究的模型就是简单的线性回归模型目前基于回归的信用评分系统应用最为普遍回归模型的优点容易解释和使用自变量可以是连续性的也可以是类别性的许多直观的指标来衡量模型的拟合度缺点不能有效处理缺失值必须通过一定的数据加工和信息转换才能处理模型往往呈线形关系比较难把握数据中的非线形关系和变量间的互动关系而且模型假定变量呈正态分布模型受样本极端值的影响往往比较大人工神经网络法近些年来随着信用评分领域的研究深入有学者将人工智能领域的一些模型算法引入到了信用评分研究中人工神经网络模型为典型代表人工神经网络是由大量简单的基本元件神经元相互连接而成的自适应非线性动态系统是一种把各种投入要素通过复杂的网络转换成产出的信息加工结构神经网络模型本质上所解决的问题仍是分类或者说模式识别问题但其原理却与其做方法迥然相异人工神经网络有多种模型比如神经网络神经网络网络等神经网络为目前研究最为成熟算法最为稳定同时应用也最为广泛的一种神经网络模型神经网络模型的优点有效地捕捉数据中非线性非可加性的数量关系适用于二元性多元性和连续性的目标变量能处理连续性和类别性的预测变量缺点基本上是一个黑箱方案难以理解如果不经过仔细控制容易微调于样本数据从而不具备充分的抗震荡性和稳定性三结语信用评分作为一种严谨的基于统计学等理论的决策手段正在逐渐被我国商业重视信用评分系统的建设在我国属于起步阶段应逐步建设适合我国特色的高水平的信贷决策支持制度不但需要借鉴国外已有的理论研究成果和实践方案更需要我界的创新或结合我国本土数据的实证研究参考文献郭敏华信用评级中国人民出版社孙薇浅析信用风险评价方法沿海企业与科技