Toad是基于Python的一个标准化评分卡模型建模工具。它提供了一条龙服务,涵盖了从数据探索到分数转换的整个建模过程。以下是Toad的主要功能和特点:
数据探索:
- 使用read_csv读取数据,了解数据概览。
- 通过EDA功能分析数据的统计性特征、缺失值、unique values等信息。
特征筛选:
- 使用quality功能计算各种指标进行变量筛选。
- 删除主键、日期等高unique values且不用于建模的特征。
- 通过toad.selection.select函数进一步筛选变量,根据阈值设置保留关键特征。
特征分箱:
- 提供多种分箱方法。
- 支持数值型和离散型数据的分箱,并能单独处理空值。
WOE转换:
- 将数据转换为更容易解释的分数形式。
- 观察分箱结果并进行调整,确保WOE转换后的分数具有良好的单调性。
建模与特征选择:
- 应用逐步回归方法筛选特征,支持向前、向后和双向筛选。
- 使用逻辑回归对数据进行拟合,并计算预测结果。
模型评估:
- 提供快速实现KS、AUC、PSI等风控模型常用评价指标的方法。
评分卡转换:
- 将逻辑回归模型转换为标准评分卡,支持传入逻辑回归参数进行调整。
GBDT编码:
- 作为GBDT与LR建模的前置步骤,以提高模型学习效果。
Toad通过提供这些功能,极大地简化了评分卡建模人员的工作,使得建模过程更加高效和便捷。