《表1 数据集介绍:改进利益驱动神经网络在欺诈信息的应用研究》
第一个数据集中包括9 388条客户的交易信息,合法交易和欺诈性交易的比例为9∶1,其中有939个欺诈性交易,其他的为合法交易。数据集拥有102条属性。第二个数据集中包括5 960个样本,其中1 019个欺诈性交易,4 941个合法交易,该数据集包括46条属性。这两个数据集是从银行交易系统遴选的一部分数据,该数据的特点是具有相当一部分欺诈性交易信息,其中,第一个数据集的合法交易与欺诈性交易比例为9∶1,第二个数据集的比例接近5∶1。这些一高一低的比例有助于理解欺诈检测方法的性能。在本文的实证研究中,数据集的划分方式为:2/3的部分被用于对模型的训练,1/3的部分被用于测试训练后的模型。在所有的数据集中都有一个基于收益的属性,在每个样本中将处罚个体化,在信用卡数据集中该属性为可用额度,在银行直销数据集中该属性为客户余额。ANN模型从训练数据集中自动地提取一个验证数据集(15%),以避免过拟合问题。关于数据集的所有信息和使用的ANN如表1所示。
图表编号 | XD00189232400 严禁用于非法目的 |
---|---|
绘制时间 | 2020.12.05 |
作者 | 孙林娟、贾月辉 |
绘制单位 | 天津大学仁爱学院计算机科学与软件系、天津中德应用技术大学软件与通信学院 |
更多格式 | 高清、无水印(增值服务) |