报告主题
决策树,基尼指数及非平衡分类
DecisionTree,WeightedGini-indexandImbalancedClassification
时间地点年8月28日
上午10:00-11:00
浙江大学教18-报告摘要不平衡数据的分类问题在实际应用中广泛存在,例如:故障诊断,文本分类和欺诈检测等。在处理不平衡数据分类问题中,特征选择成为其中一种重要的应用方法。为了解决该问题,我们提出了一种基于决策树规则和加权基尼系数的特征选择方法。通过对多个不平衡数据集的分类,验证了所提方法的有效性。结果表明,该特征选择方法可以获得更高的AUC曲线下面积和F-measure值。通过观察所提出的特征选择方法和两种filter特征选择方法(Chi-Square和F-statistic)的对比结果,可以发现该方法在选取特征数量较少的情况下,可以获得更好的性能。
Aclassimbalanceproblemappearsinmanyreal-worldapplications,e.g.,faultdiagnosis,textcategorizationandfrauddetection.Whendealingwithanimbalanceddataset,featureselectionbe早期白癜风有什么症状白癜风的危害