数据挖掘
PVA捐助者的客户细分,使他们有可能更好地了解其捐助者的行为,并在其数据库中更好地识别捐助者/潜在捐助者的不同细分
介绍我们的数据
为了直观地从我们的数据中挖掘出潜在的相关属性,其中属性数量为:475,示例/观察数量:95412。我们需要仔细阅读数据字典,并理解每一个的含义及其相关性/贡献,以构建我们的数据库。集群。 当我们第一次浏览数据集时,我们认为许多变量是潜在的重要变量。 以下是一些变量:
受控:
与捐赠者绑定的控制编号(唯一记录标识符)
收入:
让我们对有多少人能赚多少钱以及他们是否有足够的钱能够捐款做出想法。
年龄:
年轻人或老年人更可能捐款。 年龄分布是必须的。
重大的:
向我们展示他们过去是否曾经是主要捐助者。
TIMELAG:
估算用户两次捐赠之间的差距。 帮助我们了解他们可以多久捐赠一次。
HOMEOWNR:
他们是否拥有自己的房子? 这向我们展示了