经济学家正在将注意力和资源从调查数据工作转移到“大数据”工作上。 这种分析是对这种转变所需的权衡的实证探索。 平行模型是使用纽约联邦储备银行消费者信贷小组/Equifax 和消费者财务调查进行估计的。 在考虑到不同的变量定义和抽样人群进行调整后,可以得出类似的家庭总债务模型。 然而,这些估计对调整很敏感。 在非抵押债务的平行模型中几乎没有观察到相似之处。 虽然调查有意收集理论上相关的变量,但可能需要将外部数据合并到商业大数据中。 在这个例子中,一些教育和收入衡量指标成功地与大数据相结合,但其他外部汇总数据未能充分替代调查回复。 大数据提供了调查无法比拟的样本大小、频率和细节。 然而,这个例子说明了为什么在尝试用大数据代替仔细执行的调查时要谨慎。
《大数据与调查:研究论文》探讨了经济学家们正逐渐从依赖传统调查数据转向利用"大数据"的现象,并通过实证分析揭示了这一转变所面临的权衡。文章中,作者Stephan Whitaker利用纽约联邦储备银行消费者信贷小组/Equifax的数据与消费者财务调查(Survey of Consumer Finances)进行了平行模型的估计,旨在比较两者在估算家庭总债务模型时的差异和相似性。
尽管在考虑了变量定义和样本人群差异的调整后,可以构建出类似的家庭总债务模型,但这些估计结果对于调整非常敏感。这表明,大数据在处理某些问题时,其结果可能会因数据处理方式的变化而显著波动。同时,在非抵押债务的分析中,大数据和传统调查数据之间的相似性显著降低,这提示我们,大数据可能并不总是能完全替代传统调查。
文章指出,虽然调查数据通常会精心设计,收集理论上相关的变量,但在实际操作中,可能需要结合外部数据来补充商业大数据的不足。例如,某些教育和收入的度量指标能够成功地与大数据集成,但其他汇总数据,如社会经济背景等,却无法有效地替代调查回应提供的信息。这显示了大数据在深度和全面性上的局限性,它可能无法捕捉到复杂的社会现象和个体行为的细微差异。
大数据的优势在于其巨大的样本量、频繁的数据更新和详尽的信息细节,这些都是传统调查难以企及的。然而,这并不意味着大数据可以完全取代调查。大数据的广泛性和实时性可能使其在宏观经济趋势分析或快速响应市场变化方面具有优势,但在理解微观经济行为、社会结构或特定群体的特性时,仍需依赖于精心设计的调查数据。
大数据与传统调查各有优劣,它们在经济学研究中的角色并非互相排斥,而是互补的。在尝试用大数据替换调查时,应谨慎考虑数据的质量、适用性以及分析方法的适应性。这为政策制定者和研究人员提供了一个重要启示:在追求大数据带来的机遇时,不能忽视传统调查在提供深度和解释力方面的价值。