数据挖掘技术是指从大量的、不完全的、有噪声的、模糊的实际应用数据中,提取出人们事先未知的、潜在有价值的信息和知识的过程。该技术包括了数据库、人工智能、数理统计、信息检索、知识获取、模式识别、数据可视化等多个领域的科学方法。数据挖掘技术在现代的多个领域得到了广泛的应用,如商业、银行、保险、网站开发、生物信息学等。
公共工程决策是政府为了公共利益直接或间接投资形成的基础性建设项目和社会公益建设项目。公共工程项目的特点包括投资大、建设周期长、不确定性因素多、风险高、宏观效益和社会效益突出等。在我国,由于公共工程项目决策的短视行为,决策标准单一、程序不完善、缺乏约束等原因,导致项目经常出现超预算、超工期、设计不协调、项目未经充分论证等问题,严重影响了公共工程项目的成功率和建设效率。
传统的公共工程决策模式大多依赖于决策者和参与人员的经验,导致科学性和有效性较低。为了提高公共工程决策的科学性和效率,提出了一种将数据挖掘技术和基于案例推理(Case-Based Reasoning, CBR)工具进行结合的新机制。这种机制能够通过搜集、整理、分析、处理和预测所要处理的信息,减少人的非理性因素干扰,提高信息共享和透明度,改善公共工程决策的质量。
数据挖掘技术的具体应用可以分为几个阶段:数据预处理、模型生成、质量评估、交互式检验以及最终模型的选择。数据预处理阶段主要是确保数据的有效性,随机抽取独立样本,并对每一个样本产出相应的模型。之后对每一个模型进行质量评估,并通过交互式检验确保最佳模型的一致性。最终根据定量和定性的标准确定具有代表性的模型,并运用统计学和人工智能等方法对模型进行详细的分析。
基于案例推理(CBR)是一种以案例为基础的推理方法,用于从以往案例的信息中提取经验,并将这些信息用于新案例的决策。在公共工程决策中,CBR可以与数据挖掘技术结合,通过以往案例的信息对新项目进行评估,以达到最匹配的水平。
本文提出的结合DM与CBR的新机制,能够对公共工程决策中存在的问题提供一种全新的解决方案。这种结合能够确保公共工程决策的科学性和有效性,提高决策质量,同时通过数据挖掘得到的洞察力可以为公共工程项目提供更为深入和全面的理解。这不仅有助于提高公共工程项目的成功率,也能为公共工程项目的可持续发展提供科学的决策支持。