数据结构C++语言运用哈希表判断程序代码的相似性

preview
共8个文件
txt:4个
user:1个
cpp:1个
需积分: 0 8 下载量 96 浏览量 更新于2024-06-22 收藏 7KB ZIP 举报
对于两个C++语言的源程序代码,用哈希表的方法分别统计两个程序中使用C++语言关键字的情况,并最终按定量的计算结果,得出两份程序的相似性。 选择若干组编译和运行都无误的C++程序,程序之间有相近的和差别大的,用上述方法求s, 对比两个程序的相似性。 建立源代码用户标识符表,比较两个源代码用户标识符出现的频度,综合关键字频度和用户标识符频度判断两个程序的相似性。 本程序能够遍历输出根据关键字和标识符建立的哈希表以及利用这两个哈希表统计C++语言源程序关键字和标识符的使用情况,最后通过比较向量的相对距离得出源程序的相似性。