GraphChi是第一个报告的基于磁盘的图形计算引擎,可以有效地处理数十亿个图形边缘。 与GraphChi相似或什至更好的性能报告与分布式图表相比计算引擎。 但是,发现其子图许多数据挖掘算法的构建需要大量时间由于大量的随机内存访问, 最小化以提高整体系统性能。 在本文中,我们研究了GraphChi随机变量的原因内存访问问题,发现图存储演示文稿格式起着至关重要的作用。 根据在分析中,我们提出了一种自适应的图选择方法表示和稀疏矩阵存储格式对数据挖掘算法的数据使用要求, 可以减少随机存储器的访问和GraphChi的运行时间。 另外,我们实现并行通过重叠处理来对GraphChi进行图形处理将子图加载到内存并更新的过程子图。 初步实验结果表明经过提议的修改后,GraphChi的运行时间最多可减少77%。