本文主要探讨了如何利用机器学习方法来预测洋岛玄武岩中的稀土元素(REEs)含量,以此弥补地质科学共享数据库(如GEOROC、PetDB等)中REE数据缺失的问题。研究者选取了随机森林(Random Forest)算法作为机器学习模型,并以Ocean Island Basalt(OIB)的数据作为样本进行训练和验证。
文章指出,虽然现有的地质科学数据库为地球科学研究提供了丰富的基础数据,但这些数据集中稀土元素的记录通常不全,而REE在地球化学中具有重要地位。因此,通过机器学习技术预测REE的含量显得尤为必要。随机森林是一种集成学习方法,它通过构建多个决策树并结合其结果来提高预测的准确性和鲁棒性。
在实验部分,研究者从GEOROC数据库中选择了1283个OIB样本,将这些数据集划分为训练集(80%)和测试集(20%)。对比随机森林和多元线性回归两种方法在相同数据上的建模和预测效果,结果显示随机森林在预测精度上具有明显优势。这表明随机森林能更好地捕捉到输入参数(主要元素)与输出参数(稀土元素)之间的复杂关系。
进一步分析发现,随机森林模型在轻稀土元素的预测上表现优秀,而对于重稀土元素的预测效能则随着原子序数的增加而逐渐降低。这可能是因为重稀土元素与主要元素之间的关联性较弱或更为复杂。这种差异提示未来的研究需要更深入地理解重稀土元素的地球化学行为和控制因素。
此外,文章还强调了机器学习在地质科学中的应用潜力,尤其是在处理大量复杂数据时的优势。通过这种方法,可以预测和补充数据库中缺失的信息,从而促进地球化学、岩石学以及地质成因等领域研究的进步。
总结来说,这篇论文揭示了随机森林机器学习模型在预测洋岛玄武岩稀土元素含量方面的有效性,为解决地质科学数据库中REE数据不足的问题提供了一种创新的解决方案。同时,它也指出了未来研究在模型优化和理解重稀土元素地球化学特性方面需要面对的挑战。