基于神经网络的虚假评论识别系统
备注:
数据处理时,应该以 utf-8 编码,不然读出来的数据较乱,修改数据形式,
读取 Excel 文件,以 utf-8 编码
打乱数据集使得最后的结果更加合理
添加测试集验证模型
测试集:训练集=2:8
在训练集的过程中添加验证集,比例为 1:9
最后的下面如下图所示。
数据比例:
模型结构:
基于神经网络的虚假评论识别系统(Python).zip训练过程: 1.train_word2vec生成word2vec词向量模型,train_word2vec中会调用corpusprocess(对中文文本进行预处理和切词操作) 2.generate_id2wec会根据此向量模型,生成w2id,和嵌入权重embedding_weights 3.prepare_data根据w2id,划分训练集x_train, y_trian和验证集 x_val , y_val 4.w2id和embedding_weights根据定义LSTM模型Senti 5.调用train()方法训练,保存算法模型。 基于神经网络的虚假评论识别系统(Python).zip训练过程: 1.train_word2vec生成word2vec词向量模型,train_word2vec中会调用corpusprocess(对中文文本进行预处理和切词操作) 2.generate_id2wec会根据此向量模型,生成w2id,和嵌入权重embedding_weights 3.prepare_data根据w2id,划分训练集x_train,