计算关联规则:
6000条的排列组合(这里我们采用比较简单的 1-》 1 的方式(1 推荐 1 的方式)
也就是说每一条 new1 对 new2 的支持度
每次都遍历一条用户信息 ,然后
5999*5999 = 35988001 这么多种组合
每种组合需要遍历 10000 次得出 支持度,置信度:
支持度 P = 出现的次数 /总次数
置信度 P = ab 同时发生的次数/a 发生的次数
那么我们的步骤就是:
① 清理数据形成
② 从源数据中获取到 《用户列表》 和 《新闻列表》
③ 获取到 规则列表 List<String [] >GetTuiJianList
List《String []》GetTuiJian(inputPzhi,inputPxin){
For(新闻列表 i =0 ;i<6000;i++){
for(新闻列表 j =0 ;j< 6000 ; j++){