机器学习项目
项目1:
概述:
创建了一个应用程序,用于根据培训数据中的可用数据对晶片的质量进行分类。
从客户端wrt Schema.json文件中删除了超过1万条记录。
在基于主数据和真实来源创建自定义管道,文件和数据验证之前,先对EDA进行分析。
预测输出,即-1:Fault Wafer和+1 Good Wafer。
使用随机搜索CV优化了不同的机器学习算法,例如-Random Forest和XGBOOST,以达到90.4的最佳模型。
使用Flask构建了一个面向客户的API。
项目2:
概述:
创建了一个应用程序,以根据给定的预测变量集对网站是否进行网上诱骗进行分类。
从客户wrt数据共享协议中删除了超过15,000条记录。
预测输出,即-1:有效网站和+1无效网站。
根据主数据和真实来源准备了自定义管道,文件和数据验证。
使用随机搜索CV优化了不同的机器学