人工智能大作业.zip_人工智能大作业资源-CSDN文库

共49个文件

png：47个

py：2个

需积分: 5 69 浏览量 2024-04-18 16:10:40 上传评论收藏 4.13MB ZIP 举报

人工智能（Artificial Intelligence，简称AI）是一门新的技术科学，致力于研究、开发能够模拟、延伸和扩展人类智能的理论、方法、技术及应用系统。其目标是让计算机具备类人智能的能力，包括感知、理解、判断、推理、学习、识别、生成、交互等，从而能够执行各种任务，甚至在某些方面超越人类的智能表现。人工智能的应用范围极为广泛，涵盖了计算机科学、金融贸易、医药、诊断、重工业、运输、远程通讯、在线和电话服务、法律、科学发现、玩具和游戏、音乐等诸多领域。具体的应用实例包括语音识别、图像识别、自然语言处理、智能交互、自动驾驶、医疗健康等。例如，在冬奥会上，人工智能技术被用于场馆的智能化建设，提供定位精准、随叫随到的引导服务；在证件照检测方面，人工智能可以高准确度地进行人脸识别；在企业管理中，人工智能平台可以实现对各类云资源的统一管理。人工智能的优点主要有以下几点：高效性：人工智能可以在短时间内处理大量的数据和任务，显著提高效率和生产力。可靠性：相较于人类，人工智能可以更快速、更准确地执行任务，并且不会受到疲劳、情绪等因素的影响，提高了任务执行的可靠性。个性化服务：通过分析大量的用户数据，人工智能可以为用户提供个性化的服务和推荐，提高用户体验和满意度。自主学习：借助机器学习和深度学习等技术，人工智能可以自主地学习和优化模型，不断提升其性能。然而，人工智能也存在一些缺点：数据偏差：如果用于训练的数据集存在偏差，那么训练出来的模型可能会存在误差，影响其性能。隐私问题：人工智能在处理和分析大量数据时，可能会涉及到用户隐私的问题，如个人信息泄露等。总的来说，人工智能是一个不断发展和进步的领域，随着技术的不断改进，其应用范围和优势也在不断扩大。但同时，也需要关注并解决其存在的挑战和问题，以确保其健康、可持续的发展。

资源推荐

资源详情

资源评论

收起资源包目录

人工智能大作业.zip （49个子文件）

content

plot.py 5KB

assets

1543985978236.png 16KB

1543988271320.png 83KB

1543979660203.png 19KB

KNeighborsClassifier.png 294KB

1543985528201.png 11KB

1543985613896.png 15KB

AdaBoostClassifier.png 276KB

DecisionTreeClassifier-1543986138375.png 277KB

1543938093699.png 19KB

1544011344237.png 29KB

1543986032953.png 19KB

1543986368440.png 16KB

1543988318345.png 83KB

1543986493366.png 19KB

MLPClassifier-1543985720196.png 282KB

1543985891990.png 15KB

1543988323173.png 83KB

1543979467437.png 20KB

1543986046156.png 18KB

1543988404332.png 82KB

1543979642034.png 17KB

1543986427944.png 16KB

1543986131178.png 22KB

MLPClassifier.png 282KB

1543979677530.png 23KB

1543986116981.png 22KB

1543987012374.png 14KB

1543978613147.png 18KB

1543986306371.png 17KB

SVC.png 298KB

1543981448385.png 280KB

1543986246943.png 16KB

1544011095854.png 23KB

1543986886189.png 15KB

1543979672236.png 24KB

1543979691451.png 24KB

1543986470246.png 19KB

RandomForestClassifier-1543985689825.png 275KB

1543978364360.png 19KB

DecisionTreeClassifier.png 277KB

1543987105551.png 14KB

1543987789454.png 40KB

1543979652165.png 17KB

1543986437581.png 16KB

RandomForestClassifier.png 275KB

GaussianNB.png 279KB

SVC linear.png 279KB

model.py 7KB

import pandas as pd import numpy as np import matplotlib.pyplot as plt from matplotlib.colors import ListedColormap #from sklearn.model_selection import train_test_split #废弃！！ from sklearn.model_selection import train_test_split from sklearn.preprocessing import StandardScaler #from sklearn.neural_network import BernoulliRBM from sklearn.neighbors import KNeighborsClassifier from sklearn.svm import SVC from sklearn.tree import DecisionTreeClassifier from sklearn.ensemble import RandomForestClassifier, AdaBoostClassifier from sklearn.naive_bayes import GaussianNB from sklearn import metrics from sklearn import linear_model from sklearn.neural_network import MLPClassifier from sklearn.metrics import confusion_matrix from sklearn.decomposition import PCA from imblearn.over_sampling import RandomOverSampler from imblearn.under_sampling import ClusterCentroids,RandomUnderSampler from imblearn.over_sampling import SMOTE, ADASYN from collections import Counter import math h=0.2 # 读取训练数据 def readdata(): fake = pd.read_csv('fake.csv') real = pd.read_csv('real.csv') ALL=fake.append(real) all=ALL.drop(['Unnamed: 0'],axis=1) X=np.array(ALL) #X = StandardScaler().fit_transform(X) y=X[:,24] #y=np.append(np.zeros(fake.shape[0]),np.ones(real.shape[0])) X=X[:,1:-1] return X,y def allmodel(): classifiers = [ linear_model.LogisticRegression(C=1e5),#1 KNeighborsClassifier(5),#2 SVC(kernel="linear", C=0.025),#3 SVC(gamma='auto', C=1),#4 DecisionTreeClassifier(max_depth=5),#5 RandomForestClassifier(max_depth=5, n_estimators=10, max_features=1),#6 AdaBoostClassifier(),#7 GaussianNB(),#8 MLPClassifier(solver='lbfgs', alpha=1e-5,hidden_layer_sizes=(5, 2), random_state=1),#9 ] names = ['LogisticRegression',#1 "Nearest Neighbors", #2 "Linear SVM", #3 "RBF SVM",#4 "Decision Tree",#5 "Random Forest", #6 "AdaBoost",#7 "Naive Bayes",#8 'MLPClassifier',#9 ] index=['origional', "overSampler", 'underSampler', 'smotesampler', 'adasynsampler' ] return classifiers,names,index ######################## #print('%-15s %-15s %-15s'%('name','score','roc_auc','wrong')) def runmodel(input_x,input_y,index_name): X_train, X_test, y_train, y_test = train_test_split(input_x,input_y, test_size=.5, random_state=1) print("Method ACC AUC RECALL") for name, clf in zip(names, classifiers): # ax = plt.subplot(len(datasets), len(classifiers) + 1, i) clf.fit(X_train, y_train) score = clf.score(X_test, y_test) #confusion=confusion_matrix(y_test, clf.predict(X_test)) # re=metrics.recall_score(y_test, clf.predict(X_test), average=None)[0] #metrics.f1_score(y_test, clf.predict(X_test)) fpr, tpr, thresholds = metrics.roc_curve(y_test, clf.predict(X_test)) roc_auc = metrics.auc(fpr, tpr) print('%-20s, %f, %f, %f '%(name,score,roc_auc,re)) pre_score[name][index_name]=np.array([score,roc_auc,re]) # print('%-15s %-15s %-15s %-15s '%(name,score,roc_auc,sum(abs(clf.predict(X_test)-y_test)))) #,confusion) #pred = #print(metrics.classification_report(y_test, clf.predict(X_test))) ####################### def runmodel_tra(input_x,input_y,index_name): X_train, X_test, y_train, y_test = train_test_split(input_x,input_y, test_size=.5, random_state=1) X_test,y_test=X_train,y_train print("Method ACC AUC RECALL") for name, clf in zip(names, classifiers): # ax = plt.subplot(len(datasets), len(classifiers) + 1, i) clf.fit(X_train, y_train) score = clf.score(X_test, y_test) #confusion=confusion_matrix(y_test, clf.predict(X_test)) # re=metrics.recall_score(y_test, clf.predict(X_test), average=None)[0] #metrics.f1_score(y_test, clf.predict(X_test)) fpr, tpr, thresholds = metrics.roc_curve(y_test, clf.predict(X_test)) roc_auc = metrics.auc(fpr, tpr) print('%-20s, %f, %f, %f '%(name,score,roc_auc,re)) tra_score[name][index_name]=np.array([score,roc_auc,re]) ##################### def plot2(X,y,title): pca = PCA(n_components=2) newData=pca.fit_transform(X) cValue=[] for i in range(y.size): if y[i]==0: cValue.append('r') else: cValue.append('b') plt.scatter(newData[:,0], newData[:,1] , c=cValue, marker='o') #cmap=plt.cm.Paired title=title+str(sorted(Counter(y.astype(int)).items())) plt.title(title) plt.show() ################## def overSampler(X,y): ros = RandomOverSampler(random_state=0) X_resampled, y_resampled = ros.fit_sample(X, y) return X_resampled,y_resampled ################## def underSampler(X,y): cc = RandomUnderSampler(random_state=0) X_resampled, y_resampled = cc.fit_sample(X, y) return X_resampled,y_resampled ###################### def smotesampler(X,y): X_resampled_smote, y_resampled_smote = SMOTE().fit_sample(X, y) return X_resampled_smote, y_resampled_smote def adasynsampler(X,y): X_resampled_adasyn, y_resampled_adasyn = ADASYN().fit_sample(X, y) return X_resampled_adasyn, y_resampled_adasyn ####################### #sorted(Counter(y).items()) if __name__ == '__main__': classifiers,names,index=allmodel() X,y=readdata() X_resampled_over,y_resampled_over=overSampler(X,y) X_resampled_under,y_resampled_under=underSampler(X,y) X_resampled_smote, y_resampled_smote=smotesampler(X,y) X_resampled_adasyn, y_resampled_adasyn=adasynsampler(X,y) plot2(X,y,"All DATA(red=fake,blue=real)") plot2(X_resampled_over,y_resampled_over,"overSampler(red=fake,blue=real)") plot2(X_resampled_under,y_resampled_under,"underSampler(red=fake,blue=real)") plot2(X_resampled_smote, y_resampled_smote,"smote(red=fake,blue=real)") plot2(X_resampled_adasyn, y_resampled_adasyn,"adasyn(red=fake,blue=real)") pre_score=pd.DataFrame(index=index,columns=names) tra_score=pd.DataFrame(index=index,columns=names) runmodel(X,y,index[0]) runmodel(X_resampled_over,y_resampled_over,index[1]) runmodel(X_resampled_under,y_resampled_under,index[2]) runmodel(X_resampled_smote, y_resampled_smote,index[3]) runmodel(X_resampled_adasyn, y_resampled_adasyn,index[4]) runmodel_tra(X,y,index[0]) runmodel_tra(X_resampled_over,y_resampled_over,index[1]) runmodel_tra(X_resampled_under,y_resampled_under,index[2]) runmodel_tra(X_resampled_smote, y_resampled_smote,index[3]) runmodel_tra(X_resampled_adasyn, y_resampled_adasyn,index[4]) for name, clf in zip(names, classifiers): print('\n%-20s, %-15s, %s, %s '%(name,'pre_auc','tra_auc','alpha')) for index_name in index: pre_auc=pre_score[name][index_name][1] tra_auc=tra_score[name][index_name][1] myscore=-math.log(pre_auc/tra_auc) print('%-20s, %-15s, %f, %f, %f '%(name,index_name,pre_auc,tra_auc,myscore))

评论收藏

内容反馈