# 对 EEG 数据进行聚类分析
## 实验内容:
采用任意 2 个聚类算法对 EEG 数据进行聚类分析,并分析聚类结果:
–算法参数与聚类结果的关系
–聚类结果与其它标签之间的关系等
## 实验数据:
EEG 数据库,共 533 个脑电信号,每个脑电信号由 160 维特征组成,这些信号是收集 27 名测试者观察 20 个视频所产生的脑电信号所得,每个信号对应的标记为观看视频的人 subjectID,视频 videoID,情感类别 emotion category, valence, arousal,共五种标记。其中 subjectID 有 27 个状态,videoID 有 20 种状态,emotion category 有 9 中状态,valence 有 2 中状态,arousal 有两种状态。
## 实验过程:
首先对 533*160 的特征数据进行归一化。然后分别使用 KMeans 和 GaussianMixture 对其进行聚类,设置超参数聚类个数分别为 9,27,20,2,2,对应已知的五种标记对应的状态数目。
由于两种聚类方法初始均需随机初始化参数或者聚核,所以我们分别进行了十次实验然后根据内部指标选择最佳的实验结果。
测试聚类效果的时候我们分别采用内部指标与外部指标。外部指标为 adjusted random index(ARI)。内部指标有所不同,对于 KMeans 我们采用 DBI 指数和类内误差的平均值,对于 GaussianMixture 我们采用 DBI 指数。其中 ARI 指数越大越好,DBI 指数越小越好,类内误差的平均值越小越好。同时为了比较聚为不同类别时的聚类效果,我们利用 MDS 降维方法来进行可视化处理。
## 实验结果:
----------------KMeans---------------
================1、Emotion Category==================
外部指标 ARI:0.0020467375297614806
内部指标 avg center distance:34.660456271469684
内部指标 DBI:1.5041799557881894
stress(n_components = 2):1079890.2144941238 数据降维时造成的距离的误差总和
![](https://www.writebug.com/myres/static/uploads/2021/12/29/6e4eeb2eecd4466b9d860a483a45c3aa.writebug)
================2、Subject ID==================
外部指标 ARI:0.7924484950900978
内部指标 avg center distance:16.418370754616443
内部指标 DBI:1.1394404321099192
stress(n_components = 2):1007730.9877045417
![](https://www.writebug.com/myres/static/uploads/2021/12/29/9aae13c99b3f454e26dbac631f3469c2.writebug)
================3、VideoID==================
外部指标 ARI:-0.02616458010765954
内部指标 avg center distance:21.365765457716037
内部指标 DBI:1.2578781806024335
stress(n_components = 2):1134649.2184728314
![](https://www.writebug.com/myres/static/uploads/2021/12/29/08e41008c92984fe4ba1dd24a67325e0.writebug)
================4、valence==================
外部指标 ARI:-0.002312831819365238
内部指标 avg center distance:69.4935622847214
内部指标 DBI:1.4951516844883002
stress(n_components = 2):1060398.7266490702
![](https://www.writebug.com/myres/static/uploads/2021/12/29/55b605224847a5f14108a430a8d19e25.writebug)
================5、arousal==================
外部指标 ARI:0.003130360396821968
内部指标 avg center distance:69.4935622847214
内部指标 DBI:1.4951516844883002
stress(n_components = 2):1157448.5527312672
![](https://www.writebug.com/myres/static/uploads/2021/12/29/346db98bdcb07e16c6522a9dd0e96c7a.writebug)
----------------GaussianMixture-----------------
================1、Emotion Category==================
外部指标 ARI:-0.0005029018983204495
内部指标 DBI:1.5451636606300023
stress(n_components = 2):1141952.4220823725
![](https://www.writebug.com/myres/static/uploads/2021/12/29/3223a4135889f2e44962888ce01efe2a.writebug)
================2、Subject ID==================
外部指标 ARI:0.8369225786270984
内部指标 DBI:1.1364962346551442
stress(n_components = 2):1007713.8592547531
![](https://www.writebug.com/myres/static/uploads/2021/12/29/12c34527fbcbffa34d77a55e6448d092.writebug)
================3、VideoID==================
外部指标 ARI:-0.02650091723277949
内部指标 DBI:1.2352222772700536
stress(n_components = 2):1105012.0670813427
![](https://www.writebug.com/myres/static/uploads/2021/12/29/589341c321b53477b80bf81751bc372e.writebug)
================4、valence==================
外部指标 ARI:-0.002239927863109331
内部指标 DBI:1.5193465665610577
stress(n_components = 2):1024772.0071349532
![](https://www.writebug.com/myres/static/uploads/2021/12/29/15142b1791c411120616b43f1ee2f09c.writebug)
================5、arousal==================
外部指标 ARI:0.0025774351776258015
内部指标 DBI:1.5193465665610577
stress(n_components = 2):1038575.8012245239
![](https://www.writebug.com/myres/static/uploads/2021/12/29/5de5428ea8401e52a7532cb758e967fc.writebug)
## 结果分析:
首先观察内部指标,如果内部指标效果很差,这说明聚类结果没有实际意义,如果内部指标效果很好,这说明聚类结果反映了某种指标下的分类情况,有实用意义,此时如果给定某种参考指标,然后得到的 ARI 指数也比较好的话,说明聚类情况近似反映了这种指标,否则只能说明聚类反映的情况与参考指标不符。
在本问题中,从可视化图中的第一幅子图,除了聚为 27 类时,其余的聚类效果均不错,空间上距离比较近的聚为了一类。对比每幅图中的两幅子图可以发现,聚为 27 类时,聚类结果与 subjectID 标记相近,尤其是两种聚类方法的外部指标 ARI 均在 0.80 附近,可以认为此时聚类结果近似反映了 subjectID,或者说 subjectID 关于这些特征在特种空间中的分布具有集群性。所以得出结论,将特征按照 subjectID 聚为 27 类比较合适,即测试者对于该问题的直接聚类具有非常大的影响,不同人的 EEG 脑电波有着显著的差别。
没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
实验内容: 采用任意 2 个聚类算法对 EEG 数据进行聚类分析,并分析聚类结果: –算法参数与聚类结果的关系 –聚类结果与其它标签之间的关系等 实验数据: EEG 数据库,共 533 个脑电信号,每个脑电信号由 160 维特征组成,这些信号是收集 27 名测试者观察 20 个视频所产生的脑电信号所得,每个信号对应的标记为观看视频的人 subjectID,视频 videoID,情感类别 emotion category, valence, arousal,共五种标记。其中 subjectID 有 27 个状态,videoID 有 20 种状态,emotion category 有 9 中状态,valence 有 2 中状态,arousal 有两种状态。
资源推荐
资源详情
资源评论
收起资源包目录
100012179-基于Pthon对 EEG 数据进行聚类分析.zip (35个子文件)
eeg-cluster
Application.py 2KB
聚类作业.docx 9.32MB
data
__init__.py 49B
DEAP
README.txt 1KB
EEG_feature.txt 3.15MB
valence_arousal_label.txt 5KB
subject_video.txt 7KB
MAHNOB-HCI
README.txt 1KB
EEG_feature.txt 1.38MB
EEG_emotion_category.txt 1KB
valence_arousal_label.txt 2KB
subject_video.txt 3KB
LICENSE 1KB
visualization.py 815B
README.txt 222B
.idea
vcs.xml 180B
misc.xml 288B
inspectionProfiles
profiles_settings.xml 174B
modules.xml 274B
.gitignore 39B
EEG-Cluster.iml 440B
Clusterer.py 2KB
README.docx-md
3-f84f665e8cb7f799cc29e12de6f314bf.png 1009KB
5-8e5da84771598986a2dc3bce8f5fca8d.png 877KB
2-dde7345bd9d43f2d3cfa21dbbe4c0ddf.png 997KB
8-4d467735cf23ca0880c010818fc0c645.png 1.01MB
1-210e8de1ec3d016ce2284a313231e00b.png 945KB
10-35a4e8e65010037d8557e46d0e428b02.png 863KB
9-37aa639bc05f18b4d0ad90d8e255bf6d.png 895KB
6-429863e6c7a359c14abcbc38944d4d76.png 967KB
7-64452d670be87766e97019a6ec0b8c8b.png 1022KB
4-7a95593da1864e5a9512e138370a5d32.png 830KB
.gitignore 2KB
README.md 6KB
config.py 603B
共 35 条
- 1
资源评论
- m0_750402702024-02-06发现一个宝藏资源,赶紧冲冲冲!支持大佬~
神仙别闹
- 粉丝: 2925
- 资源: 7422
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 订阅OnlyFans指南.pdf
- 23552679郭磊.zip
- RabbitMQ的介绍与安装使用
- report ETL .ffff
- 大数据+机器学习+机器学习问题引出
- 西门子s7 200smart与3台欧姆龙E5cc温控器通讯控 功能:可以直接应用现场 实现西门子s7 200smart对3台欧姆
- 《图书管理系统》JavaSE:循环、判断
- Matlab 车辆配送路径规划问题 四大算法解决旅行商问题(TSP) CVRP CDVRP VRPTW tsp:旅行商问题,寻
- 交直流混合微网程序matlab 采用拉丁超立方抽样和多场景缩减,考虑风光等随机性建模,利用粒子群算法,计算得到三个微网的优化程序
- CListTextElementUI支持按列设置颜色:通过SetTextColor或者IListCallbackUI设置
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功