# 项目说明
## 简介
本次项目中完成病理图像识别诊断,用卷积神经网络代替病理专家和医护人员识别出病理图像中所有带恶性病灶的区域。
若存在恶性病灶,快速精准判断出病灶大小及扩散程度,帮助患者确定肿瘤的侵略性分级。
## 项目背景
**病理检查是当代最为可靠的肿瘤性质确诊方式,其结果就是临床的最后诊断**,**病理图像就是病变组织在光学显微镜下所呈现的形态图像**,病理学家需要观察该图像判定肿瘤的性质(良性/恶性,如果恶性具体是什么病变亚型),同时也需要判定肿瘤的侵略性分级(早期/中期/晚期)。然而,为执行病理检查,患者需要在疑似肿瘤的组织上提取部分细胞或器官。若肿瘤为恶性,此行为相当于在癌变组织上创造一个伤口,携带癌细胞的血液会外溢并扩散至全身,极大程度地提升癌症转移可能性、降低患者生存概率。
因此,能够迅速、准确地做出病理诊断,对癌症患者具有极大的意义。
![](imgs/01.png)
**使用卷积神经网络代替病理专家和医护人员,识别出病理图像中所有带恶性病灶的区域**。如上图所示,左侧是带有恶性病灶的原始图像,右侧则是通过深度学习完成的像素级识别。在原始图像中,病理专家人为绘制了绿色线作为标签,绿色线内部的像素则被标记为恶性病灶(标记为1),绿色线外部的像素则被标记为非恶性病灶(标记为0)。
深度学习的工作是利用卷积神经网络精准判断出带有恶性病灶的**像素块**,以判断病理图像中是否含有恶性病灶,若存在恶性病灶,也可快速精准判断出病灶大小及扩散程度,帮助患者确定肿瘤的侵略性分级。
所使用的数据是美国国家生物技术信息中心(NCBI)所提供真实的复现浸润性导管癌(IDC)病理检查图像,由搭载标本的整体载玻片按40倍放大扫描而来,图像的像素大约在200w~400w之间(图片大小为**1200\*1920**以上)。该数据的完整版本首次出现于哥伦比亚大学的论文《使用卷积神经网络自动检测病理图像中的浸润性导管癌》,**使用卷积神经网络代替病理专家和医护人员,识别出病理图像中所有带恶性病灶的区域**。在原始图像中,病理专家人为绘制了绿色线作为标签,绿色线内部的像素则被标记为恶性病灶(标记为1),绿色线外部的像素则被标记为非恶性病灶(标记为0)。
深度学习的工作,就是利用卷积神经网络精准判断出带有恶性病灶的像素块,以判断病理图像中是否含有恶性病灶,若存在恶性病灶,也可快速精准判断出病灶大小及扩散程度,帮助患者确定肿瘤的侵略性分级。Kaggle联合美国国家医学图书馆共同整理、披露了**部分患者**数据,专供深度学习研究者使用。
为实现**像素级**识别,研究团队在论文当中将所有图像切分成了50x50的方片数据(patch)。每个文件夹内部即是标签为0和为1的文件夹,其中标签0表示非恶性病灶,标签1表示恶性病灶。
【注】像素级说明,本次数据集中患者基本都带病灶肿瘤图像,不是判断患者是否患癌,而是要把组织图像切分成patch,判断每个小块中是否存在恶性病灶以及它的大小。
## 最终目标
在本次项目中,**目标是超越论文《使用卷积神经网络自动检测病理图像中的浸润性导管癌》中呈现的结果**。在论文当中,哥伦比亚大学使用了F1分数与平衡后的准确率(Balanced Accuracy,简写为BAC)。
- 将论文中提供的最好结果作为benchmark
| | 精确度<br>Pr | 召回率/敏感度<br>Rc/Sen | 特异度<br>Spc | F1分数 | BAC |
| :----: | :----------: | :---------------------: | :-----------: | :----: | :----: |
| ColUni | 0.6540 | 0.7960 | 0.8886 | 0.7180 | 0.8423 |
其中,两个核心评估指标的计算公式为:
$$
F1 = \frac{2* Pr * Rc}{Pr + Rc} \\
BAC = \frac{Sen + Spc}{2}
$$
- **特异度**(Specificity,也称为真阴性率)是指实际为阴性的样本中,判断为阴性的比例(例如真正未生病的人中,被医院判断为未生病者的比例),计算方式是真阴性除以真阴性+假阳性(实际为阴性,但判断为阳性)的比值
通常是向着某个损失最小化的方向训练卷积神经网络,因此PyTorch中默认提供的迭代目标基本都是损失函数。为保持与论文中评估指标一致,可以自定义损失及评估指标。
## 基于OpenCV批量分片高像素影像
为了更加精确的诊断和治疗,医疗影像往往是大像素(1920x1080)或超大像素图像(4k图像4096x2160)。这类图像的尺寸与深度学习实验数据常见尺寸(227x227,或32x32)有巨大的差别,不仅对网络的深度要求更高,所需的算力、内存、运算时间等成本也会更高。
因此,在处理医疗图像或遥感图像这样的高像素图像时,往往都需要将其批量处理成小像素方片,并针对每一个方片进行识别或预测。
编写了批量读取文件图片的方法`load_images_from_folder(folder)`与对图像进行批量分片的方法`extract_images_from_folder(folder)`,确保对**同一个文件夹下所有分级下目录的图像进行读取**。
详细代码见` 01_医学影像识别_数据探索.ipynb `
## 数据探索与可视化
- **探索数据量/数据结构**,包括图像的尺寸、数量、通道数以确认所需的**算力、架构深度以及验证策略**
- **可视化图像**,确认图像中的具体内容,以确定所需要使用的**预处理方法**
- **标签分布探索**,探索类别数量、样本均衡情况,以确定迭代用的**损失函数**,以及**是否进行均衡处理**
对于被分片的病理图像需要:
- **查看完整数据的尺寸**,以判断切除的病灶大小,**切除病灶越小,说明患者的生存率越大**
- **可视化完整数据**,对病理数据来说,特别的需要确定恶性病灶的占比
详细代码见` 01_医学影像识别_数据探索.ipynb `
## 数据导入
利用sklearn中`train_test_split`方法进行数据集切分。
编写了读取自定义数据集的类` CustomDataset`,借助整理好的dataframe读取IDC医疗病理图像数据集的标签和图像格式。
详细代码见`02_医学影像识别_数据增强.ipynb`
## 病理图像数据增强的两个方向
在计算机视觉领域,**不同类型的图像需要使用不同的预处理/增强方式,这主要是因为不同图像成像过程存在的干扰因素是大不相同的**。医疗数据当中,病理图像、超声图像和核磁图像需要完全不同的处理方式。
通常来说,对一类图像最有效的数据增强方法必须经过实验得出。
病理图像是搭载标本的整体载玻片扫描而得,载玻片上的组织需要经过染色后才能够放到显微镜下进行观察。最经济实惠的染色方法是H&E染色,其中H是苏木素(haematoxylin,可以将细胞核染色),E是伊红(eosin,可以将细胞液染色),因此病理图像、组织图像往往呈现红色。在进行基础数据探索时发现,**恶性病灶的颜色往往比良性病灶颜色更深**,在病理图像识别应用中面临的一大挑战是:**如何排除不同实验室、不同专业人员、不同批次染色剂、不同扫描仪器、不同玻片原材料、不同组织对颜色的响应程度等等因素而引起的颜色差异,而实现正确的识别**。
在应用时主要从以下两个方向来提升病理模型的泛化能力:
- **提升样本的多样性**(increase diversity):由于病理图像存在染色差
没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
基于卷积神经网络的医学病理图像识别项目源码+数据集.zip 已获导师指导并通过的高分项目,代码完整下载可用。 基于卷积神经网络的医学病理图像识别项目源码+数据集.zip 已获导师指导并通过的高分项目,代码完整下载可用。基于卷积神经网络的医学病理图像识别项目源码+数据集.zip 已获导师指导并通过的高分项目,代码完整下载可用。基于卷积神经网络的医学病理图像识别项目源码+数据集.zip 已获导师指导并通过的高分项目,代码完整下载可用。基于卷积神经网络的医学病理图像识别项目源码+数据集.zip 已获导师指导并通过的高分项目,代码完整下载可用。基于卷积神经网络的医学病理图像识别项目源码+数据集.zip 已获导师指导并通过的高分项目,代码完整下载可用。基于卷积神经网络的医学病理图像识别项目源码+数据集.zip 已获导师指导并通过的高分项目,代码完整下载可用。基于卷积神经网络的医学病理图像识别项目源码+数据集.zip 已获导师指导并通过的高分项目,代码完整下载可用。基于卷积神经网络的医学病理图像识别项目源码+数据集.zip 已获导师指导并通过的高分项目,代码完整下载可用。基于卷积神经网络的医学
资源推荐
资源详情
资源评论
收起资源包目录
基于卷积神经网络的医学病理图像识别项目源码+数据集.zip (646个子文件)
events.out.tfevents.1684962356.XGU96JHPUBWHNYL.15032.10 596B
events.out.tfevents.1684962679.XGU96JHPUBWHNYL.15032.11 566B
events.out.tfevents.1684962679.XGU96JHPUBWHNYL.15032.12 566B
events.out.tfevents.1684962679.XGU96JHPUBWHNYL.15032.13 566B
events.out.tfevents.1684962679.XGU96JHPUBWHNYL.15032.14 566B
data_info.csv 693KB
data_train.csv 555KB
data_val.csv 137KB
training_results.csv 103B
.DS_Store 8KB
.DS_Store 6KB
.DS_Store 6KB
.DS_Store 6KB
.DS_Store 6KB
.DS_Store 6KB
6152a275ad4b4ac20cd2e21a_roboflow-annotate.gif 718KB
.gitignore 176B
MRI_Project.iml 470B
U-Net迁移学习.ipynb 1.76MB
U-Net注意力机制.ipynb 1.65MB
03_医学影像识别_基于GANs完成色彩标准化-checkpoint.ipynb 1.65MB
03_医学影像识别_基于GANs的染色标准化-checkpoint.ipynb 1.65MB
03_医学影像识别_基于GANs的染色标准化.ipynb 1.65MB
04_医学影像识别_Unet.ipynb 1.32MB
04_医学影像识别_Unet-checkpoint.ipynb 1.32MB
02_医学影像识别_自定义数据集&数据增强.ipynb 889KB
02_医学影像识别_自定义数据集&数据增强-checkpoint.ipynb 889KB
imgaug与skimage实现色彩增强.ipynb 888KB
基于imgaug与skimage实现色彩增强-checkpoint.ipynb 887KB
imgaug与skimage实现色彩增强-checkpoint.ipynb 887KB
02_医学影像识别_数据增强-checkpoint.ipynb 887KB
03_医学影像识别_自编码家族.ipynb 871KB
03_医学影像识别_自编码家族-checkpoint.ipynb 871KB
DeepLab_v3_plus.ipynb 807KB
DeepLab_v3_plus-checkpoint.ipynb 806KB
01_医学影像识别_数据探索.ipynb 522KB
01_医学影像识别_数据探索-checkpoint.ipynb 522KB
DeepLab_v3+-checkpoint.ipynb 158KB
U-Net复现.ipynb 147KB
model_visulize.ipynb 12KB
model_visulize-checkpoint.ipynb 12KB
loss.jpg 203KB
iou-dice.jpg 77KB
微信图片_20230421194312.jpg 42KB
log.log 25KB
UNetResNet34_512_v1_seed2019.log 9KB
UNetResNet34_512_v1_seed2018.log 447B
README.md 13KB
README-checkpoint.md 12KB
00_医疗影像分割综述.md 11KB
医学影像_seg.md 10KB
README.md 10KB
医学影像_1.md 9KB
00_通用场景下的语义分割.md 7KB
链接.md 944B
Segment_Anything_wrapper.pdf 14.93MB
72_tailoring_automated_data_augme.pdf 12MB
1710.08543.pdf 4.5MB
tell-18-a.pdf 4.44MB
1902.09383.pdf 4.42MB
Automatic_detection_of_invasive_ductal_carcinoma_in_whole.pdf 3.28MB
Hashimoto_Multi-scale_Domain-adversarial_Multiple-instance_CNN_for_Cancer_Subtype_Classification_with_Unannotated_CVPR_2020_paper.pdf 1.48MB
Khattar_Cross-Domain_Multi-Task_Learning_for_Object_Detection_and_Saliency_Estimation_CVPRW_2021_paper.pdf 1.19MB
nnunet.pdf 252KB
image-20230501163642328.png 1.81MB
微信截图_20230427113652.png 1.25MB
image-20230502152740839.png 829KB
image-20230502151443579.png 795KB
12.png 737KB
image-20230502103702022.png 725KB
06.png 708KB
14.png 682KB
微信截图_20230427112407.png 673KB
10.png 650KB
微信截图_20230426234524.png 620KB
22.png 599KB
08.png 589KB
11.png 587KB
15.png 587KB
09.png 586KB
21.png 586KB
18.png 586KB
02.png 585KB
19.png 585KB
05.png 584KB
16.png 584KB
07.png 584KB
13.png 584KB
17.png 584KB
03.png 584KB
23.png 584KB
image-20230429174458328.png 574KB
image-20230429175015904.png 539KB
image-20230502104106401.png 523KB
04.png 521KB
image-20230427115133146.png 518KB
image-20230429170921265.png 516KB
微信截图_20230501163606.png 497KB
image-20230502154025999.png 496KB
image-20230427120433182.png 487KB
共 646 条
- 1
- 2
- 3
- 4
- 5
- 6
- 7
猰貐的新时代
- 粉丝: 1w+
- 资源: 2497
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
- 1
- 2
前往页