雷锋网消息,近日,第四届岭南眼科论坛暨第二届全国眼科人工智能大会在广州举办。大会以“Eye+AI”为主题,由广东省医师协会眼科分会、中国医药教育协会智能医学专委全国智能眼科学组主办,中山大学中山眼科中心、广东省医师协会眼科医师分会青年委员会、广东省眼科诊断与治疗创新工程技术研究中心承办。
本次大会设置了近80个主题演讲,与人工智能相关的主题有“AI技术与眼科实践”、“Eye+AI”、“眼科AI技术应用”,涉及青光眼、白内障、角膜病、糖尿病视网膜病变等多个关注度较高的病种。
目前,南方科技大学的唐晓颖教授与中山大学中山眼科中心的袁进教授进行合作,共同开发面向眼科的AI诊疗系统,系统的数据主要来自中山大学中山眼科中心,研究项目关注的病变主要有三类:出血、渗出以及微动脉瘤。
病变检测从本质上而言仍然属于目标检测领域,而目标检测不能绕开的一个话题就是深度学习技术。
唐晓颖表示,对于医学的任务而言,最重要的因素就是Big Data,而且是Big Good Data,数据的质量控制是非常重要的,医生在其中发挥重要作用。而手工标注的方式又会耗费医生大量时间,并且存在漏标和误标的问题。因此,团队的一个重要工作就是研究用自动化的方法对不精准的标注进行校正。
研究中最重要的一部分是如何模拟生成粗略标注数据。唐晓颖说到,由于IDRiD 数据集是像素级别的分割,所以对于任何一个病变,首先得到可以包含病变的最小长方形作为标注金标准,然后将标注金标准的长和宽随机扩大10%-50%,并在始终包含病灶的基础上做随机的平移,由此生成模拟的粗略标注数据集。
最后,在一种相对“粗糙”的标注方法下,团队生成了6164份训练集以及1436份数据集,回归网络模型训练后评估指标IoU达到0.8615。“将训练好的标注回归网络运用于粗略标注数据集,我们可以去生成一个标注更加精准的数据集。”
以下为唐晓颖教授的演讲内容,雷锋网做了不改变原意的编辑
唐晓颖:糖尿病视网膜病(Diabetic retinopathy ,DR)是全世界范围内首要的致盲因素。检测和诊断DR主要用到的检查方式是数字彩色眼底摄像。在我国需要被筛查和检查的眼底图像是非常巨大的,一方面是因为我们的病人数量非常多,另一方面专业的医生数量相对是比较少的。
回到我演讲报告的主题,我们为什么想要做一个眼底病变自动筛查工具?首先,因为DR的症状表现为眼底的病变,包括微动脉瘤和出血;其次DR的严重程度可以根据这些病变的位置,还有病变的数量去做一个判别,像我们下图里展示的这样。
然而对于一些微小的病变,像微动脉瘤,即使一名资深医生来鉴别,可能都特别容易忽视。在这种情况下,如果我们利用一些自动检测的算法,是否会达到一些比较好的效果?这是我们所研究方向的研究背景。
病变检测从本质上而言仍然属于目标检测领域,谈到目标检测我们不能绕开的一个话题—深度学习技术(Deep Learning )。最近几年随着计算机视觉的发展,深度学习的研究如火如荼,在计算机视觉的很多应用方向得到了非常成功的推广。
我们举三个简单的例子,一是行为识别,二是物体追踪,三是和我们更加相关的生物信号的检测,如虹膜识别。在这些目标检测的任务中,深度学习其实都做到了非常好的应用。
在我个人看来,深度学习有三个主要的要素。第一个是大数据(Big Data),第二个是高性能的计算机配置,第三个是如何去设计更加高级的深度学习模型。
对于医学的任务而言,我认为最重要的因素就是Big Data,而且是Big Good Data,像刚才杨院长所说,数据的质量控制是非常重要的。但是非常遗憾,在医学任务里面,特别是涉及到病变分割,要获得高质量的数据其实是非常难,所以研究者们一直在强调医学数据难以获取,非常宝贵。
以眼底病变的检测任务为例,如果我们想去做像素级别的分割,就是把眼底图像中每一个有病变的像素都标注出来。
对于很多医生来说,将眼底病变手工标注出来是非常耗时的。我们与中山眼科中心医生团队讨论过,对于这样的一张2D图像,医生如果想去做像素级的标注,手动的分割出来,可能需要花至少六个小时。
我们既需要这种高质量的数据,又需要数据量比较大,这个是很难同时去满足的。
我们的研究项目关注的病变主要是有三类,第一个是出血,第二个是渗出,第三个是微动脉瘤。所以我们采用了一个折中的方案。
我们让医生用图中这种圆圈尽量去把病变的区域框出来。相对于像素级标注来说,它要节约大概六倍的时间。在我们的项目中医生以这种方式手动地将病变画出来,比像素级别标注要轻松。
我们收集了590张眼底出血病变的数据集,600张渗出病变数据集,296张微动脉瘤数据集。这种标注方式相对比较粗糙,我们把它称之为coarse annotation。
Coarse annotation会带来一些问题。首先是这种画圈方式不是非常精准,我们也去看了很多张图像,发现实际病变比勾画的bounding box 更小,所以它是比较粗糙的标注。比如说图中的出血灶,还有下面这个图里的微动脉瘤,即使达不到像素级别的分割,标注框也需要改进。
第二个问题是我们发现医生在标注的时候,即使是这样比较粗略的一个标注方式,仍然会有漏标的情况存在,当然这也是在所有的手动标注工作里面都不可避免的一个问题。比如下面图里面,我们会发现有一些出血和渗出灶被医生漏标了。
第三个问题是有一些错误的标注,比如第一个图里面,医生把这一块用黄色框标注出来,认为它是出血,其实是摄像时候的伪影。第二个图是医生把出血误判为微动脉瘤。
以上是三类在医生手工标注工作中可能存在的问题,最好的办法是让不同的医生去标注和检查,最后达成一致。
但这样仍然是非常耗时的,也违背了我们的初衷。有没有可能用一种自动化的方法去把这些不精准的标注做校正呢?首先如果我们能够让数据集更准确,对后面的深度学习的结果肯定有很大提升;其次像素级分割的数据集是非常有限的,公共数据集的病人数量是非常少的;第三用同一来源的数据训练模型一般结果会更好。
我们的研究主要分为以下三个部分。首先将非精确标注的数据集进行改进,接着进行图像预处理,最后输入目标检测CNN模型进行训练,我们采用了目标检测领域一些经典的网络模型。
首先第一步就是怎么样去改进我们的粗略标注数据集。我们人工生成一组模拟粗略标注的数据集,并采用CLAHE预处理技术去增强眼底图片病灶的对比度。我们使用的是IDRiD 数据集来人工生成标注,这是一个像素级别标注的非常优质的数据集,主要包括出血等眼底病灶,但是只有81份数据。
下图是眼底图片采用CLAHE预处理前后对比,我们可以发现处理后病灶与正常区域的对比度明显增加,这是一种比较基础的做法,也有其他的方法可以达到这种效果,比如GAN技术。
接下来是我们研究中最重要的一部分,我们如何模拟生成粗略标注数据呢?由于IDRiD 数据集是像素级别的分割,所以对于任何一个病变,首先得到可以包含病变的最小长方形,作为标注金标准(ground-truth bounding box)。然后将ground-truth bounding box的长和宽随机扩大10%-50%,并在始终包含病灶的基础上做随机的平移,由此生成模拟的粗略标注数据集。
上述生成的数据分别有一组ground-truth bounding box和coarse bounding box。我们以coarse bounding box作为模型输入,ground-truth bounding box作为模型输出,来训练一个标注回归网络(Bounding box regression network )。
经过我们的这种处理,最后生成6164份训练集,1436份数据集,回归网络模型训练后评估指标IoU达到0.8615,是一个比较好的结果。右图中可以发现模型预测的病变标注框和金标准是比较接近的。
我们将训练好的标注回归网络运用于我们的粗略标注数据集,去生成一个标注更加精准的数据集。下图可以看出经回归网络改进后病变标注框更加精确和标准了,达到了我们想要的效果。
我们将上述标注经过refining的数据集输入目标检测模型中,经CNN提取特征图片,接着分为两个子网络,其中一个是目标定位,找到病变的位置,另一个是做病变分类,判断该病灶属于哪种病变。
目标检测模型我们采用经典的模型—RetinaNet ,在ResNet基础上建立特征金字塔网络(FPN),之后分成目标定位和目标分类两个子网络。其中我们用到两个技巧,一个是迁移学习,另一个是Label smoothing ,用来降低模型置信度。
这是我们最终的模型训练结果,可以看出相对于基础算法,叠用了CLAHE和Label smoothing 的方法,取得了更好的效果,mAP为54.13%。图中示例可见模型对眼底病变的检测效果比较理想,经过refined的训练数据的模型结果明显比原始数据好,此外,与医生手工标注相比,我们的模型还可以检测出一些漏标的病灶。
这些就是我今天要讲的内容,非常感谢我们眼科医生的合作团队,中山眼科中心袁进教授团队,以及我的课题组,主要包括中山大学和南方科技大学的学生们,谢谢大家!雷锋网(公众号:雷锋网)