行业动态

m6在线登陆·肽积木CEO柏文洁:AI 医学影像的三大技术实战、

发布时间:2024-05-19 09:45:44 来源:M6官网注册 作者:M6米乐手机登录APP入口

  近日,雷锋网AI掘金志邀请到了肽积木科技CEO柏文洁,为大家深入讲解《AI 医学影像的三大技术实战、优劣与经验》。

  作为一名处在AI医学影像产业一线的管理者和算法研究者,柏文洁立足实践经验,在120分钟的分享里为500多位资深医疗人工智能专业人士剖析了医疗影像AI的实战方法与案例,并重点分析了分类网络、图像切割网络、GAN网络在医疗影像中的应用及其优缺点。

  柏文洁指出,虽然从逻辑上理解,分类网络比较简单,但从解决问题的角度来说,分类问题是远期目标,短期内难以应用。病灶标识和视频跟踪并不直接对疾病进行判别,只是作为医生的一种辅助,相对容易实现,是AI应用的中期目标。

  柏文洁,北京肽积木科技有限公司创始人&CEO,大数据领域的连续创业者,知名大数据公司信柏科技、时趣互动运营核心创始成员。AI算法工程师,独创的LP-NET算法在医疗影像病灶识别方面取得国际领先水平。

  柏文洁指出,在普通民众看来,医疗AI应该能替代医生,但现有的深度学习算法主要还是对传统方案的优化,是一些新的工具。这些新的工具未来有可能发生质变,但还需要我们的共同努力。

  AI医疗影像作为AI切入医疗的突破口,仍然只是传统医疗流程中的一部分,对医疗影像的判读是医生诊断治疗的参考依据之一。现有的AI医疗影像还无法构成一个闭环,完成对患者的诊断及治疗方案规划。因此AI必须先融入到医疗环节之中,才能提升医疗效率和降低成本。

  目前绝大多数AI医疗影像创业公司都是技术背景出身,融入医疗环节相对比较困难,普遍会遭遇三个问题:

  数据坎:一方面,创业公司通过和三甲医院合作获取的数据无法直接使用,面临数据标记的难题。另一方面,如果创业公司的产品没有融入到医院的业务流程中,就无法获得长期、持续、有效的数据。

  渠道坎:CFDA认证是医疗行业的一道硬性门槛。虽然近期CFDA对医疗AI产品有逐步开放的趋势,但要通过认证还是非常困难的,而且过程十分漫长。没有CFDA认证,就无法形成稳定的营销渠道,也很难给渠道商足够的利润空间去推广产品。

  硬件坎:在医疗场景中,很多时候AI必须结合硬件使用,而且也只有通过硬件,AI才能够获取相应的价值。目前很多人脸识别厂商已经开始做摄像头之类的硬件产品了。

  从更高的维度来说,AI应用于诊断环节能够产生的社会价值是低于治疗环节的。医生最关注的还是如何更加高效地,以更低的成本治病救人。

  尽管面临诸多挑战,但柏文洁认为AI在医疗行业的应用前景仍然是潜力无限的。现有的传统医疗环节中,可被AI提升和改造的地方非常多。如果我们能把AI的能力应用到这些场景中,将对整个行业产生极大的提升,正如大数据对对传统行业所产生的影响那样。

  柏文洁首先对AI在医疗影像中的应用进行了一番梳理。她介绍道,医疗影像主要有放射性影像(X光、CT、MRI、OCT等),超声、彩超检测,病理检测,内窥镜检测,高倍拍照(主要针对眼底、皮肤)等几种类型。

  针对这些不同类型的医疗影像,又主要有分类、标记、切割和序列四种处理方式,它们分别对应的范围为图像、区域、像素和视频。以传统的CAD问题拓展出更好的结果,这是目前应用比较广的热点问题。

  柏文洁认为,虽然从逻辑上理解,分类网络比较简单,但从解决问题的角度来说,分类问题是远期目标,短期内反而难以应用。因为我们最终要做的是判断患者有没有疾病,而现有的技术还很难对疾病进行非常准确的判别。

  病灶标识和视频跟踪并不直接对疾病进行判别,只是作为医生的一种辅助,因此是AI应用的中期目标。

  分类网络应用于医疗影像,优点非常明显——简单明确而且有很多预训练结果。基于这些结果可以做进一步的预训练和迁移学习。

  二、针对小病灶的分类容易产生偏差。过去的分类模型都是对猫、狗等较大的物体进行分类,相对比较容易。

  三、分类标注往往不具备客观性。如果有解剖金标准做为依据,分类是比较简单的,但在实际应用场景中,很多分类标准不具备客观性,而是受医生的个人情况和医院的知识传承影响。

  四、可解释性差。在医生给出分类标准的前提下,算法的分类结果与医生可能存在一定的差异,无法令人信服。

  柏文洁认为,图像切割是AI在医疗影像中应用最丰富的场景。因为医生在诊断和治疗过程中经常需要将病灶区域清楚地描绘出来,为后续提供指导意义和价值。但在一些特殊情况下——尤其是在一些X光片中,边界非常模糊无法进行图像切割,只好用物体识别的方法。

  目前图像切割的主流做法有三种:编解码结构、孔洞卷积和条件随机场。其中Unet是最主流的网络之一,也是首个应用于医学案例的FCN网络,是深度学习用于图像切割的早期重要论文。

  首先是大内核,它解决的核心问题是,在FCN的同时对多个物体进行切分,然后进行分类。这种情况下,小内核对整体信息的把握是不够的。

  其次是PSPnet。PSPnet会把整张图切成四等份再做pooling,这样的好处是可以获取全局的信息。

  MaskRCNN也是比较新的,它实际上整合了物体识别优势和方法。柏文洁表示很看好这种方法,正在积极探索其在医疗领域的具体应用方法。

  Unet适用于边缘明确的组织和病灶,但它也存在一些不足:首先数据量严重不足,数据标记很难获取;其次病灶类别具有天然的不均衡性。网络上的很多公开数据库都是对数、汽车之类的物体进行分割,这类物体在图片中的占比很高,实践起来相对容易。但病灶在图片中的面积占比通常非常小。以眼底图像为例,用FCN直接训练眼底图,一不小心就可能训练成全阴性的网络。

  今年GAN网络十分火热,不停有人发布新的GAN网络。但GAN网络在医疗领域的应用目前还非常有限的。

  柏文洁认为,GAN网络在医疗领域其实是有一些应用场景的,比如图像切割和增强样本。众所周知,GAN网络一半用于生成一半用于判别,比如我们可以用GAN网络生成图片的一部分或者一个眼镜。图像的标记本质上也是一种信息生成,在此基础上可以做后期溯源。

  既然GAN网络可以生成图像和标记,那么是不是也可以生成更多的数据和病灶,解决数据不足的问题呢?

  目前业界正在对GAN网络进行积极探索,可惜迄今为止在医疗领域尚未诞生特别有影响力的论文。用GAN网络生成的伪样本还缺少足够的实用价值。这主要是因为大家对于GAN网络内在机理的探索还不够。

  Q:从医院获取的图像中,经常有测量结节大小的“+”或“×”字标记,这种图像对训练网络有影响吗?


m6在线登陆
亮照