行业动态

m6在线登陆·肽积木CEO柏文洁：AI 医学影像的三大技术实战、

发布时间：2024-05-19 09:45:44 来源：M6官网注册作者：M6米乐手机登录APP入口

　　近日，雷锋网AI掘金志邀请到了肽积木科技CEO柏文洁，为大家深入讲解《AI 医学影像的三大技术实战、优劣与经验》。

　　作为一名处在AI医学影像产业一线的管理者和算法研究者，柏文洁立足实践经验，在120分钟的分享里为500多位资深医疗人工智能专业人士剖析了医疗影像AI的实战方法与案例，并重点分析了分类网络、图像切割网络、GAN网络在医疗影像中的应用及其优缺点。

　　柏文洁指出，虽然从逻辑上理解，分类网络比较简单，但从解决问题的角度来说，分类问题是远期目标，短期内难以应用。病灶标识和视频跟踪并不直接对疾病进行判别，只是作为医生的一种辅助，相对容易实现，是AI应用的中期目标。

　　柏文洁，北京肽积木科技有限公司创始人&CEO，大数据领域的连续创业者，知名大数据公司信柏科技、时趣互动运营核心创始成员。AI算法工程师，独创的LP-NET算法在医疗影像病灶识别方面取得国际领先水平。

　　柏文洁指出，在普通民众看来，医疗AI应该能替代医生，但现有的深度学习算法主要还是对传统方案的优化，是一些新的工具。这些新的工具未来有可能发生质变，但还需要我们的共同努力。

　　AI医疗影像作为AI切入医疗的突破口，仍然只是传统医疗流程中的一部分，对医疗影像的判读是医生诊断治疗的参考依据之一。现有的AI医疗影像还无法构成一个闭环，完成对患者的诊断及治疗方案规划。因此AI必须先融入到医疗环节之中，才能提升医疗效率和降低成本。

　　目前绝大多数AI医疗影像创业公司都是技术背景出身，融入医疗环节相对比较困难，普遍会遭遇三个问题：

　　数据坎：一方面，创业公司通过和三甲医院合作获取的数据无法直接使用，面临数据标记的难题。另一方面，如果创业公司的产品没有融入到医院的业务流程中，就无法获得长期、持续、有效的数据。

　　渠道坎：CFDA认证是医疗行业的一道硬性门槛。虽然近期CFDA对医疗AI产品有逐步开放的趋势，但要通过认证还是非常困难的，而且过程十分漫长。没有CFDA认证，就无法形成稳定的营销渠道，也很难给渠道商足够的利润空间去推广产品。

　　硬件坎：在医疗场景中，很多时候AI必须结合硬件使用，而且也只有通过硬件，AI才能够获取相应的价值。目前很多人脸识别厂商已经开始做摄像头之类的硬件产品了。

　　从更高的维度来说，AI应用于诊断环节能够产生的社会价值是低于治疗环节的。医生最关注的还是如何更加高效地，以更低的成本治病救人。

　　尽管面临诸多挑战，但柏文洁认为AI在医疗行业的应用前景仍然是潜力无限的。现有的传统医疗环节中，可被AI提升和改造的地方非常多。如果我们能把AI的能力应用到这些场景中，将对整个行业产生极大的提升，正如大数据对对传统行业所产生的影响那样。

　　柏文洁首先对AI在医疗影像中的应用进行了一番梳理。她介绍道，医疗影像主要有放射性影像（X光、CT、MRI、OCT等），超声、彩超检测，病理检测，内窥镜检测，高倍拍照（主要针对眼底、皮肤）等几种类型。

　　针对这些不同类型的医疗影像，又主要有分类、标记、切割和序列四种处理方式，它们分别对应的范围为图像、区域、像素和视频。以传统的CAD问题拓展出更好的结果，这是目前应用比较广的热点问题。

　　柏文洁认为，虽然从逻辑上理解，分类网络比较简单，但从解决问题的角度来说，分类问题是远期目标，短期内反而难以应用。因为我们最终要做的是判断患者有没有疾病，而现有的技术还很难对疾病进行非常准确的判别。

　　病灶标识和视频跟踪并不直接对疾病进行判别，只是作为医生的一种辅助，因此是AI应用的中期目标。

　　分类网络应用于医疗影像，优点非常明显——简单明确而且有很多预训练结果。基于这些结果可以做进一步的预训练和迁移学习。

　　二、针对小病灶的分类容易产生偏差。过去的分类模型都是对猫、狗等较大的物体进行分类，相对比较容易。

　　三、分类标注往往不具备客观性。如果有解剖金标准做为依据，分类是比较简单的，但在实际应用场景中，很多分类标准不具备客观性，而是受医生的个人情况和医院的知识传承影响。

　　四、可解释性差。在医生给出分类标准的前提下，算法的分类结果与医生可能存在一定的差异，无法令人信服。

　　柏文洁认为，图像切割是AI在医疗影像中应用最丰富的场景。因为医生在诊断和治疗过程中经常需要将病灶区域清楚地描绘出来，为后续提供指导意义和价值。但在一些特殊情况下——尤其是在一些X光片中，边界非常模糊无法进行图像切割，只好用物体识别的方法。

　　目前图像切割的主流做法有三种：编解码结构、孔洞卷积和条件随机场。其中Unet是最主流的网络之一，也是首个应用于医学案例的FCN网络，是深度学习用于图像切割的早期重要论文。

　　首先是大内核，它解决的核心问题是，在FCN的同时对多个物体进行切分，然后进行分类。这种情况下，小内核对整体信息的把握是不够的。

　　其次是PSPnet。PSPnet会把整张图切成四等份再做pooling，这样的好处是可以获取全局的信息。

　　MaskRCNN也是比较新的，它实际上整合了物体识别优势和方法。柏文洁表示很看好这种方法，正在积极探索其在医疗领域的具体应用方法。

　　Unet适用于边缘明确的组织和病灶，但它也存在一些不足：首先数据量严重不足，数据标记很难获取；其次病灶类别具有天然的不均衡性。网络上的很多公开数据库都是对数、汽车之类的物体进行分割，这类物体在图片中的占比很高，实践起来相对容易。但病灶在图片中的面积占比通常非常小。以眼底图像为例，用FCN直接训练眼底图，一不小心就可能训练成全阴性的网络。

　　今年GAN网络十分火热，不停有人发布新的GAN网络。但GAN网络在医疗领域的应用目前还非常有限的。

　　柏文洁认为，GAN网络在医疗领域其实是有一些应用场景的，比如图像切割和增强样本。众所周知，GAN网络一半用于生成一半用于判别，比如我们可以用GAN网络生成图片的一部分或者一个眼镜。图像的标记本质上也是一种信息生成，在此基础上可以做后期溯源。

　　既然GAN网络可以生成图像和标记，那么是不是也可以生成更多的数据和病灶，解决数据不足的问题呢？

　　目前业界正在对GAN网络进行积极探索，可惜迄今为止在医疗领域尚未诞生特别有影响力的论文。用GAN网络生成的伪样本还缺少足够的实用价值。这主要是因为大家对于GAN网络内在机理的探索还不够。

　　Q：从医院获取的图像中，经常有测量结节大小的“+”或“×”字标记，这种图像对训练网络有影响吗？

m6在线登陆

上一篇：AI将视网膜成像速度提高百倍--健康·生活--人民下一篇：今日 Paper 随机微分方程；流式自动语音识别；