• 您的网站试用资格将于 2028-01-08 到期。

腾讯的“移动互联网+AI”,正通往移动医疗

发表时间:2018-01-08 00:00

 BAT 们与各路资本齐齐砸下血本,对这个 AI 技术当下最热门的垂直场景之一发起了多轮攻势。AI 与医疗的双高门槛,是区别于两年前移动医疗热潮的最重要因素之一。但是,将上一轮移动医疗热情彻底浇灭的那些教训,却仍然值得此轮医疗创业者借鉴。


  当下,移动医疗从 2015 年下旬开始经历的那一场突然而又漫长的寒冬,已基本无人谈起。

  “那是 2015 年吧,移动医疗就已经死了一批了,有些融完 A 轮就不行了。后来慢慢的,相比移动医疗,大家就开始更多地用“数字医疗”这个词了。”这是一位从 2014 年就开始深入调查分析医疗创业项目的分析师给到我们的碎片式回忆。

  实际上,早在 2016 年 10 月,动脉网根据深入调查而出具的一份名为《互联网医疗生存报告:38 家企业为什么死去?》的医疗创业项目倒闭白名单,曾轰动一时。

  其中,技术含量不高导致的创业同质化,对医疗工作流程特殊性的错误理解,监管层面的约束,对市场的忽视,以及过高的估值与资本介入,都是那时候医疗创业者用血与泪换来的教训。

  2016 年中旬左右,几乎像是一场足球比赛上下场的转换,AI+医疗强势崛起。这个难得让 BAT 与资本们共同找到兴奋点的医疗新赛道,在过去不到 2 年的时间里,孕育出超过 100 家以医疗为重点的 AI 创业公司。

  如果再快进到 2017 年,你会发现在过去的 9 个月中,国内外以医疗为重点的 AI 创业公司获得融资的频率几乎可以媲美曾红极一时的“共享充电宝”。其中,“医疗影像自动化诊断”算是一个近期各家“齐头并入”的热门应用场景。

  当然,与曾经同质化严重的移动医疗相比,极高的 AI 门槛加上极高的医疗门槛,让进入 AI 医疗界的一众创始人们一开始就似乎有了“睥睨天下”的资本。

  业内人士,算法专家,海归博士……与其他 AI 创业公司并无太多差异,技术与研发当仁不让成为公司宣传的核心;而资本方也难得进入“高僧打坐”模式,只是“期待”,闭口不谈商业模式与盈利要求。

  那么,一个如此早期的领域,只有拼技术就够了?移动医疗曾经经历的那一场暴风雪,是否也有相似的教训值得当下借鉴?

  VoxelCloud(体素科技),算是最近一头扎入这个领域的 AI 创业公司中比较露锋芒的一个。2016年才成立,就在2017年5月获得红杉领投的千万级融资;仅隔3个月,又在今天得到腾讯的超亿元人民币 A+轮投资。很显然,这个数额与融资频率应该会让当下一众同类型的创业公司十分眼红。

  当然,尽管腾讯有自己医疗布局的考虑在内(刚刚推出一款医疗影像产品“觅影”),但对于选投 VoxelCloud 的理由,腾讯与红杉的“口径”较为一致:

  “他们之前就有了明确的产品,以后还会有更多创新性应用”。

  VoxelCloud 的创始人丁晓伟很爽快地接受了我们的专访,而且并不避讳一些敏感问题。不过,自始至终,对于 AI 医疗,他的态度是谦卑且谨慎的,甚至承认“现在的技术和硬件并不天然满足医疗应用级产品的研发,需要通过大量另辟蹊径实现”。

  “我们有技术,有很强的人,但是我们也必须考虑商业模式,也需要正确面对那些市面上的 AI 医疗诊断系统曾经犯过的错误。”

  只谈学术,不谈应用,这不靠谱

  “借助先进的人工智能技术,系统在短时间内处理海量数据,并对病人做出愈加准确的诊断。”这是 IBM 旗下的 AI 诊疗系统 Watson 曾做出的承诺。

  然而,在 IBM 将 Watson 推向全世界的 6 年里,这个 AI 医疗领域最负盛名的产品,却遭到了无数医生的质疑与媒体的嘲讽。

  可靠的技术,高质量的数据,医生的配合。事实上,这些在研发人员中最为看重的几个因素,一旦“合体”落实到临床实验中,就会遇见各种各样的麻烦。这就像一个仅有完整的身体与四肢,却没有关节与润滑剂的机器人,只能是一个无法动弹的残次品。

  譬如,在实际工作中,Watson 合作医院的医生们真的会主动用它来处理病患信息吗?医生输入数据过程中是否会遇到各种问题?给出的诊断结果是否会参考不同国别、人种的差异?

  作为加州大学洛杉矶分校的计算机视觉博士,VoxelCloud 的创始人丁晓伟并没有否认研发与应用之间横亘着巨大的鸿沟。那些在实验室中熠熠闪光,让人十分兴奋的技术与样品,其实很容易“见光死”。

  这也是他为何通常在产品研发过程中,选择与医生们一待就是 6 个月的原因:

  “我虽然学的是计算机视觉这一学科,但是我家人都是医生,我基本从小就长在中国的医院里。哪个科室做什么,到底怎样运转,我都见过。我觉得,做医疗产品必须走到医院里,去观察医生的每一步到底是怎么做的。

  譬如我们在研发无创肺癌筛查诊断系统的时候,就跟医生长时间一起工作,大概要相处半年吧,天天在一起讨论。这不是说我们一定要掌握哪一种病症,而是要去了解这个病的知识难点,看看医生处理的时候会有哪些问题。然后我们再独立去分析一个病种的时候,再去考虑怎么与深度学习技术融合。

  另外在临床实验过程中,对某一项任务的安全编制,医生的需求是什么,这里面的容错空间有多大,做成什么样子是最能为他们解决问题的,这些都是非常细节的问题。

  你不走进医院,你绝对不知道有哪些很棘手的问题。

  但是,即便与医院进行长时间无缝隙合作,也不能保证机器给出的治疗方案给出的一定是精准的,或者是被医生认同的解决方案。这就像欧洲一些曾对 Watson 系统多有抱怨的医生透露,Watson 给出的建议带有针对美国患者与美国医院治疗方案的倾向。

  对于这个疑问,丁晓伟首先提出了一个大部分人对人工智能医疗应用的理解误区:机器诊断报告一定需要与某个医生的主观印象高度匹配。

  他认为,与医生主观印象做比对是一种错误的认知,机器诊断结果,应该在有条件的情况下,去对比该疾病的金标准检查结果(Gold Standard)。

  “早期疾病的筛查在绝大多数状况下,不确定性是不可避免的。而且医生也知道,在初步筛查结果下得到的只是初步意见,不能作为金标准来下定论。我们能够保证的,是基于数据信息量,让病症在某一阶段的诊断准确率无限接近金标准。

  当然,如果出现某一特殊病症没有现有的金标准可以参考,也同时为了保证诊断结果的客观性,我们会请权威医疗专家,把他们分成 4~5 组,分别独立去做一批数据诊断,对数据做质控标记。

  这就相当于,把我们的系统作为第 6 组医生,它与每一组医生的差异率要维持在这几组医生之间差异率之内。

  实际上,一些市场中现有计算机辅助诊断系统出现的问题,在某种程度上也被丁晓伟认为是 AI 医疗产品之间存在的目标性差异。

  譬如,有些公司可能只做图像诊断,给出一个辅助性的诊断结果,而有些产品是既给出诊断结果,也会改进医生的工作流程,把医生写报告、做随访的时间也给一同安排了。“大概我们的产品在人性化方面会要求的更高一些”,丁晓伟说得比较委婉。

  “你看市面上的大部分的诊断应用,可能都是机械地去做特定疾病检测与判断。这起到的是查缺补漏的作用,因为我们显然不可能完全相信算法。

  但我想让自己的系统多一点特性,就是能给予医生一种信任感,让人不会觉得那么生硬。你看,就像完成一个机械动作,人与机器都能完成,但是过程与感觉是不一样的。

  作为医生,除了给出一个诊断,他还具备『处理不确定性的能力』。他知道哪些是不确定的,会去找上级医生寻求帮助,会去寻求更进一步的但代价更大的医学检查。

  举个例子,某一种病的治疗方案如果没有特别有说服力的信息量,医生的选择总是通过各种各样的方式去验证,譬如不断地去随访,或者寻求外部援助。而这些机制机器都是通通忽略的,妄图在一次检查中给出最好的答案。”

  换句话说,在他的认知中,一件成功的医疗诊断产品,不仅会“学习海量的数据”,还要对诊断过程有一个深度理解。把医生写报告,向上级寻求帮助,二次审核等梯级任务都学到手,具备像人类一样的“处理不确定性的能力”。

  某种程度上,这个设想与 Google Deepmind 团队一边做糖网病筛查诊断系统,一边研发医务支持与任务管理系统的“两手抓”计划有共通之处。

  “所以,我们想优化的是整个看病流程,而非仅仅提高一个诊断结果的准确率。这不是一个单纯拼技术水平高低的问题,而是谁能在现实诊疗过程中更有风险控制的能力。”

  但是,无论通过什么手段来保证诊断的准确率与提升医生的满意度,丁晓伟也承认一定需要考虑地域之间的差异。这也是 VoxelCloud 在美国与中国分别设立研发中心,与美中两国医疗机构同时进行项目试验的根本原因:

  “我们的研发中心是洛杉矶,跟梅奥医学中心,UCLA 医学中心的关系也非常好,项目都是一起合作的。在国内,虽然合作医院需要取得授权才可以透露名字,但已经有 100 多家了,都是北京和上海的三甲医院。

  这样做的理由,不只是因为病患的数据会有地域差异。国内外的诊疗流程也很不一样,两者都是相辅相成的,而且两地的研发结果也能做到互补,我们必须同时考虑到。

  VoxelCloud与交大洽谈医疗影像合作

  数据是否是核心竞争力?

  好算法虽然是价值千金,但是好数据却更是“千金难买”。

  风投机构 8VC 的 CEO Joe Lonsdale 曾在今年在斯坦福举行的 Light Forum 会议上称:“做医疗诊断一开始遇到的挑战就在于搜集与创建数据”。

  而美国癌症中心 MD Anderson 的一位负责人也认为,只有在拥有上万患者数据的前提下,才能初步找到针对性治疗模式:

  “从各种患者数据中找到不同的特征很关键,这对针对性治疗与精确用药非常有帮助。但是如果不能扩大现有数据集,上述愿景是无法实现的。你可能只有 1 万个肺癌患者数据,但其实这个数字并没有很大。”

  此外,一位专注于医疗创业项目的分析师告诉机器之能:“现在 AI 医疗初创项目之间的竞争核心,就在于谁能拿到更多的数据。”

  很简单,医疗数据之于医疗诊断的重要性,就像道路测试之于无人驾驶汽车。你只有不断地让汽车去实地训练,不断地收集与“咀嚼”道路数据,才能绘制出更高精的地图,逼近更高的安全数值。

  同理,人体的复杂性更是不必多说。这也是为何 IBM 的数据工程师与医生们耗费了六年之久,才仅仅让 Watson 学习了 7 种癌症;而科技巨头与这个领域内所有创业公司也只能从单一的或者两三种疾病入手来进行摸索学习。

  丁晓伟也认同这个观点。他认为,目前这个市场,大多数公司都在做肺癌、糖网病的 AI 医疗诊断,一方面是因为这些病种发病率非常高,影响范围非常广,且难以攻克,所以研究价值非常大。

  而另一方面,其实是因为这些病的数据比较容易能拿到,包括网络等很多途径都是能搜集到很多案例的。

  “这些可能是起点与上手都相对其他病症来说更容易一些(不是说本身容易)的项目,所以大家都从这几个病种入手。”

  目前大多数AI医疗公司研究最多的4种病症:肺癌、糖网病、冠心病、肝病

  根据知名医疗媒体 mobihealthnews 的一份调查,在医疗领域,数据的收集形式其实很丰富,包含临床实验、医生报告、医学图像、传感器和生物样本等多种获取途径。

  然而,如何获取优质数据,特别是“干净”的患者数据,对于所有该领域的公司来说,是更为至关重要的。

  “不管是研究项目、还是产品项目,模型的能力是不可能超出收集数据的质量。目前对于癌症来讲,可能最有效的做法就是取得病人的手术活检,或者穿透活检的病例结果,然后把这个结果作为金标准用于目前的训练。

  但问题在于,在一家医院里,有活检病人的数量是远少于没有活检病人数量的。”丁晓伟这样解释高质量数据的重要性。

  换句话说,要保证有持续的高质量数据的输入,公司只能尽可能多得通过与医院及其他医疗机构的合作来获得。因此,如何“拿下”医院的合作项目,也是鉴别 AI 医疗创业公司生存能力的一个重要衡量标准。

  虽然丁晓伟并没有过多透露 VoxelCloud 与国外包括美国 NIH(美国国立卫生研究院)、梅奥医学中心等顶尖医疗机构的合作条约内容。但很显然,其导师 Demetri Terzopoulos 在全球医疗界的赫赫声望,为 VoxelCloud 铺开了一张巨大的关系网:

  “我们算是师徒创业吧,我的博士生导师 Demetri 是英国皇家科学院院士和加拿大科学院院士,在业界的地位非常高。

  当然,IEEE Fellow、ACM Fellow 等头衔,奥斯卡技术成就奖,德国亥姆霍兹奖等一大堆奖项就不用说了,其实他被肯定的最重要的一点,是对医疗应用层的贡献。譬如他参与研发的图像分割算法,就被广泛应用于医疗成像技术中。”

  这种略显豪华的技术背景优势,是否能够让开发者在面对成百上千万的数据时,更能对它们进行游刃有余地处理? 根据丁晓伟给出的一份案例显示,他们正在基于一份包含 250 多万病例的数据集上做出眼底各种疾病分析模型,诊断结果已经能够达到专业医生水平的准确率。

  然而,他们需要面对的挑战依旧很大。

  MIT(麻省理工科技评论)曾在批评包括 Watson 在内的诸多医疗诊断系统“不作为”时,把矛头指向“数据处理的难度”而非“数据的量级”,这同样也是所有 AI 医疗公司都有的短板:

  “很多时候,诊断结果不够好并不是公司本身的原因,而是由于数据的复杂性与相对不可用性。因此,这需要 AI 系统基于数据调整参数,以达到最佳拟合效果。对于相对容易的任务,比如检测恶性肿瘤 X 射线,效果可能很好;但在很多关系复杂的病况下,就很难实现。”

  而加州大学伯克利分校公共卫生学院的生物统计学教授 Maya Peterson 也持有同样的观点,她在今年 7 月的一次医疗会议上指出:

  “人体的数据真的太过复杂,而我们还没有完全理解他们之间的联系。在探索更加复杂的病症中,机器学习在某种程度上野心过大,这也不是一件好事。”


分享到:
qrCode
客服服务热线
400-000-0000
(周一至周日:9:00-22:00)
公司地址:XXX省XXX市XXX县XXX路XXX号 邮政编码:000000 客服邮箱:contact@fkadjkhsf.co