数据科学、机器学习和人工智能有可能深刻改变医疗保健行业。在这次采访中,皇家飞利浦首席医疗、创新和战略官ShezPartovi博士解释了这些技术在改善患者预后、诊断疾病等方面发挥的重要作用。对话包括以下主题:关于健康科技公司飞利浦。数据在医疗保健转型中的作用。需要重新思考医疗保健转型中的数据分析。医疗保健转型中的数据收集和数据来源。将医疗保健中的数据科学应用与改善患者结果联系起来。为医疗保健中的数据共享创建激励机制。在数据科学中选择正确的问题来解决。避免以数据为中心的医疗保健中的偏见。基于医疗保健数据孤岛的患者锁定。谁对不良数据、算法和患者结果负责。医疗保健中数据和人工智能的未来;2021年3月Shez正式在全球领先的医疗科技公司皇家飞利浦担任首席创新和战略官一职,领导首席技术办公室、研究、HealthSuite平台、首席医疗办公室、产品工程、体验设计和战略等。与运营和市场合作,创新和战略组织负责指导公司战略以满足客户需求并推进业务增长和盈利目标。据悉,Partovi于1998年开始其职业生涯,当时是巴罗神经病学研究所的一名神经放射学家,直到2013年才从事临床工作。此后,Partovi在美国第五大医疗系统DignityHealth工作了20年。他于2018年加入亚马逊,担任医疗保健、生命科学和医疗器械业务发展全球总监,负责亚马逊的全球营销工作。除了在蒙特利尔麦吉尔大学接受过医学培训外,他还拥有计算机科学研究生学位。他帮助创办了亚利桑那州立大学生物医学信息学系,并在那里担任了三年的临床教授。采访摘录:关于健康科技公司PhilipsMichaelKrigsman(主持人):数据科学和人工智能正在改变医疗保健行业。下面请皇家飞利浦首席创新与战略官ShezPartovi为我们做简单介绍。ShezPartovi:七年前,飞利浦决定剥离医疗保健以外的所有业务,现在它完全是一家健康科技公司。也就是说,虽然您可能仍会看到飞利浦照明,但它实际上只是一个生产清单。飞利浦本身现在是一家100%的健康技术公司,专注于连续护理,包括家庭、门诊、住院等。所以,既然提到了飞利浦,就把它想象成一家健康科技公司。它是一家拥有130年历史的“创业公司”,因为它在10年前才真正转型,所以它就像一家拥有130年历史的创业公司。MichaelKrigsman:据我所知,你是一名医生。现在您再次担任飞利浦的首席创新和战略官。你能简单描述一下你的角色,你做什么以及你关注什么吗?ShezPartovi:自从我开始从事战略工作以来,我拥有世界上最好的工作之一。我开始与客户合作,了解他们未被满足的需求,从客户的问题出发,与同事一起制定策略,让飞利浦真正为客户解决这些问题。这就是它在战略上的意义。那么在创新方面,我们在倾听客户和他们的问题的时候,我们要清楚如何从他们的角度去创新去解决这些问题?飞利浦内部的整个创新社区是我职责的一部分,我们所做的是倾听客户需求,观察市场趋势,然后探索我们拥有的或飞利浦外部的技术并将它们整合起来,以便我们能够满足客户的需求。这项工作的核心是倾听客户的声音,获取信号,制定战略,然后与创新团队沟通:“我们如何创造性地满足客户需求?我们如何从他们的角度进行创新?”然后采纳这些建议并将其付诸实践。那是我领导的团队,我认为这是我做过的最好的工作。数据在医疗保健转型中的作用MichaelKrigsman:我知道您的很多工作都以数据为中心。您能解释一下它在医疗保健转型中的作用吗?ShezPartovi:我们现在正在医疗保健领域进行大量数据创建和数据生成。当然,愤世嫉俗的人会说,“嗯,是的,其中大部分只是为了计费。”尽管有这种情绪,但现在绝大多数数据都是数字化的也是事实。例如,当你使用剪贴板在线填写内容时,就意味着数据已经被数字化了。然而,数字化的机制和过程不一定是无缝和无摩擦的,可能会有很多重复和琐碎的工作。当人们谈论临床医生倦怠、医生和护士倦怠时,部分原因是当我们正在进行数字化转型时,他们不一定以无摩擦的方式进行,他们通常不了解工作流程并且是重复的。这不是最好的数字化过程。然后回到数据创建和生成问题,有些人会争辩说我们没有以一种非常令人惊讶的方式有意义地使用这些数据。我们可能拥有丰富的数据,但缺乏洞察力。A)我们以摩擦的方式创建数据。B)不幸的是,我们并没有真正从这些数据中创造出令人印象深刻的见解。在我看来,这是我们需要努力的地方。需要重新思考医疗保健转型中的数据分析MichaelKrigsman:是什么促使您提出上述两个基本问题?ShezPartovi:我们面临一些挑战。首先,生成的数据现在仍然更加以应用程序为中心,这意味着它们是孤立的。我记得当我在卫生系统工作时,我们收到了大约1500份申请。现在假设您正在数字化数据,该数据存在于应用程序环境中,但您有1500个应用程序。其次,缺乏数据流动性,这意味着虽然你已经将数据数字化并存储在磁盘上,但你不一定能将它组合到一个环境中并从中获得洞察力。面对如此众多的孤立环境,我们需要做大量工作才能将所有数据汇集在一起??,形成一个可以产生洞察力的公共环境。当然,科技也在进步。飞利浦有一个名为“HealthSuite”的环境,它与数据移动性有关。它能够从数百个不同来源引入数据,组合数据,然后从中获得洞察力。这就是我们所做的。事实上,许多卫生系统目前都在努力将数据整合到一个共同的环境中。医疗保健转型中的数据收集和数据采购MichaelKrigsman:数据移动性和互操作性似乎仍然是许多数字活动领域的瓶颈。是这样吗?谢兹·帕托维:是的。事实上,您应该将数据互操作性视为两个维度:共享数据的句法互操作性和共享意义的语义互操作性。诚然,我们仍然存在很多数据孤岛,但不可否认,我们在数据互通方面也取得了很大进步。随着越来越多的互操作性发生,一些组织创造了流动性,这催生了从数据到信息、从信息到知识、从知识到洞察力的愿景。这就是人工智能可以发挥作用的地方。MichaelKrigsman:您如何从您刚才描述的数据丰富到数据驱动?ShezPartovi:我可以举一个从数据到信息、从信息到知识、从知识到洞察力的例子。让我们从一个数据点开始,比如血糖水平。如果您的血糖在每分升140毫克左右,那就很高了。但另一方面,是不是因为那个人刚吃过饭?是空腹血糖吗?是非空腹血糖吗?所以,这只是一个数据点。有用,但还没有洞察力。但如果我告诉你血糖有上升趋势,那就是信息。信息就是趋势,这个趋势在上升,说明你的身体可能出现了问题。如果我们进一步查看患者的病史并了解它可能是早期糖尿病,那就是知识。但今天,为了以积极的方式实现三重目标——提高质量、降低成本和改善体验——我们需要了解卫生系统需要什么,临床医生、医生、护士和组织想要什么,以及他们想要更多不仅仅是数据、信息或知识。他们想回答以下问题:您给我看的这个病人有多大可能患有前驱糖尿病?他们在接下来的18个月内发生充血性心力衰竭的可能性有多大?一年内患糖尿病足溃疡的可能性有多大?这种预测,这种对未来的洞察力,才是真正的机会。当您将数据整合在一起并能够使用它来构建机器学习模型和使用AI时,这就是您真正使用数据为您的组织提供洞察力的时候。这就是主线:从数据到信息,再到知识,再到观察,再到对我有用的东西。在这个服务点,我能在这个时间点给这个病人最好的服务。将医疗保健中的数据科学与改善患者结果联系起来MichaelKrigsman:您如何将所有这些与患者结果联系起来?或者,如果我们有这种互操作性,优势是什么?ShezPartovi:我会把这一切归结为上面提到的三重目标,即提高护理质量,降低护理成本,并改善临床医生或患者的临床或消费者体验。例如,从降低成本开始,我认为这可能是最简单的。将AI与数据一起使用可以做的一件事是帮助进行所谓的现实操作预测,例如,下周五晚上我的急诊室需要多少员工?病人流量是多少?病人流动以调整人员数量?顺便说一句,这会影响护理质量,因为如果人手不足,这将是一个挑战。调整规模既对成本有积极影响,对护理质量也有积极影响。例如,使用ADT流程(入院、出院、转院流程)构建模型,预测患者入院的流程,进而帮助您实现正确的人员配备,这不仅会影响患者体验,还会影响临床医生的体验经验。因为如果人手不足,无疑会影响护理质量。这正是飞利浦目前正在做的事情。以上是运营预测,再来说说前面提到的临床预测。我以糖尿病为例来预测糖尿病足溃疡或心脏病的可能性。其实临床预测的例子很多。例如,您可以使用人工智能和机器学习来读取放射图像以识别或预测异常。如果算法决定应尽快处理图像,因为它会影响护理质量,放射科医生应立即检查并采取积极措施。该算法不是按照拍摄顺序对图像进行排序,而是首先对具有异常的图像进行排序。只有先发现,先治疗,才能取得积极的治疗效果。在飞利浦,这些是AI和ML改善患者治疗效果的一些最常见用例。为医疗保健中的数据共享创建激励机制MichaelKrigsman:大量数据保存在极少数市场领先的应用程序中。为什么垄断企业有动力分享这些数据?换句话说,软件和基础设施的市场力量不会影响您描述的数据共享类型吗?ShezPartovi:这些数据属于卫生系统,软件公司实际上并不拥有这些数据。例如,飞利浦不拥有数据,我们本质上只是数据控制者。然而,我确实知道世界上有一些国家(我不会说出它们的名字,因为我不想说他们的坏话),软件公司实际上拥有这些数据。因此,也可以说你的论点是正确的。但至少在美国,说“我拒绝共享数据”是不正确的。信息屏蔽规则将禁止这样做。MichaelKrigsman:您能告诉我们需要汇总什么样的数据吗?ShezPartovi:如果您正在考虑人工智能和机器学习、临床预测和运营预测,您需要从问题开始,以了解需要哪些数据。以谷歌地图为例,如果你还记得的话,曾经有一段时间它只是用红色热图向你显示方向和耗时。后来,它开始显示乘车时间、步行时间、最佳路线等等。根据他们想要提供的预测和价值,他们正在收集越来越多的数据。现在回到企业本身,在考虑需要收集哪些数据来创建模型时,我们也需要从问题出发。假设您想预测住院时间以维持适当且有效的护理规模。那么您可能只需要一个ADT流来预测逗留时间。另一方面,如果您试图预测一个人是否患有特定疾病或特定癌症,您可能需要成像、血液值、EHR(电子病历数据)数据。总而言之,您需要从问题陈述开始,了解您要预测的内容,以及您希望为临床医生或运营团队提供的工具,然后回过头来思考构建这种模型需要哪些数据可以为您提供预测。在数据科学中选择正确的问题来解决MichaelKrigsman:您如何确保选择正确的问题来解决?ShezPartovi:每个组织要么有试图解决运营问题的运营人员,要么有精干的团队。不久前,精益团队真的风靡一时。现在有转型团队。尽管他们的名字不同,但他们都在四处寻找要解决的问题。当然还有卓越的临床团队和卓越的运营团队。只是它们在您的组织中的称呼可能不同。如果你去参加他们的指导委员会会议,你会发现他们可能知道他们需要解决什么问题以及他们有什么头疼的问题。事实上,这些都是客户告诉他们的。因此,我建议从这些已经在部署该计划的团队开始,例如,首席护理官或首席医疗官正在运行一个临床卓越计划;首席运营官正在运行精益运营计划或卓越计划。他们正在努力解决一些挑战。所以他们有数据来建立机器学习模型作为解决这些问题的工具。我会说,如果我是一个卫生系统的首席营销官(CMO),我当然有很多问题需要解决,但我会从已经在研究的问题开始。同时,考虑使用AI和ML作为这些团队的工具。在以数据为中心的医疗保健中避免偏见MichaelKrigsman:换句话说,解决您可能面临的直接实际问题,无论是临床问题还是外科问题。正确的?ShezPartovi:当然。我的意思是我现在很实际。它可能与组织KPI保持一致,与团队KPI保持一致。对于这些东西,这确实是最简单、最直接的起点。MichaelKrigsman:成为一个更加以数据为中心、数据高效的医疗保健系统的挑战是技术偏向运营方面吗?ShezPartovi:首先,您当然需要将数据数字化。在数据方面,存在三个V:数量、多样性和准确性。要真正创建一个模型作为保护工具,您需要实现这些品质。因为数量多有助于消除偏见;多样化可以创建更好的机器学习模型;真实性恢复数据的真实性。这是第一步。接下来,你需要实际训练一个模型,你需要标记数据,并验证模型。另外,你还需要决定是否申请FDA审查(比如飞利浦申请FDA审查),你不仅需要验证,还需要满足一定的要求。进行结果研究以证明情况确实如此。同样,这更多是在供应商方面。在内部,对于操作,您不需要这样做。数据(大众化、多样性、真实性)、标签、机器学习、建模、测试和验证等等,所有这些活动都需要组织与健康科技公司合作。对于一些复杂的学术医学中心,他们也会联系大学寻找需要的人才来帮助。当你问我障碍是什么时,这取决于你是在实施可能从飞利浦获得的工具,还是想自己构建它们。在这种情况下,您可能会与可以为您提供帮助的健康科技公司合作,或者与可以为您提供帮助的某种公司合作,或者您可能决定建立内部能力来做到这一点。工具在那里。但将它们整合在一起需要能力、培训和技能提升。因此,您要么在内部构建它,要么与您的合作伙伴合作。MichaelKrigsman:当数据来自各种记录系统时,组织如何创建企业范围的视图?毕竟来自不同的软件供应商,这在本质上是不同的系统。ShezPartovi:您希望您的数据处于一个所有数据都汇集在一起??的环境中。至少从技术上讲,您必须考虑到您确实需要一个存储区,将其称为“数据湖”,或者随便怎么称呼它,一个健康的数据空间。提问者提到了可视化的问题,我觉得这个很重要。上面我谈到了数据、信息、知识和洞察力,如果你还记得的话,可视化是我用来将数据转化为信息的术语。人们倾向于将可视化与“显示仪表板和图表”联系起来。但我认为更强大的东西,也可能是问题所暗示的,是我如何从这些数据中创造洞察力,这比简单的可视化具有更高的投资回报率。顺便说一下,我认为你确实需要某种数据湖环境,最好是在云端,因为如果你要运行机器学习模型,你肯定不想购买位于数据中心的昂贵GPU并且每天只使用半小时,让它闲置23.5小时。您可以使用云并根据您的使用情况付费。在云端,您可以使用最复杂的机器学习模型训练集、训练技术,并且只为使用的部分付费。如果您尝试在自己的数据中心构建它,您将为只使用一小部分时间的东西付出高昂的代价。永远不要那样做。基于医疗保健数据孤岛的患者锁定MichaelKrigsman:为了告诉你一个关于我个人的小故事,我不会说出具体的医疗保健系统,但我肯定会坚持使用它们。有很多原因,其中之一就是他们是伟大的,伟大的医生等等。但是它也有一个信息锁,如果我离开他们的系统,医生会给我发一个通知。这种固有的信息锁定不会对您描述的数据共享类型产生不利影响吗?ShezPartovi:这肯定会使数据共享变得更加困难。然而,许多组织正试图摆脱这种现状。例如,我们在加州大学旧金山分校(UCSF)的合作伙伴正在使用我上面提到的公共共享环境,他们实际上正在从UCSF环境之外的实践中获取数据,并试图创建一个整体视图患者在实践之间移动变得简单易行,信息共享也是如此。谁应对不良数据、算法和患者结果负责MichaelKrigsman:如果存在不良数据、错误算法以及由此导致的错误预测,谁该负责?ShezPartovi:在飞利浦,我们仍然相信这是一种帮助临床医生做决定的工具,但最终你希望临床医生成为最终的决策者。回到问题本身,首先,哲学上,至少从我们的角度来看,我们正在研究如何创建一个透明、公正、提高体验感的工具,这个工具也可以帮助临床医生做他们的工作。工作,例如验血或任何其他测试。顺便说一句,任何测试都可能有假阳性或假阴性。临床医生会根据自己的验证,综合考虑后做出决定,这与算法自我诊断不同。无论是数据、算法还是预测,都只是帮助临床医生做出决策的工具。然后说到数据偏差,我会在之前的3V(massification、diversification、authentication)的基础上加上1V,validation。当然,创建算法的过程包括这种大众化、多样性、真实性,然后是验证。事实上,作为临床医生,我们都认为医疗保健是地方性的,这意味着在一个地区流行的疾病在另一个地区可能并不流行。我在加拿大和美国都接受过培训。我可以告诉你,在加拿大进行的一项特定的胸部X光检查是肺结核,而我在美国训练的那台检查结果发现是肺炎球菌。他们是不同的。但那是因为医疗保健是本地的。算法需要根据部署环境进行微调。世界上不会有一种通用的算法,更不用说美国了。医疗保健是本地的。培训需要在当地进行微调。MichaelKrigsman:您提出了一个非常有争议的观点,即模型需要本地化或反映当地条件。谁应该负责创建这些模型?ShezPartovi:可以对算法进行微调——我们做到了。因此,一个模型可以“通用”地进行训练和微调,甚至可以在投入生产之前部署在一个环境中的后台,部署后继续训练。根据定义,它通过实施和继续使用而成为本地的。MichaelKrigsman:这些模型通常由软件供应商、医疗保健系统或飞利浦等公司提供吗?谁来提供这些模型?ShezPartovi:以上都是。当然飞利浦也开发模型,我们其实有一个叫“AIManager”的环境,你可以把我们的模型放到里面去用。机构也可以建立自己的模型,放入AIManger中使用。目前,有很多年轻的公司在做这件事。我认为任何可以访问数据的公司都可以使用好的数据来构建模型。MichaelKrigsman:你的意思是局部模型是一种减少模型内部偏差的方法,我的理解正确吗?ShezPartovi:是的,它确实有助于减少偏差,训练和验证的模型进入本地并开始使用后,它被认为是本地优化调优模型。医疗保健中数据和人工智能的未来MichaelKrigsman:未来几年医疗保健中的数据和人工智能将走向何方?ShezPartovi:当你取一些组织、血液并对其进行测试时,会生成数据流,你可以获取数据并在其上运行算法作为测试。因此,就像您抽血和接受血液测试一样,您可以让您的数据流经卫生系统的静脉和动脉。您可以获取该数据并对其应用算法。临床医生使用排序算法作为测试。是的,有一些后台算法一直在运行。但是有些算法可能需要使用大量的计算能力。此类算法实际上最终可能会成本高昂,因为您正在使用计算能力来运行它们。我认为随着时间的推移,临床医生会像订购测试一样订购算法。MichaelKrigsman:您预计这需要多长时间?ShezPartovi:我认为我们可能会在五到十年内看到一些早期迹象。MichaelKrigsman:我们如何确保数据科学用于改善患者护理,而不仅仅是利润?而且技术很贵,应该怎么考虑?ShezPartovi:人们应该将AI和ML技术用于医疗保健,以提高质量、降低成本和改善体验的综合意义。其实可以看出,成本只占这些因素的三分之一。我们应该关注三重目标的所有方面,而不仅仅是降低成本。我之前确实说过“数据科学是用来提高运营效率的”,但在我看来,在某些情况下,运营效率是提高了医疗服务的提供,因为例如,人手不足会导致医疗质量差。这些因素都捆绑在一起,我不想让人觉得它们是分开的。迈克尔·克里格斯曼(MichaelKrigsman):面对这种不断变化的环境,您对医疗保健高管有什么建议?他们知道他们需要适应,但这对他们来说会非常艰难,因为他们承受着巨大的财务压力、监管压力以及各种不同的压力。ShezPartovi:我很早就在与其他组织的合作中了解到这一点。我知道这听起来很自私,因为我在这里代表飞利浦,但如果我是CMO,我会进行培训和提高技能以及许多其他事情。而我对管理员的建议是,为他们自己的问题找到最好的解决方案,并引入一个技术合作伙伴,看看AIML如何与这个合作伙伴一起应用到这个问题上。这就是我作为管理员做事的方式。MichaelKrigsman:关于这个不断变化的医疗保健世界,您希望决策者了解什么?ShezPartovi:政策制定者应该而且需要知道。人工智能和机器学习在推进三重目标方面发挥着重要作用。因此,在我看来,AIML可以在当今时代提高质量、降低成本并改善患者和临床医生的体验。政策制定者应该研究如何推动数据科学的采用并消除人工智能和机器学习的障碍,因为这样做的最终效果是其他团体想要的。这三个目标是相互关联的,我们应该弄清楚如何通过政策推动实践。
