人工智能(AI)在医疗保健领域的应用正获得发展势头。在Sage Growth Partners进行的一项调查中,90%的提供商表示,他们已经制定了人工智能战略。调查进一步显示,41%的供应商处于规划阶段,25%处于早期实施阶段。
虽然人工智能的使用可以在整个护理连续体中提供一些好处,例如人工智能辅助机器人手术、精准医疗、基因组学和临床研究,但使用人工智能也存在一些明显的障碍。
由于人工智能严重依赖数据,训练人工智能模型所依据的底层数据的完整性和质量对于确保准确性和消除模型偏差和不透明的风险至关重要。为了大规模推动成功的人工智能计划,医疗机构将需要一个全面的人工智能治理战略作为基本支柱。
据全球管理咨询公司麦肯锡(McKinsey)称,这种情况正在加强数据治理数据访问、数据质量、数据安全和互操作性是至关重要的。如果没有适当的控制,训练数据很快就会成为一个问题。
考虑到训练人工智能模型所需的大量数据,如果数据和模型缺乏透明度,考虑不周全的过程可能会导致意想不到的后果。此外,在患者安全和护理是重中之重的医疗保健领域,使用可靠的数据以及严格的人工智能治理和数据管理策略是必不可少的。
医疗机构在启动人工智能计划时需要解决的一些关键挑战包括:
- 数据质量差-医疗保健组织面临的一个关键障碍是,近30%的医疗保健成本直接归因于使用质量差的数据(重复、不完整、不一致和错误数据的组合)。如果模型所训练的底层数据质量较差,那么这将对AI模型的准确性和质量产生不利影响。
- 无法发现数据-据估计,数据科学家平均花费近70%的时间寻找和准备数据来训练模型。由于千兆字节级的数据分布在数百个不同的数据源中,许多数据源很难及时找到所需的数据。此外,即使所有数据都位于数据湖中,如果数据没有得到适当的管理或编目,数据湖也可能很快变成数据沼泽。换句话说,这使得快速查找、探索、访问和理解数据变得非常困难。
- 缺乏对数据的理解-研究人员和数据科学家在构建数据管道时也需要深入了解数据。例如,数据属性是什么,数据是否经过认证并完全受控于使用,数据是否包含个人健康信息(PHI)和个人身份信息(PII)。此外,是来自可靠来源的数据。这在选择数据集来训练AI模型时非常重要。
- 缺乏透明度和可审计性-轻松跟踪数据集和模型的能力是转向可解释的AI的必要条件。数据科学家应该利用端到端数据沿袭从源到目标跟踪模型和数据集。他们还应该有详细的信息,对数据集可能发生的任何变化进行全面的审计跟踪。这对于在模型中建立信任以及支持任何法规遵从要求将变得越来越重要。
Coll亚愽视频ibra数据智能云如何提供帮助
在Co亚愽视频llibra,我们与全球领先的医疗保健和生命科学组织合作,帮助他们进行创新可信的数据.
亚愽视频Collibra数据智能云是一个智能数据平台,利用机器学习的力量,提供了一种全面和集成的方法,在内部部署、混合和多云环境中对数据进行编目、治理、保护、管理和协作。
与亚愽视频Collibra数据智能云计算、研究人员和数据科学团队可以轻松地与数据协作,并实现可解释的AI,从而提高数据集和模型的透明度和可审计性。例如:
- 的智能数据目录可以作为一个可信的存储库元数据(关于数据的数据),包括AI模型技术、数据输入、数据特征、预期输出等。
- 研究人员和数据科学团队可以轻松地发现他们需要的数据,确保这些数据经过使用认证,并获得丰富的业务和技术背景。此外,他们可以对使用的数据集进行评级、排序和优先级排序,使他们能够以更快的速度构建健壮的数据管道。
- 一个活动元数据图端到端数据沿袭使数据科学家能够更清楚地了解模型和底层数据。用户可以跟踪数据集和模型的沿袭,并了解数据依赖关系。他们可以获得关于数据集可能经历的转换的详细信息。
- 支持机器学习(ML)的数据质量和可观察性可以帮助检测数据漂移、异常值和模式,以确保人工智能和分析模型随着时间的推移的准确性和性能。此外,亚愽视频数据质量可观察性主动检测数据中的异常,如丢失的记录、值以及跨表或系统的破裂关系,从而快速解决问题。
- 高级功能数据隐私保护有助于确保敏感数据易于识别,并通过基于角色的访问控制得到充分保护。
下一个步骤:
为了了解更多,我想邀请您观看以下网络研讨会:
- 生命科学与制药领域的数据智能之旅——以基因泰克/罗氏集团
- 现代医疗保健组织中的数据智能——以梅奥诊所
- 构建数据治理案例——以阿斯利康
AI:真相还是后果——以俄亥俄州立大学