合并队列方程(PCE)预测具有预先指定范围内特征患者的动脉粥样硬化性心血管疾病(ASCVD)风险,但在亚洲人或西班牙人中表现不确定。机器学习(ML)模型是否能改善更广泛多样的真实人群的ASCVD风险预测尚不清楚。我们使用北加利福尼亚州的电子健康记录(EHR)数据库开发了用于多民族患者ASCVD风险预测的ML模型。我们的队列包括18岁或以上既往无心血管疾病且基线检查时未服用他汀类药物的患者(n=),根据缺失或超出范围的变量按PCE合格患者(n=)或PCE不合格患者分层。我们训练了ML模型[具有L2penalty和L1lasso惩罚的逻辑回归,随机森林,梯度提升机(GBM),极端梯度提升],并确定了5年ASCVD风险预测,包括是否纳入额外EHR变量,以及亚洲和西班牙裔亚组。共有名患者发生ASCVD事件,其中名PCE不合格患者。包括PCE不合格患者在内的整个队列中的GBM表现(受试者工作特征曲线下面积(AUC)0.,95%可信区间(CI):0.–0.)明显优于PCE合格队列中的PCE表现(AUC0.,95%可信区间:0.–0.)。在40-79岁的患者中,GBM在纳入额外EHR数据之前(AUC0.,95%可信区间:0.-0.)和之后(AUC0.,95%可信区间:0.-0.)表现相似。总的来说,与PCE相比,ML模型取得了可比或改进的性能,同时允许在更大的患者群体(包括PCE不合格患者)中进行风险识别。EHR训练的ML模型可能有助于弥补ASCVD风险预测中的重要差距。
纳入和排除标准
临床特征基线
PCE和ML模型性能的ROC曲线
小猪的科研生活