欢迎来到尧图网

客户服务 关于我们

您的位置:首页 > 健康 > 养生 > 数据分析:多诊断指标ROC分析

数据分析:多诊断指标ROC分析

2025/9/27 14:35:00 来源:https://blog.csdn.net/H20230717/article/details/141020403  浏览:    关键词:数据分析:多诊断指标ROC分析

禁止商业或二改转载,仅供自学使用,侵权必究,如需截取部分内容请后台联系作者!

在这里插入图片描述

介绍

pROC::roc函数能够使用一个指标(predictor)去区分两个或多个分组(response),并计算95%置信区间的原理基于以下几个关键点:

  1. ROC曲线:ROC曲线是一种图形表示,用于展示分类模型在所有可能的分类阈值下的性能。它通过绘制真正类率(True Positive Rate, TPR)和假正类率(False Positive Rate, FPR)来评估模型的分类能力。
  2. AUC:曲线下面积(Area Under the Curve, AUC)是一个单一的数字,用于描述ROC曲线下的面积。AUC的值介于0和1之间,其中1表示完美的分类器,0.5表示没有区分能力的分类器(相当于随机猜测)。
  3. 指标转换pROC::roc函数首先将分组变量(response)中的类别标签转换为二进制形式(例如,"healthy"和"cancer"转换为0和1)。这样,可以使用逻辑回归或其他分类方法来估计预测指标(predictor)的概率。
  4. 排序和阈值pROC::roc函数根据预测指标的概率对样本进行排序,并计算在每个可能的阈值下模型的TPR和FPR。
  5. 置信区间pROC::roc函数计算AUC的95%置信区间,这是通过使用非参数方法(如自助法)或正态近似方法来实现的。ci = TRUE参数指示函数计算这个置信区间。
  6. 模型拟合:在内部,pROC::roc可能使用逻辑回归模型来拟合数据,将预测指标作为预测变量,将分组变量作为响应变量。
  7. 水平设置levels参数指定了响应变量的类别顺序。这很重要,因为ROC曲线是基于类别的正负性来绘制的。在逻辑回归中,通常将较高级别的类别设置为“成功”或“事件”。
  8. 统计测试pROC::roc函数还包括对AUC是否统计显著不同于0.5(即随机猜测)的测试,这可以通过pROC::summary.roc函数获得。

通过这些步骤,pROC::roc函数提供了一种评估和比较不同预测指标或模型在区分两个或多个分组方面性能的方法。这种方法在医学研究、生物统计学和其他领域中非常常用,尤其是在诊断测试评估和风险预测模型的开发中。

加载R包

knitr::opts_chunk$set(warning = F, message = F)library(tidyverse)
library(pROC)
library(ggrepel)

导入数据

数据可从以下链接下载(画图所需要的所有数据):

  • 百度云盘链接: https://pan.baidu.com/s/1u_p0ebiq9a3X3IITYOBOLA

  • 提取码: xshp

data <- read.csv("./inputdata/54-All_Scores.csv", row.names = 1)head(data)
sampletypescore.methscore.delfiscore.meth_regens_preds
PGDX16571Phealthy0.11479340.22618100.089355600.06348261
PGDX16601Pcancer0.51785630.95825970.419196910.84425808
PGDX16605Pcancer

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com