数据信息
数据简介
本数据集整合了结直肠癌患者在诊疗过程中的肿瘤标志物(癌胚抗原(CEA)、糖类抗原CA199、糖类抗原CA72)及血常规(白细胞计数(WBC)、中性粒细胞绝对值、淋巴细胞绝对值、血小板计数)检验记录,并衍生出NLR、PLR、SII、肿瘤标志物动态斜率、连续上升次数、异常持续计数、复合肿瘤负荷指数及治疗响应等级等多个加工指标。通过对原始检验数据的深度挖掘,实现了对患者炎症状态、肿瘤负荷及治疗响应的量化评估。本数据集适用于肿瘤动态分析、疗效评价、预后预测及临床决策支持等场景。
数据处理规则说明
1.数据整合与清洗:以患者ID为唯一主键,从医院信息系统中抽取“人口信息学”、“血常规”等表单中的相关字段。
2.核心衍生指标计算说明:
1)NLR、PLR、SII:分别采用公式 中性粒细胞 / 淋巴细胞、血小板 / 淋巴细胞、血小板 × 中性粒细胞 / 淋巴细胞 计算,反映全身炎症状态。
2)肿瘤标志物动态斜率:对同一患者同一标志物的多次检测值(时间序列)进行线性回归,计算回归系数(斜率)。斜率 >0 提示持续上升,<0 提示下降。
3)连续上升次数:统计同一患者同一标志物的检测序列中,连续两次检测值上升的累计次数。
4)异常持续计数:计算同一患者同一标志物的检测值中,超过该患者历史均值的次数。
5)复合肿瘤负荷指数:先将患者个体的CEA和CA199分别除以全部患者的CEA中位数和CA199中位数,再相乘。
治疗响应等级:基于治疗前后(如化疗前后)肿瘤标志物变化百分比进行分级:下降 ≥50% 为显著响应(2分),下降 30%-50% 为部分响应(1分),变化在 -30%至+20% 之间为稳定(0分),上升 >20% 为进展(-1分)。
应用场景描述
临床医生可利用NLR、PLR、SII等炎症指标,结合肿瘤标志物动态斜率,识别高炎症状态及肿瘤快速进展患者,为术前风险分层和术后管理提供依据。
抗肿瘤治疗疗效评估:通过治疗响应等级,可客观量化患者对化疗、靶向或免疫治疗的应答,辅助临床医生及时识别无效治疗,调整方案。
预后预测模型构建:科研人员可将动态斜率、复合肿瘤负荷指数、异常持续计数等作为特征,构建结直肠癌患者生存预测模型,提升预测性能。
样例数据
00ff6b425678ca5671a18eb8a1396e82 67 1 xxxx-xx-xx AFPCEA+肿瘤系列[男性] 7.51 1.79 14.95 5.46 3.97 0.94 217 4.22 230.85 916.48 0.0171284255871353 8 6 0.27 1
00ff6b425678ca5671a18eb8a1396e82 67 1 xxxx-xx-xx AFPCEA+肿瘤系列[男性] 17.46 2.9 5.66 3.37 2.08 0.91 182 2.29 200 416 0.0171284255871353 8 6 1.03 -2
00ff6b425678ca5671a18eb8a1396e82 67 1 xxxx-xx-xx AFPCEA+肿瘤系列[男性] 15.57 2.87 5.53 4.69 3.2 0.89 175 3.6 196.63 629.21 0.0171284255871353 8 6 0.91 1
附件下载
数据结构样例
患者ID varchar
年龄 varchar
性别 varchar 1:男,2:女
检验日期 date
检验项目名称 varchar
癌胚抗原(CEA) varchar
糖类抗原CA199 varchar
糖类抗原CA724 varchar
白细胞计数(WBC) varchar
中性粒细胞绝对值 varchar
淋巴细胞绝对值 varchar
血小板计数 varchar
NLR varchar
PLR varchar
SII varchar
肿瘤标志物动态斜率 varchar 单位:值/天
连续上升次数 varchar
异常持续计数 varchar
复合肿瘤负荷指数 varchar
治疗响应等级 varchar -1:进展,0:稳定,1:部分响应,2:显著响应