广东省数据知识产权存证登记平台
登记信息
成人实体瘤治疗方案结构化数据集(23癌种·8658条·含NCT验证) 已登记
  • 数据申请号:

    粤2026041004277

  • 数据登记号:

    SZ2026310003245.6

  • 关键词:

    成人实体瘤,23癌种,8658条,NCT验证,结构化

  • 登记时间:

    2026-06-03

  • 登记主体:

    李晓端

  • 平台证书编号:

    20260444000003245

  • 服务机构:

    暂无

  • 法院编号:

    广州互联网法院 - bfa33bafa6bc2ce50e44044538f3c69259e4e5fe20f75d865f769ea88a1ff9a6-749fc1a4;legalxchain

区块链信息
  • 上链时间:

    2026-05-13

  • 所属区块链:

    司法联盟链·广东省知识产权保护中心

  • 证据指纹:

    d7bea1d8a564f84d6b97280d61e4414adc6794ed62171779d79422cc0fb2c182c26cee175913f6015c4b22c046f0678c2c74bc7f284cecf1c5f5010b084cc563

  • 区块链存证证书编号:

    LXM-GDIPI-23202605136945370037

数据信息
数据简介
本数据集由申请人独立加工整理,覆盖23种成人实体瘤(含14种常见成人癌种及9种含儿童在内的癌种),包含8658条治疗方案记录。每条记录采用31个标准化字段,涵盖癌种基本信息、治疗方案、证据等级、药物信息、医保状态、NMPA获批标识、NCT临床试验关联等。其中1500条记录已关联有效NCT试验号,可追溯至ClinicalTrials.gov公开试验方案。数据来源为公开临床试验注册库及公开发布的诊疗指南,经标准化清洗、去重、证据分级后形成。适用于AI模型训练、临床决策支持系统开发及药品研发真实世界研究。数据集已完成数据指纹存证。
  • 数据来源:

    公开采集

  • 数据所属行业分类:

    Q84 卫生

数据处理规则说明
本数据集经以下独创性规则加工,形成智力成果: 一、定向数据采集规则 基于ClinicalTrials.gov公开库,通过NCT号定向检索,提取干预措施、用药方案、适应症、分组信息等公开字段;未使用爬虫。8658条中1500条含有效NCT号。 二、交叉校验规则 其余记录的癌种、分期、治疗线数等背景信息,通过公开诊疗指南摘要及学术会议记录进行索引交叉验证。 三、字段映射与归一化规则 将不同来源术语统一映射:NCT干预措施→“首选方案”;“治疗阶段”标准化为“一线”“二线”;不同指南的证据等级映射至本数据集分级(1类/2A类)。 四、独创性增量信息 (1)证据等级:自建评级体系(Ⅰ级:Meta分析/系统综述;Ⅱ级:RCT;Ⅲ级:单臂/回顾性;Ⅳ级:专家共识)。 (2)NMPA获批标识:定期查询CDE官网公开信息标识药品审批状态。 (3)医保报销标识:比对历年国家医保目录进行标识。 (4)关联试验ID:建立NCT号与完整试验方案(入排标准等)的关联索引。 五、冲突消解规则 多源信息不一致时,优先采用NCT官方记录或更高证据等级来源。
应用场景描述
本数据集适用于以下应用场景: 1. AI医疗大模型训练:为临床决策支持系统(CDSS)提供高质量训练数据,覆盖23癌种、8658条治疗方案记录。 2. 药品研发真实世界研究(RWS):为药企和CRO公司提供精准治疗方案数据支撑,1500条记录可通过NCT号追溯至ClinicalTrials.gov完整试验方案。 3. 患者NCT临床试验智能匹配:通过关联试验ID(NCT号)建立入排标准的关联索引,支持患者与临床试验的智能匹配。 4. 药品可及性分析:通过NMPA获批标识及医保报销标识,支持医保准入和药品市场分析。
  • 数据格式:

    csv格式文档

  • 数据更新频率:

    其他

  • 数据量:

    8658

样例数据
方案ID,癌种,首选方案,治疗大类,市面药物,NMPA获批标识,医保报销标识,指南依据,证据等级,备选方案,保底方案,癌种编码,病理亚型,基因突变,转移部位,体能状态,分期,治疗线数,分层标识,特殊人群/条件,技术变体说明,技术手段,核心设备,姑息治疗标识,关联专家ID,关联试验ID,版本号,更新日志,指南哈希值,生物标志物分层标识,技术依赖标识 C18_C20-000014,结直肠癌,Pembrolizumab 200mg IV每3周或400mg每6周,免疫治疗,Pembrolizumab (Keytruda)、Nivolumab (Opdivo)、Ipilimumab (Yervoy),无,无,NCCN 2026 v1 DOI:10.6004/jnccn.2026.0001;KEYNOTE-177研究 DOI:10.1056/NEJMoa2017699;CHECKMATE-8HW DOI:10.1056/NEJMoa2400821,1类,Nivolumab 240mg IV每2周或480mg每4周±Ipilimumab,无,C18-C20,腺癌,MSI-H/dMMR,肝|肺|腹膜, 附件下载
数据结构样例
数据结构说明 表名:tumor_treatment_plan_dataset 主关键字段:方案ID 数据格式:CSV 数据量:8658条 字段列表(31字段,全部为字符串类型): 方案ID(主键,非空) 癌种(非空) 首选方案(非空) 治疗大类(非空) 市面药物 NMPA获批标识 医保报销标识 指南依据 证据等级 备选方案 保底方案 癌种编码 病理亚型 基因突变 转移部位 体能状态 分期(非空) 治疗线数(非空) 分层标识 特殊人群/条件 技术变体说明 技术手段 核心设备 姑息治疗标识 关联专家ID 关联试验ID(NCT号) 版本号(非空) 更新日志 指南哈希值 生物标志物分层标识 技术依赖标识 说明:必填字段(非空)为方案ID、癌种、首选方案、治疗大类、分期、治疗线数、版本号。无明确信息字段填"无"。关联试验ID中约1500条包含有效NCT号。
事务信息
  • 2026-06-03

    数据知识产权登记完成