广东省数据知识产权存证登记平台
登记信息
患者年龄特征与就诊诊断结构分类数据集 已登记
  • 数据申请号:

    粤2026042204359

  • 数据登记号:

    SZ2026120003157.7

  • 关键词:

    患者年龄特征、就诊类型、诊断编码、疾病系统分类、诊断结构类别

  • 登记时间:

    2026-05-30

  • 登记主体:

    佛冈县人民医院

  • 平台证书编号:

    20260444000003157

  • 服务机构:

    暂无

  • 法院编号:

    广州互联网法院 - 093a8fa8ba6bbb6470153ebff3f8c0904fe414dc3ebfcea150e9a1c9e24cbef9-749fc1a4;legalxchain

区块链信息
  • 上链时间:

    2026-05-20

  • 所属区块链:

    司法联盟链·广东省知识产权保护中心

  • 证据指纹:

    d1f2db91e6c7e6d6ea7da478aecc7828fb074bc11453ed9921d3fb8203731761b40b0507d8b277b0a3cf6d9fc64504058ba23c59134906e6bb154ffa68bfb786

  • 区块链存证证书编号:

    LXM-GDIPI-23202605206424538962

数据信息
数据简介
该数据集用于反映患者在不同年龄阶段、不同就诊场景下的诊断分布情况,可为医院就诊结构分析、患者群体特征研究及相关管理工作提供基础数据支撑。数据内容主要包括:数据编号,用于标识每条记录;年龄年、年龄月、年龄日,用于反映患者就诊时的具体年龄信息,其中低龄患者保留至日龄;年龄分层,用于对患者年龄阶段进行归类;就诊类型,用于区分门诊和住院;性别,用于反映患者性别情况;诊断编码和诊断名称,用于记录患者对应的诊断信息;疾病系统分类,用于归纳诊断所属的系统类别;诊断性质标识,用于区分感染性、慢病管理类、结节包块类、症状体征类等诊断性质;患者诊断结构类别,用于在年龄特征、疾病系统分类和诊断性质标识基础上形成综合分类结果。
  • 数据来源:

    自行产生

  • 数据所属行业分类:

    Q84 卫生

数据处理规则说明
首先,在原始数据整理阶段,对医院门诊和住院来源数据进行汇总、核对和统一整理,保留基础信息删除重复记录,剔除诊断编码与诊断名称同时缺失的无效数据,并统一字段名称、数据格式和取值口径;对年龄字段进行标准化处理,其次,在实质性加工阶段,使用 Python 数据处理工具对整理后的数据进行清洗、拆分、归类和重组,通过字符串拆分方法将原始诊断信息分解为“诊断编码”和“诊断名称”,再依据诊断编码首位字母对应的疾病分类规则,并结合诊断名称关键词匹配方法,构建疾病系统分类规则模型和诊断性质识别规则模型,将诊断记录归入呼吸系统疾病、循环系统疾病、消化系统疾病、泌尿生殖系统疾病等疾病系统类别,以及感染性、慢病管理类、结节包块类、症状体征类、健康服务类等诊断性质类别;同时根据年龄年、年龄月、年龄日计算年龄分层,形成新生儿、婴儿、儿童等分类结果。最后,生成创新性数据字段“患者诊断结构类别”,该字段是在年龄分层、疾病系统分类和诊断性质标识基础上,按照预设分类规则综合判定形成的总结性分类结果,用于反映患者在特定年龄特征和诊断背景下的诊断结构归属,该创新性字段位于数据文件第一个工作表第十二列
应用场景描述
该数据集可应用于医院运营管理、患者结构分析、专科服务优化、疾病分布研究及公共卫生辅助决策等场景。通过对不同年龄层患者在门诊和住院场景下的诊断结构进行分类整理,可用于分析医院患者群体的年龄分布特点、常见诊断类型及系统疾病构成,辅助医院掌握儿童、青少年、中年及老年患者的主要就诊需求,为门诊排班、住院床位配置、重点专科建设及诊疗资源调配提供参考;同时可用于识别感染性疾病、慢病管理类疾病、结节包块类疾病等在不同年龄层中的分布特点,为儿科、老年医学科、呼吸科、内分泌科、泌尿外科等相关专科的服务优化和管理提供支持;在更广泛的应用中,该数据集还可作为区域医疗服务研究、疾病谱观察及卫生管理分析的基础数据,为医院开展精细化管理和相关研究工作提供数据支撑。
  • 数据格式:

    xlsx

  • 数据更新频率:

    周更新

  • 数据量:

    2788

样例数据
数据编号:HJ00001;年龄年:81;年龄月:11;年龄日:28;年龄分层:老年;就诊类型:门诊;性别:男;诊断编码:M17.900x003;诊断名称:双侧膝关节骨性关节病;疾病系统分类:肌肉骨骼系统疾病;诊断性质标识:肌骨系统类;患者诊断结构类别:老年肌骨系统类。 数据编号:HJ00002;年龄年:23;年龄月:1;年龄日:3;年龄分层:青年;就诊类型:门诊;性别:男;诊断编码:R50.900;诊断名称:发热查因;疾病系统分类:症状与体征类;诊断性质标识:感染性;患者诊断结构类别:青中年感染类。 数据编号:HJ00003;年龄年:70;年龄月:4;年龄日:23;年龄分层:老年前期;就诊类型:门诊;性别:男;诊断编码:H26.900;诊断名称:白内障;疾病系统分类:耳眼及感觉器官疾病;诊断性质标识:耳眼专科类;患者诊断结构类别:老年耳眼专科类。
数据结构样例
患者年龄特征与就诊诊断结构分类数据集存储于 Excel 表中,数据表字段包含:数据编号(Data_ID)、年龄年(Age_Year)、年龄月(Age_Month)、年龄日(Age_Day)、年龄分层(Age_Group)、就诊类型(Visit_Type)、性别(Gender)、诊断编码(Diagnosis_Code)、诊断名称(Diagnosis_Name)、疾病系统分类(Disease_System_Category)、诊断性质标识(Diagnosis_Nature_Label)、患者诊断结构类别(Patient_Diagnostic_Structure_Category)。
事务信息
  • 2026-05-30

    数据知识产权登记完成