广东省数据知识产权存证登记平台
登记信息
佛山大学蛋白质等电位与匹配度相关性数据集 已登记
  • 数据申请号:

    粤2025101602175

  • 数据登记号:

    SZ2025120017427.0

  • 关键词:

    实验;蛋白质等电位;匹配度

  • 登记时间:

    2025-11-10

  • 登记主体:

    佛山大学

  • 平台证书编号:

    20251044000017427

  • 服务机构:

    暂无

  • 法院编号:

    暂无

区块链信息
  • 上链时间:

    2025-11-04

  • 所属区块链:

    司法联盟链·广东省知识产权保护中心

  • 证据指纹:

    1c79523d40d5ce38ce8b20e08dbd9c86dc3dd61b7602c09b89d05a2c32218f6b1114d1b4839734f6f80218ec7e799078db9a48b6aed37564fa07999f42045ce4

  • 区块链存证证书编号:

    LXM-GDIPI-23202511044014152209

数据信息
数据简介
本数据集源自佛山大学生物信息学实验室质谱分析实验数据,包含60种常见基因蛋白质的分子量(MW)、等电点(calc. pI)与匹配度评分(Score)的关联数据。数据通过检测获取并由人工记录,形成结构化相关性分析数据集,可用于蛋白质特性研究、生物标记物筛选、实验方法优化等场景。
  • 数据来源:

    自行产生

  • 数据所属行业分类:

    M73 研究和试验发展

数据处理规则说明
1、数据清洗与标准化 必填字段:Gene Symbol、MW [kDa]、calc. pI、Score Sequest HT 缺失处理:任一关键字段缺失的记录予以剔除 2、数据质量校验 (1) 逻辑关系验证: 分子量分类与数值范围匹配校验 相关系数值范围校验(-1至1之间) (2) 异常值处理: Sequest HT评分≤2的记录标记为低置信度数据 等电点(pI)超出常规蛋白范围(3-12)的记录需复核 3、数据存储管理: 每次数据更新生成MD5校验码 保留至少3个历史版本 4、数据处理分析 首先通过“分子量分类”,对MW [kDa]数值小于50标记为小分子,MW [kDa]数值大于50并小于150标记为中分子,MW [kDa]数值大于150标记为大分子。然后运用皮尔逊相关系数,按照分子大小,分别计算等电位(calc. pI)与匹配度评分(Score Sequest HT: Sequest HT)的相关度系数。
应用场景描述
1、蛋白质特性研究:分析不同分子量区间的等电点分布规律 2、生物标记物筛选:基于高评分(pI与Score强相关)筛选候选标记物 3、实验方法优化:为质谱实验参数设置提供参考范围(如针对大分子蛋白优化电离条件),校准等电点预测算法的准确性
  • 数据格式:

    excel表格

  • 数据更新频率:

    实时更新

  • 数据量:

    60

样例数据
序号 Gene Symbol MW [kDa] calc. pI Score Sequest HT: Sequest HT 分子量分类 calc. pI与Score Sequest HT: Sequest HT相关系数 1 TPM2 40.3 4.93 260.07 小分子蛋白 -0.301694521 2 TUBA8 55 5.14 77.14 中分子蛋白 -0.244526774 3 PTBP3 59.9 9.03 31.3 中分子蛋白 -0.244526774
数据结构样例
字段名称 类型 描述 示例 序号 数值 不同基因数据编号 1 Gene Symbol 文本 标准基因符号 TPM2 MW [kDa] 数值 分子量(千道尔顿) 40.3 calc. pI 数值 计算等电点 4.93 Score Sequest HT: Sequest HT 数值 质谱匹配度评分 260.07 分子量分类 文本 按分子量划分的类别 小分子蛋白 calc. pI与Score Sequest HT: Sequest HT相关系数 数值 pI与评分的相关性系数 -0.30169452146983
数据状态
  • 2025-11-10

    数据知识产权登记完成