广东省数据知识产权存证登记平台
登记信息
佛山大学蛋白质PSMs与Unique Peptides关联强度数据集 已登记
  • 数据申请号:

    粤2025101602174

  • 数据登记号:

    SZ2025120017426.X

  • 关键词:

    蛋白质;PSMs;Unique Peptides

  • 登记时间:

    2025-11-10

  • 登记主体:

    佛山大学

  • 平台证书编号:

    20251044000017426

  • 服务机构:

    暂无

  • 法院编号:

    暂无

区块链信息
  • 上链时间:

    2025-11-04

  • 所属区块链:

    司法联盟链·广东省知识产权保护中心

  • 证据指纹:

    5f37f5b4bb765830197a97dd8871bdebb19a92cfebf3d3b2600735e18e57a774e316578475ab8fd1a98f4ff61578efeb2d0279a0736aea2b8c2d12ef39e56781

  • 区块链存证证书编号:

    LXM-GDIPI-23202511044042664584

数据信息
数据简介
本数据集源自佛山大学生物医学实验室的蛋白质谱鉴定研究,记录了技术鉴定的蛋白质谱数据。数据通过检测获取并由人工记录,经过数据清洗、校验、存储及分析处理后形成结构化数据集。该数据集可用于数据可靠性与质量评估应用场景。
  • 数据来源:

    自行产生

  • 数据所属行业分类:

    M73 研究和试验发展

数据处理规则说明
1、数据清洗与标准化 (1) 完整性校验:必填字段:蛋白ID、PSMs、Unique Peptides、calc. pI。缺失值处理:删除PSMs=0的记录 (2) 逻辑修正:pI<7为酸性蛋白,pI≥7为碱性蛋白。 2、数据质量校验 勾稽关系验证: PSMs占比=单个蛋白PSMs/总PSMs Unique Peptides占比=单个蛋白Unique Peptides/总Unique Peptides 3、数据存储管理 原始质谱数据:分布式存储 分析结果数据:MySQL关系型数据库 4、数据处理分析 PSMs 占比列:计算每个蛋白的 PSMs 数量占总 PSMs 数量的比例。Unique Peptides 占比列:类似于 PSMs 占比,计算每个蛋白的 Unique Peptides 数量占总 Unique Peptides 数量的比例。 pI 分类列:根据calc. pI的值对蛋白进行分类。 PSMs 与 Unique Peptides 关联强度列:通过计算两者的相关性系数(如皮尔逊相关系数),判断这两个指标之间的关联程度。
应用场景描述
1、蛋白质功能研究:通过pI分类分析蛋白质等电点分布特征 2、生物标记物发现:筛选PSMs占比>5%的高丰度蛋白,识别Unique Peptides特异性组合模式 3、实验方法优化:分析酶解效率与PSMs数量的相关性
  • 数据格式:

    excel表格

  • 数据更新频率:

    实时更新

  • 数据量:

    60

样例数据
序号 蛋白ID PSMs Unique Peptides calc. pI PSMs占比 Unique Peptides占比 pI分类 PSMs与Unique Peptides关联强度 1 A0A287AN33 76 1 4.93 0.253333333 0.008547009 酸性蛋白 76 2 A0A8W4FE53 34 1 5.14 0.113333333 0.008547009 酸性蛋白 34 3 A0A288CFU5 21 6 9.03 0.07 0.051282051 碱性蛋白 3.5
数据结构样例
字段名称 数据类型 字段描述 示例值 序号 编号 数据编号 1 蛋白ID 编号 蛋白编号 A0A287AN33 PSMs 数值 肽段-谱图匹配数 76 Unique Peptides 数值 唯一肽段数 1 calc. pI 数值 理论等电点 4.93 PSMs占比 数值 PSMs/总PSMs 0.253333333 Unique Peptides占比 数值 Unique Peptides/总Unique Peptides 0.008547009 pI分类 文本 酸性蛋白/碱性蛋白 酸性蛋白 PSMs与Unique Peptides关联强度 数值 PSMs与Unique Peptides关联强度 76
数据状态
  • 2025-11-10

    数据知识产权登记完成