广东省数据知识产权存证登记平台
登记信息
用户活跃度多维度特征数据集 已登记
  • 数据申请号:

    粤2025122603481

  • 数据登记号:

    SZ2025120026818.4

  • 关键词:

    用户活跃度;行为特征;用户分群;数据驱动;用户运营

  • 登记时间:

    2026-02-15

  • 登记主体:

    万里数据(广东)有限公司

  • 平台证书编号:

    20251244000026818

  • 服务机构:

    广州恒成智道信息科技有限公司

  • 法院编号:

    暂无

区块链信息
  • 上链时间:

    暂无

  • 所属区块链:

  • 证据指纹:

    7df140dcb927b14ef7925ca6255c2f5acff6a57b09d4f8f06270f234b6d6227e240c49986d6a8b85486885486c530950f96b775f2faac5679fe75d7d0a4fa9af

  • 区块链存证证书编号:

数据信息
数据简介
本数据集源于万里数据(广东)有限公司自行研发的“打卡潮汕平台”后台记录的活动数据,通过对原始登录记录进行多维度特征提取与结构化加工,形成用户级的活跃度分析数据集。数据集经过清洗、聚合、特征衍生与标签化处理,适用于用户行为分析、活跃度评估、用户分群及运营策略制定等场景,可为用户生命周期管理、活跃度预测、个性化推荐等数据驱动决策提供结构化输入。
  • 数据来源:

    自行产生

  • 数据所属行业分类:

    I64 互联网和相关服务

数据处理规则说明
1.数据预处理与字段衍生。按用户ID进行分组,通过截取时间中的日期部分生成标准化日期字段,支持按自然日进行活跃行为统计。 2.用户行为特征提取。基于用户分组与时间序列,计算每个用户的登录总次数、首次登录时间与末次登录时间。进一步进行去重统计,得到用户在观测周期内的活跃天数,形成“登录频率—时间跨度—活跃持续性”多维特征体系。 3.活跃度标签生成。采用基于规则的数据标注方法,根据用户的活跃行为特征划分的用户类别,规则为:①核心高频活跃:当前用户的总登录次数≥10次,且日均登录次数≥2次;②中度活跃:5≤当前用户的总登录次数<10次,但日均登录次数<2次;③低频活跃:2≤当前用户的总登录次数<5次(不满足前两个条件);④单次体验:当前用户的总登录次数=1次;⑤未知:其他所有情况。 4.数据脱敏说明。本数据集中的用户ID为系统内部乱码生成,不涉及个人身份信息,无需进行脱敏处理。
应用场景描述
1.用户行为分析与活跃度评估。可基于登录频次、活跃天数、首次末次登录间隔等指标,构建用户活跃度评分体系,识别高活跃用户、流失风险用户及沉默用户。通过行为特征聚类,支持用户画像构建与行为模式挖掘,为产品迭代与用户留存策略提供依据。 2.用户分群与运营策略制定。结合活跃度标签,可将用户划分为不同群体,如“高频活跃用户”“间歇性用户”“新用户”“流失预警用户”等。基于分群结果,可设计差异化触达策略,如针对低活跃用户开展唤醒活动,对高活跃用户实施忠诚度计划,实现精细化运营。
  • 数据格式:

    xlsx

  • 数据更新频率:

    月更新

  • 数据量:

    135

样例数据
用户ID 记录时间 用户总登录次数 登录日期辅助列 用户活跃天数 用户首次登录时间 用户末次登录时间 活跃度标签 90323 2025/8/23 10:26 1 45892 1 2025/8/23 10:26 2025/8/23 10:26 单次体验 90324 2025/8/23 10:50 1 45892 1 2025/8/23 10:50 2025/8/23 10:50 单次体验 90329 2025/8/23 11:20 1 45892 1 2025/8/23 11:20 2025/8/23 11:20 单次体验
数据结构样例
序号 字段名称 字段类型 字段示例值 1 用户ID VARCHAR(20) 90323 2 记录时间 DATETIME 2025/8/23 10:26 3 用户总登录次数 INT 1 4 登录日期辅助列 DATE 45892 5 用户活跃天数 INT 1 6 用户首次登录时间 DATETIME 2025/8/23 10:26 7 用户末次登录时间 DATETIME 2025/8/23 10:26 8 活跃度标签 VARCHAR(20) 单次体验
数据状态
  • 2026-02-15

    数据知识产权登记完成