广东省数据知识产权存证登记平台
登记信息
耀仔AI工程垂类大模型训练数据集 已登记
  • 数据申请号:

    粤2025123103650

  • 数据登记号:

    SZ2026120001292.5

  • 关键词:

    建筑行业;AI大模型;工程咨询;人工智能;工程技术服务。

  • 登记时间:

    2026-03-21

  • 登记主体:

    广东鼎耀工程技术有限公司

  • 平台证书编号:

    20260244000001292

  • 服务机构:

    广东省电子信息行业协会

  • 法院编号:

    暂无

区块链信息
  • 上链时间:

    暂无

  • 所属区块链:

  • 证据指纹:

    321ab08b0b6758a43078432120c2c456f94d16c5c2238a99f76a8e165b02b5f78645bcde6f056b51018572d53b64fd7f0521344fc1012b5492e97a74245bc056

  • 区块链存证证书编号:

数据信息
数据简介
本数据集源于公司自研平台耀仔AI系统,通过对智能体的交互,快速查找问题对应的规范,项目具体的管理情况,来辅助项目精细化管理。工程垂类大模型,生成报告+规范精准查询,秒级输出专业决策依据解决“判”的薄弱,作为工程领域专属智能助手,覆盖项目管理、技术指导、数据统计等场景,支持多模态交互,助力工地人员高效决策,降低工程管理操作门槛。数据集为系统的标注数据,人工对模型的问题回答进行正负例答案标注,用于对模型进行微调训练,使模型能够理解复杂工程场景、精准引用条款、具备更好的逻辑推理能力。
  • 数据来源:

    自行产生

  • 数据所属行业分类:

    E48 土木工程建筑业

数据处理规则说明
1、完整性校验​:剔除缺失关键信息的记录,确保每条进识别记录的基本要素完整。2、逻辑修正​:统一时间格式,将不同来源的识别时间规范为标准的日期时间格式。3、数据处理:对采集到的数据进行去重、校验等处理,除去无效、错误、重复的数据记录,确保标准数据现行有效并转化为结构化数据集。4、数据质量校验​:问题、对应文档、正例答案、负例答案等关键信息缺失的记录,以便进一步核实数据准确性。5、加工工具:Excel:用于初步的数据查看、筛选和简单计算。6、采用AI训练算法进行模型训练。
应用场景描述
耀仔AI为工程垂类大模型,基于建设方、施工方、设计单位、监理单位等多方立场思考,可一键问答项目进展情况,管理问题反馈及改进建议,并建立辅助项目管理的AI智能助手,支持多种工程类型、多种数字化业务场景的智能化问答,通过集成多种规范与问题集的垂类AI,快速生成合规技术方案与报告,有效弥补了多方人员的知识盲区,助力工地人员高效决策,降低工程管理操作门槛。
  • 数据格式:

    xlsx

  • 数据更新频率:

    实时更新

  • 数据量:

    60

样例数据
序号 问题 对应文档 正例答案 负例答案 标注时间 1 某项目采用水泥土搅拌桩复合地基,施工完成后对其进行承载力检验,施工单... GB50202-2018 建筑地基工程施工质量验收标准 根据建筑标准规范要求,该检验方案存在以... 根据《JGJ79-2012 建筑地基处理技术规范》第7.1.6条,水泥... 2025-12-07 22:41:52 2 某项目采用天然地基,持力层为粉质黏土层,设计... GB50202-2018 建筑地基工程施工质量验收标准 判定结论分析施工单位的结论不正确... 根据《GB50202-2018 建筑地基基础工程施工质量验收标准》第4.1.5条... 2025-12-07 23:06:42 3 在乙等剧场观众厅中,若舞台台口未设... JGJ 57-2016 剧场建筑设计规范 根据建筑防火设计规范的要求,我需要指出以... 据《JGJ 57-2016 剧场建筑设计规范》第8.1.2条第1款:对于乙等剧场... 2025-12-08 14:36:09 附件下载
数据结构样例
字段名称 字段说明 字段类型 是否主键 序号 序号 文本 非主键 问题 输入的问题 数值 非主键 对应文档 回答对应的文档 文本 非主键 正例答案 回答最好的一项 文本 非主键 负例答案 回答最差的一项 文本 非主键 标注时间 标注的时间 时间 非主键
数据状态
  • 2026-03-21

    数据知识产权登记完成