广东省数据知识产权存证登记平台
登记信息
AI数据管家增强知识数据集 已登记
  • 数据登记申请号:

    SZ2024120001212.6

  • 关键词:

    知识泛化、语料库、智能用数、数据管家、智能问数

  • 登记时间:

    2024-04-02

  • 登记主体:

    广东金赋科技股份有限公司

  • 平台证书编号:

    20240344000001212

  • 服务机构:

    暂无

  • 法院编号:

    广州互联网法院 - a8cc33d7d249ac7cf876e0ed9a6ce12c5d3be8e9c2a40c6a4042cbca26193aa5-749fc1a4;legalxchain

区块链信息
  • 上链时间:

    2024-03-27

  • 所属区块链:

    司法联盟链·广东省知识产权保护中心

  • 证据指纹:

    f2d215e0a759a4c0e8cab75f1daedde90c2b33495877bb25a3b594c9b960548c44b0292b094d0f99d0636d0e4651e312a922a4631633199d5cca4f091837db8e

  • 区块链存证证书编号:

    LXM-GDIPI-23202403275021964167

数据信息
数据简介
在现在人工智能涌现时代,数据集成为了训练和优化机器学习模型的关键要素。AI数据管家增强知识数据集,作为一种模型训练语料库,具有广泛的应用前景和重要的价值,主要体现在,它融合了专业标准术语与泛化的日常口语化表达,为算法模型提供了丰富的语言泛化知识,从而使其能够更好地理解和处理日常用语。 本数据集包含了通用领域的知识词汇,涵盖了行业标准术语和技术性词汇。然而,在日常生活中,人们更倾向于使用口语化、通俗易懂的语言来交流。因此,这个数据集通过将这些专业术语与日常用语进行关联和映射,为算法模型提供了一种桥梁,增加对日常用语的理解,使其能够在不同语境中灵活应用,从而形成字段名、字段中文名、字段值、泛化词、抽象化构成的数据集。 本数据集可以帮助算法模型适应不同的语言环境。通过引入日常用语的数据,模型可以更好地理解用户的真实意图和需求,从而提高与用户互动的准确性和效率。其次,在模型训练方面,这个数据集可以作为一种补充语料库,与其他专业领域的语料库相结合,使模型具备更全面的知识背景。这有助于模型在处理复杂任务时,提高场景理解的准确性。最后,在推理使用方面,该数据集可以帮助模型更好地理解和处理自然语言文本
  • 数据来源:

    自行产生

  • 数据所属行业分类:

    I65 软件和信息技术服务业

数据处理规则说明
本数据集根据不同场景进行处理,确保数据集在在不同场景下,让算法模型能够更好地融合场景,精准获取语义。 本数据集依据场景,对接数据表结构、枚举值、系统术语收集等方式获取标准化的知识和词汇,然后通过与系统使用对象沟通了解日常用语,从而展开对标准词汇进行泛化和抽象,构建一对多的数据表。 在通义千问大模型基础上进行微调,并融合自有数据后,形成自有的模型kamfu-coder,在kamfu-coder里面嵌入一个增强知识的算法模型,对算法或者模型的输入进行embedding后,先进行一个泛化处理,即与本数据集进行对碰,通过文字匹配、向量计算方式重新构建输入,对标到fewshot或者prompt,从而提供AI生成准确率,其中对算法模型的输出进行脱敏,涉及到个体数据进行模糊化后再输出展示。
应用场景描述
本数据集主要应用于对智能用数场景方面,可以适应不同行业不同场景。支持通过自然语言问答模式,通过一定算法模型,自动输出对应的数据结果,应用广泛。1、经营分析:基于O2O营销数据,利用AI数据管家,可以让非技术业务人员也可以进行经营分析,公司产品分布、竞争力、竞品分析等;2、公司内部数据分析,利用公司内部数据进行高效利用,挖掘内部数据价值,如财务、项目管理等,无需开发,所问即所得等;
  • 数据格式:

    xlsx

  • 数据更新频率:

    其他

  • 数据量:

    16700

样例数据
字段名 字段中文名 字段值 泛化词 抽象化 知识附加说明 删除标志位 删除时间 major 专业(标准化) 财务管理 财务管理 某专业 0 duty_type 职能分类 管理部门 管理 某职能分类 0 major 专业(标准化) 财务管理 财管 某专业 0 department 所属部门 产品规划部 解决方案中心 某部门 0 department 所属部门 产品规划部 方案中心 某部门 0 duty_type 职能分类 知识产权部 知识产权 某职能分类 0 duty_type 职能分类 管理部门 管理部门 某职能分类 0 duty_type 职能分类 管理部门 管理部 某职能分类 0 department 所属部门 产品规划部 产品解决方案中心 某部门 0 department 所属部门 产品规划部 产品与解决方案中心 某部门 0 duty_type 职能分类 管理部门 管理人员 某职能分类 0 duty_type 职能分类 管理部门 管理层 某职能分类 0
数据结构样例
数据集数据结构包括:类型、字段名、字段中文名、字段值、泛化词、抽象化、知识附加说明、删除标识、删除时间。
数据状态
  • 2024-04-02

    数据资产登记入表备案

    数据资产登记入表时间:2024年03月30日
  • 2024-04-02

    数据知识产权登记完成