数据信息
数据简介
本数据集是基于食用菌工厂化栽培技术相关专利,采用三级技术标签体系,对专利数据实现结构化处理,并增设"菌种栽培技术效果"标注,支持技术手段与技术功效之间的交叉映射分析,为技术发展路径研判与功效关联挖掘提供结构化数据基础。揭示全球范围内工厂化栽培的技术热点与空白领域,协助企业有效规避现有专利壁垒,通过"技术手段-功效"矩阵交叉分析矩阵,明确技术成效关联路径,引导研发资源实现精准与高效配置。通过解析主要国家/地区的技术布局特征与重点竞争对手的动态动向,为企业制定市场进入策略提供支撑。
数据处理规则说明
1. 原始数据:原始数据源于商用专利数据库的初始检索结果,数据字段包括专利原文及基础信息。
2. 实质性加工流程: 基于技术分解树,构建布尔逻辑检索式(关键词组合+国际专利分类号IPC),并进行查全率与查准率校验,迭代优化检索式。
数据分析与标注:采用“AI自然语言处理模型辅助预标注 + 领域专家人工判读校正”的人机协同工作流; 使用基于BERT的文本分类模型,对专利摘要和权利要求书进行自动分析,预判其所属的技术分支(瓶栽、床栽、其他)和菌种类型;应用TF-IDF、TextRank等关键词抽取算法,结合自定义的技术功效词典,从专利文本中自动抽提及识别与技术效果(如“增产”、“防腐”、“缩短周期”)相关的表述,并标注标准化后的技术功效描述;再由技术背景技术人员进行人工审核、校正与标准化,确保标注的准确性。
3. 创新性数据内容:经上述加工后,将非结构化的菌种专利文本转化为结构化的技术标签。包含专利所属的特定食用菌种类(如香菇、金针菇)、菌种栽培技术手段|Level 1/2/3(Level 1: 设施栽培,Level 2: 工厂化栽培,Level 3: 瓶栽)、菌种栽培技术。
应用场景描述
本数据集适用于从事食用菌工厂化栽培技术研发、战略规划与知识产权管理的各类机构与人员,包括农业科技企业研发部门、科研院所研究人员、行业分析师以及企业战略决策者。
数据集主要解决三大核心问题:一是技术路径模糊,通过对全球专利进行“技术手段-功效”的交叉映射分析,清晰揭示不同技术方案(如瓶栽、床栽)与实现效果(如提高产量、降低成本)间的关联关系,帮助企业选择最优研发路径,避免重复投入。二是专利风险难测,通过解析主要国家/地区及竞争对手的技术布局,可精准识别技术热点与空白领域,为市场进入策略制定和专利壁垒规避提供依据。三是研发资源错配,借助结构化的功效标签与矩阵分析,可引导研发资源投向高价值、低竞争的技术方向,实现精准投入。
该数据集为解决技术决策中的信息不对称问题提供了可靠的结构化数据基础,是提升研发效率与战略布局有效性的关键工具。
样例数据
序号 公开(公告)号 标题 申请号 申请日 [标]原始申请(专利权)人 [标]当前申请(专利权)人 专利类型 IPC主分类号 受理局 简单法律状态 被引用专利数量 食用菌类型 菌种栽培技术手段|Leve 1 菌种栽培技术手段|Level 2 菌种栽培技术手段|Level 3 菌种栽培技术效果
1 CN101366346A 一种纯白金针菇的培育方法 CN200810023197.5 2008-07-31 芜湖野树林生物科技有限公司 芜湖野树林生物科技有限公司 发明申请 A01G1/04 中国 失效 111 金针菇 设施栽培 工厂化栽培 瓶栽 抗逆性能较强
2 CN1059068A 中药渣栽培食用菌的方法 CN91104240.7 1991-06-21 云南省曲靖地区制药厂 | 曲靖医学高等专科学校 云南省曲靖地区制药厂 | 曲靖医学高等专科学校 发明申请 A01G1/04 中国 失效 52 金针菇 设施栽培 工厂化栽培 瓶栽 降低培育成本
3 CN1796539A 冬虫夏草大规模发酵生产及菌粉加工工艺 CN200410101728.X 2004-12-24 青海月王青藏药业有限责任公司
附件下载
数据结构样例
菌种栽培专利技术标注数据集
字段名称 字段类型 字段属性
序号 数字 主关键字段,唯一标识符
公开(公告)号 字符串 专利公开号,唯一标识
标题 字符串 专利标题全文
申请号 字符串 专利申请号
申请日 字符串 日期格式(YYYY-MM-DD)
[标]原始申请(专利权)人 字符串 原始申请人名称,多值用分隔符
[标]当前申请(专利权)人 字符串 当前权利人名称,多值用分隔符
专利类型 字符串 如发明申请、授权发明等
IPC主分类号 字符串 国际专利分类号
受理局 字符串 专利受理机构(如中国、美国等)
简单法律状态 字符串 如审中、有效、失效等
被引用专利数量 数字 整数,表示被引次数
食用菌类型 字符串 食用菌分类,多值用换行符分隔
菌种栽培技术手段|Level 1 字符串 分类,多值用换行符分隔
菌种栽培技术手段|Level 2 字符串 代谢产物名称,多值用换行符分隔
菌种栽培技术手段|Level 3 字符串 代谢产物名称,多值用换行符分隔
菌种栽培技术效果 字符串 浮点数,计算字段(基于IDF算法)