专利发明等级分类建模技术研究
2017-12-25分类号:G306;TP181
【部门】北京工业大学经济与管理学院
【摘要】【目的】针对如何确定专利发明等级,提出一种基于机器学习分类算法的专利发明等级分类模型。【方法】从专利文本中提取技术特征词,利用Word2Vec训练的词向量模型构建专利技术特征向量,计算专利文本指标和后向引用指标,构造模型训练数据集,采用机器学习分类算法构建分类模型。【结果】获取语音识别技术领域相关专利,对领域专利数据分类,高等级与低等级发明专利占比约为1︰4,符合实际情况,证明了该模型可行性。【局限】由于使用了Word Net词典,对于技术特征词汇的抽取会受到词典收录局限的影响。【结论】该模型可以对专利进
【关键词】专利发明等级 技术特征向量 词向量 机器学习
【基金】北京市社会科学基金项目“要素异质性视角下京津冀现代制造产业转移路径研究”(项目编号:15JGB124);; 北京市自然科学基金项目“基于技术交易数据的京津冀科技协同创新潜力挖掘”(项目编号:9172002)的研究成果之一
【所属期刊栏目】数据分析与知识发现
文献传递