标题
  • 标题
  • 作者
  • 关键词

基于多特征多分类器集成的专利自动分类研究

2017-08-25分类号:G254.1

【作者】贾杉杉  刘畅  孙连英  刘小安  彭涛  
【部门】北京联合大学智慧城市学院  北京联合大学机器人学院  北京联合大学城市轨道交通与物流学院  
【摘要】【目的】为了准确地给专利申请书分配IPC分类号,本文提出一种基于多特征多分类器集成的专利自动分类方法。【方法】使用从专利申请书中提取的全词典TFIDF特征、信息增益词典TFIDF特征、段落向量特征、主题模型向量特征,分别训练朴素贝叶斯、支持向量机、AdaBoost分类器,以此构建特征–类别矩阵,并结合F1权重矩阵集成,获得最终IPC预测分类号。【结果】对2014年–2016年"发动机或泵"领域的10个小类进行分类,使用Top Prediction、All Categories和Two Guesses三种评
【关键词】专利分类  段落向量  主题向量  分类器集成
【基金】国家重点研发计划项目“公共安全风险防控与应急技术装备”(项目编号:2016YFC0802107);; 北京市教育委员会科技计划面上项目(项目编号:SQKM201411417013)的研究成果之一
【所属期刊栏目】数据分析与知识发现
文献传递