基于机器学习模型的专利质量预测初探
2019-04-24分类号:G255.53
【部门】浙江大学管理学院知识产权管理研究所 香港科技大学计算机科学及工程学系
【摘要】随着专利数量的迅速增长,如何预测专利质量,已成为企业、政府以及学术界越发关注的问题。传统的统计分析方法虽然对专利质量评估进行了多方面探索,却较少对专利质量进行预测,尤其是充分利用到专利数据的海量样本和持续更新的优势。本文以2010—2011年国家知识产权局受理的共计85万余件专利申请为研究对象,抓取申请文档中以及相关引文的特征信息,搭建完整的随机森林模型,对后续被引情况进行机器学习及预测。除此之外,随机森林对特征重要性的评估结果显示,专利的向前引证专利的特征比该专利本身的特征对后续引证的预测提供了更多有效信息,进一步显示出专利审查中对前引专利检索工作的重要性。同时,文章结尾指出了本文模型的局限性以及今后借助机器学习对专利预测的改进方法。
【关键词】专利质量 机器学习 随机森林 预测
【基金】浙江省博士后科研项目择优资助“基于专利存续期和溢价的中国企业专利价值估测和研究”(71402161);“互联网+”嵌入企业协同创新生态系统研究项目(71732008)
【所属期刊栏目】情报学报
文献传递