基于模型检测方法的中文专利法律状态数据清洗研究
2018-03-30分类号:G255.53
【部门】南京理工大学经济管理学院
【摘要】[目的/意义]专利法律状态信息具有时序特征,其清洗工作要求保证法律状态个体的正确性和状态之间时序关系的合理性,文章设计了一个时序关系数据清洗框架,识别出专利法律状态数据中所隐藏的时序逻辑问题。[方法/过程]利用模型检测方法对法律状态信息数据库建模,构建基于时序关系的法律状态分类体系、法律状态信息数据库模型,设计专利法律状态信息清洗框架;对专利法律状态信息时序演变关系进行抽取、描述和检测。结合实证研究对提出的框架进行验证,发现专利法律状态信息在时间序列方面的常见错误模式。[结果/结论]文章设计的数据清洗框架
【关键词】模型检测方法 专利 数据清洗 数据质量
【基金】国家自然科学基金项目“突发事件网民负面情感的模型检测研究”(项目编号:71774084);国家自然科学基金项目“突发事件网络舆情演变过程中的人群仿真研究”(项目编号:71273132);国家自然科学基金项目“基于时间感知模型的学术主题检索与演化挖掘研究”(项目编号:71503124);; 江苏省“青蓝工程2016(15)”资助的研究成果
【所属期刊栏目】情报理论与实践
文献传递