基于用电特征单一视角数据的中小企业生命周期阶段识别
2019-04-25分类号:F276.3
【部门】中国科学院大学经济与管理学院 普华讯光(北京)科技有限公司 中国科学院数学与系统科学研究院
【摘要】以我国某地区黑色金属加工及冶炼行业的212家中小企业为样本,先使用带行业影响修正的用电量增长率法标注样本,再利用K-means聚类算法和SMOTE过采样技术提取数据集特征和平衡训练集类别,最后采用经MetaCost元代价敏感算法改造后的梯度提升决策树模型进行企业生命周期阶段的识别建模和预测。构建的七项特征具有典型的长尾性质,表现在对模型的预测能力贡献上它们的重要度比较平均一致。经过代价矩阵调参,模型对失衡类别企业样本的最佳查准率和查全率分别为83.3%和88.9%。通过与传统方法结果的横向Kappa一致性检验和纵向实证分析,验证了基于单视角企业用电数据利用机器学习算法模型来识别企业生命周期阶段的可信性和有效性。
【关键词】中小企业 生命周期 机器学习 发展阶段识别 电力数据
【基金】国家自然科学基金项目“基于供给使用表和考虑企业异质性的中国投入产出模型及应用研究”(71673269)
【所属期刊栏目】技术经济
文献传递