标题
  • 标题
  • 作者
  • 关键词

长期保存视角下的中文微博信息采集关键问题探讨

2015-02-05分类号:G250.73

【作者】刘超  郑建程  
【部门】中国科学院文献情报中心  
【摘要】[目的 /意义]对中文微博信息采集的关键问题进行分析,以期为中文微博信息的采集与长期保存研究和实践提供参考。[方法 /过程]选取采集范围、采集权利、采集方法 3个微博信息采集过程中的关键问题,与网络信息采集进行对比分析,并提出相应的对策。[结果 /结论]分析发现,对于微博信息,由于其具有自身特点,无法套用网络信息采集实践的经验,需要确定具有针对性的采集策略与方法;针对选取的3个关键问题,分别建议采取完整性采集、CC协议结合剔除策略、通过API采集的对策。
【关键词】微博信息  长期保存  采集范围  采集权利  采集方法
【基金】
【所属期刊栏目】图书情报工作
文献传递