标题
  • 标题
  • 作者
  • 关键词
登 录
当前IP:忘记密码?
年份
2024(6510)
2023(9265)
2022(7898)
2021(7531)
2020(6375)
2019(14586)
2018(14553)
2017(27889)
2016(14984)
2015(16769)
2014(16733)
2013(15803)
2012(14184)
2011(12552)
2010(11995)
2009(10519)
2008(9762)
2007(8138)
2006(6519)
2005(5261)
作者
(39885)
(33504)
(33115)
(31415)
(21083)
(15862)
(15156)
(13404)
(12790)
(11599)
(11353)
(11163)
(10542)
(10198)
(10195)
(10149)
(9936)
(9931)
(9592)
(9410)
(8090)
(8053)
(8034)
(7742)
(7543)
(7342)
(7199)
(7136)
(6699)
(6632)
学科
(56872)
经济(56804)
管理(42942)
(39107)
(33244)
企业(33244)
方法(30686)
数学(27473)
数学方法(27071)
(15710)
(14239)
中国(14021)
(11551)
业经(11519)
(10824)
理论(10430)
地方(10079)
(9943)
财务(9896)
财务管理(9872)
(9447)
贸易(9444)
企业财务(9390)
技术(9187)
农业(9181)
(9171)
(9152)
(8676)
(8271)
银行(8249)
机构
大学(198122)
学院(196801)
管理(79796)
(77862)
经济(76326)
理学(70424)
理学院(69663)
管理学(68251)
管理学院(67893)
研究(61599)
中国(44913)
(40207)
科学(37933)
(35490)
(32116)
业大(30886)
中心(29687)
财经(29180)
(29065)
(27823)
研究所(26908)
(26841)
(25975)
师范(25653)
农业(25329)
经济学(23975)
北京(23868)
(23349)
财经大学(22128)
技术(21894)
基金
项目(145811)
科学(116450)
基金(107585)
研究(106009)
(94057)
国家(93299)
科学基金(81366)
社会(67768)
社会科(64235)
社会科学(64222)
基金项目(57364)
(57041)
自然(53646)
自然科(52482)
自然科学(52467)
自然科学基金(51529)
教育(50812)
(48370)
资助(43240)
编号(42539)
成果(33145)
重点(32929)
(32883)
(31073)
(30346)
课题(29235)
创新(28975)
科研(28708)
教育部(28628)
国家社会(28380)
期刊
(75148)
经济(75148)
研究(51280)
中国(36717)
学报(32004)
科学(28999)
管理(28766)
(28431)
(27649)
大学(25121)
教育(24376)
学学(23890)
技术(18981)
农业(18946)
财经(14158)
(14000)
金融(14000)
业经(13184)
经济研究(12311)
(12158)
问题(10177)
(9685)
(9589)
统计(9342)
科技(9164)
理论(8907)
技术经济(8784)
业大(8705)
(8633)
图书(8583)
共检索到271206条记录
发布时间倒序
  • 发布时间倒序
  • 相关度优先
文献计量分析
  • 结果分析(前20)
  • 结果分析(前50)
  • 结果分析(前100)
  • 结果分析(前200)
  • 结果分析(前500)
[期刊] 图书情报工作  [作者] 乔建忠  
提出一种借助主题爬虫自动从返回的相关网页进行本体非分类关系学习的框架与方法。针对利用互联网进行本体学习的特点,所用到的主要方法是词频、共现统计和分割聚类算法K-Means,并没有采用复杂的语法结构分析和半指导聚类算法如EM、BIRCH和SOM,因此自动化程度和效率较高。学习结果将用于指导主题爬虫进行网页相关性的判断。这种非分类关系的学习质量将由主题爬虫在实际应用中的表现来客观评价。
[期刊] 华中农业大学学报  [作者] SUN Yong  王译霄  宣晓婷  张熙悦  邓文艺  靳欢  凌建刚  
果汁鉴伪技术正成为全球食品营养安全领域的研究热点,其发展对果汁质量与安全控制至关重要。结合机器学习联合网络爬虫算法检索文献技术,本文综述了近年来果汁鉴伪技术的研究进展与应用领域,并着重阐述了非靶向/靶向代谢组学鉴伪技术的研究进展。结合多学科交叉和计算机技术发展趋势,对检测方法耦合发展、监督型机器学习统计工具开发、无人监督鉴伪等趋势作了预测,以期为果汁鉴伪领域的深入研究提供参考。
[期刊] 图书馆杂志  [作者] 杨学明  刘柏嵩  
相比于数字图书馆中的可控高质量文档信息,互联网上提供了大量非结构化信息,如何有效利用这些信息成为当前的研究热点。本文提出将基于本体的主题爬虫技术应用在数字图书馆中,作为数字图书馆和互联网间的桥梁和媒介,利用丰富的网络资源来扩展数字图书馆。
[期刊] 中国内部审计  [作者] 吴则建  王鹏虎  庞瑞江  黄永平  
本文介绍了网络爬虫及主题爬虫原理,结合商业银行内部审计工作实践,探索了主题网络爬虫在商业银行内部审计中的实践应用及未来展望。
[期刊] 浙江农林大学学报  [作者] 刘建成  吴保国  陈栋  
针对如何在互联网上准确获取森林经营知识的问题,提出研建森林经营知识采集系统来解决这一问题。在分析森林经营知识采集问题的基础上,设计系统流程、系统模块、数据库,改进网络爬虫规则并加以限定,论述爬虫工作流程和算法。该系统总结分析了森林经营主题网页的特点,通过建立森林经营特征向量对采集内容进行识别,并对森林经营知识去噪处理,智能匹配规则提取知识,使用欧氏距离识别指纹去除重复的森林经营知识。实验结果表明,该系统采集的森林经营知识具有高主题相关度、高准确率、低重复度的特点,满足服务于森林经营决策支持系统的要求。
[期刊] 中国注册会计师  [作者] 陈伟  孙梦蝶  
大数据审计的研究与应用是近年来审计领域的热点问题,如何获得审计需要的相关数据是开展大数据审计的关键环节。本文首先阐述了开展大数据审计的重要性,分析了目前大数据审计数据采集过程中存在的问题;在此基础上,提出了基于网络爬虫技术的大数据审计方法原理;最后,以某审计项目为例分析了如何采用网络爬虫技术实现所需要审计数据的采集。研究结果为今后开展大数据审计提供了技术方法。
[期刊] 情报理论与实践  [作者] 刘爱琴  王友林  尚珊  
随着信息化技术的不断提高,知识性数据库不断向集成化、智能化的方向发展,信息检索功能不断发展和完善,在满足用户信息需求的便捷性方面有很大的提升。信息资源的极大丰富,使得信息查全率得到很大提高,但随之带来用户检索、筛选时间的增加,以及查准率的降低。为了解决这一矛盾,本研究融合网络爬虫技术和学术资源网站结构化数据的特征,将网站网页数据进行爬取、加工、整合,用结构化、可视化的图像数据辅助检索,实现了在缩小用户的筛查范围,提升用户检索的准确度的同时,以关联推荐方式提升用户在学术资源网站中信息检索的效率。
[期刊] 情报理论与实践  [作者] 贾君枝  卫荣娟  
FrameNet的语义类型主要用于对框架、框架元素和词元所指称的事物或现象进行概念层面的分类。文章主要通过分析各种框架关系中框架间框架元素的映射,研究了框架元素的语义本体类型的关系,发现对应的框架元素存在着语义类型相同或者语义等级关系,并以FrameNet的具体框架为例进行了论证说明。
[期刊] 会计之友  [作者] 王燕嘉  
从互联网上获取信息进行分析,已经成为人们进行决策的重要手段。有效地从海量数据中获取正确的目标信息是当前的重点和难点问题。通用搜索引擎检索的结果由于主题相关性不强,无法满足特定用户的需求。文章在改进SVM参数寻优算法的基础上,提出了结合关键词过滤算法和适用于大数据分类的支持向量机算法,并利用设计的财务管理相关主题信息分类算法,构建了财务管理相关主题爬虫系统。实验结果表明,基于关键词与改进支持向量机的财务管理主题相关爬虫能有效地采集目标信息,能够较好地适用于财务管理舆情管理和财务管理危机管理等相关领域。
[期刊] 图书馆论坛  [作者] 谢 辉  
文章利用python语言,建立微信公众号爬虫系统。结合试验数据,从宏观和实例角度探讨省级公共图书馆微信公众号现状以及存在的问题。研究表明:省级公共图书馆微信公众平台平均推送文章数量差异较大,人力资源分配不均衡,微信公众平台的服务水平和质量存在较大的差异。
[期刊] 地域研究与开发  [作者] 徐庭伟  罗守贵  
随着信息技术的发展,基于大数据支撑的城际信息流、产业流等为基于"流空间"的城市网络研究提供了新的研究视角。为了进一步研究城际信息流的经济意义,通过编写Python爬虫程序对基于百度搜索的我国271个城市之间信息流进行统计和数据结构化。结果表明:城市信息流总量是一个城市发展程度的综合反映,同时通过对结构洞理论的延伸,证明了在城际网络中,中心节点具有较高的冗余度。通过回归分析算法证明了城市信息流总量受到城市人均GDP、货运量、互联网接入用户数、城市的区位及其行政等级的显著影响。
[期刊] 统计研究  [作者] 孙易冰  赵子东  刘洪波  
本文参照官方CPI的制度方法,设计了一种基于网络爬虫技术的价格指数计算模型。通过模型试算值与官方数据的比较,以及对原始数据的特征挖掘,发现该种模型具有时效性强和灵敏度高的特点。
[期刊] 图书情报工作  [作者] 乔建忠  
针对主题爬行技术中的单一分类算法在面对多主题Web抓取和分类需求时泛化能力不强的局限,设计一种利用多种强分类算法形成的分类器组合,主题爬行器根据当前主题任务在线评估并为分类器排名,从中选择最优分类器分类的策略,并开展在多个主题抓取任务下的分类实验,比较每种分类算法的准确率和组合后的平均分类准确率以及对分类效率等评价指标的综合分析,结果证明该策略对领域局域性有所克服,普适性较强。
[期刊] 开放教育研究  [作者] 胡瑛  贾积有  
可重用性是学习对象不同于其他教学资源构件的重要特性,是其价值得以实现的重要条件,也是其成为学术界研究热点的重要原因之一;而本体由于其概念化、共享的本质特征,可以用于描述和表达学习对象,实现学习对象的共享与重用。本文采用文献分析方法,指出了只通过本体描述来丰富学习对象元数据的不足之处,提出以语义网的本体概念本身作为研究切入点,通过建立学习对象本体描述框架,对学习对象内容及结构进行本体描述,以实现学习对象中各成分的重用。
[期刊] 现代城市研究  [作者] 陈霈琛  董欣  
本文通过对摩拜共享单车客户端数据的抓取与分析,构建了"堆积程度"与"使用热度"两个指标来衡量共享单车的分布情况与运行状态。发现西安的共享单车具有以下特征:首先,西安城区范围内共享单车呈现"才"字型分布,西安二环以内借还车行为分布均匀,但借还车高峰区域分布在二环外侧的多个节点;其次,车辆堆积越严重,空间的边际借还数量越低;第三,车辆高使用率地区通常位于用地性质单一的区域和公交可进入性差的边缘地区;第四,在一些地段自组织地出现了位置固定的单车"准车站"。根据以上特征提出共享单车的停放策略应综合考虑城市土地利用现状与发展规划,与公共交通设施互补发展,与城市规划、城市建设相协调。
文献操作() 导出元数据 文献计量分析
导出文件格式:WXtxt
作者:
删除