- 年份
- 2024(1595)
- 2023(2190)
- 2022(1786)
- 2021(1544)
- 2020(1194)
- 2019(2447)
- 2018(2271)
- 2017(4239)
- 2016(2329)
- 2015(2510)
- 2014(2554)
- 2013(2491)
- 2012(2328)
- 2011(2218)
- 2010(2122)
- 2009(1869)
- 2008(1837)
- 2007(1587)
- 2006(1389)
- 2005(1296)
- 学科
- 济(14756)
- 经济(14752)
- 地方(8014)
- 地方经济(5925)
- 管理(5028)
- 方法(4201)
- 数学(3963)
- 数学方法(3881)
- 中国(3086)
- 学(2947)
- 业(2928)
- 环境(2730)
- 农(2534)
- 域(2270)
- 区域(2266)
- 业经(2142)
- 农业(1958)
- 和(1894)
- 发(1771)
- 企(1717)
- 企业(1717)
- 融(1716)
- 金融(1714)
- 资源(1676)
- 划(1514)
- 虫(1493)
- 及其(1427)
- 产业(1371)
- 规划(1306)
- 生态(1233)
- 机构
- 学院(35515)
- 大学(34884)
- 研究(14227)
- 济(13555)
- 经济(13239)
- 管理(12221)
- 理学(10697)
- 理学院(10508)
- 科学(10360)
- 管理学(10221)
- 管理学院(10156)
- 中国(9813)
- 所(7771)
- 京(7599)
- 研究所(7307)
- 农(6643)
- 中心(6111)
- 业大(5939)
- 范(5820)
- 师范(5779)
- 院(5525)
- 江(5436)
- 农业(5300)
- 科学院(4897)
- 财(4821)
- 师范大学(4735)
- 州(4610)
- 省(4535)
- 北京(4491)
- 研究院(4358)
共检索到49515条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 图书情报工作
[作者]
文阳 陈文宇 袁野 朱建
认为传统的基于主题的链接过滤算法虽然在某一领域的主题爬虫中使用广泛,但该方法只关心抓取的网页与主题之间的相关性,忽略了网站自身链接的结构特点。提出基于域名的链接过滤算法,该方法对基于网页链接中域名的结构特点进行比较,同时以基于主题的链接过滤算法作为辅助,判断出无用的垃圾链接。与单一基于主题的链接过滤算法相比较,基于域名的链接过滤算法的判断方式更为全面,链接过滤效率更高,从而能有效地提高网络爬虫的抓取效率和情报检索的效率。最后,通过仿真实验证明该算法的有效性。
关键词:
网络爬虫 链接过滤 域名过滤 主题过滤
[期刊] 情报理论与实践
[作者]
刘爱琴 王友林 尚珊
随着信息化技术的不断提高,知识性数据库不断向集成化、智能化的方向发展,信息检索功能不断发展和完善,在满足用户信息需求的便捷性方面有很大的提升。信息资源的极大丰富,使得信息查全率得到很大提高,但随之带来用户检索、筛选时间的增加,以及查准率的降低。为了解决这一矛盾,本研究融合网络爬虫技术和学术资源网站结构化数据的特征,将网站网页数据进行爬取、加工、整合,用结构化、可视化的图像数据辅助检索,实现了在缩小用户的筛查范围,提升用户检索的准确度的同时,以关联推荐方式提升用户在学术资源网站中信息检索的效率。
[期刊] 华中农业大学学报
[作者]
SUN Yong 王译霄 宣晓婷 张熙悦 邓文艺 靳欢 凌建刚
果汁鉴伪技术正成为全球食品营养安全领域的研究热点,其发展对果汁质量与安全控制至关重要。结合机器学习联合网络爬虫算法检索文献技术,本文综述了近年来果汁鉴伪技术的研究进展与应用领域,并着重阐述了非靶向/靶向代谢组学鉴伪技术的研究进展。结合多学科交叉和计算机技术发展趋势,对检测方法耦合发展、监督型机器学习统计工具开发、无人监督鉴伪等趋势作了预测,以期为果汁鉴伪领域的深入研究提供参考。
[期刊] 图书情报工作
[作者]
乔建忠
提出一种借助主题爬虫自动从返回的相关网页进行本体非分类关系学习的框架与方法。针对利用互联网进行本体学习的特点,所用到的主要方法是词频、共现统计和分割聚类算法K-Means,并没有采用复杂的语法结构分析和半指导聚类算法如EM、BIRCH和SOM,因此自动化程度和效率较高。学习结果将用于指导主题爬虫进行网页相关性的判断。这种非分类关系的学习质量将由主题爬虫在实际应用中的表现来客观评价。
[期刊] 浙江农林大学学报
[作者]
刘建成 吴保国 陈栋
针对如何在互联网上准确获取森林经营知识的问题,提出研建森林经营知识采集系统来解决这一问题。在分析森林经营知识采集问题的基础上,设计系统流程、系统模块、数据库,改进网络爬虫规则并加以限定,论述爬虫工作流程和算法。该系统总结分析了森林经营主题网页的特点,通过建立森林经营特征向量对采集内容进行识别,并对森林经营知识去噪处理,智能匹配规则提取知识,使用欧氏距离识别指纹去除重复的森林经营知识。实验结果表明,该系统采集的森林经营知识具有高主题相关度、高准确率、低重复度的特点,满足服务于森林经营决策支持系统的要求。
[期刊] 中国注册会计师
[作者]
陈伟 孙梦蝶
大数据审计的研究与应用是近年来审计领域的热点问题,如何获得审计需要的相关数据是开展大数据审计的关键环节。本文首先阐述了开展大数据审计的重要性,分析了目前大数据审计数据采集过程中存在的问题;在此基础上,提出了基于网络爬虫技术的大数据审计方法原理;最后,以某审计项目为例分析了如何采用网络爬虫技术实现所需要审计数据的采集。研究结果为今后开展大数据审计提供了技术方法。
关键词:
大数据审计 网络爬虫 数据采集 审计方法
[期刊] 图书馆杂志
[作者]
杨学明 刘柏嵩
相比于数字图书馆中的可控高质量文档信息,互联网上提供了大量非结构化信息,如何有效利用这些信息成为当前的研究热点。本文提出将基于本体的主题爬虫技术应用在数字图书馆中,作为数字图书馆和互联网间的桥梁和媒介,利用丰富的网络资源来扩展数字图书馆。
关键词:
主题爬虫 本体 数字图书馆 信息检索
[期刊] 中国内部审计
[作者]
吴则建 王鹏虎 庞瑞江 黄永平
本文介绍了网络爬虫及主题爬虫原理,结合商业银行内部审计工作实践,探索了主题网络爬虫在商业银行内部审计中的实践应用及未来展望。
关键词:
大数据 智慧审计 网络爬虫
[期刊] 统计与决策
[作者]
雷兵 梁凯凯 刘维
文章针对全量爬虫数据编制价格指数成本高的问题,提出了一种抽样方法。该方法采用“大数据—小数据”思想,在基期通过网络爬虫技术全量抓取电商平台的商品交易数据,形成抽样框;在连续性调查中采用抽样技术,根据分层抽样思想,运用聚类算法及其轮廓系数实现总体数据分层,并通过不等概率随机抽样获取各层代表性样本;考虑到连续性调查中入选样本存在无回答现象,提出正式和备选样本思路,针对每个正式样本,采用最近邻匹配法挑选若干个备选样本,当正式样本无回答时,以备选样本作为替补来完成价格指数编制。以天猫商城粮油品类为例进行验证,结果表明:在抓取的数据中,基期全量爬虫数据有18351条,第2—8期连续性调查的平均抽样比为10.18%,抽样的平均相对误差为0.59%,说明该方法是可行的。
[期刊] 税务研究
[作者]
张福伟
一、税务稽查面临的信息困境(一)信息获取渠道单一,内容有限在传统的税务稽查工作中,检查人员主要依赖于企业的报表(会计报表、纳税申报表)、会计凭证、发票和第三方的鉴证报告(会计师事务所或税务师事务所出具的审计报告等)来获取所需信息,但由于这些资料均是由被检查的企业提供,很难保证其真实性。为此,税务部门在纳税申报表上设计了大量的关联项目,在一定程度上规避了一些常见的涉税风险,同时也大大增加了纳税人的负担。虽然进行了多
关键词:
税务稽查 爬虫技术 纳税申报
[期刊] 国际经贸探索
[作者]
王半牧
本文首先综述并评析了关于域名的各种观点,其次将域名分为企业性域名和非企业性域名,分别论述了它们的法律性质,认为企业性域名属于知识产权范畴,但并不是一种新的独立的知识产权,企业性域名的实质是企业的网上名称;而非企业性域名属于人身权范畴。
关键词:
域名 知识产权 人身权
[期刊] 经济问题
[作者]
卫聪玲 张军
近年来,随着因特网业务在全球范围内的迅猛发展,域名作为连接到因特网上的计算机识别标志,与商标的冲突亦愈演愈烈。如何解决二者间的冲突,对维护域名权人和商标权人的利益,以及网络业的发展都有重要意义。在分析域名与商标冲突的特征和性质的基础上,论述了解决域名与商标冲突的途径。
关键词:
域名 域名抢注 知名商标
[期刊] 国际贸易
[作者]
薛虹
近一、两年,Internet风靡全球,各行各业都希望在网络空间占有一席之地。城名就象人们在网络空间的“联系地址”,人们借助域名在网络空间标名挂号,既宣传自己,又彼此联系。域名已经成为一种重要的“资源”,并有稀缺的趋势。很快,人们就象争夺商标、争夺“吉祥号码”一样,开始争夺域名。已经有“好事者”借助域名牟利。1994年,域名尚未如今日般“火爆”,美国
[期刊] 国际贸易
[作者]
薛虹
知识产权的特征之一是有限 性。由于这种权利不象有形财产那样存在物理性的局限,因此法律必须对它存在的时间和范围加以限定,使之不会剥夺人们使用信息自由和阻碍科学文化进步。正因为如此,版权、专利、商标等知识产权保护制度都包括权利限制的内容,只不过这些内容在有些法律中显而易见,在另一些法律中则含而不露而已。例如,我国著作权法第22条对版权人的权利限制作明确规定,而在我国商标法中并没有关于商标权人权利限制的条文,但是
[期刊] 国际商务研究
[作者]
陶立峰
域名的经济价值被逐渐认可,使得域名注册和使用过程中纠纷不断,给现行纠纷处理方式带来了相当大的冲击。通过解析现有域名争议方式,探究有效的域名争端处理机制,对域名制度的发展具有重要意义。
关键词:
域名 争端处理 方式 评析
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除