标题
  • 标题
  • 作者
  • 关键词
登 录
当前IP:忘记密码?
年份
2024(9068)
2023(13152)
2022(11615)
2021(10858)
2020(9105)
2019(21095)
2018(20930)
2017(40741)
2016(21805)
2015(24664)
2014(24330)
2013(23685)
2012(21393)
2011(18906)
2010(18489)
2009(16456)
2008(15602)
2007(13106)
2006(10986)
2005(8979)
作者
(61124)
(50801)
(50384)
(48030)
(32261)
(24482)
(22940)
(20223)
(19406)
(17670)
(17518)
(16912)
(15882)
(15776)
(15726)
(15297)
(15289)
(15145)
(14488)
(14467)
(12509)
(12238)
(12195)
(11641)
(11368)
(11178)
(11079)
(11051)
(10100)
(10044)
学科
(84158)
经济(84065)
管理(62019)
(58736)
(49547)
企业(49547)
方法(44276)
数学(38981)
数学方法(38380)
(21568)
(21379)
中国(19809)
(19515)
业经(18285)
地方(15990)
农业(14537)
(14380)
理论(14348)
财务(14310)
财务管理(14279)
(14274)
贸易(14269)
(13839)
技术(13729)
(13723)
企业财务(13539)
环境(13445)
(12792)
(11746)
(10799)
机构
大学(300523)
学院(299075)
管理(124121)
(114471)
经济(112003)
理学(109504)
理学院(108348)
管理学(106182)
管理学院(105669)
研究(94273)
中国(68210)
(62472)
科学(61374)
(50513)
业大(46993)
(46514)
(45653)
中心(43842)
研究所(42402)
财经(42226)
(40672)
(39244)
师范(38852)
(38646)
北京(38506)
农业(36613)
(35401)
经济学(33904)
(33372)
财经大学(31909)
基金
项目(220709)
科学(174386)
基金(161639)
研究(158620)
(141320)
国家(140222)
科学基金(121735)
社会(99059)
社会科(93914)
社会科学(93889)
基金项目(86828)
(85853)
自然(81853)
自然科(79989)
自然科学(79971)
自然科学基金(78489)
教育(73187)
(72752)
资助(66430)
编号(64631)
成果(49999)
重点(49268)
(48311)
(46031)
(45927)
课题(43255)
科研(43166)
创新(42843)
教育部(41415)
大学(41242)
期刊
(113222)
经济(113222)
研究(81024)
学报(48417)
中国(47716)
科学(44858)
管理(42965)
(40299)
(37303)
大学(36930)
学学(34940)
教育(31002)
农业(28620)
技术(27106)
业经(19358)
财经(19125)
(19082)
金融(19082)
经济研究(18065)
(16160)
图书(15829)
科技(15052)
问题(14777)
理论(14479)
技术经济(14394)
资源(14342)
(14321)
(13889)
统计(13624)
实践(13535)
共检索到404354条记录
发布时间倒序
  • 发布时间倒序
  • 相关度优先
文献计量分析
  • 结果分析(前20)
  • 结果分析(前50)
  • 结果分析(前100)
  • 结果分析(前200)
  • 结果分析(前500)
[期刊] 情报理论与实践  [作者] 吴思竹  张智雄  
本文通过对网页结构和内容特征的深入分析和识别,对噪音网页的过滤方法进行研究和实验。首先利用阈值过滤具有明显特征的噪音网页,而后建立网页特征向量,利用SVM对网页进行分类。采用采集自Web的网页数据进行实验分析,最后得出研究结论,并展望下一步工作。
[期刊] 中南林业科技大学学报  [作者] 季秀兰  熊拥军  
识别存在于大量的WEB网页中的不良信息的非法文本,并将其有效屏蔽,是未来信息过滤研究的新领域。在传统方法的基础上,在对抓取到的网页进行预处理后,设置加权的关键字词典;应用汉语语料库里同类词的概念,从词汇关联的角度出发,最终提出了基于同类词权重均值的关联过滤算法。最后,从两个角度进行算法评估,该过滤算法更为高效,并且能够很好的应对不良网站的反关键字过滤策略。
[期刊] 情报学报  [作者] 韩彬斌  王培康  
WWW上的文本信息挖掘工作是网络信息处理领域的新课题。本文研究了两种机器学习算法———Rocchio算法和Widrow Hoff算法在Web网页识别领域中的应用 ,并对几种网页识别算法进行了比较分析
[期刊] 中国科学技术大学学报  [作者] 顾敏  郭庆  曹野  朱峰  顾彦慧  周俊生  曲维光  
Web网页中含有丰富的信息资源,通过网页分类可以更好地对其内容进行抽取和管理,方便用户阅读.针对网页复杂的结构信息和丰富的文本内容,提出了一种基于网页文本和结构的网页分类方法,利用众创相关网页的结构特点和文本信息,选择联合特征和原子特征相结合的方法进行分类.实验表明,这种方法有一定的可行性,且比单一使用文本信息进行分类的方法具有更高的正确率和召回率.
[期刊] 图书馆论坛  [作者] 邹永利  林智昊  
互联网上免费的中文学术资源数量庞大,但实用的专门检索工具仍然或缺。文章以网络中文学术文献的识别与检索为目标,调查分析网络学术文献网页的特征,并以非学术文献网页作为参照,验证所发现特征的可靠性。研究结果显示,学术文献网页在关键词词频、链接数量和相关链接比例等特征方面与非学术文献网页具有明显差别,差异程度都大于75%,属于程度明显,能较好地用于区分学术文献网页与非学术文献网页,为今后系统开发学术文献网页的自动化识别工具提供了依据和理论支持。
[期刊] 图书馆  [作者] 张孝飞  
文章通过分析传统关键词提取方法的特点及不足,提出了融合多元特征的中文网页关键词提取方法。该方法既综合了中文网页文档词语的词频、词性、词长以及词位置等特征,又考虑了文档中出现的同义词、组合词现象的关键词评分,有效提高了传统关键词提取算法的精度。实验结果表明该算法优于传统方法,在网络情报监测中具有较大应用价值。
[期刊] 教育研究  [作者] 刘世清  周鹏  
通过对浏览文本—图片类教育网页的注视时间、注视点个数等视觉参数进行眼动实验研究发现,在文本—图片类网页中,左图右文结构对文本区的注视时间、注视点个数最多;上图下文结构则对图片区的注视时间、注视点个数最多。由此,教育网页的界面设计在从经验型向科学型转变中,当网页界面以文为主时应采用左图右文优选原则和上图下文避免原则;当网页界面以图为主时应采用上图下文优选原则和左图右文避免原则;当网页界面以图文为主的,要坚持网页界面的图文兼顾原则。
[期刊] 管理评论  [作者] 蒋玉石  李永建  何丹  朱坤  宋喆明  
采用E-Prime呈现视觉刺激材料,利用ASL收集相应的眼动数据,把网页广告内容作为控制变量,在屏幕不同位置分别呈现12毫秒和48毫秒的网页广告"靶",对30名中国移动音乐门户网站(www.12530.com)的目标顾客进行被试内眼动重复实验。研究结果表明,在网页广告中,人们的视觉搜索同样存在明显的空间不对称性;网页广告屏位置对顾客视觉搜索反应正确率是以屏幕中央区域向四个角方向延伸,识别效率递减;广告"靶"呈现速度不是决定用户识别效率高低的关键因素,不会影响顾客的兴趣中心。在此基础上,建议网页广告的定价应采取非线性的定价策略,弹出式广告在网页上停留的时间在3-5秒钟之间为宜。
[期刊] 数字图书馆论坛  [作者] 黄政  张学福  
本文结合开放获取期刊(Open Access Journal,OA期刊)资源特点,针对无法通过OAI-PMH协议进行资源采集的OA期刊,提出一种基于网页信息抽取的资源采集策略。本文从网页资源描述的角度总结OA期刊资源特点并对其分类。基于网页信息抽取方法在OA期刊资源采集适用性,提出一种基于OA期刊网页元数据抽取的采集方法,并在此方法的基础上设计了采集系统。通过对国内外不遵循OAI-PMH协议的10本OA期刊的网站实证采集,得到45 785篇论文的元数据,证明该采集方法能有效地应用于此类资源采集。研究丰富了
[期刊] 情报理论与实践  [作者] 李广建  乔建忠  
网页信息抽取包装器的生成方法很多,按自动化程度可分为手工、半自动和全自动三类,本文旨在研究全自动生成网页信息抽取包装器的主要技术方法,首先构建了对应的分类体系;其次对近年来主流的15种包装器生成技术进行了定性分析和分类比较;最后提出5点发展趋势。
[期刊] 图书情报工作  [作者] 任成义  
随着信息技术的快速发展和网络的普及,以网页形式表示的信息越来越多,基于网页的知识元挖掘就是从浩瀚的网页信息中发现潜在的有价值知识。网页知识元挖掘要处理大量的非结构化的文档信息和复杂的语义关系,采用全新的数据挖掘方法直接对非结构化数据进行挖掘,其基本流程包括:文件格式转换、分词与词性标注、文本知识元挖掘、知识元聚类以及推理与知识发现。
[期刊] 图书情报工作  [作者] 倪静  孟宪学  
[目的 /意义]为解决现有网页文本缺乏起源标注的问题,提出一种借助PROV本体发现相似网页文本起源关系的方法。[方法/过程]通过聚类算法、自动语义标注和关联数据构建等技术的综合应用,结合PROV-POL溯源模型,检测网页文本实体的演变过程,实现文本级和属性级两级溯源方案。[结果 /结论]实验验证了借助语义网技术和数据溯源模型实现网页文本数据溯源的可行性,但实验过程中聚类算法的召回率有待提高。
[期刊] 图书馆建设  [作者] 安琳  
网页信息存档已成为保护网络信息资源的重要举措。LCWA和IA是两个较为成功的网页信息存档项目,在一定程度上展现了近年来网络信息资源的保存在世界范围内的研究与实践情况。目前网页信息存档在具体实施上还面临一系列的困难,包括技术、经济、法律等诸多方面,这些问题的解决有助于在世界范围内加快网页信息存档的发展步伐。
[期刊] 情报理论与实践  [作者] 陈定权  顾梅  
The paper first introduces the principle of dynamic Webpage.Then,it discusses 4 kinds of technologies for making dynamic Webpages.The principles,performances and applicable ranges of these 4 kinds of technologies are analyzed.
[期刊] 情报理论与实践  [作者] 李真  黄瑞华  
网页作品的著作权保护形式问题是关系到如何保护网站原创性的重要因素。本文从分析网页作品的构成和性质出发 ,在对保护现状进行分析的基础上 ,分 3个步骤探讨了网页作品保护的具体形式问题 ,并根据研究结论提出了相应的立法建议
文献操作() 导出元数据 文献计量分析
导出文件格式:WXtxt
作者:
删除