- 年份
- 2024(1071)
- 2023(1625)
- 2022(1354)
- 2021(1262)
- 2020(1057)
- 2019(2374)
- 2018(2350)
- 2017(4039)
- 2016(2213)
- 2015(2474)
- 2014(2298)
- 2013(2277)
- 2012(2140)
- 2011(2049)
- 2010(2005)
- 2009(1656)
- 2008(1671)
- 2007(1430)
- 2006(1305)
- 2005(1186)
- 学科
- 济(6402)
- 经济(6394)
- 学(4111)
- 管理(3586)
- 业(3539)
- 企(2699)
- 企业(2699)
- 和(2650)
- 税(2520)
- 方法(2397)
- 税收(2338)
- 中国(2332)
- 收(2307)
- 数学(1957)
- 数学方法(1924)
- 研究(1897)
- 农(1767)
- 财(1574)
- 地方(1301)
- 理论(1291)
- 情报(1270)
- 业经(1266)
- 农业(1232)
- 工作(1191)
- 教育(1144)
- 制(1140)
- 建设(1134)
- 分析(1129)
- 析(1129)
- 组织(1114)
- 机构
- 大学(31541)
- 学院(28997)
- 研究(12729)
- 管理(9789)
- 中国(9547)
- 科学(9322)
- 济(9294)
- 经济(9023)
- 理学(8277)
- 理学院(8119)
- 管理学(7886)
- 管理学院(7828)
- 京(7129)
- 所(6779)
- 研究所(6386)
- 中心(5927)
- 农(5910)
- 范(5525)
- 师范(5469)
- 江(4853)
- 院(4850)
- 业大(4806)
- 财(4745)
- 农业(4684)
- 师范大学(4630)
- 北京(4462)
- 室(4081)
- 图书(3960)
- 研究院(3955)
- 科学院(3875)
共检索到46539条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 图书馆论坛
[作者]
邹永利 林智昊
互联网上免费的中文学术资源数量庞大,但实用的专门检索工具仍然或缺。文章以网络中文学术文献的识别与检索为目标,调查分析网络学术文献网页的特征,并以非学术文献网页作为参照,验证所发现特征的可靠性。研究结果显示,学术文献网页在关键词词频、链接数量和相关链接比例等特征方面与非学术文献网页具有明显差别,差异程度都大于75%,属于程度明显,能较好地用于区分学术文献网页与非学术文献网页,为今后系统开发学术文献网页的自动化识别工具提供了依据和理论支持。
关键词:
网络文献 学术文献 网页特征 信息检索
[期刊] 图书情报工作
[作者]
邹永利 冯文炬
学术文献具有鲜明的文体特征,且部分特征能够用于PDF格式网络中文学术文献的自动识别与检索。提取学术文献在特有表述、句子平均长度、中西文比例等方面存在的特征,用来识别PDF格式的中文学术文献,对Google通用搜索引擎的搜索结果进行重新排序。结果显示文体特征的运用能够在一定程度上提高网络PDF学术文献的检准率。
[期刊] 图书馆
[作者]
张孝飞
文章通过分析传统关键词提取方法的特点及不足,提出了融合多元特征的中文网页关键词提取方法。该方法既综合了中文网页文档词语的词频、词性、词长以及词位置等特征,又考虑了文档中出现的同义词、组合词现象的关键词评分,有效提高了传统关键词提取算法的精度。实验结果表明该算法优于传统方法,在网络情报监测中具有较大应用价值。
关键词:
提取 多元特征 同义词 组合词
[期刊] 情报理论与实践
[作者]
吴思竹 张智雄
本文通过对网页结构和内容特征的深入分析和识别,对噪音网页的过滤方法进行研究和实验。首先利用阈值过滤具有明显特征的噪音网页,而后建立网页特征向量,利用SVM对网页进行分类。采用采集自Web的网页数据进行实验分析,最后得出研究结论,并展望下一步工作。
关键词:
网络资源 噪音网页 过滤方法
[期刊] 图书馆论坛
[作者]
陈漪红
中文学术会议文献作为文献信息资源中的一个重要品种,在我国长期未得到应有的重视。本文认为,不仅应重视中文学术会议文献的收集,还应做好其机读目录,组织好卡片目录,使其学术价值得以更充分的发挥。
关键词:
学术会议文献 文献收集 文献整理
[期刊] 图书情报工作
[作者]
王星 刘伟
针对中文学术文献,提出一种新的自动标引方法,该方法基于文献之间的引用关系,利用被引文献的标引词,对遗传算法进行改进,实现自动标引,避免利用文献正文、标题等内部文本特征进行自动标引的局限性。通过在大规模真实测试集(中文学术文献)上进行实验,验证该方法的有效性。
[期刊] 情报学报
[作者]
唐琳 郭崇慧 陈静锋 孙磊磊
基于学术文献构建领域本体对促进领域学科发展具有重要的意义。本文提出了一种以中文学术文献为数据源,半自动化抽取领域本体层次关系的框架方法。首先,构建了一个通用的领域本体层次关系的细粒度研究框架。其次,设计了一种新的概念表示方法,融合了深度学习方法得到的概念语义特征和上下文的时间序列词频。进一步结合了AP聚类、Prim算法和Web搜索引擎的查询数据,提出了基于规则推理的本体概念层次关系抽取算法(RROCHE),实现了半自动化概念层次关系抽取。最后,基于中文分词领域的中文学术文献数据,通过数值实验方法讨论了方法的可行性和有效性。本文提出的框架方法也非常容易推广并应用到各领域本体层次关系任务中。
[期刊] 情报学报
[作者]
邹永利 王皓
学术文献在网络上的分布日益广泛,探索其识别方法对于提高检索效率具有重要意义。本文针对网络中文学术文献的主要干扰文献——新闻报道,对6906篇学术文献语料和16316篇新闻报道语料进行比较研究,尝试从标点符号的使用方面发现两者的异同,以期为网络中文学术文献的自动识别提供思路。对两个语料库标点符号的使用量、相对使用率、平均使用量和差异量等因素所做统计与比较显示,网络中文学术文献与新闻报道在14种常用标点符号的使用上具有明显差异。我们将所发现的标点符号特征应用到已开发的网络中文学术文献检索系统(NSIRS)中,
[期刊] 图书馆杂志
[作者]
王晋生
介绍了一种利用ASP+Access构建检索网页及馆藏标准文献数据库,深入揭示标准文献汇编本的方法,对此方法的优点及可行性进行了讨论,可将其结果扩大到论文集、会议录等汇编本文献,认为这是一种在目前深入揭示馆藏,深化图书馆为读者服务功能的切实可行的方法。
[期刊] 中国图书馆学报
[作者]
邹永利
主题检索一直是信息检索系统也是信息检索研究的重点,但文献的非主题特征的研究与利用没有受到足够的重视。文献的非主题特征指与文献相关,但与其主题内容或语义没有直接或必然联系的特征。笔者尝试较系统地归纳文献的非主题特征,并基于信息需求研究、信息查找与利用行为研究的有关理论,分析非主题特征对于信息检索理论与实践的意义,并通过基于非主题特征的网络中文学术文献识别系统(NSIRS)的设计与评价,验证其可行性与效果,分析了当前一些信息检索系统的非主题检索功能与特色。
[期刊] 中国科学技术大学学报
[作者]
顾敏 郭庆 曹野 朱峰 顾彦慧 周俊生 曲维光
Web网页中含有丰富的信息资源,通过网页分类可以更好地对其内容进行抽取和管理,方便用户阅读.针对网页复杂的结构信息和丰富的文本内容,提出了一种基于网页文本和结构的网页分类方法,利用众创相关网页的结构特点和文本信息,选择联合特征和原子特征相结合的方法进行分类.实验表明,这种方法有一定的可行性,且比单一使用文本信息进行分类的方法具有更高的正确率和召回率.
关键词:
网页分类 朴素贝叶斯 原子特征 联合特征
[期刊] 情报理论与实践
[作者]
吴国恩
从基本情报思维活动的特点出发,先分析文献的事例构成和事例的属性值,接着分 析文献的特征,并用模糊数学方法比较文献或事例间的贴近程度,最后指出文献特征分析法在情报 活动中的应用,还给出一个用最大树法聚类分析事例的实例。
关键词:
情报思维 模糊数学 文献特征分析
[期刊] 情报理论与实践
[作者]
杜薇薇
科技文献抄袭现象伴随着科学技术的发展时有发生,这严重损害了文献原作者,也对科技文献的严肃性提出了挑战。本文利用分词技术提取文献特征向量,并结合动态规划算法对文献的相似度给出具体评价,针对不同抄袭的现象,发现其中存在的规律,具体问题具体分析。最后给出实际实验结果,为文献评审提供参考。
关键词:
特征向量 相似度 中文文献 自动分词
[期刊] 图书馆杂志
[作者]
韦庆媛
高校图书馆的学术文库主要收藏本校教师、校友的学术著作和其他作品及与本校有关的各类资料,是高校图书馆的特色资源,建立本校文库网页非常必要。本文探讨了高校文库网页栏目的设计原则,并在清华大学图书馆文库网页栏目设计中作了尝试。
关键词:
高校文库 清华文库 网页栏目设计
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除