- 年份
- 2024(9805)
- 2023(14248)
- 2022(12421)
- 2021(11583)
- 2020(9759)
- 2019(22371)
- 2018(22254)
- 2017(43400)
- 2016(23200)
- 2015(25967)
- 2014(25628)
- 2013(25010)
- 2012(22726)
- 2011(20139)
- 2010(19709)
- 2009(17459)
- 2008(16613)
- 2007(14125)
- 2006(11948)
- 2005(9998)
- 学科
- 济(91359)
- 经济(91269)
- 管理(67606)
- 业(65694)
- 企(55377)
- 企业(55377)
- 方法(46244)
- 数学(40746)
- 数学方法(40195)
- 农(23879)
- 财(23038)
- 中国(22034)
- 学(20724)
- 业经(20131)
- 技术(19027)
- 地方(17432)
- 农业(16128)
- 贸(15653)
- 贸易(15647)
- 务(15299)
- 财务(15226)
- 理论(15220)
- 易(15199)
- 财务管理(15197)
- 制(14933)
- 企业财务(14457)
- 和(14272)
- 环境(14244)
- 划(12451)
- 银(11826)
- 机构
- 大学(321832)
- 学院(320600)
- 管理(132082)
- 济(125574)
- 经济(122938)
- 理学(116268)
- 理学院(115027)
- 管理学(112861)
- 管理学院(112295)
- 研究(102908)
- 中国(73833)
- 京(67113)
- 科学(66064)
- 财(54628)
- 农(50495)
- 业大(50108)
- 所(50078)
- 中心(47358)
- 研究所(46420)
- 财经(45525)
- 江(44177)
- 范(42140)
- 经(41705)
- 师范(41685)
- 北京(41458)
- 农业(39633)
- 院(38445)
- 经济学(37643)
- 州(35948)
- 技术(34875)
- 基金
- 项目(234386)
- 科学(185589)
- 基金(171603)
- 研究(169171)
- 家(150084)
- 国家(148922)
- 科学基金(129156)
- 社会(106210)
- 社会科(100781)
- 社会科学(100753)
- 基金项目(92146)
- 省(91416)
- 自然(86087)
- 自然科(84131)
- 自然科学(84113)
- 自然科学基金(82596)
- 教育(78110)
- 划(77206)
- 资助(70207)
- 编号(68441)
- 成果(52997)
- 重点(52744)
- 部(51579)
- 发(49497)
- 创(49290)
- 课题(46206)
- 创新(46046)
- 科研(45494)
- 教育部(44271)
- 国家社会(43709)
- 期刊
- 济(126017)
- 经济(126017)
- 研究(87987)
- 中国(52872)
- 学报(51755)
- 科学(48446)
- 管理(46382)
- 农(43808)
- 财(40454)
- 大学(39493)
- 学学(37369)
- 教育(33995)
- 农业(31070)
- 技术(31044)
- 业经(21281)
- 财经(21167)
- 融(20814)
- 金融(20814)
- 经济研究(20373)
- 经(18016)
- 科技(17107)
- 技术经济(16768)
- 图书(16578)
- 问题(16539)
- 业(15884)
- 理论(15128)
- 资源(14833)
- 版(14669)
- 实践(13967)
- 践(13967)
共检索到438087条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 中国科学技术大学学报
[作者]
顾敏 郭庆 曹野 朱峰 顾彦慧 周俊生 曲维光
Web网页中含有丰富的信息资源,通过网页分类可以更好地对其内容进行抽取和管理,方便用户阅读.针对网页复杂的结构信息和丰富的文本内容,提出了一种基于网页文本和结构的网页分类方法,利用众创相关网页的结构特点和文本信息,选择联合特征和原子特征相结合的方法进行分类.实验表明,这种方法有一定的可行性,且比单一使用文本信息进行分类的方法具有更高的正确率和召回率.
关键词:
网页分类 朴素贝叶斯 原子特征 联合特征
[期刊] 情报理论与实践
[作者]
吴思竹 张智雄
本文通过对网页结构和内容特征的深入分析和识别,对噪音网页的过滤方法进行研究和实验。首先利用阈值过滤具有明显特征的噪音网页,而后建立网页特征向量,利用SVM对网页进行分类。采用采集自Web的网页数据进行实验分析,最后得出研究结论,并展望下一步工作。
关键词:
网络资源 噪音网页 过滤方法
[期刊] 教育研究
[作者]
刘世清 周鹏
通过对浏览文本—图片类教育网页的注视时间、注视点个数等视觉参数进行眼动实验研究发现,在文本—图片类网页中,左图右文结构对文本区的注视时间、注视点个数最多;上图下文结构则对图片区的注视时间、注视点个数最多。由此,教育网页的界面设计在从经验型向科学型转变中,当网页界面以文为主时应采用左图右文优选原则和上图下文避免原则;当网页界面以图为主时应采用上图下文优选原则和左图右文避免原则;当网页界面以图文为主的,要坚持网页界面的图文兼顾原则。
关键词:
教育网页 眼动实验 文本—图片类网页
[期刊] 图书情报工作
[作者]
李志义 梁士金
针对国内2000-2010年之间有关网页去重技术的研究成果进行计量分析,重点从网页结构、网页特征、网页内容、同源网页、元搜索等方面总结和分析去重技术的基本研究现状,并兼论基于布尔逻辑模型与傅立叶系数的网页去重以及网页去重技术在一些特殊领域的应用研究。
关键词:
重复网页 同源网页 网页去重
[期刊] 图书情报工作
[作者]
倪静 孟宪学
[目的 /意义]为解决现有网页文本缺乏起源标注的问题,提出一种借助PROV本体发现相似网页文本起源关系的方法。[方法/过程]通过聚类算法、自动语义标注和关联数据构建等技术的综合应用,结合PROV-POL溯源模型,检测网页文本实体的演变过程,实现文本级和属性级两级溯源方案。[结果 /结论]实验验证了借助语义网技术和数据溯源模型实现网页文本数据溯源的可行性,但实验过程中聚类算法的召回率有待提高。
关键词:
PROV模型 内容追溯 关联数据
[期刊] 图书情报工作
[作者]
王晓艳 林昌意
[目的/意义]通过网页分类提高搜索引擎及内容网站的检索性能,根据查询意图分类更精确地满足用户需求。[方法/过程]以信息类中文网页为研究对象,采用人工归纳的方法构建信息类查询意图类目体系,提出根据该类目体系对信息类网页进行分类的方法,并通过实验进行验证。[结果/结论]实验结果表明,所提出的方法具有较强的可行性,有助于精确地满足用户信息需求,提高搜索引擎及内容网站的检索性能。
[期刊] 图书情报工作
[作者]
岳丽欣 刘自强 刘春江 方曙
[目的 /意义]探索融合引用和文本特征的专利技术创新路径识别分析方法,有助于规避技术创新风险、优化选择技术创新路径,对提升创新主体的创新能力,促进现代产业发展,布局科技前沿发展战略等具有重要的意义。[方法 /过程]首先基于Node2Vec模型和Doc2Vec模型将专利引用和文本数据表示学习为可计算的高维向量;然后利用LDA主题模型进行技术主题识别并结合T-SNE算法降维,添加时间维度构建初始技术创新路径;最后,在专利引用和文本特征向量表示结果基础上,开展向量融合拼接从而实现融合引用和文本特征的技术创新路径识别。[结果 /结论 ]通过对超级电容器领域的实证,验证提出的融合引用和文本特征的的技术创新路径识别方法能够从特定领域专利文献中高效、准确地识别专利技术创新路径,证明方法的可行性和有效性。
关键词:
嵌入 主题模型 引用关系 创新路径
[期刊] 图书馆论坛
[作者]
邹永利 林智昊
互联网上免费的中文学术资源数量庞大,但实用的专门检索工具仍然或缺。文章以网络中文学术文献的识别与检索为目标,调查分析网络学术文献网页的特征,并以非学术文献网页作为参照,验证所发现特征的可靠性。研究结果显示,学术文献网页在关键词词频、链接数量和相关链接比例等特征方面与非学术文献网页具有明显差别,差异程度都大于75%,属于程度明显,能较好地用于区分学术文献网页与非学术文献网页,为今后系统开发学术文献网页的自动化识别工具提供了依据和理论支持。
关键词:
网络文献 学术文献 网页特征 信息检索
[期刊] 统计与决策
[作者]
刘苗 谢邦昌
文章从文本特征抽取、分类算法效率和精度两个角度出发,首先利用概率潜在语义分析(PLSA)方法,有效地提取出隐含在文档词频数据中的语义概念信息;然后构建了分类精度较高的Adaboost算法作为分类器。实验结果表明,该方法发挥了两种方法的优势,能够很好地完成对文本的自动分类。
[期刊] 情报理论与实践
[作者]
庞观松 蒋盛益
文章从文本表示、特征选择、分类算法、常用基准语料以及评估指标等方面对近年来的研究成果进行综述并讨论。认为短文本分类和多语言文本分类管理是新出现的重要且紧迫的问题,并对这两个问题以及数据集偏斜、多层分类、标注瓶颈等几个关键问题进行重点讨论。最后总结并展望这些研究内容。
关键词:
自动分类 文本分类 文本处理 综述
[期刊] 情报理论与实践
[作者]
高影繁 王惠临 徐红姣
本文以综述的形式对跨语言文本分类技术目前的发展态势进行了介绍,从应用背景出发,了解跨语言文本分类技术的社会需求;从关键技术出发,了解该项技术的核心问题及解决方案;从已有研究成果得到的结论揭示了该项技术的发展状况,作为一种重要的多语信息组织手段,跨语言文本分类技术发展前景广阔。
关键词:
跨语言文本分类 特征提取 算法
[期刊] 情报理论与实践
[作者]
陈定权 顾梅
The paper first introduces the principle of dynamic Webpage.Then,it discusses 4 kinds of technologies for making dynamic Webpages.The principles,performances and applicable ranges of these 4 kinds of technologies are analyzed.
[期刊] 图书馆
[作者]
张孝飞
文章通过分析传统关键词提取方法的特点及不足,提出了融合多元特征的中文网页关键词提取方法。该方法既综合了中文网页文档词语的词频、词性、词长以及词位置等特征,又考虑了文档中出现的同义词、组合词现象的关键词评分,有效提高了传统关键词提取算法的精度。实验结果表明该算法优于传统方法,在网络情报监测中具有较大应用价值。
关键词:
提取 多元特征 同义词 组合词
[期刊] 情报学报
[作者]
张金柱 李溢峰
为了丰富专利分类的网络和文本语义表示,实现两者更有效的语义融合,提高技术融合预测效果,提出基于专利分类序列和文本语义表示的技术融合预测方法。首先,综合考虑专利分类位置及其上下文语境,直接对专利分类序列进行语义表示,提出基于专利分类序列语义表示的技术融合预测方法;其次,根据专利分类在序列中的重要性排序研究专利分类文本分配方法,形成基于专利分类文本语义表示的技术融合预测方法;在此基础上,设计多种特征融合方法,提出融合专利分类序列结构和文本内容语义表示的技术融合预测方法;最后,基于链路预测的理论和方法对提出的多种技术融合预测方法进行定量评价。在无人机领域的实验证实,专利分类序列语义表示模型的效果明显优于其他网络表示学习方法;依据重要性排序的专利分类文本赋予方式优于文本平均分配方式,基于此的专利分类文本语义表示能更好地进行技术融合预测;“SVM (support vector machine)+哈达玛积”的特征融合方法在所有方法中表现最优,较单一方法均有提高。本文提出的方法能够提高技术融合预测的效果,更好地为技术布局、技术研发提供借鉴和参考。
[期刊] 大学图书馆学报
[作者]
侯汉清 薛鹏军
针对中文网页文本信息特征,提出了信息标引和组织方案,并构建了一个基于知识库的网页自动标引和自动分类系统。中文网页的自动标引和自动分类思想主要基于知识库进行。知识库实际上是一个基于《中图法》的专家知识系统,包括了中图法库、汉表库、分类号主题词对应库、同义词库、关键词库等若干数据库。在确定网页基本信息标引源的基础上,中文网页主题标引运用了基于词频的统计加权法;通过与分类号一主题词对应库主题词串的词面相似度计算,进一步完成中文网页的分类标引。最后还讨论了新词识别等技术问题。
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除