- 年份
- 2024(10172)
- 2023(14848)
- 2022(13102)
- 2021(12571)
- 2020(10298)
- 2019(23872)
- 2018(23574)
- 2017(46168)
- 2016(24937)
- 2015(28083)
- 2014(27836)
- 2013(27159)
- 2012(24876)
- 2011(22340)
- 2010(22167)
- 2009(20065)
- 2008(19388)
- 2007(16712)
- 2006(14604)
- 2005(12471)
- 学科
- 济(96974)
- 经济(96873)
- 管理(74687)
- 业(70571)
- 企(59221)
- 企业(59221)
- 方法(46270)
- 数学(40242)
- 数学方法(39655)
- 农(27061)
- 财(25338)
- 中国(25008)
- 业经(21796)
- 地方(20073)
- 学(19827)
- 农业(18090)
- 贸(17649)
- 贸易(17642)
- 易(17160)
- 制(16809)
- 理论(16727)
- 和(16711)
- 务(16294)
- 财务(16218)
- 财务管理(16185)
- 技术(16011)
- 环境(15942)
- 策(15857)
- 企业财务(15317)
- 划(14665)
- 机构
- 大学(346431)
- 学院(346404)
- 管理(142669)
- 济(137580)
- 经济(134565)
- 理学(124181)
- 理学院(122871)
- 管理学(120728)
- 管理学院(120073)
- 研究(112389)
- 中国(82863)
- 京(72896)
- 科学(69596)
- 财(62568)
- 所(54707)
- 农(52889)
- 中心(51577)
- 业大(51031)
- 财经(50653)
- 研究所(50071)
- 江(49728)
- 经(46210)
- 范(45936)
- 北京(45583)
- 师范(45562)
- 院(41619)
- 农业(41206)
- 州(40489)
- 经济学(40185)
- 财经大学(37842)
- 基金
- 项目(242726)
- 科学(191445)
- 研究(179062)
- 基金(176276)
- 家(152615)
- 国家(151346)
- 科学基金(131247)
- 社会(111776)
- 社会科(105940)
- 社会科学(105910)
- 省(94329)
- 基金项目(93653)
- 自然(86164)
- 自然科(84066)
- 自然科学(84046)
- 教育(82547)
- 自然科学基金(82516)
- 划(79275)
- 编号(74279)
- 资助(72754)
- 成果(59273)
- 重点(53712)
- 部(53692)
- 发(51644)
- 创(50259)
- 课题(50097)
- 创新(46763)
- 科研(46239)
- 教育部(46234)
- 项目编号(45726)
- 期刊
- 济(145746)
- 经济(145746)
- 研究(98711)
- 中国(61019)
- 学报(52518)
- 管理(52021)
- 科学(48923)
- 农(47083)
- 财(46549)
- 大学(40195)
- 教育(38417)
- 学学(37505)
- 农业(33078)
- 技术(31316)
- 融(27680)
- 金融(27680)
- 业经(24966)
- 财经(23559)
- 经济研究(22777)
- 图书(20650)
- 经(20038)
- 问题(18966)
- 理论(16862)
- 技术经济(16692)
- 业(16681)
- 科技(16575)
- 资源(16551)
- 现代(15732)
- 实践(15588)
- 践(15588)
共检索到494381条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 中国图书馆学报
[作者]
陆勇 章成志 侯汉清
采用实证的方法,以百度百科语料库为实验抽取对象,在对同义词自动抽取技术分析比较的基础上,提出了多策略的中文同义词抽取的思路。综合利用字面相似度方法、特征模式匹配方法和PageRank链接分析方法对中文百科语料库中的同义词进行自动获取,具有多领域适用性、获取同义词类型多样性等特点。实验结果表明,该方法具有可行性,并可应用于其它语种的同义词自动获取中。未来的研究应进一步实现模式的自动定义、完善抽词词典、有效排除噪音数据并构建能真实反映语义关系的词汇矩阵。
[期刊] 图书情报工作
[作者]
刘伟
[目的/意义]鉴于目前同义词抽取方法无法避免抽取结果含有较多的噪音,需要较高的人工代价去除噪音,提出一种对同义词抽取结果排序的方法,使得正确结果排序提前,以达到提高抽取结果准确性及降低人工去噪代价的目的。[方法/过程]将抽取结果转化为抽取关系有向图,基于该有向图计算抽取结果中每个词汇与被抽取词汇的词义相似性,并按照词义相似性高低进行排序。排序方法的最大特点是只利用了当前的同义词抽取方法,不需要人工参与和额外的语义知识。[结果/结论]通过在真实数据集上进行验证,得出排序效果与抽取结果的规模呈正向关系的论点,即一个给定词汇的同义词抽取结果数量越多,排序的效果就会越好。
关键词:
同义词 信息抽取 噪音清洗 结果排序
[期刊] 情报理论与实践
[作者]
王志宏 过弋
[目的/意义]专利关键词是对专利核心内容的概括,高效准确地抽取专利关键词不仅可以辅助人们对专利的快速查找,同时对专利分类、聚类、翻译等具有重要意义。[方法/过程]提出了"关键词在关键句中"的关键词抽取新思路。首先构建了一个联合句网络语义图特征和启发式规则特征的专利摘要句排序模型,然后仅选择Top-KS%的句子参与关键词计算,同时将句子语义权重参数引入到关键词权重计算过程中,从而使得句子的重要性传递到句中的词上。[结果/结论]在真实中文专利数据集中实验表明,从中文专利中选择适当比例关键句参与关键词抽取计算,相较于传统关键词抽取算法F值提升了6%~13%左右,有效地降低原始文档的噪声数据,提升了关键词抽取的效果。
[期刊] 中国图书馆学报
[作者]
林泽斐 欧石燕
在线百科词条中蕴含着海量的人物间关系信息,基于这些信息可以抽取出大规模社会网络,为数字人文和社会计算研究提供数据支撑。本研究以百度百科为例,首次对面向中文在线百科的大规模社会网络抽取进行探索,提出一种新的人物社会网络抽取方法。该方法利用排序学习综合多种特征计算人物关系权重,通过估计人物生存时空来发现人物间的时空耦合关系。由此,从百度百科中抽取出一个带权重的跨时空人物社会网络和一个时空耦合的人物网络。这两个人物网络具有良好的小世界和无标度特性,并存在清晰的社区结构。最后,通过可视化分析展示了百科人物网络在数字人文研究中的应用模式和应用价值。图8。表6。参考文献39。
[期刊] 情报理论与实践
[作者]
宋宇 罗准辰 真溱
科技文献间的引用关系把关系密切、具有相似主题的文献联系在一起。通过引用关系可以获得文献的引用背景信息。引用背景信息有助于对科技文献内容的理解。文章提出了一种基于引用关系构造引用背景信息,用来改进关键词自动抽取效果的方法,并通过实验验证了方法的有效性。
关键词:
自动抽取 关键词 科技文献 引用
[期刊] 情报理论与实践
[作者]
徐文海 温有奎
本文在海量智能分词基础之上,提出了一种基于向量空间模型和TFIDF方法的中文关键词抽取算法。该算法在对文本进行自动分词后,用TFIDF方法对文献空间中的每个词进行权重计算,然后根据计算结果抽取出科技文献的关键词。通过自编软件进行的实验测试表明该算法对中文科技文献的关键词自动抽取成效显著。
关键词:
关键词抽取 向量空间模型 算法
[期刊] 清华大学学报(自然科学版)
[作者]
周炫余 刘林 卢笑 李璇 张思敏
关键词抽取是指能自动抽取反映文本主题的词或者短语,被广泛应用于文本检索、文本摘要等领域中。目前关键词抽取任务主要依赖于预训练语言模型来获取文本表示,这类语言模型主要基于单一模态的通用文本语料进行训练,存在无法根据下游任务特性进行领域适配和语义表征能力有限的问题。该文提出一种多模态信息增强表示的中文关键词抽取方法MIEnhance-KPE,首先引入Adapter层将偏旁和部首信息集成到预训练语言模型层中,得到领域自适应的文本表示;其次利用卷积神经网络提取汉字的图像特征,同时使用交叉注意力机制融合汉字图像特征和文本特征,实现文本语义表示增强;最后利用CRF(conditional random field)模型进行序列标注任务,并计算词语的位置词频权重对其进行排序获得关键词。与目前十分先进的关键词抽取方法KIEMP相比, MIEnhance-KPE在公开的中文科学文献数据集和自构建的中文教育关键词抽取数据集上的F值分别提升了15.71%和3.40%;消融实验结果表明,所提出的领域自适应模块和视觉语义增强表示模块均能有效提高关键词抽取的准确性。MIEnhance-KPE的提出有助于教育研究者精准了解教育发展趋势,促进教育理论和实践的创新。
[期刊] 中国图书馆学报
[作者]
王兰成 李超
信息检索的核心技术是文档集与提问集的相似匹配。目前基于关键词的字面匹配方法和基于词义的概念匹配方法各有优势与不足。在数字图书馆文献检索中可以综合两者的优势。设计一种改进的中文同义词相似匹配方法较现有两种方法优越,并具有更好的应用性。图2。表3。参考文献2。
[期刊] 图书情报知识
[作者]
尹开国
本文从基于Wiki协作式创作系统的技术平台、基于多层级权限分配机制的志愿者管理模式、基于开放式编撰和中立性观点及免费共享等基本原则的内容发展方针等三个方面,阐述了维基百科的社群发展策略。
关键词:
维基百科 社群 虚拟社群
[期刊] 情报杂志
[作者]
熊回香 叶佳鑫
[目的/意义]利用同义词词林,挖掘标签间的相互关系,构建标签等级结构,对标签进行规范化控制,从而提高利用标签检索的效率。[方法/过程]首先,按照标签间关系联系的紧密大小对标签间的关系进行了层级划分;随后,通过分析标签与资源的联系强度,将标签与关系紧密的资源联系起来;最后,根据标签间及标签与资源的关系来确定标签间的父子关系,构建标签等级结构。[结果/结论]选取了"豆瓣读书"中的实例数据进行实证研究,研究表明,该算法具有一定的可行性和有效性,能够较好地构建标签等级结构。
关键词:
大众分类 标签 同义词词林 等级结构
[期刊] 情报理论与实践
[作者]
蒋婷 孙建军
[目的/意义]术语是本体的重要组成部分,术语自动抽取是本体自动构建的基础,文章采用回归的方法对未登录词进行概率(某个数值(组合)对应的候选词集合中术语的概率)预测,获得该词可能为术语的概率。[方法/过程]文章结合语言学和统计方法,通过构建术语库提取术语抽取模板来抽取候选术语,此外,通过引入回归的方法,将术语抽取问题转化为对词语成为术语的概率的预测问题。[结果/结论]提出的方法最后通过实验验证了其有效性。
[期刊] 情报理论与实践
[作者]
李有梅
In the field of automatic information processing,how to precisely describe the text's content has become a rather critical problem.The vector space presentation,which is widely applied at present,is used to approximately illustrate conceptions and meanings by extracting keywords from the text.
[期刊] 情报学报
[作者]
王汀 冀付军
在进行大规模领域本体的构建时,基于手工方式的构建模式效率较低并且可行性较差。为了解决大规模领域本体的自动化构建问题,提出了一种领域主题词表与网络百科知识库相融合的两阶段领域本体自动化构建方案。第一阶段,进行主题词表至本体的粗映射,形成领域粗糙本体;第二阶段,采用改进的同义词词林与编辑距离相似度相结合的方式对百科知识与粗糙本体进行自动融合、自适应调整和扩充,形成含有丰富语义信息的、良构的领域本体。基于两阶段方法自动化地构建了大规模中国电子政务领域本体(Chinese E-Gov Ontology),从而验证
[期刊] 情报理论与实践
[作者]
张海潮 王昊 唐慧慧 薛蔚
[目的/意义]探讨中文社会科学领域题名关键词最佳抽取模型,用以获取引文题名关键词,完成附加关键词的抽取。[方法/过程]文章以2014年CSSCI全部文献的题名为语料,运用条件随机场(CRFs),通过探究不同特征(或集合)和参数对关键词识别的影响,构建字角色标注的题名关键词标引模型,最终迁移应用到引文题名。[结果/结论]通过实验,获得最佳题名关键词标引模型,F1值可达到52.03%,每篇原文可获得附加关键词9个左右。在恰当的特征组合与参数下,构建的标引模型可以有效完成附加关键词的获取工作。[局限]语料中的每个关键词平均出现两次可能会影响机器学习的效果,原文与引文题名的差异可能影响模型的适用性,此外模型得到的附加关键词尚需进一步斟酌选择。
[期刊] 图书情报工作
[作者]
王娟 曹树金 姜灵敏 胡青
以提高领域概念相关性判断的准确度为研究宗旨,提出综合利用中文维基百科的分类体系结构和概念释义内容进行概念间语义相关度计算的方法。选取中文维基百科分类体系下的图书情报领域的概念为实验对象,将基于分类信息和文本信息的加权算法与单独基于分类信息的语义距离算法和信息量算法,以及基于文本信息的文本重叠算法进行对比分析。实验结果表明:加权算法能取得更好的效果,可为实现面向领域的信息检索、领域本体构建等应用提供重要技术支持。
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除