- 年份
- 2024(7764)
- 2023(11370)
- 2022(10145)
- 2021(9687)
- 2020(8117)
- 2019(19197)
- 2018(19144)
- 2017(37106)
- 2016(20228)
- 2015(22868)
- 2014(22900)
- 2013(22453)
- 2012(20149)
- 2011(18101)
- 2010(18161)
- 2009(16275)
- 2008(15725)
- 2007(13441)
- 2006(11656)
- 2005(9915)
- 学科
- 济(79435)
- 经济(79354)
- 管理(56508)
- 业(53475)
- 企(45603)
- 企业(45603)
- 方法(41174)
- 数学(36152)
- 数学方法(35454)
- 农(19817)
- 中国(19191)
- 学(18080)
- 财(17557)
- 业经(17501)
- 地方(15733)
- 理论(15456)
- 和(13587)
- 农业(13321)
- 贸(13146)
- 贸易(13137)
- 易(12748)
- 技术(12672)
- 制(12475)
- 环境(12067)
- 务(11626)
- 财务(11551)
- 财务管理(11532)
- 划(10983)
- 企业财务(10891)
- 教育(10595)
- 机构
- 大学(281696)
- 学院(281154)
- 管理(115457)
- 济(104394)
- 经济(101960)
- 理学(101213)
- 理学院(100123)
- 管理学(97897)
- 管理学院(97410)
- 研究(88989)
- 中国(64145)
- 京(60141)
- 科学(58689)
- 财(45536)
- 农(44555)
- 所(44442)
- 业大(44236)
- 研究所(40952)
- 中心(40345)
- 江(39329)
- 北京(37899)
- 范(37467)
- 财经(37413)
- 师范(37119)
- 农业(34995)
- 经(34017)
- 州(32787)
- 院(32738)
- 技术(31514)
- 经济学(29947)
- 基金
- 项目(200300)
- 科学(156917)
- 研究(144880)
- 基金(143991)
- 家(125926)
- 国家(124882)
- 科学基金(107679)
- 社会(88016)
- 社会科(83390)
- 社会科学(83363)
- 省(79678)
- 基金项目(76698)
- 自然(72581)
- 自然科(70946)
- 自然科学(70932)
- 自然科学基金(69604)
- 教育(67793)
- 划(67007)
- 资助(60677)
- 编号(60149)
- 成果(47793)
- 重点(44680)
- 部(43171)
- 发(41882)
- 创(41701)
- 课题(41336)
- 创新(38731)
- 科研(38522)
- 大学(37270)
- 项目编号(37210)
- 期刊
- 济(108071)
- 经济(108071)
- 研究(76809)
- 中国(49529)
- 学报(46142)
- 科学(41639)
- 管理(41548)
- 农(39416)
- 大学(34580)
- 教育(34225)
- 财(32818)
- 学学(32079)
- 农业(28090)
- 技术(26925)
- 融(18740)
- 金融(18740)
- 业经(18545)
- 图书(18515)
- 经济研究(17129)
- 财经(16777)
- 业(14664)
- 科技(14597)
- 经(14141)
- 技术经济(13920)
- 理论(13884)
- 问题(13818)
- 统计(13520)
- 实践(13016)
- 践(13016)
- 版(12758)
共检索到391478条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 图书馆论坛
[作者]
李湘东 胡逸泉 黄莉
探索对多种类型文献进行混合分类组织时LDA主题模型的可行性及优越性。以图书、期刊、网页等不同类型的馆藏文献作为实验对象,分别采用LDA主题模型与VSM模型对实验材料进行建模,采用SVM算法实现文本混合自动分类。仿真实验表明:LDA主题模型相对VSM模型具有一定优势,混合自动分类准确率最大差距达19.9%;图书与学术性期刊、网页与非学术性期刊之间的混合分类效果较好,分类准确率可达72%以上。实验证明LDA主题模型对实现多种类型文献统一组织具有较高的可行性和适用性。
[期刊] 图书馆杂志
[作者]
李湘东 胡逸泉 巴志超 黄莉
探索数字图书馆的图书、期刊、网页等不同类型的馆藏文献进行分类组织时,多种类型文献单独及混合自动分类的特点。采用KNN等分类算法对多种类型文献进行分类实验并分析比较。仿真实验表明:随着实验文本数增加,各种类型文献的单独自动分类准确率有2%至7.8%不等的提升。图书与学术性期刊、网页与非学术性期刊之间的混合分类效果较好,分类准确率可达到85%以上;对多种类型文献实现基于自动分类的统一组织具有较高的可行性。
关键词:
数字图书馆 自动分类 文献类型 文献特征
[期刊] 数据分析与知识发现
[作者]
李湘东 阮涛 刘康
【目的】通过基于维基百科的特征扩展解决由于不同类型文献而产生的特征不匹配等问题,以提高文本分类效果。【方法】在特征扩展之前,对TF-IDF加以改进,提出并使用一种新的特征选择方法 CDFmax-IDF获得候选词集;在使用维基百科进行特征扩展时,通过分别计算直接链接关系、类别关系、间接链接关系三类词语间关系并进行融合得到词语间的语义相关度实现特征扩展;针对扩展得到的特征,提出一种改进的LDA概率主题模型w LDA模型进行文本建模。【结果】本文提出的方法分别在朴素贝叶斯、KNN和SVM三种分类器上实现分类,其
[期刊] 数据分析与知识发现
[作者]
王婷婷 韩满 王宇
【目的】为提升传统LDA模型的主题识别性能,并给主题最优数目选择提供技术方案,提出基于自适应聚类的K-wrLDA模型。【方法】利用LDA和Word2Vec模型得出包含主题词概率信息及词义相关性的T-WV矩阵,并将传统LDA模型的主题数目选择问题转化为聚类效果评价问题,以内部指标伪F统计量作为目标函数,计算主题聚类数目的最优解,并对新旧两种模型的主题识别效果进行比较。【结果】经自适应聚类得出最优主题数量为33,且新模型的困惑度得分始终低于传统模型,主题识别效果对比显示新模型具有更好的凝聚性。【局限】在实证语
关键词:
主题模型 词嵌入 自适应聚类 困惑度
[期刊] 情报理论与实践
[作者]
刘扬
文章分析了学术信息推荐的特性和学术信息质量的影响因素,认为信息质量是提升学术推荐系统性能的重要影响因素。并归纳、分析了推荐系统用户满意度变量,重点考虑了信息质量、信息内容和信息协同3个影响因素,构建了包括信息表述、用户偏好获取、混合推荐、信息质量评估和综合评分5个模块的混合推荐模型,并简述了其实现步骤与方法。
关键词:
学术信息 信息质量 算法 推荐模型
[期刊] 科技管理研究
[作者]
马文聪 雷璇 李远辉
利用中国知网(CNKI)数据,基于CiteSpace可视化文献分布情况,采用隐含狄利克雷分布(LDA)主题模型提取关键词,挖掘出文本隐含的研究主题及重要性程度;结合动态主题模型(DTM),分析不同主题内容的演化过程。结果表明,粤港澳相关研究主题主要集中于经济合作、协同治理、人才培养、环境保护、产业升级、旅游与文化六大方面。其中,经济合作和协同治理是目前研究关注的重点,人才培养和环境保护是今后主要研究趋势,且相关内容呈现不断细化特征。
[期刊] 图书情报工作
[作者]
关鹏 王曰芬 傅柱
[目的/意义]潜在狄利克雷分布(Latent DirichLet aLLocation,LDa)在科技情报分析中用来发现学科主题、挖掘研究热点以及预测研究趋势等。对常见的科学文献文本语料库(关键词、摘要、关键词+摘要)进行LDa主题抽取效果的评价,以揭示不同语料库的主题抽取效果,提高LDa在科技情报分析中的应用效果。[方法/过程]对上述3种语料库下的LDa主题模型进行对比研究,采用基于查全率、查准率、F值以及信息熵的定量分析和基于主题抽取的广度和主题粒度的定性分析相结合的方法对主题抽取效果进行评价。[结果/结论]通过国内风能领域的科学文献数据实证研究发现,无论是从定量分析还是从定性分析来看,摘...
[期刊] 情报理论与实践
[作者]
巴志超 李湘东 马亚雪 徐健
为满足数字图书馆各种类型数字化资源统一分类组织的需要,文章着重对数字图书馆中多种类型文献混合分类的可行性进行探索与分析。引入语义主题模型构建方法,结合外部知识库Wikipedia进行语义扩展,构建一种基于主题语义扩展的混合类型文献自动分类方法。研究发现:在多类型文献混合分类中,网页与非学术性期刊文献、图书与学术性期刊文献之间具有较高的亲和力,可互相作为分类材料中的训练集并达到较高分类性能;不同分类算法针对多种类型文献混合分类具有不同的可学习能力和适应性,贝叶斯算法、最大熵模型比支持向量机更能适应多种类型文
关键词:
主题模型 语义扩展 数字资源 混合分类
[期刊] 图书馆杂志
[作者]
沈立力 姜鹏 王静
Google AI团队发布的BERT模型在多项自然语言处理任务中取得了研究成果,但在中文文献自动分类领域尚有待探索。本文旨在探索BERT_(base)中文基础模型在中文社科、科技期刊文献分类上的实际分类效果,指出模型在实际应用中存在的问题并提出解决方法。本文选取R大类(医药、卫生)、TG大类(金属学与金属工艺)、F大类(经济)、J大类(艺术)共1 745 000条数据作为训练语料,并以另外9 610条数据作为测试样本,利用BERT模型分别对社科、科技期刊文献进行分类研究。测试结果表明BERT模型在社科文献中的四级准确率为76.95%,科技文献为68.55%。之后引入惩罚策略,为实际工作中免检数据阈值的设定提供参考。BERT_(base)模型在《全国报刊索引》实际分类标引工作中有一定可行性,基本满足当前网络环境下中文文献自动分类的需求。
[期刊] 情报理论与实践
[作者]
罗鹏程 王继民 聂磊
[目的/意义]探索有效提高文献资源自动层次分类和跨语言分类效果的方法。[方法/过程]将文献资源分类视为分类号生成任务,利用图书馆编目数据构造训练集和测试集,基于ChatGLM 3、Llama 2等大语言模型在训练集上进行模型的高效微调,并在中英文测试集上分析模型的分类效果。[结果/结论]在不同的输出格式中,微调大语言模型使其直接输出分类号,可以获得最优的分类效果;随着训练样本数量的增加,微调后的大语言模型分类效果不断提升;基于22000个样本微调的大语言模型在中图法一级类目和完整分类号的准确率分别可达0.8848、0.5076,优于通用大语言模型;在中文文献上训练的大语言模型可以有效地分类英文文献,分类效果仅比中文文献略低;大语言模型生成的分类号中有少量不是有效的中图分类号。
[期刊] 情报理论与实践
[作者]
颜端武 陶志恒 李兰彬
文章研究了一种基于HDP主题模型的主题文献自动推荐方法,并将其应用于专题情报服务领域知识库构建平台系统的开发。该方法在中文分词和词性标注的基础上,进行文献特征的预筛选获得特征词频分布矩阵,通过HDP主题模型生成各文献与文献集的主题分布矩阵,利用余弦相似度计算与时间阈值加权,生成每篇文献的相关文献集并进行主题文献自动推荐。选取雷达领域语料为样本,在面向专题情报服务的领域知识库构建平台系统中进行了主题文献推荐的模块设计和实际应用。
[期刊] 情报科学
[作者]
梁珊 邱明涛 马静
【目的/意义】考虑到使用LDA模型进行主题抽取时,抽取到的特征词是无序的,破坏了原有的主谓宾结构,导致抽取效果不准确,可读性差的缺陷,构造了WO词序模型,并将LDA模型与WO模型结合,提出了基于LDA-WO混合模型的微博主题有序特征抽取算法。【方法/过程】使用LDA模型进行主题建模,获得无序特征词,然后通过WO模型对特征词进行排序,将特征词与原语料进行对比,构造特征词-语料位置矩阵,通过对特征词的位置排序,构造特征词词序权值矩阵,最终获得有序的特征词,完成对话题特征的有序抽取。【结果/结论】本文以真实新浪
[期刊] 情报理论与实践
[作者]
王曰芬 傅柱 陈必坤
[目的]利用LDA主题模型来探究全局主题和学科主题之间存在的差异。[方法]基于LDA主题模型,以国内知识流研究领域为例,在主题抽取的基础上,比较与分析全局主题和学科主题所存在的差异。[结果]全局主题和学科主题在可描述性、内容相关性、内容质量、学科分布4个方面具有显著的差异。[局限]采用经验判断选取了用于实验分析的全局热点主题和学科热点主题。
关键词:
LDA模型 科学文献 主题识别 知识流
[期刊] 情报理论与实践
[作者]
唐晓波 翟夏普
[目的/意义]信息过载是当前社会面临的普遍性问题,如何从大量的信息中提取有价值的内容,已成为研究的一个重点,目前自动摘要技术成为解决此问题的一种途径。[方法/过程]为了解决多文档摘要信息不全面、冗余度高的问题,文章提出了针对中文文本的多文档自动摘要混合模型,并对该模型所包含的句子向量化、分类器分类、句群划分和句子重组四个部分做了详细说明。该混合模型在摘要提取的过程不仅考虑了句子的形式特征,还融合了句子的深层语义,最后采用基于改进的PageRank算法对摘要句进行重组。[结果/结论]当摘要句为30时,该模型的ROUGE-1得分平均值为0.2074,明显高于TextRank (0.0728)和基于聚类的算法(0.1074)。实验结果表明该模型在多主题的中文长文本上是有效的。[局限]由于中文语料的限制,本实验的数据量相对较小,模型的适应能力未在大数据集上验证。
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除