- 年份
- 2024(11351)
- 2023(16789)
- 2022(14682)
- 2021(13962)
- 2020(11697)
- 2019(27230)
- 2018(27096)
- 2017(52353)
- 2016(28501)
- 2015(32062)
- 2014(32095)
- 2013(31265)
- 2012(28326)
- 2011(25362)
- 2010(25332)
- 2009(22747)
- 2008(22000)
- 2007(19170)
- 2006(16428)
- 2005(13969)
- 学科
- 济(109020)
- 经济(108897)
- 管理(82128)
- 业(76869)
- 企(65086)
- 企业(65086)
- 方法(53135)
- 数学(45978)
- 数学方法(45164)
- 农(29710)
- 财(28221)
- 中国(27808)
- 业经(24908)
- 学(24330)
- 地方(22416)
- 理论(21272)
- 农业(19855)
- 制(19399)
- 贸(18746)
- 贸易(18734)
- 务(18709)
- 财务(18619)
- 财务管理(18572)
- 技术(18169)
- 易(18156)
- 和(17823)
- 企业财务(17490)
- 环境(16400)
- 划(15230)
- 银(15049)
- 机构
- 学院(391655)
- 大学(390994)
- 管理(156282)
- 济(147885)
- 经济(144441)
- 理学(136189)
- 理学院(134681)
- 管理学(131832)
- 管理学院(131130)
- 研究(122233)
- 中国(90245)
- 京(82733)
- 科学(78031)
- 财(67455)
- 所(59886)
- 农(59772)
- 业大(58823)
- 江(57123)
- 中心(57013)
- 财经(54897)
- 研究所(54736)
- 范(53454)
- 师范(52936)
- 北京(51544)
- 经(49856)
- 州(46840)
- 农业(46694)
- 院(45233)
- 经济学(44054)
- 技术(43403)
- 基金
- 项目(272628)
- 科学(214412)
- 研究(200921)
- 基金(195935)
- 家(169972)
- 国家(168521)
- 科学基金(145937)
- 社会(123710)
- 社会科(117093)
- 社会科学(117063)
- 省(108020)
- 基金项目(104313)
- 自然(96208)
- 教育(94720)
- 自然科(93991)
- 自然科学(93972)
- 自然科学基金(92243)
- 划(90302)
- 编号(84176)
- 资助(81334)
- 成果(67624)
- 重点(60924)
- 部(59441)
- 发(57549)
- 课题(57520)
- 创(56842)
- 创新(52899)
- 科研(52232)
- 项目编号(51687)
- 大学(51608)
- 期刊
- 济(156879)
- 经济(156879)
- 研究(110076)
- 中国(71415)
- 学报(60677)
- 管理(56084)
- 科学(55616)
- 农(53383)
- 财(52500)
- 教育(50542)
- 大学(46662)
- 学学(43353)
- 技术(37698)
- 农业(37153)
- 融(28330)
- 金融(28330)
- 业经(27750)
- 财经(25458)
- 经济研究(24801)
- 图书(23838)
- 经(21730)
- 问题(20601)
- 业(19125)
- 技术经济(18803)
- 科技(18745)
- 版(18540)
- 理论(18101)
- 统计(17689)
- 商业(17401)
- 资源(17217)
共检索到554714条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 情报理论与实践
[作者]
傅柱 王曰芬 关鹏
[目的]为了能够更为全面地探索和揭示研究领域的知识结构和热点主题,文章提出基于分类视角的LDA主题抽取方法。[方法]以国外知识流领域为研究对象,根据研究方向将知识流的相关文献分为5类。利用LDA主题模型分别对分类后的文献集进行主题抽取,筛选得到不同研究方向下的11个热点主题,并深入分析不同研究方向下热点主题所揭示的知识点。[结果]实验结果表明,基于分类视角的LDA主题抽取方法能够较为全面和细致地挖掘研究领域的学科主题和研究热点。[局限]所提的方法未能与其他主题挖掘方法进行对比,研究结果也未与现有文献中分析出的知识流领域研究热点进行对照。
[期刊] 图书情报工作
[作者]
胡吉明 陈果
指出文本内容主题的挖掘和演化研究对于文本建模和分类及推荐效果提升具有重要作用。从分析基于LDA主题模型的文本内容主题挖掘原理入手,针对当前网络环境下的文本内容特点,构建适用于动态文内容本主题挖掘的LDA模型,并通过改进的Gibbs抽样估计提高主题挖掘的准确性,进而从主题相似度和强度两个方面研究内容主题随时间的演化问题。实验表明,所提方法可行且有效,对后续有关文本语义建模和分类研究等具有重要的实践意义。
关键词:
主题挖掘 主题演化 动态LDA模型
[期刊] 图书情报工作
[作者]
关鹏 王曰芬 傅柱
[目的/意义]潜在狄利克雷分布(Latent DirichLet aLLocation,LDa)在科技情报分析中用来发现学科主题、挖掘研究热点以及预测研究趋势等。对常见的科学文献文本语料库(关键词、摘要、关键词+摘要)进行LDa主题抽取效果的评价,以揭示不同语料库的主题抽取效果,提高LDa在科技情报分析中的应用效果。[方法/过程]对上述3种语料库下的LDa主题模型进行对比研究,采用基于查全率、查准率、F值以及信息熵的定量分析和基于主题抽取的广度和主题粒度的定性分析相结合的方法对主题抽取效果进行评价。[结果/结论]通过国内风能领域的科学文献数据实证研究发现,无论是从定量分析还是从定性分析来看,摘...
[期刊] 华中师范大学学报(自然科学版)
[作者]
肖明 商慧语 肖毅 廖莉莉
为揭示并对比统计学CSSCI期刊创办至今的刊文发展趋势与热门主题,该研究收集从1985-2020年CNKI数据库收录的统计学CSSCI期刊43 001篇文献为研究对象,运用LDA主题模型及共现网络模型对热门主题及主流研究方法等指标进行热门主题与知识图谱分析,并绘制相关知识图谱.研究表明,近5年来研究方法上大量采用结构方程模型和分位数回归法,而大数据则成为近年来新增的高频词.LDA模型能够较为精确地挖掘统计学领域的热门主题和研究方法,为科研人员和决策人员开展前沿科学活动提供重要支持.
[期刊] 情报理论与实践
[作者]
朱晓霞 宋嘉欣 孟建芳
[目的/意义]近些年来,随着互联网的快速发展,微博逐渐成为人们发表言论的一个社交网络平台。通过对大量评论信息进行情感分析,对政府进行舆情治理、企业市场决策和消费行为分析具有十分重要的意义。[方法/过程]文章针对微博评论表达的特点,提出一种基于主题—情感挖掘模型的无监督情感分类方法,通过将语义角色标注、TF-IDF和K-means聚类方法相结合,构建情感单元词表和主题—情感匹配词表,同时挖掘出评论中主题和情感的分布与联系,并利用点互信息(Pointwise Mutual Information,PMI)和情感词典的方法计算主题词的情感极性值,基于此进行情感分类。[结果/结论]经实验证明,该方法同时考虑了评论中的主题分布与情感极性信息,解决了主题模型中常见的数据稀疏问题,提高了情感分类的效率和准确性,在F值上比S-LDA模型提高了14.24%。
[期刊] 物流技术
[作者]
魏忠 乐玥
电商平台上存在大量的物流数据评价信息,然而,个人语言表达中存在或多或少的差异,导致主题分类词并不能很好的聚类,为商家与消费者提供决策信息。因此,提出了一种基于LDA(Latent Dirichlet Allocation)主题模型的同义主题合并的文本分类方法对在线评价进行物流主题挖掘,寻找其中更深层次的决策信息。首先,采用python3.9爬取某电商平台生鲜类、食品类、电器类、个护类、日用类及服务类产品的在线评论数据。运用TF-IDF(Term Frequency-Inverse Document Frequency)分词方法对数据集进行分词处理,获得特征词及其概率分布,利用物流行业同义词库进行特征词的同义替换,并进行概率重整合,最后进行LDA主题模型分析以及可视化分析。在数据实证算例分析中发现,在六大类的商品中,消费者对于物流的要求并不相同,商家可根据在线评论的主题挖掘结果进行物流企业的选择以满足消费者需求,物流企业也可依据此进行自身服务质量的提升。
[期刊] 情报科学
[作者]
曲靖野 陈震 胡轶楠
【目的/意义】大数据时代文本主题挖掘在情报分析领域中的作用日趋重要,通过特征比较共词分析和LDA模型分析两种主流文本主题挖掘方法,研究两者的具体特点,为相关人员合理地运用文本主题挖掘方法处理数据提供一定的参考。【方法/过程】本文分两种情况对比研究:第一、两者挖掘不同时段同一种类文本数据的主题分布信息和主题演化信息的能力;第二、两者挖掘同一时段不同种类文本数据的提取正确主题的能力。【结果/结论】在不同时段LDA模型分析与共词分析相比挖掘主题分布信息的能力可不断提升,并且其可挖掘出更加细化的主题演化信息;在同
[期刊] 图书情报工作
[作者]
张琴 张智雄
[目的/意义]以主题短语识别为研究对象,提出基于PhraseLDA模型的主题短语挖掘方法,为快速理解文本内容、准确抽取文本主题提供借鉴思路。[方法/过程]对低频词进行量化定义,提出一种合理的短语重要度计算方法,最终利用PhraseLDA主题模型推理出主题短语。[结果/结论]实验结果表明该方法在多种数据集中挖掘出的主题短语质量较高,主题一致性较强。
关键词:
主题模型 短语挖掘 主题短语
[期刊] 情报理论与实践
[作者]
陈斌 马静
[目的/意义]为了弥补LDA模型建模过程中未考虑到网络文本中文档关注度和质量度这一因素,并增强结果的语义可解释性和主题表示能力,文章提出了一种热度加权的HLDA-IDF的网络文本主题挖掘模型。[方法/过程]本文首先是给出了较为准确的热度定义,并对LDA模型进行热度加权,构建出了HLDA模型,再依据词汇的主题表示能力存在差异这一实际情况,引入TF-IDF算法并改进,构建出HLDA-IDF模型,最后利用实际论坛数据进行实验验证。[结果/结论]实验结果表明该模型的结果语义可解释性和主题表示能力较强。
关键词:
热度 模型 主题挖掘 网络文本 文本挖掘
[期刊] 图书情报工作
[作者]
唐晓波 王洪艳
为了弥补目前微博平台主题挖掘方法的不足,兼顾到微博信息的稀疏性、多维性、海量性等特点,提出根据微博信息特点进行有针对性的预处理后,使用基于先验概率的潜在语义分析模型LDA(Latent Dirichlet Alloca-tion)进行微博主题挖掘,并在LDA建模的基础上,设计文本增量聚类算法,进一步实现主题结构的识别,从而使用户更好地理解主题及其结构。通过在真实微博数据集上的实验,证明该模型能有效进行主题挖掘和主题结构的识别。
[期刊] 情报杂志
[作者]
王文娟 马建霞
[目的/意义]基于当前对科研项目的研究主要以数据统计和计量分析为主,以NSF资助的海洋酸化相关研究的项目数据为例,从项目主题的角度研究科研立项的重点和演化,并对未来投入趋势加以预测。[方法/过程]使用LDA主题模型对该研究的主题进行分析,计算主题强度分析演化过程,统计NSF申请书项目与支撑发表的核心论文主题强度之间的相关性,进而分析NSF海洋酸化项目的主题发展趋势。[结果/结论]发现LDA模型可以很好的发现海洋酸化的主要研究主题,且NSF资助的科研项目与支撑发表论文的主题演化规律具有一致性。使用的方法对科
关键词:
LDA NSF项目 主题演化 海洋酸化
[期刊] 情报科学
[作者]
邱明涛 马静 张磊 姚兆旭
【目的/意义】提出一种基于可扩展LDA模型的微博话题特征抽取方法。【方法/过程】利用词语权重调整方法筛选高贡献度高频词语;基于bootstrap思想,迭代产生特征词条候选集;引入信息熵值理论筛选话题词条;并利用四维泛化分类实现对特征词条的泛化和归类。【结果/结论】本文以真实新浪微博数据为实验对象,实验结果表明基于扩展LDA模型的特征词提取方法可弥补传统LDA模型在话题可解释性上的不足,有效地对微博文本进行话题特征抽取。
关键词:
LDA模型 微博话题 话题特征 特征抽取
[期刊] 情报学报
[作者]
胡昊天 邓三鸿 孔玲 闫晓慧 杨文霞 王东波 沈思
情报学术语承载了情报学科基础知识与核心概念。从概念维度梳理与分析情报学术语对推动学科发展、助力下游知识挖掘任务具有重要意义。面对数量快速增长的科技文献,自动术语抽取替代了人工筛选,但现有方法严重依赖大规模标注数据集,难以迁移至低资源场景。本文设计了一种生成式情报学术语抽取方法 (generative term extraction for information science,GTX-IS),将传统基于序列标注的抽取式任务转化为序列到序列的生成式任务。结合小样本学习策略与有监督微调,提升面向特定任务的文本生成能力,能够在低资源有标签数据集场景下较为精准地抽取情报学术语。对于抽取结果,本文进一步开展了情报学领域术语发现及多维知识挖掘。综合运用全文科学计量与信息计量方法,从术语自身、术语间关联、时间信息等维度,对术语的出现频次、生命周期、共现信息等进行统计分析与知识挖掘。采用社会网络分析方法,结合时间维度特征,从术语角度出发,完善期刊的动态简介,探究情报学研究热点、演变历程和未来发展趋势。本文方法在术语抽取实验中的表现超越了全部13种主流生成式和抽取式模型,展现出较强的小样本学习能力,为领域信息抽取提供了新的思路。
[期刊] 情报理论与实践
[作者]
张思凤 梁梦丽 曹高辉
[目的/意义]主题抽取的效果对于信息检索、自动标引、自然语言处理具有重要的价值,提高主题抽取的效果,既能改善检索系统主题检索准确性,又能够帮助学者更加高效地了解文献的主要思想。文章研究并探讨了从引用内容中抽取文献主题的有效性。[方法/过程]选取自然语言处理领域文献为研究对象,利用文献之间的引用与被引用关系抽取引用内容,进行分词并计算权重;将引用内容、全文抽取的候选词进行专家打分评价效果并将其与关键词对比,使用F值评价两种语料库抽取候选词的优劣。[结果/结论]通过专家打分及计算F值,发现引用内容在抽取候选词
关键词:
科技文献 引文 主题抽取 关键词
[期刊] 情报理论与实践
[作者]
谢秀芳 张晓林
[目的/意义]为了加强针对科技路线图的情报研究,探索从科技路线图报告中自动抽取核心信息的方法。[方法/过程]通过分析21个国家或组织发布的166份科技路线图的内容组织和表达特征,总结科技路线图中包含的核心信息,提出一种新的信息抽取思路"抽取—同步—分类",实现对科技路线图中核心内容的抽取。[结果/结论]以45篇科技路线图报告为测试案例进行方法验证,最终获取26736条有效数据信息,按时间序列可视化呈现,能够基本反映科技路线图的主要内容,表明该方法设计可行,能够快速获取科技路线图中的核心信息,提高针对科技路
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除