标题
  • 标题
  • 作者
  • 关键词
登 录
当前IP:忘记密码?
年份
2024(3099)
2023(4617)
2022(4041)
2021(4017)
2020(3537)
2019(8219)
2018(8452)
2017(16122)
2016(9004)
2015(10389)
2014(10490)
2013(9925)
2012(9166)
2011(8140)
2010(8722)
2009(8099)
2008(8165)
2007(7393)
2006(6530)
2005(5814)
作者
(26716)
(22264)
(22049)
(21075)
(14182)
(10780)
(10115)
(8837)
(8387)
(8197)
(7751)
(7419)
(7197)
(7095)
(6806)
(6789)
(6655)
(6525)
(6496)
(6350)
(5609)
(5580)
(5472)
(5121)
(5030)
(5009)
(4985)
(4939)
(4625)
(4510)
学科
(36219)
经济(36181)
管理(25346)
(22804)
方法(20439)
(20114)
企业(20114)
数学(17922)
数学方法(17329)
中国(9234)
理论(8408)
(8346)
(8087)
(7084)
业经(6949)
(6559)
贸易(6552)
(6383)
教学(6287)
(5995)
(5599)
技术(5404)
地方(5330)
(4993)
农业(4983)
(4938)
银行(4930)
(4820)
(4647)
(4617)
机构
学院(127397)
大学(127115)
管理(48819)
(45460)
经济(44289)
理学(41930)
理学院(41471)
研究(40269)
管理学(40051)
管理学院(39840)
中国(31061)
(27989)
科学(27337)
(21486)
(21293)
(20690)
业大(20063)
(19890)
中心(19321)
研究所(19307)
北京(17682)
农业(16974)
(16792)
师范(16594)
财经(16439)
技术(16359)
(16179)
(14719)
(14325)
(13240)
基金
项目(83337)
科学(64590)
基金(58787)
研究(58419)
(51987)
国家(51586)
科学基金(44171)
社会(34325)
(33848)
社会科(32497)
社会科学(32484)
自然(30547)
自然科(29959)
自然科学(29953)
基金项目(29941)
自然科学基金(29354)
教育(28880)
(28445)
资助(26547)
编号(24585)
成果(20208)
重点(19040)
(17447)
课题(17391)
(17083)
(16804)
计划(16150)
科研(15966)
创新(15900)
大学(15558)
期刊
(49132)
经济(49132)
研究(34771)
中国(27114)
学报(21762)
(19424)
管理(19422)
科学(19356)
教育(18403)
大学(16425)
(16210)
学学(15225)
技术(14697)
农业(13392)
统计(12913)
(10573)
决策(9905)
(9617)
金融(9617)
图书(7943)
业经(7872)
(7782)
财经(7761)
经济研究(7668)
技术经济(7080)
(6702)
(6614)
科技(6104)
业大(5974)
问题(5905)
共检索到191839条记录
发布时间倒序
  • 发布时间倒序
  • 相关度优先
文献计量分析
  • 结果分析(前20)
  • 结果分析(前50)
  • 结果分析(前100)
  • 结果分析(前200)
  • 结果分析(前500)
[期刊] 数理统计与管理  [作者] 王健  张俊妮  
本文讨论了中文文本挖掘的三个问题:分词、关键词提取和文本分类。对分词问题,介绍了基于层叠隐马尔可夫模型的ICTCLAS分词法,以及将词与词之间的分隔视为缺失数据并用EM算法求解的WDM方法;对关键词提取问题,提出了贝叶斯因子法,并介绍了使用稀疏回归的CCS方法;对文本分类问题,介绍了根据关键词频率建立分类器的方法,以及先建立主题模型再根据主题概率建立分类器的方法。本文通过两组文本数据对上述方法进行比较,并给出使用建议。
[期刊] 数理统计与管理  [作者] 王健  张俊妮  
本文讨论了中文文本挖掘的三个问题:分词、关键词提取和文本分类。对分词问题,介绍了基于层叠隐马尔可夫模型的ICTCLAS分词法,以及将词与词之间的分隔视为缺失数据并用EM算法求解的WDM方法;对关键词提取问题,提出了贝叶斯因子法,并介绍了使用稀疏回归的CCS方法;对文本分类问题,介绍了根据关键词频率建立分类器的方法,以及先建立主题模型再根据主题概率建立分类器的方法。本文通过两组文本数据对上述方法进行比较,并给出使用建议。
[期刊] 统计与决策  [作者] 李泽安  李泽慧  
回归分析是数据挖掘中重要的方法之一。文章研究了基于半参数Beta回归模型结合惩罚样条估计的数据挖掘方法。当数据中因变量的数据取值为(0,1)区间(或某个区间)时,利用半参数Beta回归模型进行数据挖掘,不仅具有很好的解释效果,而且能挖掘出隐含在数据内部的有用信息。实验结果验证了研究方法的有效性。
[期刊] 情报科学  [作者] 曲靖野  陈震  胡轶楠  
【目的/意义】大数据时代文本主题挖掘在情报分析领域中的作用日趋重要,通过特征比较共词分析和LDA模型分析两种主流文本主题挖掘方法,研究两者的具体特点,为相关人员合理地运用文本主题挖掘方法处理数据提供一定的参考。【方法/过程】本文分两种情况对比研究:第一、两者挖掘不同时段同一种类文本数据的主题分布信息和主题演化信息的能力;第二、两者挖掘同一时段不同种类文本数据的提取正确主题的能力。【结果/结论】在不同时段LDA模型分析与共词分析相比挖掘主题分布信息的能力可不断提升,并且其可挖掘出更加细化的主题演化信息;在同
[期刊] 统计与决策  [作者] 马辉民 ,胡凌 ,郭潇  
[期刊] 图书情报工作  [作者] 唐涛  
将领域本体学习的任务与中文文本挖掘技术相结合,构建基于文本挖掘的中文领域本体学习模型,从领域文本库构建、领域概念学习、概念间关系学习、本体表示和本体评价五个方面研究该模型各个模块的实现方法和技术。
[期刊] 中国图书馆学报  [作者] 章成志  侯汉清  
针对当前Web文本挖掘工具的不足之处,提出了一种基于层次结构、面向概念挖掘的模型,即文本层次模型。该模型具有数据源适应性强、结构灵活、可操作性强、用途广泛优点,具有很强的实用性和一定的可扩展能力。图2。参考文献13。
[期刊] 情报理论与实践  [作者] 陈斌  马静  
[目的/意义]为了弥补LDA模型建模过程中未考虑到网络文本中文档关注度和质量度这一因素,并增强结果的语义可解释性和主题表示能力,文章提出了一种热度加权的HLDA-IDF的网络文本主题挖掘模型。[方法/过程]本文首先是给出了较为准确的热度定义,并对LDA模型进行热度加权,构建出了HLDA模型,再依据词汇的主题表示能力存在差异这一实际情况,引入TF-IDF算法并改进,构建出HLDA-IDF模型,最后利用实际论坛数据进行实验验证。[结果/结论]实验结果表明该模型的结果语义可解释性和主题表示能力较强。
[期刊] 图书情报工作  [作者] 郭金龙  许鑫  陆宇杰  
指出作为处理海量数据的有效工具,文本挖掘技术近年来在人文社科领域得到广泛重视。概述文本挖掘的相关技术和研究现状,介绍信息抽取、文本分类、文本聚类、关联规则与模式发现等常用的文本挖掘方法在人文社科研究中的具体应用,以拓展文本挖掘的应用领域,并为人文社科研究的方法创新提供新的思路。
[期刊] 清华大学教育研究  [作者] 王金羽  詹逸思  冯起  李曼丽  
信息时代海量增长的文本资料成为质性研究者开展研究的数据宝藏,但未得到充分研究,其原因在于针对海量中文文本数据的有效分析方法尚待突破。文章率先在质性研究范式中使用了以结构主题模型(STM)为代表的人机协同方法,对某大学在线教学效果评估的课堂观察记录数据展开文本挖掘。以教学评估研究数据分析为例,完整呈现了在教育质性研究中应用STM进行数据挖掘的四个步骤,并分析了其在挖掘海量中文文本资料方面的独特优势。研究表明,跨学科研究方法的尝试有助于解决教育学科甚至人文社科领域内海量中文文本在质性分析上的固有难题。
[期刊] 中国远程教育  [作者] 孙晓梅  
关联规则的挖掘是数据挖掘中的一个重要问题,在最近几年里被广泛研究。本文将目前广受关注的粗糙集理论及方法引入网络课程评价中,构建了基于粗集的关联规则挖掘模型,并实例探讨了网络课程评价中的关联规则挖掘方法。希望为我们开展网络课程评价的实践提供新的思路与方法。
[期刊] 大学图书馆学报  [作者] 张计龙  殷沈琴  龙向洋  
以复旦大学图书馆2005-2010年的流通数据、复旦大学院系师生人数、2005-2010年新闻出版业出版情况为数据源,通过数据筛选、清洗、处理等方法,建模并进行多元回归分析,从海量实际数据中挖掘出影响采访经费分配的显著变量,确定变量之间的数学关系式,并进行统计校验,由此得出采访经费比例预测模型。
[期刊] 图书情报工作  [作者] 陆宇杰  许鑫  郭金龙  
调研文本挖掘在人文社会科学领域的应用现况,介绍国际上文本挖掘在这些领域应用的成功案例与经验,展现目前文本挖掘在人文社科领域的最新研究进展,给国内相关研究的开展提供一定的启示。
[期刊] 实验技术与管理  [作者] 霍鑫  何长春  张华  赵辉  
基于与三一重工共建的工程机器人联合创新实验室,开发了电动挖掘机模型实验教学平台。通过平台自身软硬件设计和一系列教学实验设计,能够培养学生综合运用知识的能力、实践动手能力及创新思维。教学实践表明,该平台的开发和教学应用大大调动了学生的学习积极性,促进了学生的专业知识掌握和实践技能培养。
[期刊] 情报学报  [作者] 陆伟   刘寅鹏   石湘   刘家伟   程齐凯   黄永   汪磊  
大型语言模型突出的任务理解和指令遵循能力,使用户可以通过简单的指令交互完成复杂的信息处理任务。科技文献分析领域正在积极探索大模型的应用,但尚未形成对指令工程技术和模型能力边界的系统性研究。本文以学术文本挖掘任务为切入点,从上下文学习、思维链推理等角度设计推理端指令策略,构建了涵盖文本分类、信息抽取、文本推理和文本生成4个能力维度共6项任务的大模型学术文本挖掘专业能力评测框架,并选取了7个国内外主流的指令调优模型进行实验,对比了不同指令策略的适用范围和不同参数模型的专业能力。实验结果表明,少样本、思维链等复杂指令策略在分类任务上的应用效果并不显著,而在抽取、生成等难度较高的任务上表现良好。千亿级参数规模的大模型经过指令引导,能够取得与充分训练的深度学习模型相近的效果,但对于十亿级或百亿级规模大模型,推理端的指令策略存在明显上限。为了实现大模型向科技情报领域的深层嵌入,现阶段仍需在调优端对模型参数进行领域化适配。
文献操作() 导出元数据 文献计量分析
导出文件格式:WXtxt
作者:
删除