- 年份
- 2024(5506)
- 2023(8181)
- 2022(7110)
- 2021(6790)
- 2020(5734)
- 2019(13352)
- 2018(13238)
- 2017(25460)
- 2016(14002)
- 2015(15872)
- 2014(15646)
- 2013(15232)
- 2012(13847)
- 2011(12599)
- 2010(13342)
- 2009(12131)
- 2008(11943)
- 2007(10830)
- 2006(9759)
- 2005(8809)
- 学科
- 济(53985)
- 经济(53935)
- 管理(41984)
- 业(40827)
- 企(35307)
- 企业(35307)
- 方法(24127)
- 数学(21021)
- 数学方法(20450)
- 农(15393)
- 中国(15281)
- 财(13220)
- 策(12592)
- 业经(12358)
- 地方(11521)
- 理论(11184)
- 制(10299)
- 贸(10216)
- 贸易(10208)
- 技术(10027)
- 易(9956)
- 农业(9753)
- 学(9290)
- 划(8930)
- 和(8720)
- 银(8588)
- 银行(8575)
- 行(8194)
- 务(7797)
- 财务(7748)
- 机构
- 学院(193966)
- 大学(189377)
- 济(77709)
- 管理(77634)
- 经济(75931)
- 理学(66407)
- 理学院(65688)
- 管理学(64259)
- 管理学院(63881)
- 研究(63756)
- 中国(48201)
- 京(39849)
- 科学(37851)
- 财(36700)
- 所(31327)
- 江(30569)
- 中心(29381)
- 研究所(28194)
- 农(28115)
- 财经(28086)
- 业大(26143)
- 范(25801)
- 师范(25591)
- 经(25335)
- 北京(25314)
- 州(24409)
- 院(23400)
- 技术(22957)
- 经济学(21792)
- 农业(21711)
- 基金
- 项目(125365)
- 科学(99558)
- 研究(95437)
- 基金(88574)
- 家(75946)
- 国家(75290)
- 科学基金(65537)
- 社会(57990)
- 社会科(55069)
- 社会科学(55053)
- 省(51132)
- 教育(46055)
- 基金项目(45428)
- 划(42583)
- 自然(42370)
- 自然科(41450)
- 自然科学(41443)
- 编号(41168)
- 自然科学基金(40697)
- 资助(37488)
- 成果(34355)
- 课题(29554)
- 重点(28331)
- 发(27460)
- 部(27242)
- 创(27153)
- 项目编号(25151)
- 创新(25127)
- 年(23919)
- 教育部(23650)
共检索到296214条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 情报学报
[作者]
陆伟 刘寅鹏 石湘 刘家伟 程齐凯 黄永 汪磊
大型语言模型突出的任务理解和指令遵循能力,使用户可以通过简单的指令交互完成复杂的信息处理任务。科技文献分析领域正在积极探索大模型的应用,但尚未形成对指令工程技术和模型能力边界的系统性研究。本文以学术文本挖掘任务为切入点,从上下文学习、思维链推理等角度设计推理端指令策略,构建了涵盖文本分类、信息抽取、文本推理和文本生成4个能力维度共6项任务的大模型学术文本挖掘专业能力评测框架,并选取了7个国内外主流的指令调优模型进行实验,对比了不同指令策略的适用范围和不同参数模型的专业能力。实验结果表明,少样本、思维链等复杂指令策略在分类任务上的应用效果并不显著,而在抽取、生成等难度较高的任务上表现良好。千亿级参数规模的大模型经过指令引导,能够取得与充分训练的深度学习模型相近的效果,但对于十亿级或百亿级规模大模型,推理端的指令策略存在明显上限。为了实现大模型向科技情报领域的深层嵌入,现阶段仍需在调优端对模型参数进行领域化适配。
关键词:
大模型 学术文本挖掘 指令工程 能力评测
[期刊] 图书情报工作
[作者]
俞琰 陈磊 赵乃瑄
[目的/意义]为帮助高校师生充分利用网络招聘信息,提出基于大数据量网络招聘文本挖掘的课程知识模型及其自动构建方法。[方法/过程]本文提出包含"岗位-课程-知识点"的三级课程知识模型,利用自然语言文本挖掘技术实现课程知识点模型的自动构建,并通过实验对其构建过程进行验证和分析。[结果/结论]实验结果表明本文提出的模型及方法具有高度的可行性与有效性,可为高校和学生提供教学和学习参考。
关键词:
网络招聘文本 课程知识模型 文本挖掘
[期刊] 情报理论与实践
[作者]
王萍 牟冬梅 石琳 琚沅红
[目的/意义]融合学科领域知识优化数据挖掘模型构建的策略,提高知识发现结果的可靠性和置信度。[方法/过程]以某三甲医院冠心病住院患者的临床资料为研究对象,将医学领域知识融合嵌入机器学习过程,从数据集成与质量控制层、数据分析与模型构建层、模型结果优化与调整层构建数据挖掘模型。[结果/结论]领域知识融合可以驱动数据挖掘模型构建策略的优化,能够促进数据的知识发现从传统型的技术算法驱动向新型的领域知识指导转型,提高数据挖掘结果的置信度。[局限]多领域知识融合的机制和效果还需深入探讨。
关键词:
领域知识 知识融合 数据挖掘 模型构建
[期刊] 中国图书馆学报
[作者]
章成志 侯汉清
针对当前Web文本挖掘工具的不足之处,提出了一种基于层次结构、面向概念挖掘的模型,即文本层次模型。该模型具有数据源适应性强、结构灵活、可操作性强、用途广泛优点,具有很强的实用性和一定的可扩展能力。图2。参考文献13。
[期刊] 图书情报工作
[作者]
唐涛
将领域本体学习的任务与中文文本挖掘技术相结合,构建基于文本挖掘的中文领域本体学习模型,从领域文本库构建、领域概念学习、概念间关系学习、本体表示和本体评价五个方面研究该模型各个模块的实现方法和技术。
关键词:
文本挖掘 领域本体 本体学习
[期刊] 情报理论与实践
[作者]
陈斌 马静
[目的/意义]为了弥补LDA模型建模过程中未考虑到网络文本中文档关注度和质量度这一因素,并增强结果的语义可解释性和主题表示能力,文章提出了一种热度加权的HLDA-IDF的网络文本主题挖掘模型。[方法/过程]本文首先是给出了较为准确的热度定义,并对LDA模型进行热度加权,构建出了HLDA模型,再依据词汇的主题表示能力存在差异这一实际情况,引入TF-IDF算法并改进,构建出HLDA-IDF模型,最后利用实际论坛数据进行实验验证。[结果/结论]实验结果表明该模型的结果语义可解释性和主题表示能力较强。
关键词:
热度 模型 主题挖掘 网络文本 文本挖掘
[期刊] 数理统计与管理
[作者]
王健 张俊妮
本文讨论了中文文本挖掘的三个问题:分词、关键词提取和文本分类。对分词问题,介绍了基于层叠隐马尔可夫模型的ICTCLAS分词法,以及将词与词之间的分隔视为缺失数据并用EM算法求解的WDM方法;对关键词提取问题,提出了贝叶斯因子法,并介绍了使用稀疏回归的CCS方法;对文本分类问题,介绍了根据关键词频率建立分类器的方法,以及先建立主题模型再根据主题概率建立分类器的方法。本文通过两组文本数据对上述方法进行比较,并给出使用建议。
[期刊] 数理统计与管理
[作者]
王健 张俊妮
本文讨论了中文文本挖掘的三个问题:分词、关键词提取和文本分类。对分词问题,介绍了基于层叠隐马尔可夫模型的ICTCLAS分词法,以及将词与词之间的分隔视为缺失数据并用EM算法求解的WDM方法;对关键词提取问题,提出了贝叶斯因子法,并介绍了使用稀疏回归的CCS方法;对文本分类问题,介绍了根据关键词频率建立分类器的方法,以及先建立主题模型再根据主题概率建立分类器的方法。本文通过两组文本数据对上述方法进行比较,并给出使用建议。
[期刊] 金融论坛
[作者]
姜卫韬 姜卫宁
本文从客户经理社会资本的视角剖析了客户挖掘能力的内在构成要素:代表结构能力的客户经理关系网络和代表资源能力的客户经理社会资源。研究表明,关系网络的结构特征用中心性、不对称性和地位性来描述,其核心是控制利益;而社会资源本质上体现的是角色的二重性,其核心是信息利益。客户经理社会资本就是其调动关系网络中的社会资源以获取客户挖掘机会的能力。在实践中,客户经理需要通过掌握更多的网络通道来优化自身的关系网络,通过建立更异质化的社会联系来优化自身的社会资源,如加入社会团体,参加培训,利用网络媒体,借助学缘及地缘聚会等。
[期刊] 建筑经济
[作者]
姜早龙 李荷
基于爬虫技术获取社交媒体上老旧小区改造话题的文本信息,应用文本挖掘技术提取出改造认知、改造需求、改造施工等主题中不同热点词汇的关联信息,深入研究公众的关注热点与讨论内容,据此提出针对性的老旧小区改造推进策略,以期提高老旧小区改造项目实施后与公众需求的契合度,推动老旧小区改造更好地发展。
[期刊] 财会通讯
[作者]
冯炳纯
近年来,我国上市公司数量的急剧增加及其财务舞弊手段的不断更新对审计工作中的财务舞弊识别提出了更高要求,克服传统人工识别方法的种种弊端转而寻求高效的财务舞弊识别方法具有重要现实意义。本文以数据挖掘技术为基础构建了不同的财务舞弊识别模型,并结合样本进行了财务舞弊识别检验,对比实验结果后得出结论:随机森林与R elief算法指标组合模型的识别效率最高;与Boruta算法指标组合模型的综合性能最佳。
关键词:
数据挖掘 财务舞弊识别模型 特征选择
[期刊] 情报科学
[作者]
曲靖野 陈震 胡轶楠
【目的/意义】大数据时代文本主题挖掘在情报分析领域中的作用日趋重要,通过特征比较共词分析和LDA模型分析两种主流文本主题挖掘方法,研究两者的具体特点,为相关人员合理地运用文本主题挖掘方法处理数据提供一定的参考。【方法/过程】本文分两种情况对比研究:第一、两者挖掘不同时段同一种类文本数据的主题分布信息和主题演化信息的能力;第二、两者挖掘同一时段不同种类文本数据的提取正确主题的能力。【结果/结论】在不同时段LDA模型分析与共词分析相比挖掘主题分布信息的能力可不断提升,并且其可挖掘出更加细化的主题演化信息;在同
[期刊] 情报理论与实践
[作者]
邵康 张建伟
文章提出的基于Web文本挖掘的个性化推荐模型是从Web交易事务中挖掘出与当前用户会话相似度最高的会话集,该模型将BM25F运用到了文本挖掘中。BM25F模型最初用在搜索引擎中,在个性化推荐中用来计算文本文档的相似性是可行的,并且通过实验分析,其推荐结果更加优于传统的TF*IDF模型,因为BM25F计算的权重精确度大幅提高,进而提高了推荐的精确度。此外该模型能有效地跟踪用户的当前偏好,对用户随时改变兴趣偏好能及时作出响应。
[期刊] 图书情报工作
[作者]
王翠波
在分析情感知识的技术竞争情报价值和文本信息资源的情感特性及情感化方式的基础上,围绕企业技术竞争情报获取目标与环境,结合文本情感挖掘流程构建由数据层、处理层、应用层组成的采集模型,可用于从以网络技术评论为典型代表的主观性文本信息资源中识别出情感知识作为对传统的主题式情报采集的有益补充,实现情感类技术竞争情报的智能获取。
关键词:
企业技术竞争情报 情报采集 情感挖掘
[期刊] 情报理论与实践
[作者]
张玉峰 张婧
本文简要介绍了不良信息的概念和分类,有针对性地分析了国内外不良信息监测的研究现状与问题,综合应用文本内容特征分析、文本分类分析等挖掘方法,构建了W eb文本不良信息监测模型,提出了文本不良信息监测算法。
关键词:
数据挖掘 不良信息 信息监测
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除

