- 年份
- 2024(6703)
- 2023(9770)
- 2022(8393)
- 2021(7938)
- 2020(6817)
- 2019(15848)
- 2018(15742)
- 2017(30548)
- 2016(16317)
- 2015(18545)
- 2014(18050)
- 2013(17443)
- 2012(15657)
- 2011(13837)
- 2010(13601)
- 2009(12180)
- 2008(11456)
- 2007(9672)
- 2006(8104)
- 2005(6743)
- 学科
- 济(64352)
- 经济(64284)
- 管理(46428)
- 业(44015)
- 企(37422)
- 企业(37422)
- 方法(35906)
- 数学(32433)
- 数学方法(31775)
- 财(15983)
- 农(15701)
- 中国(15187)
- 业经(13023)
- 学(12886)
- 理论(11613)
- 贸(11104)
- 贸易(11097)
- 易(10834)
- 务(10486)
- 地方(10456)
- 财务(10431)
- 农业(10409)
- 财务管理(10405)
- 技术(10348)
- 制(9935)
- 企业财务(9856)
- 和(9575)
- 环境(9082)
- 划(8635)
- 银(8166)
- 机构
- 大学(221074)
- 学院(220873)
- 管理(88719)
- 济(87825)
- 经济(86112)
- 理学(78203)
- 理学院(77407)
- 管理学(75484)
- 管理学院(75100)
- 研究(71042)
- 中国(52323)
- 京(45821)
- 科学(45653)
- 农(38231)
- 财(38152)
- 业大(35990)
- 所(35009)
- 中心(33646)
- 研究所(32311)
- 江(31463)
- 财经(31383)
- 农业(30488)
- 经(28819)
- 北京(27897)
- 经济学(26928)
- 范(26903)
- 院(26831)
- 师范(26484)
- 技术(24930)
- 州(24583)
- 基金
- 项目(162041)
- 科学(128401)
- 基金(119452)
- 研究(113516)
- 家(106354)
- 国家(105563)
- 科学基金(91183)
- 社会(71263)
- 社会科(67624)
- 社会科学(67605)
- 省(63445)
- 基金项目(62515)
- 自然(62511)
- 自然科(61167)
- 自然科学(61148)
- 自然科学基金(60028)
- 划(54397)
- 教育(54317)
- 资助(50494)
- 编号(44750)
- 重点(37048)
- 部(35925)
- 创(34669)
- 成果(34296)
- 发(34140)
- 创新(32388)
- 科研(32238)
- 计划(31321)
- 课题(30891)
- 教育部(30832)
共检索到305007条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 统计与决策
[作者]
刘源 尹慧萍 朱建平
文章基于对平稳时间序列数据的随机抽取,选用AR模型研究其模型定阶方法和参数评估准则。根据数据有序性的特点,提出利用交叉验证的方法确定自回归模型阶数,并通过对原数据的无放回抽取实现对系数参数估计的评估。实例分析结果表明,交叉验证的定阶与AIC准则定阶结果保持较高一致性,新的参数评估在一定的模型误差范围内可以得到更为简单有效的系数估计区间。
关键词:
随机抽取 AR模型 模型定阶 参数评估
[期刊] 统计与决策
[作者]
刘源 尹慧萍 朱建平
文章基于对平稳时间序列数据的随机抽取,选用AR模型研究其模型定阶方法和参数评估准则。根据数据有序性的特点,提出利用交叉验证的方法确定自回归模型阶数,并通过对原数据的无放回抽取实现对系数参数估计的评估。实例分析结果表明,交叉验证的定阶与AIC准则定阶结果保持较高一致性,新的参数评估在一定的模型误差范围内可以得到更为简单有效的系数估计区间。
关键词:
随机抽取 AR模型 模型定阶 参数评估
[期刊] 情报学报
[作者]
李志义 王冕 赵鹏武
自媒体环境下对海量评价信息进行情感分析与监控已越发重要,它不仅可推动观点挖掘的深入研究,而且可帮助企业探索用户需求以产生巨大的商业价值。本文在条件随机场模型(CRFs)的基础上,结合句法特性,通过实验选取合适的句法特性组合,寻找评价特征提取的路径;其次,构建了手机领域的评论语料库。然后,利用句法分析器把评论短句分解成相应的句法树,分析评价特征词和评价词之间存在的依存关系以及观点信息的完整性结构,利用算法将〈评价特征,评价词〉对从评论语料中抽取出来。提出了基于依存语法的〈评价特征,评价词〉对抽取方法,利用A
[期刊] 图书情报工作
[作者]
陈德鑫 占袁圆 杨兵 谢亚霓
[目的/意义]在线医疗信息抽取是实现医疗信息检索、医疗信息推荐、个人医疗健康提醒及警示、疾病诊断、公众健康监控、药物不良反应挖掘等服务的基础环节,而医疗实体抽取则是在线医疗信息抽取的首要工作。本文拟解决传统医疗实体抽取严重依赖于人工特征提取且效率低的问题。[方法/过程]以网络文本为研究对象,首先对医疗实体类型和医疗实体抽取的目标进行描述。将在线医疗文本中的医疗实体抽取任务看作序列标注问题来解决,通过对CNN模型和BiLSTM模型基础理论的探讨,构建基于混合深度学习模型CNN-BiLSTM的医疗实体抽取框架。[结果/结论]通过三组对比实验,验证了本文所使用的CNN-BiLSTM模型在医疗实体抽取任务中的有效性。
[期刊] 统计与决策
[作者]
李贤锦 胡锡健 杨玉琴
为了解决AR(1)-MA(0)双重模型的参数估计问题,文章引入一种新的方法即基于MCMC和贝叶斯估计方法,对该模型的参数进行了估计,系统地推导出了模型中各参数的估计值;通过数值模拟,说明用该方法估计此类模型的参数是可行的,且与传统方法相比更易于实现。
[期刊] 情报理论与实践
[作者]
邓擘 郑彦宁 樊孝忠
在基于Bootstrap的信息抽取技术中,为提高实体关系抽取模式的质量,需要对抽取模式的可信度进行评估。本文提出了根据模式的历史匹配记录来对其进行可信度评估的简单方法,并以此为基础对模式进行了优化合并。经过可信度评估的模式在对句子进行实体关系标注时,有效提高了标注的准确率。这说明该方法能够提高抽取模式的质量,对信息抽取系统的性能提高有一定价值。
关键词:
信息抽取 关系模式 模式匹配 可信度
[期刊] 图书情报工作
[作者]
魏巍 郑杜
[目的/意义]社交媒体的出现为医疗健康数据的收集提供了新的途径,应用自然语言处理技术从社交媒体中抽取患者报告的ADR(AdverseDrugReaction,药物不良反应)信号对于改善药物不良反应监测的临床和科学知识具有很大的潜力。然而,从社会媒体中提取患者报告的ADR信号仍然面临重大挑战。为此,开发一个利用高级自然语言处理技术从健康主题社交媒体中抽取ADR信号的研究模型。[方法/过程]该模型首先采用基于多词典源匹配的方法,从嘈杂的社交媒体中识别医学实体;然后采用最短依存路径核函数为基础的统计学习方法提取
[期刊] 情报理论与实践
[作者]
王昊 苏新宁
本文重点阐述了中文通用本体概念实例的机器抽取过程,建立了基于模式匹配的通用本体概念识别模型,以此作为领域本体自动构建的基础。此后探讨了该模型在情报学各研究领域中的应用前景,并通过实验检验模型在实际应用中的识别效果。
[期刊] 消费经济
[作者]
任雪 秦瑶
论文基于时间序列和随机理论,提出了消费随机预测AR-GARCH模型仿真方法,估计出社会消费的预测值与置信区间。应用AR-GARCH模型模拟出全国社会消费品零售总额历月的走势并对其预测,研究表明,该模型预测精度高,反映出我国社会消费品零售总额虽呈现出逐年上升的走势,但增幅却有平稳下降的可能,并据此提出相关政策建议,为消费政策的调整和完善提供决策依据。
[期刊] 情报理论与实践
[作者]
高庆宁 吴鹏 张晶晶
[目的]网页所表达的主要信息通常隐藏在大量无关的结构和内容中,使用户不能迅速获取主题内容,限制了网页资源的可用性,使用信息抽取技术解决了这一问题。[方法]基于文档对象模型(DOM)的信息抽取技术能够简单准确地从网页中提取所需内容,但依靠网页本身结构;基于行块分布算法的技术摆脱网页结构的限制,克服限定数据源的缺点,但需要人工干预,文章结合DOM技术和行块分布算法以及正则表达式,实现网页信息采集与信息抽取。[结论]能够自动准确提取网页信息。[局限]对英文以及结构复杂的网页抽取效果不是很理想,抽取内容仅限于文字。
关键词:
文档对象模型 算法 网页 信息抽取
[期刊] 图书情报工作
[作者]
俞琰 鞠鹏 尚明杰
[目的/意义]针对目前专利关键词抽取算法评价中主要采用抽取的关键词与专家人工标注关键词进行匹配存在的问题,提出一种基于信息增益与相似度的专利关键词抽取算法评价模型。[方法/过程]提出的评价模型从内部和外部两个层面评估专利关键词抽取算法的准确性。其中,内部评价模型度量待评价算法抽取的每个关键词的信息增益,以评估被抽取的关键词的新颖性与创造性;外部评价模型使用待评价算法抽取的关键词集表示专利,计算相关专利的相似度,衡量算法抽取的关键词描述专利主题的有效性。[结果/结论]通过评价模型有效性验证实验与评价模型应用实证研究,结果表明提出的基于信息增益与相似度的评价模型具有可行性与有效性。
关键词:
专利 关键词抽取 评价 信息增益 相似度
[期刊] 情报学报
[作者]
吴俊 程垚 郝瀚 艾力亚尔·艾则孜 刘菲雪 苏亦坡
专业术语的识别与自动抽取对于提升专业信息检索精度,构建领域知识图谱发挥着重要基础性作用。为进一步提升中文专业术语识别的精确率和召回率,提出一种端到端的不依赖人工特征选择和领域知识,基于谷歌BERT预训练语言模型及中文预训练字嵌入向量,融合BiLSTM和CRF的中文专业术语抽取模型。以自建的1278条深度学习语料数据为实验对象,该模型对术语提取的F1值为92.96%,相对于传统的浅层机器学习模型(如左右熵与互信息算法、word2vec相似词算法等)和BiLSTM-CRF深度神经网络模型的性能有较为显著的提升。本文也给出了模型应用的具体流程,能够为中文专业术语库的构建提供实践指南。
[期刊] 图书情报工作
[作者]
关鹏 王曰芬 傅柱
[目的/意义]潜在狄利克雷分布(Latent DirichLet aLLocation,LDa)在科技情报分析中用来发现学科主题、挖掘研究热点以及预测研究趋势等。对常见的科学文献文本语料库(关键词、摘要、关键词+摘要)进行LDa主题抽取效果的评价,以揭示不同语料库的主题抽取效果,提高LDa在科技情报分析中的应用效果。[方法/过程]对上述3种语料库下的LDa主题模型进行对比研究,采用基于查全率、查准率、F值以及信息熵的定量分析和基于主题抽取的广度和主题粒度的定性分析相结合的方法对主题抽取效果进行评价。[结果/结论]通过国内风能领域的科学文献数据实证研究发现,无论是从定量分析还是从定性分析来看,摘...
[期刊] 情报科学
[作者]
邱明涛 马静 张磊 姚兆旭
【目的/意义】提出一种基于可扩展LDA模型的微博话题特征抽取方法。【方法/过程】利用词语权重调整方法筛选高贡献度高频词语;基于bootstrap思想,迭代产生特征词条候选集;引入信息熵值理论筛选话题词条;并利用四维泛化分类实现对特征词条的泛化和归类。【结果/结论】本文以真实新浪微博数据为实验对象,实验结果表明基于扩展LDA模型的特征词提取方法可弥补传统LDA模型在话题可解释性上的不足,有效地对微博文本进行话题特征抽取。
关键词:
LDA模型 微博话题 话题特征 特征抽取
[期刊] 情报学报
[作者]
赵洪 王芳
理论术语的抽取是大规模文献内容分析和跨学科知识转移深度揭示的基础。作为一种特定类型的命名实体,理论术语涉及的学科多、文献规模大、特征复杂,也缺乏大规模的成熟语料,因而抽取难度较大。为提高理论术语的抽取性能并降低训练集的人工标注代价,本文构建了面向理论术语抽取的深度学习模型,并研究了该模型中理论术语的特征构造和标注方法,同时也提出了一种自训练算法以实现模型的弱监督学习。通过实验对比,分别验证了本文模型和自训练算法的有效性,不仅为理论术语抽取提供了更加有效的通用方法,也为其他类型命名实体的识别研究提供了方法参考。
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除