- 年份
- 2024(3072)
- 2023(4302)
- 2022(3638)
- 2021(3418)
- 2020(2936)
- 2019(6499)
- 2018(6769)
- 2017(12209)
- 2016(6916)
- 2015(7850)
- 2014(7923)
- 2013(7504)
- 2012(6941)
- 2011(6266)
- 2010(6330)
- 2009(5712)
- 2008(5568)
- 2007(5185)
- 2006(4486)
- 2005(4013)
- 学科
- 济(24211)
- 经济(24173)
- 管理(17831)
- 业(14228)
- 企(11488)
- 企业(11488)
- 方法(11389)
- 数学(9771)
- 数学方法(9500)
- 学(8012)
- 中国(7509)
- 制(6817)
- 财(6767)
- 农(6370)
- 体(6044)
- 理论(5502)
- 银(4880)
- 银行(4860)
- 融(4746)
- 金融(4739)
- 行(4687)
- 地方(4668)
- 业经(4476)
- 教育(4289)
- 和(4059)
- 农业(3962)
- 策(3719)
- 体制(3612)
- 技术(3594)
- 务(3343)
- 机构
- 大学(94889)
- 学院(93773)
- 研究(35104)
- 济(33804)
- 管理(32984)
- 经济(32844)
- 理学(27665)
- 理学院(27294)
- 中国(26919)
- 管理学(26443)
- 管理学院(26264)
- 科学(23661)
- 京(21582)
- 农(19534)
- 所(18791)
- 研究所(17176)
- 财(16809)
- 业大(16170)
- 中心(16068)
- 农业(15508)
- 江(15406)
- 北京(13567)
- 院(13175)
- 技术(12819)
- 范(12689)
- 财经(12636)
- 师范(12484)
- 省(11987)
- 州(11831)
- 经(11440)
- 基金
- 项目(64246)
- 科学(49613)
- 基金(45696)
- 研究(45055)
- 家(41326)
- 国家(41021)
- 科学基金(34206)
- 社会(26720)
- 省(25406)
- 社会科(25304)
- 社会科学(25297)
- 基金项目(23073)
- 自然(23001)
- 自然科(22512)
- 自然科学(22504)
- 自然科学基金(22062)
- 划(21912)
- 教育(21228)
- 资助(19598)
- 编号(18445)
- 成果(15933)
- 重点(14762)
- 部(13770)
- 课题(13330)
- 发(13327)
- 创(12906)
- 计划(12883)
- 科研(12605)
- 创新(12174)
- 体(11705)
共检索到149777条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 清华大学学报(自然科学版)
[作者]
王庆人 王银子 仲红 张以文
作为信息抽取的核心任务,命名实体识别能够从文本中识别不同类型命名实体。得益于深度学习在字词表示、特征提取方面的应用,中文命名实体识别任务取得了丰富研究成果。然而,中文命名实体识别任务依旧面临词汇信息缺乏的挑战,主要表现为:1)词汇边界信息和上下文语义信息未充分利用;2)字和自匹配词汇间语义信息未能有效捕获;3)图注意力网络输出信息中不同交互图信息的重要性未被考虑。该文提出一种面向中文的字词组合序列实体识别方法。采用字词组合序列嵌入结构,实现词汇边界信息以及字符与词汇间语义信息的充分捕捉;采用多图注意力融合架构,实现不同图神经网络提取特征重要性的区分。实验表明,相比已有经典方法,该方法在Weibo、 Resume、 OntoNotes4.0及MSRA四个数据集上的F1明显提升,在中文命名实体识别任务上具有可行性。
[期刊] 统计与决策
[作者]
吕忠伟 秦建国
模型识别是建立时间序列模型的基础,是模型预测成败的关键。本文介绍了五种多变量时间序列模型识别的方法,分析了每种识别方法的输出形式,最后利用SAS统计软件对多变量时间序列模型的识别进行实证研究。
[期刊] 统计与决策
[作者]
周影辉 倪中新 谢琳
对于泊松序列中的变点问题,文章提出了一个快速有效的用于判断变点是否存在,以及当变点存在时确定未知变点位置的统计方法。进而,通过分析两个煤矿灾难的实际数据,阐释所提方法的准确性和有效性。
关键词:
泊松序列 变点 煤矿灾难
[期刊] 工业工程与管理
[作者]
张钠 殷哲 吕飞 马士华
考虑国内连锁零售业需求预测的现状,以一家典型经营快速消费品的连锁零售食品公司为研究对象,通过分析其现有的门店销售预测和总仓预测模式,借助订货公式找出需求时界,确定预测时段,采用动态优化加权移动平均,自适应指数平滑,综合预测等方法提高预测的准确性,同时检验现有经验模式的可行性。研究结果表明7天移动平均的方法非常适合长期预测,综合预测的方法可以提高预测准确性,但其实施的复杂程度增加。同一种预测方法在不同订货周期预测过程中,误差区别较大,门店销售受诸多因素影响,需求波动较大,不同订货周期的门店应采用不同的预测方法。
关键词:
连锁零售 预测 周期
[期刊] 工业技术经济
[作者]
向小东
考虑到已有混沌识别方法需要大量无噪声数据的要求 ,提出了利用径向基函数网络的模式识别思想来去除短时含噪数据中的噪声并扩展数据的方法 ,然后根据最大Lyapunov指数的定义计算最大Lyapunov指数值。实例结果表明了本文方法的有效性。
[期刊] 图书情报工作
[作者]
王若佳 赵常煜 王继民
[目的/意义]健康医疗大数据是我国重要的基础性战略资源,本研究对中文电子病历分词与实体识别的探讨与实证较好地完成了医疗数据的信息抽取任务,对今后医疗大数据在语义层面的应用发展具有重要意义。[方法/过程]本研究首先融合权威词表、官方标准、健康网站数据及其他医学补充词库构建了词语数量级达到10万的医学词表;然后对电子病历的字段进行分词,对比了jieba工具、导入词典后的jieba、无监督学习及AC自动机4种模型的分词效果;最后,以自动分词和人工标注结果为语料,实现基于条件随机场的电子病历实体识别研究,并比较不同实体类别以及不同文本特征下的实体识别效果,选出最优模板。[结果/结论]分词结果显示,AC自动机的效果最好,F值可达82%;实体识别结果表明,"检查"和"疾病"实体的识别效果最好,而"症状"的识别效果不太理想。
[期刊] 数量经济技术经济研究
[作者]
杜宽旗 蒙肖莲
由于时间序列数据挖掘方法具有刻画和预测所观察事件特征的突出特点,将它运用于股票价格时间序列分析,不仅可以揭示隐藏于股票价格时间序列中的瞬时模式,而且还可以有效预测诸如股票价格急剧变化等高频金融时间序列事件。本文基于时间序列数据挖掘理论与方法的探讨,将其运用于具体的股票价格生成的高频时间序列分析。结果表明,具有统计显著性的、可以刻画和预测事件的隐藏瞬时模式是能够被识别的。
[期刊] 工业工程与管理
[作者]
伊辉勇 李开国 刘伟
产品在线大规模定制模式已经成为可能和未来发展的趋势。从顾客产品需求分类入手,探讨了各类配置元的识别方法和模型。给出产品配置元类型结构的几何解释,并综合考虑产品类型和企业在线大规模定制综合能力的影响,提出了在线定制服务提供商的产品配置元结构优化策略。最后以一款摩托车产品为例,详细探讨了产品各类配置元的识别过程,证明了所述方法的可行性和有效性。
[期刊] 科技管理研究
[作者]
黄晓林 严安平 李维思 魏巍
识别未来产业创新链中的关键核心技术,有助于超前布局一批产业技术攻关项目,形成未来产业发展先发优势,进而构建以未来产业为引领的现代化产业体系。氢能产业正处于产业爆发的前夕,但目前已有相关技术分析存在数据完整性不够和相对陈旧等问题,缺乏定量的技术评估和明确的关键核心技术识别结果。因此,从面向未来产业的创新决策需求出发,聚焦关键核心技术对未来氢能产业的支撑性和引领性,基于相关的全球专利数据,利用新的专利交叉影响分析方法(NPCIA)计算技术影响力,构建结合技术影响力和新颖性的产业关键核心技术识别方法。以2015年碳中和政策正式提出以来的全球氢能产业专利数据为样本,识别出构建氢能产业未来优势需重点关注的关键技术,主要包括以电解水为代表的绿氢制取技术,以固态储氢介质和碳纤维复合材料为代表的储氢材料技术,以交通和储能等为重点场景的氢能加注技术,以燃料电池为核心的氢能应用技术,以及影响全产业链发展的氢安全和智能化配套技术等。该方法立足未来产业构建的情境需求,实现技术影响力和新颖性并重的关键核心技术识别,以期为未来产业发展重点方向凝练、关键核心技术攻关项目布局决策提供方法支撑。
[期刊] 数据分析与知识发现
[作者]
倪维健 孙浩浩 刘彤 曾庆田
【目的】对现有中文分词方法在领域文献上的分词结果进行调整,以提升领域文献上的分词效果。【方法】对传统中文分词方法处理领域文献的不足进行分析,以此为基础设计一个反映领域文献构词特点的分词指标——词频偏差,并基于该指标提出一个无监督的分词结果优化方法。【结果】基于农业领域语料开展实验,结果表明该方法对比ICTCLAS、THULAC和LTP的分词结果 F1值提升2%-3%,并具有实现简单、参数鲁棒性强的特点。【局限】提升召回率方面效果不佳。【结论】基于词频偏差的分词结果优化算法能够有效提升已有分词结果的准确性,
关键词:
领域文献 中文分词 分词优化 词频偏差
[期刊] 商业研究
[作者]
李守伟 钱省三
在金融时间序列相关性的基础上,重要的是应该研究金融市场中的规则网络,即从相关系数矩阵中抽取的MST和等级树,再研究金融市场中的复杂网络,即具有无标度特性的复杂相关性网络。这样,用实际金融数据对规则网络和复杂网络,就可以得出一些实证结果。
关键词:
金融市场 相关系数 最小生成树 复杂网络
[期刊] 情报理论与实践
[作者]
阮光册 夏磊
[目的/意义]在文本主题求解时,LDA模型更倾向于高频率的词项,造成主题的语义特征和内容区分度不高。[方法/过程]从文本的词权重入手,综合考虑词项在文本集合中的全局统计特征和局部语义特征,衡量词语在文本中的重要性,并将词语的特征值作为LDA主题模型的输入,改变LDA模型生成词的概率。[结果/结论]实验表明,结合词权重的LDA模型,具有更好的模型拟合度,同时能够较好的识别语料库中主要话题,提高了主题词分布的广度和主题的语义区分度。通过新闻文本数据验证了该方法的可行性与有效性。[局限]对词语的局部语义特征描述需要大数据量的计算。
[期刊] 中国图书馆学报
[作者]
高劲松 周习曼 梁艳琪
随着关联数据应用的不断深入,已有众多的数据集发布在网上,但目前已发布的关联数据集之间关联很少,为数据的共享使用带来不便。本研究提出一种基于统计学习方法进行关联数据集间实体识别及链接构建的方法。首先进行数据集间的实体匹配,采用基于K中心点聚类算法实现属性的聚合及关系发现,对具有高相关度的属性进行匹配关系描述,降低实体匹配时的属性匹配计算次数;其次对已匹配的属性进行实体属性值的相似度比较计算,实现实体间相似度的比较,在SILK框架下实现实体的链接构建工作,以达到实体链接发现的目的;最后通过实验验证,这一方法能降低数据集间实体匹配计算次数,提高实体链接的正确率,具有可行性及实用性。
关键词:
关联数据 实体链接 数据链接 链接发现
[期刊] 图书馆论坛
[作者]
杨跃翔 刘文玲 林睿婷 陈雨杰 王皖
突发事件影响广泛,涉及因素较多,当前突发事件要素识别研究存在灾害要素信息、应对流程信息、承灾载体信息等数据自动识别困难等问题。文章构建突发事件应急要素“四维”模型,确定包含保障措施、响应措施等流程性信息在内的八类应急要素类别,提出TDA-RoBERTa-wwm-BiLSTM-CRF模型。该模型采用基于模板的数据增强策略,融合预训练模型与双向长短期记忆网络-条件随机场方法,实现了突发事件多要素信息的自动识别。对比与消融实验结果表明,该模型在突发事件应急要素自动识别中能起到良好效果。
关键词:
突发事件 应急要素 数据增强 深度学习
[期刊] 国家图书馆学刊
[作者]
王东波 高瑞卿 沈思 李斌
结合数字人文的数据获取、标注和分析方法,识别和挖掘先秦典籍中历史事件基本实体构件具有重要的推广和使用价值。本文将先秦时期极具代表性的《公羊传》《谷梁传》《左氏春秋》《吕氏春秋》《晏子春秋》等作为处理语料,对其中的人名、地名、时间实体等进行内部数量统计和外部特征分析,构建特征模板。在已有的465,197个词汇的基础上进行实体抽取训练与测试,选出人名、地名、时间实体识别效果的调和平均数最大(87.37%)的模型,并将其应用于《国语》语料以便检验识别效果,同时将以上过程进行可视化展现。
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除