- 年份
- 2024(9616)
- 2023(13952)
- 2022(12046)
- 2021(11172)
- 2020(9396)
- 2019(21564)
- 2018(21425)
- 2017(40883)
- 2016(22170)
- 2015(25218)
- 2014(25111)
- 2013(24470)
- 2012(22346)
- 2011(19944)
- 2010(20178)
- 2009(18634)
- 2008(17162)
- 2007(15001)
- 2006(13151)
- 2005(11496)
- 学科
- 济(81804)
- 经济(81704)
- 管理(61508)
- 业(58278)
- 企(49490)
- 企业(49490)
- 方法(37892)
- 数学(32685)
- 数学方法(32162)
- 中国(27510)
- 融(27229)
- 金融(27221)
- 银(25563)
- 银行(25514)
- 行(24626)
- 财(22997)
- 农(21702)
- 学(21097)
- 制(19296)
- 地方(19141)
- 业经(19016)
- 理论(16216)
- 务(15483)
- 财务(15406)
- 财务管理(15378)
- 企业财务(14670)
- 农业(14637)
- 贸(13734)
- 贸易(13721)
- 和(13475)
- 机构
- 大学(305765)
- 学院(304505)
- 管理(119139)
- 济(114059)
- 经济(111209)
- 理学(102931)
- 研究(102816)
- 理学院(101758)
- 管理学(99682)
- 管理学院(99164)
- 中国(82172)
- 科学(66593)
- 京(65779)
- 财(54154)
- 所(52117)
- 农(51736)
- 中心(48647)
- 研究所(47888)
- 业大(47568)
- 江(44437)
- 财经(43377)
- 北京(41628)
- 农业(40705)
- 范(40529)
- 师范(40060)
- 经(39375)
- 院(38045)
- 州(36773)
- 技术(33958)
- 经济学(33578)
- 基金
- 项目(213862)
- 科学(166825)
- 研究(154339)
- 基金(153721)
- 家(135116)
- 国家(133988)
- 科学基金(114337)
- 社会(94076)
- 社会科(89094)
- 社会科学(89070)
- 省(84522)
- 基金项目(81817)
- 自然(76365)
- 自然科(74579)
- 自然科学(74563)
- 自然科学基金(73149)
- 划(71482)
- 教育(70709)
- 资助(63953)
- 编号(63447)
- 成果(51505)
- 重点(48312)
- 部(45961)
- 发(45247)
- 创(44257)
- 课题(44187)
- 科研(41535)
- 创新(41306)
- 计划(39626)
- 大学(39436)
- 期刊
- 济(121468)
- 经济(121468)
- 研究(88731)
- 中国(59662)
- 学报(52117)
- 科学(46548)
- 农(46044)
- 管理(42931)
- 财(40259)
- 大学(38739)
- 融(37729)
- 金融(37729)
- 学学(36528)
- 教育(35669)
- 农业(31382)
- 技术(26432)
- 财经(20115)
- 业经(19802)
- 经济研究(19110)
- 经(16985)
- 图书(16752)
- 业(15751)
- 理论(15720)
- 问题(15223)
- 科技(15113)
- 实践(14622)
- 践(14622)
- 版(14389)
- 技术经济(13778)
- 统计(13550)
共检索到447910条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 情报学报
[作者]
林泽斐 欧石燕
命名实体链接是利用知识库进行命名实体消歧,将文本中的实体指称映射至知识库中正确义项的一种方法。现有的命名实体链接研究与实践多利用维基百科实现西文实体的消歧,缺乏对中文命名实体消歧的研究。本文以百度百科作为基础知识库,提出了一种中文命名实体链接方法,该方法融合了单实体消歧和多实体消歧特征,并根据不同文本长度选用不同的特征组合,同时,在传统一阶段式消歧的基础上添加了第二阶段消歧以改善消歧结果。在真实中文语料上的实验表明,多特征叠加和两段式消歧可较大程度地提升消歧准确率。对比实验显示,本文提出的命名实体链接方法的总体性能优于当前主流同类系统的水平。
[期刊] 情报理论与实践
[作者]
张军亮 方雪梅 雒曼 孙晶晶
中文电子病历中存在大量非结构化的文本信息,其中的医学命名实体识别是生物医学领域知识组织和服务的基础。文章首先分析了中文电子病历特征的词语、词性、语素和词的组成等语法特征,以及HowNet语义特征;然后,运用CRF模型,提出了基于CRF医学命名实体的识别方案;最后,实验表明融合HowNet的中文电子病历命名实体识别方法具有较好的效果。
[期刊] 图书情报知识
[作者]
陆伟 鞠源 张晓娟 吴丹
随着互联网经济的飞速发展,信息抽取领域的产品命名实体识别在商务智能领域有着广泛的应用。本文采用条件随机场(CRF)模型,选取词汇、词法和词形上一系列的特征进行训练,通过交叉验证对识别效果进行评价,并通过识别效果指导特征的选取。实验中比较了两种标注方式(BRAND/TYPE和PROD),并取得了令人满意的识别效果。在与最大熵模型对比中,验证了CRF模型对于产品实体识别的优越性。
[期刊] 图书情报工作
[作者]
甘小红 张兆年
提出一种具有特征级别的领域特征集合的情感资源挖掘方法,将基于HowNet词典的分类法构建的情感特征与基于机器学习的特征分类方法中的无内容特征以及领域特征相融合,并将该集合放入支持向量机中进行情感分类实验,实验结果表明,使用抽取模式以及多特征融合的分类方法,可增强中文情感分类效果,验证两种分类方法综合研究的正确性与有效性,弥补目前特征级别的中文情感分类研究的不足。
关键词:
情感分类 情感特征 无内容特征 领域特征
[期刊] 情报理论与实践
[作者]
韩普 陈文祺 顾亮 叶东宇 景慎旗
[目的/意义]医学实体识别是医疗健康知识挖掘和知识组织的关键环节。深入挖掘多模态数据间语义关联可以提升医学实体识别效果,进而为领域知识补全和知识推理提供支撑。[方法/过程]提出一种基于双线性注意力融合机制的多模态中文医学实体识别模型BAF-MNER。首先通过视觉和文本编码器进行多模态医学数据的语义特征学习;接着利用双线性注意力网络实现图像和文本跨模态语义交互,并引入门控机制过滤视觉噪声;然后融合基于注意力机制的视觉特征和文本特征进而构建多模态特征表示,同时增加批量归一化层优化深度神经网络;最后将多模态特征向量输入CRF层解码获取预测标签。[结果/结论]本模型能够有效提升中文医学实体识别效果,在多模态医学数据集上的F1值较单模态基线模型提升4.07%,较多模态基线模型提升1.65%;在多模态公开数据集上的实验表明模型具有良好的泛化能力。
[期刊] 情报理论与实践
[作者]
张建娥
文章通过分析传统关键词提取方法的特点和存在的问题,提出基于多特征融合的中文文本关键词提取方法。该方法通过融合中文文本词语的频率、关联度、词性以及位置多种特征,有效避免了传统关键词提取方法产生的偏差。实验结果表明,该方法在不同测试集上与传统方法相比关键词提取的平均召回率均得到明显提升。
关键词:
中文文档 特征融合 关键词
[期刊] 华中师范大学学报(自然科学版)
[作者]
朱颢东 杨立志 丁温雪 冯嘉美
近年来,网络媒体微博的迅速发展,为命名实体的识别研究提供了一种全新的载体.针对中文微博文本短、表达不清、网络化严重等特点,论文提出了一种规则与统计相结合的中文微博命名实体识别方法.该方法首先利用中文微博的主题标签对处理后的数据进行筛选,然后再选取合适的特征模板,并利用条件随机场模型(Conditional random fields,CRF)进行实体识别.为了满足实验要求,该文将传统网页爬虫方法与API接口采集方法相结合进行微博数据采集.实验结果表明,该方法能够有效提高中文微博命名实体的识别效果.
关键词:
命名实体 中文微博 主题标签 条件随机场
[期刊] 情报学报
[作者]
范涛 王昊 陈玥彤
地方志作为中华文化的组成部分,是建设文化强国的重要一环,对其进行挖掘研究具有重要意义;同时,有效识别实体对地方志知识组织和知识图谱构建有着重要影响。当前地方志命名实体识别研究主要基于文本,缺乏文本对应的图片,而图片中的内容能够为识别文本中的实体提供额外的信息,从而提升模型识别实体的性能,并且实体识别还面临着已标注语料匮乏的问题。基于此,本文提出了利用深度迁移学习方法,结合地方志中的文本和图片进行多模态命名实体识别。首先,基于人民日报语料库和中文推特多模态数据集,分别预训练结合了自注意力机制的BiLSTM-attention-CRF模型和自适应联合注意力模型,利用基于神经网络的深度迁移学习方法将权重迁移至地方志多模态命名识别模型中,使模型获得提取文本和图片语义特征的能力;然后,结合过滤门对多模态融合特征去噪;最后,将融合后的多模态特征输入CRF (conditional random fields)层进行解码。本文将提出的模型在地方志多模态数据中进行了实证研究,并同相关基线模型作对比,实验结果表明,本文所提出的模型具有一定优势。
关键词:
深度迁移学习 多模态命名实体识别 地方志
[期刊] 图书馆理论与实践
[作者]
袁慧 马建霞
各学科领域内相关命名实体情报挖掘是文本处理的重要方法之一。精确的相关命名实体情报挖掘是后续实体关系、事实抽取或文本分类等工作的基础。本文梳理和总结了命名实体的定义及特征,对基于不同方法的命名实体情报挖掘方法和系统研究现状进行了剖析,指出了命名实体情报挖掘在自然语言处理、图书馆知识管理及其他领域的应用,最后从构建命名实体资源库、研究不依赖资源库的算法和知识获取的自动化研究等方面提出了建议。
[期刊] 清华大学学报(自然科学版)
[作者]
尹学振 赵慧 赵俊保 姚婉薇 黄泽林
互联网公开数据蕴含着大量高价值的军事情报,成为获取开源军事情报的重要数据源之一。军事领域命名实体识别是进行军事领域信息提取、问答系统、知识图谱等工作的基础性关键任务。相比较于其他领域的命名实体,军事领域命名实体边界模糊,界定困难;互联网媒体中军事术语表达不规范,随意性的简化表达现象较普遍;现阶段面向军事领域的公开语料鲜见。该文提出一种考虑实体模糊边界的标注策略,结合领域专家知识,构建了基于微博数据的军事语料集MilitaryCorpus;提出一种多神经网络协作的军事领域命名实体识别模型,该模型通过基于Transformer的双向编码器(bidirectional encoder representations from transformers, BERT)的字向量表达层获得字级别的特征,通过双向长短时记忆神经网络(bi-directional long short-term memory, BiLSTM)层抽取上下文特征形成特征矩阵,最后由条件随机场层(conditional random field, CRF)生成最优标签序列。实验结果表明:相较于基于CRF的实体识别模型,应用该文提出的BERT-BiLSTM-CRF模型召回率提高28.48%,F值提高18.65%;相较于基于BiLSTM-CRF的实体识别模型,该文模型召回率提高13.91%,F值提高8.69%;相较于基于CNN (convolutional neural networks)-BiLSTM-CRF的实体识别模型,该文模型召回率提高7.08%,F值提高5.15%。
[期刊] 数据分析与知识发现
[作者]
张琴 郭红梅 张智雄
【目的】为解决已有方法中单词特征表示不具有语义信息这一问题,对词嵌入表示特征在关系抽取中的作用进行探讨。【方法】考虑词嵌入表示级别、词汇级别和语法级别三种类型特征,利用朴素贝叶斯模型、决策树模型和随机森林模型进行对比实验,并选出代表全部特征的有效特征子集。【结果】使用全部特征时,决策树算法的准确率达到0.48,关系抽取效果最佳,Member-Collection(E_2,E_1)类型关系的F_1值达到0.70,特征排序结果表明依存关系有助于关系抽取。【局限】对小样本量和情况复杂的关系类型识别效果有待提高,
关键词:
关系抽取 词嵌入表示 Word2Vec
[期刊] 图书情报工作
[作者]
孙安 于英香 罗永刚 王祺
[目的 /意义]针对中文语言表达特点,提出一种含分词标签的字粒度词语特征提取方法,有效提升了中文临床病历命名实体识别任务的F_1值,同时该方法可以为其他中文序列标注模型所借鉴。[方法 /过程]选取汉语词语的词性标注、关键词权值、依存句法分析三个特征,构筑字粒度序列标注模型的临床病历训练文本,语料来源CCKS2017:Task2。在不同特征组合方式下,采用条件随机场算法验证两种字粒度词语特征提取方案Method1与Method2。[结果 /结论]在四种不同词语特征组合下,Method2相对于Method1在临床病历命名实体识别任务中性能均有所提升,四折交叉测试中F_1值平均提升了0. 23%。实验表明在中文分词技术日趋成熟的环境下,Method2相对Method1能够获得更好的词语特征表示,对中文字粒度序列标注模型的处理性能具有提升作用。
[期刊] 实验技术与管理
[作者]
蔡伊娜 包先雨 林燕奎 彭锦学 彭智彬 林泳奇 李俊霖 郭云
针对现有命名实体识别存在数据处理效率低的问题,该文提出了一种并行化Block-BAC模型。提出了前处理中的数据分块优化算法,并基于Hadoop实现并行化的运作机制;采用局部注意力优化机制,有效减少模型的隐层节点。与已有的BERT-BAC模型相比,在确保较高F_1值(精确率和召回率的调和平均数)的情况下,该模型训练时间和实体识别时间分别缩短60.36%、39.43%,具有更广泛的实用性。
[期刊] 情报学报
[作者]
刘晓娟 刘群 余梦霞
命名实体识别是自然语言处理的基础性任务,其结果具有广泛的应用。关联数据由于具有丰富的语义知识,能够对现有命名实体识别进一步完善。本文实现了一个基于关联数据的可配置的中英文命名实体识别系统,在识别过程中对实体进行消歧并对识别结果进行扩展,为命名实体识别的进一步完善提供了新的思路。具体包括:基于DBpedia构造了跨领域的中英文命名实体词典;设计了一个基于Hive的分布式管理数据存储模型,基于该模型实现了对DBpedia数据集的组织、存储以及扩展;设计了一个基于图的命名实体识别算法,该算法能够充分利用关联数据的语义关系对命名实体进行消歧,并且基于DBpedia Spotlight NER Corpus对算法进行测试,并将算法结果与DBpedia Spotlight、NERSO以及Zwmanta三个系统进行对比评价,结果表明本文实现的算法在查全率、查准率、F值上具有更好的表现。
关键词:
命名实体识别 命名实体消歧 关联数据
[期刊] 图书馆
[作者]
张孝飞
文章通过分析传统关键词提取方法的特点及不足,提出了融合多元特征的中文网页关键词提取方法。该方法既综合了中文网页文档词语的词频、词性、词长以及词位置等特征,又考虑了文档中出现的同义词、组合词现象的关键词评分,有效提高了传统关键词提取算法的精度。实验结果表明该算法优于传统方法,在网络情报监测中具有较大应用价值。
关键词:
提取 多元特征 同义词 组合词
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除