标题
  • 标题
  • 作者
  • 关键词
登 录
当前IP:忘记密码?
年份
2024(10663)
2023(15675)
2022(13825)
2021(13171)
2020(11249)
2019(25931)
2018(26254)
2017(49600)
2016(27494)
2015(31363)
2014(31625)
2013(30696)
2012(28306)
2011(25382)
2010(25694)
2009(23538)
2008(23135)
2007(20279)
2006(17837)
2005(15629)
作者
(80555)
(66931)
(66552)
(63610)
(42741)
(32327)
(30264)
(26345)
(25537)
(24109)
(23018)
(22574)
(21471)
(21329)
(20726)
(20477)
(20086)
(19824)
(19195)
(18997)
(16748)
(16691)
(16541)
(15449)
(15102)
(14965)
(14890)
(14759)
(13681)
(13305)
学科
(101553)
经济(101401)
管理(76018)
(69016)
(58199)
企业(58199)
方法(47269)
数学(40698)
数学方法(39893)
(27967)
中国(27120)
(26673)
(25657)
业经(22211)
(21810)
地方(21248)
理论(20192)
农业(17983)
(17723)
贸易(17708)
(17151)
(16938)
(16047)
银行(15990)
(15675)
技术(15641)
(15596)
财务(15504)
财务管理(15468)
环境(15281)
机构
大学(382869)
学院(381180)
管理(145324)
(138543)
经济(135042)
研究(129151)
理学(125339)
理学院(123795)
管理学(120906)
管理学院(120228)
中国(97129)
科学(85628)
(83431)
(67580)
(66979)
(66157)
研究所(61057)
业大(61000)
中心(59370)
(57757)
农业(53228)
(52843)
北京(52791)
师范(52253)
财经(51937)
(47455)
(46949)
(46787)
技术(44279)
师范大学(42045)
基金
项目(261572)
科学(203090)
研究(187144)
基金(186563)
(164619)
国家(163245)
科学基金(138490)
社会(112674)
社会科(106302)
社会科学(106270)
(103740)
基金项目(98888)
自然(93551)
自然科(91351)
自然科学(91329)
自然科学基金(89620)
(88054)
教育(87634)
资助(77974)
编号(77556)
成果(63948)
重点(59134)
(56111)
(54669)
课题(54658)
(53661)
科研(50552)
创新(50013)
计划(49024)
大学(48276)
期刊
(154987)
经济(154987)
研究(109184)
中国(79995)
学报(67752)
(61287)
科学(60230)
管理(53926)
(50687)
大学(50347)
教育(49977)
学学(47161)
农业(41877)
技术(34996)
(30698)
金融(30698)
业经(25420)
财经(24471)
经济研究(23584)
(22148)
图书(21942)
(20800)
问题(19989)
(19808)
科技(19039)
业大(17830)
资源(17790)
理论(17722)
技术经济(17481)
统计(17441)
共检索到565876条记录
发布时间倒序
  • 发布时间倒序
  • 相关度优先
文献计量分析
  • 结果分析(前20)
  • 结果分析(前50)
  • 结果分析(前100)
  • 结果分析(前200)
  • 结果分析(前500)
[期刊] 图书情报工作  [作者] 孙安  于英香  罗永刚  王祺  
[目的 /意义]针对中文语言表达特点,提出一种含分词标签的字粒度词语特征提取方法,有效提升了中文临床病历命名实体识别任务的F_1值,同时该方法可以为其他中文序列标注模型所借鉴。[方法 /过程]选取汉语词语的词性标注、关键词权值、依存句法分析三个特征,构筑字粒度序列标注模型的临床病历训练文本,语料来源CCKS2017:Task2。在不同特征组合方式下,采用条件随机场算法验证两种字粒度词语特征提取方案Method1与Method2。[结果 /结论]在四种不同词语特征组合下,Method2相对于Method1在临床病历命名实体识别任务中性能均有所提升,四折交叉测试中F_1值平均提升了0. 23%。实验表明在中文分词技术日趋成熟的环境下,Method2相对Method1能够获得更好的词语特征表示,对中文字粒度序列标注模型的处理性能具有提升作用。
[期刊] 图书情报知识  [作者] 陆伟  鞠源  张晓娟  吴丹  
随着互联网经济的飞速发展,信息抽取领域的产品命名实体识别在商务智能领域有着广泛的应用。本文采用条件随机场(CRF)模型,选取词汇、词法和词形上一系列的特征进行训练,通过交叉验证对识别效果进行评价,并通过识别效果指导特征的选取。实验中比较了两种标注方式(BRAND/TYPE和PROD),并取得了令人满意的识别效果。在与最大熵模型对比中,验证了CRF模型对于产品实体识别的优越性。
[期刊] 图书馆论坛  [作者] 王娟  王志红  曹树金  
命名实体分类和识别是自然语言处理中的关键任务,识别效果将会影响许多下游任务的性能。本文基于现有知识图谱,提出了图情领域9大类实体,并构建了适用于图情领域实体识别的LISERNIE模型。通过开展广泛的实验,结果表明,在预训练阶段注入了图情领域知识的LISERNIE模型能有效识别出命名实体,并且在小规模标注数据集上具有明显的性能优势,在应用到后续的开放域关系抽取实验中,其准确率远高于CORE系统,为进一步构建如知识图谱、问答系统、机器阅读等提供数据支撑。
[期刊] 情报理论与实践  [作者] 杨鑫禹  牟冬梅  彭浩  王颖  王萍  李桦  
[目的/意义]探索电子病历数据的情报价值,拓展情报学研究数据源和问题域,实现电子病历数据创新使能,为嵌入临床诊疗与临床研究的情报工作和情报服务提供支持。[方法/过程]分析电子病历数据特征及其对数据驱动的影响;针对特征讨论电子病历数据处理技术;基于新技术环境下的信息链理论,构建电子病历数据驱动临床决策模型。实证部分采用随机森林等方法构建电子病历数据驱动的肺癌转移预测模型,实现与验证理论模型。[结果/结论]电子病历数据具有时间依赖、高维稀疏等特征,理论层面基于数据特征构建了电子病历数据驱动临床决策模型,实证层面使用真实电子病历数据构建肺癌转移预测模型,预测模型性能较好。
[期刊] 情报理论与实践  [作者] 杨鑫禹  牟冬梅  彭浩  王颖  王萍  李桦  
[目的/意义]探索电子病历数据的情报价值,拓展情报学研究数据源和问题域,实现电子病历数据创新使能,为嵌入临床诊疗与临床研究的情报工作和情报服务提供支持。[方法/过程]分析电子病历数据特征及其对数据驱动的影响;针对特征讨论电子病历数据处理技术;基于新技术环境下的信息链理论,构建电子病历数据驱动临床决策模型。实证部分采用随机森林等方法构建电子病历数据驱动的肺癌转移预测模型,实现与验证理论模型。[结果/结论]电子病历数据具有时间依赖、高维稀疏等特征,理论层面基于数据特征构建了电子病历数据驱动临床决策模型,实证层面使用真实电子病历数据构建肺癌转移预测模型,预测模型性能较好。
[期刊] 实验技术与管理  [作者] 蔡伊娜  包先雨  林燕奎  彭锦学  彭智彬  林泳奇  李俊霖  郭云  
针对现有命名实体识别存在数据处理效率低的问题,该文提出了一种并行化Block-BAC模型。提出了前处理中的数据分块优化算法,并基于Hadoop实现并行化的运作机制;采用局部注意力优化机制,有效减少模型的隐层节点。与已有的BERT-BAC模型相比,在确保较高F_1值(精确率和召回率的调和平均数)的情况下,该模型训练时间和实体识别时间分别缩短60.36%、39.43%,具有更广泛的实用性。
[期刊] 情报理论与实践  [作者] 张军亮  方雪梅  雒曼  孙晶晶  
中文电子病历中存在大量非结构化的文本信息,其中的医学命名实体识别是生物医学领域知识组织和服务的基础。文章首先分析了中文电子病历特征的词语、词性、语素和词的组成等语法特征,以及HowNet语义特征;然后,运用CRF模型,提出了基于CRF医学命名实体的识别方案;最后,实验表明融合HowNet的中文电子病历命名实体识别方法具有较好的效果。
[期刊] 图书馆论坛  [作者] 林立涛  王东波  刘江峰  李斌  冯敏萱  
通用命名实体识别难以满足不同领域研究的需要,特定领域命名实体识别研究对于提升文本挖掘精度具有重要意义。基于Siku BERT预训练模型构建用于典籍动物命名实体识别模型,为典籍动物知识挖掘提供有效方法。利用25部经人工标注动物命名实体的先秦典籍语料,对Siku BERT等由BERT预训练模型发展而来的系列模型以及CRF、Bi-LSTM-CRF进行训练,构建多种用于识别典籍中动物命名实体的模型,并对这些模型进行识别性能测试,比较验证Siku BERT预训练模型的识别性能。结果表明,基于Siku BERT经训练所构建的动物命名实体识别模型效果最优,10折交叉测试的平均调和平均值(F1)为85.46%,最高一次达86.29%,应用于《史记》动物命名实体识别准确率达91.6%。
[期刊] 图书馆论坛  [作者] 谢靖  刘江峰  王东波  
古代中国医学文献是中华古籍的重要组成部分,含有丰富的中医学知识,是中医理论研究的重要载体和思想源泉。标注古代中医文献的命名实体,能进一步挖掘其蕴藏的中医学知识,推进中医现代化发展。文章基于BERT-base、RoBERTa、SikuBERT、SikuRoBERTa预训练模型,以《黄帝内经·素问》为研究对象、Flat-lattice Transformer结构为微调模型,构建中医文献中病证、病理、经络、穴位、五行等命名实体识别任务。实验结果表明:直接使用古文繁体BERT模型对古代中医文献进行领域命名实体识别,则基于繁体《四库全书》的SikuBERT、SikuRoBERTa预训练模型效果要优于BERT-base、RoBERTa模型;在引入Flat-lattice Transformer(FLAT)结构作为微调模型后,SikuBERT在有标点情况下表现最优,识别效果可以提升4%左右,SikuRoBERTa在无标点情况下表现最优,识别效果可以提高2%~3%。实验验证了FLAT作为微调模型对BERT模型在中医专业领域中古文献命名实体识别工作上的有效性。该微调模型可以有效避免分词错误引起的实体识别传播错误,进而提高中医命名实体的识别效率。
[期刊] 情报学报  [作者] 林泽斐  欧石燕  
命名实体链接是利用知识库进行命名实体消歧,将文本中的实体指称映射至知识库中正确义项的一种方法。现有的命名实体链接研究与实践多利用维基百科实现西文实体的消歧,缺乏对中文命名实体消歧的研究。本文以百度百科作为基础知识库,提出了一种中文命名实体链接方法,该方法融合了单实体消歧和多实体消歧特征,并根据不同文本长度选用不同的特征组合,同时,在传统一阶段式消歧的基础上添加了第二阶段消歧以改善消歧结果。在真实中文语料上的实验表明,多特征叠加和两段式消歧可较大程度地提升消歧准确率。对比实验显示,本文提出的命名实体链接方法的总体性能优于当前主流同类系统的水平。
[期刊] 图书馆杂志  [作者] 范午攸  
科研文献正文中包含未被文摘、题录记载的仪器信息,从正文中有效提取此类信息可作为仪器绩效评估等定量研究的依据。文章以化学领域论文与大型分析仪器为对象,实现了通过语义相似度及构词规律从文献中发现未知仪器名、针对PDF排版的仪器名模糊检索,以及基于文献类型、正文结束标识、使用标识词、全称简称对应关系的实际使用仪器与未使用仪器和同名实体的区分,并与人工标注结果比对验证了准确性。
[期刊] 情报学报  [作者] 范涛  王昊  陈玥彤  
地方志作为中华文化的组成部分,是建设文化强国的重要一环,对其进行挖掘研究具有重要意义;同时,有效识别实体对地方志知识组织和知识图谱构建有着重要影响。当前地方志命名实体识别研究主要基于文本,缺乏文本对应的图片,而图片中的内容能够为识别文本中的实体提供额外的信息,从而提升模型识别实体的性能,并且实体识别还面临着已标注语料匮乏的问题。基于此,本文提出了利用深度迁移学习方法,结合地方志中的文本和图片进行多模态命名实体识别。首先,基于人民日报语料库和中文推特多模态数据集,分别预训练结合了自注意力机制的BiLSTM-attention-CRF模型和自适应联合注意力模型,利用基于神经网络的深度迁移学习方法将权重迁移至地方志多模态命名识别模型中,使模型获得提取文本和图片语义特征的能力;然后,结合过滤门对多模态融合特征去噪;最后,将融合后的多模态特征输入CRF (conditional random fields)层进行解码。本文将提出的模型在地方志多模态数据中进行了实证研究,并同相关基线模型作对比,实验结果表明,本文所提出的模型具有一定优势。
[期刊] 情报科学  [作者] 周源  刘怀兰  杜朋朋  廖岭  
【目的/意义】特征提取会很大程度地影响分类效果,而传统TF-IDF特征提取方法缺乏对特征词上下文环境和对特征词在类之间分布状况的考虑。【方法/过程】本文提出一种改进TF-IDF特征提取的方法:(1)基于文本网络和改进Page Rank算法计算节点重要程度值,解决传统TF-IDF忽略文本结构信息的问题;(2)增加特征值IDF值的方差来衡量特征词w在不同类别文本集中程度的分布情况,解决传统TF-IDF忽略特征词在类之间分布状况的不足。【结果/结论】基于该改进方法构建了文本分类模型,对3D打印数据进行分类实验。
[期刊] 图书情报知识  [作者] 吴丹  何大庆  陆伟  
综述命名实体识别与翻译研究现状,提出基于信息抽取的命名实体识别与翻译方法,以及对该方法进行一系列集成优化处理,并实现了基于命名实体识别与翻译的跨语言信息检索实验。实验结果显示出命名实体识别与翻译在跨语言信息检索中的重要性,并证明了所提出的翻译加权和网络挖掘未登录命名实体方法的应用能显著提高跨语言信息检索的性能。
[期刊] 情报学报  [作者] 刘晓娟  刘群  余梦霞  
命名实体识别是自然语言处理的基础性任务,其结果具有广泛的应用。关联数据由于具有丰富的语义知识,能够对现有命名实体识别进一步完善。本文实现了一个基于关联数据的可配置的中英文命名实体识别系统,在识别过程中对实体进行消歧并对识别结果进行扩展,为命名实体识别的进一步完善提供了新的思路。具体包括:基于DBpedia构造了跨领域的中英文命名实体词典;设计了一个基于Hive的分布式管理数据存储模型,基于该模型实现了对DBpedia数据集的组织、存储以及扩展;设计了一个基于图的命名实体识别算法,该算法能够充分利用关联数据的语义关系对命名实体进行消歧,并且基于DBpedia Spotlight NER Corpus对算法进行测试,并将算法结果与DBpedia Spotlight、NERSO以及Zwmanta三个系统进行对比评价,结果表明本文实现的算法在查全率、查准率、F值上具有更好的表现。
文献操作() 导出元数据 文献计量分析
导出文件格式:WXtxt
作者:
删除