- 年份
- 2024(4158)
- 2023(6012)
- 2022(5016)
- 2021(4785)
- 2020(3936)
- 2019(8657)
- 2018(8964)
- 2017(15928)
- 2016(9053)
- 2015(10427)
- 2014(10722)
- 2013(9921)
- 2012(9495)
- 2011(8541)
- 2010(8762)
- 2009(8188)
- 2008(8304)
- 2007(7880)
- 2006(7046)
- 2005(6454)
- 学科
- 济(30549)
- 经济(30499)
- 管理(28247)
- 业(22678)
- 企(20077)
- 企业(20077)
- 方法(12332)
- 财(10398)
- 数学(9711)
- 学(9667)
- 数学方法(9460)
- 中国(9352)
- 制(9263)
- 理论(9004)
- 农(8133)
- 业经(7869)
- 体(7684)
- 务(6845)
- 财务(6810)
- 财务管理(6793)
- 企业财务(6484)
- 银(6340)
- 银行(6321)
- 教学(6206)
- 教育(6149)
- 行(6032)
- 融(5948)
- 金融(5940)
- 和(5646)
- 贸(5606)
- 机构
- 大学(130310)
- 学院(128793)
- 管理(45689)
- 研究(44117)
- 济(42785)
- 经济(41506)
- 理学(37656)
- 理学院(37180)
- 管理学(36236)
- 管理学院(35984)
- 中国(34337)
- 京(29200)
- 科学(28799)
- 农(23690)
- 财(23126)
- 所(23102)
- 江(21767)
- 中心(21760)
- 研究所(20727)
- 业大(19826)
- 农业(18811)
- 北京(18331)
- 范(18264)
- 师范(17971)
- 技术(17900)
- 州(17687)
- 财经(17497)
- 院(16039)
- 经(15684)
- 省(15513)
- 基金
- 项目(81789)
- 科学(62145)
- 研究(59837)
- 基金(56494)
- 家(50322)
- 国家(49873)
- 科学基金(41583)
- 社会(34811)
- 社会科(32717)
- 社会科学(32709)
- 省(32591)
- 基金项目(28807)
- 教育(28623)
- 划(27367)
- 自然(27091)
- 编号(26588)
- 自然科(26511)
- 自然科学(26502)
- 自然科学基金(26016)
- 成果(24085)
- 资助(23942)
- 课题(18290)
- 重点(18119)
- 项目编号(17343)
- 部(16995)
- 创(16187)
- 发(16163)
- 科研(15445)
- 大学(15418)
- 创新(15137)
共检索到209961条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 图书情报知识
[作者]
吴丹 何大庆 陆伟
综述命名实体识别与翻译研究现状,提出基于信息抽取的命名实体识别与翻译方法,以及对该方法进行一系列集成优化处理,并实现了基于命名实体识别与翻译的跨语言信息检索实验。实验结果显示出命名实体识别与翻译在跨语言信息检索中的重要性,并证明了所提出的翻译加权和网络挖掘未登录命名实体方法的应用能显著提高跨语言信息检索的性能。
关键词:
命名实体 跨语言信息检索 识别 翻译
[期刊] 图书馆建设
[作者]
梁少博 朱慧宁 吴丹
对我国公共数字文化资源中的优秀传统文化内容进行多语言组织与检索,能够有效促进我国优秀传统文化的推广,推动中国优秀传统文化"走出去"。戏剧文化资源是我国公共数字文化资源的重要组成部分,以湖南地方戏剧资源为研究对象,构建了基于湖南地方戏剧资源命名实体的双语词典,采用提问式翻译策略来实现源语言与目标语言的语种统一,实现了对湖南地方戏剧资源的中英文跨语言信息检索,并对其跨语言信息检索结果进行评价,评价结果显示跨语言信息检索方法提升了检索性能,为戏曲文化资源的跨语言信息检索提供了支撑。
[期刊] 情报理论与实践
[作者]
徐红姣 王惠临 章成志
双语机读词典是基于查询翻译的跨语言信息检索中的常用资源,但是传统的手工构建词典的方法费时费力,本文利用统计方法从英汉句对齐平行语料库中自动获取翻译词典,以用于查询翻译过程中。
关键词:
跨语言 信息检索 翻译词典
[期刊] 图书情报工作
[作者]
徐红姣 高影繁
针对某网站在线运行的基于词典的查询翻译接口,对接口中实现的3种比较常用的查询翻译消歧算法进行改进,利用性能测试工具Loadrunner对改进前后的查询翻译接口的运行效率进行对比分析,最后总结影响基于词典的查询翻译的运行效率的3个主要因素。
[期刊] 图书情报知识
[作者]
陆伟 鞠源 张晓娟 吴丹
随着互联网经济的飞速发展,信息抽取领域的产品命名实体识别在商务智能领域有着广泛的应用。本文采用条件随机场(CRF)模型,选取词汇、词法和词形上一系列的特征进行训练,通过交叉验证对识别效果进行评价,并通过识别效果指导特征的选取。实验中比较了两种标注方式(BRAND/TYPE和PROD),并取得了令人满意的识别效果。在与最大熵模型对比中,验证了CRF模型对于产品实体识别的优越性。
[期刊] 情报学报
[作者]
刘晓娟 刘群 余梦霞
命名实体识别是自然语言处理的基础性任务,其结果具有广泛的应用。关联数据由于具有丰富的语义知识,能够对现有命名实体识别进一步完善。本文实现了一个基于关联数据的可配置的中英文命名实体识别系统,在识别过程中对实体进行消歧并对识别结果进行扩展,为命名实体识别的进一步完善提供了新的思路。具体包括:基于DBpedia构造了跨领域的中英文命名实体词典;设计了一个基于Hive的分布式管理数据存储模型,基于该模型实现了对DBpedia数据集的组织、存储以及扩展;设计了一个基于图的命名实体识别算法,该算法能够充分利用关联数据的语义关系对命名实体进行消歧,并且基于DBpedia Spotlight NER Corpus对算法进行测试,并将算法结果与DBpedia Spotlight、NERSO以及Zwmanta三个系统进行对比评价,结果表明本文实现的算法在查全率、查准率、F值上具有更好的表现。
关键词:
命名实体识别 命名实体消歧 关联数据
[期刊] 图书情报工作
[作者]
高影繁 徐红姣
面对日益膨胀的多语种信息资源,跨语言信息检索已成为实现全球知识存取和共享的关键技术手段。构建一个实用型的跨语言检索查询翻译接口,可方便地嵌入任意的信息检索平台,扩展现有信息检索平台的多语言信息处理能力。该查询翻译接口采用基于最长短语、查询分类和概率词典等多种翻译消歧策略,并从查询翻译的准确性和接口的运行效率两个角度对构建的查询翻译接口进行评测,实验结果验证所采用方法具有可行性。
关键词:
查询翻译消歧 查询翻译接口效率 评测
[期刊] 图书情报工作
[作者]
吴丹 王惠临
解释多语本体的含义,指出其在不同语言中所对应的领域知识,分析多语本体在查询扩展、语义标注、基于概念索引3方面对改善跨语言信息检索的作用,并通过介绍EuroWorldNet和Cindor系统的多语本体概念的对应方法,探讨本体应用于跨语言信息检索最关键的多语本体库的映射方法,认为采用中间语言作为概念表示、并通过词典翻译对照与不同语种的词汇建立链接关系是多语本体映射的一种良好方法。
关键词:
本体 多语本体 信息检索 跨语言信息检索
[期刊] 图书馆杂志
[作者]
范午攸
科研文献正文中包含未被文摘、题录记载的仪器信息,从正文中有效提取此类信息可作为仪器绩效评估等定量研究的依据。文章以化学领域论文与大型分析仪器为对象,实现了通过语义相似度及构词规律从文献中发现未知仪器名、针对PDF排版的仪器名模糊检索,以及基于文献类型、正文结束标识、使用标识词、全称简称对应关系的实际使用仪器与未使用仪器和同名实体的区分,并与人工标注结果比对验证了准确性。
关键词:
全文计量分析 实体识别 大型仪器设备
[期刊] 清华大学学报(自然科学版)
[作者]
尹学振 赵慧 赵俊保 姚婉薇 黄泽林
互联网公开数据蕴含着大量高价值的军事情报,成为获取开源军事情报的重要数据源之一。军事领域命名实体识别是进行军事领域信息提取、问答系统、知识图谱等工作的基础性关键任务。相比较于其他领域的命名实体,军事领域命名实体边界模糊,界定困难;互联网媒体中军事术语表达不规范,随意性的简化表达现象较普遍;现阶段面向军事领域的公开语料鲜见。该文提出一种考虑实体模糊边界的标注策略,结合领域专家知识,构建了基于微博数据的军事语料集MilitaryCorpus;提出一种多神经网络协作的军事领域命名实体识别模型,该模型通过基于Transformer的双向编码器(bidirectional encoder representations from transformers, BERT)的字向量表达层获得字级别的特征,通过双向长短时记忆神经网络(bi-directional long short-term memory, BiLSTM)层抽取上下文特征形成特征矩阵,最后由条件随机场层(conditional random field, CRF)生成最优标签序列。实验结果表明:相较于基于CRF的实体识别模型,应用该文提出的BERT-BiLSTM-CRF模型召回率提高28.48%,F值提高18.65%;相较于基于BiLSTM-CRF的实体识别模型,该文模型召回率提高13.91%,F值提高8.69%;相较于基于CNN (convolutional neural networks)-BiLSTM-CRF的实体识别模型,该文模型召回率提高7.08%,F值提高5.15%。
[期刊] 图书馆论坛
[作者]
王娟 王志红 曹树金
命名实体分类和识别是自然语言处理中的关键任务,识别效果将会影响许多下游任务的性能。本文基于现有知识图谱,提出了图情领域9大类实体,并构建了适用于图情领域实体识别的LISERNIE模型。通过开展广泛的实验,结果表明,在预训练阶段注入了图情领域知识的LISERNIE模型能有效识别出命名实体,并且在小规模标注数据集上具有明显的性能优势,在应用到后续的开放域关系抽取实验中,其准确率远高于CORE系统,为进一步构建如知识图谱、问答系统、机器阅读等提供数据支撑。
[期刊] 情报理论与实践
[作者]
张军亮 方雪梅 雒曼 孙晶晶
中文电子病历中存在大量非结构化的文本信息,其中的医学命名实体识别是生物医学领域知识组织和服务的基础。文章首先分析了中文电子病历特征的词语、词性、语素和词的组成等语法特征,以及HowNet语义特征;然后,运用CRF模型,提出了基于CRF医学命名实体的识别方案;最后,实验表明融合HowNet的中文电子病历命名实体识别方法具有较好的效果。
[期刊] 华中师范大学学报(自然科学版)
[作者]
朱颢东 杨立志 丁温雪 冯嘉美
近年来,网络媒体微博的迅速发展,为命名实体的识别研究提供了一种全新的载体.针对中文微博文本短、表达不清、网络化严重等特点,论文提出了一种规则与统计相结合的中文微博命名实体识别方法.该方法首先利用中文微博的主题标签对处理后的数据进行筛选,然后再选取合适的特征模板,并利用条件随机场模型(Conditional random fields,CRF)进行实体识别.为了满足实验要求,该文将传统网页爬虫方法与API接口采集方法相结合进行微博数据采集.实验结果表明,该方法能够有效提高中文微博命名实体的识别效果.
关键词:
命名实体 中文微博 主题标签 条件随机场
[期刊] 图书馆论坛
[作者]
朱武信 夏翠娟
近年上海图书馆通过数字人文搭建多个知识服务平台,通过关联数据,以知识图谱、GIS等展示方式提供服务。基于关联数据的专业服务对基础数据提出新要求,如数据本体化须具体到人名、地名、时间等实体;数据保留关联性,以关联数据形式存储。在新的数据要求与数据量日益增加的背景下,传统通过人力来加工数据的方法,或提取简单的实体,无法满足需求。为此,研发命名实体识别工具,以上图关联数据为词典,结合HANLP技术,实现文本的实体挖掘。工具投入使用后,可对数据批量进行实体识别,改进了数据处理流程,缩短了数据加工周期。
[期刊] 清华大学学报(自然科学版)
[作者]
张天宇 孙媛媛 杜文玉 邢铁军 林鸿飞 杨亮
法律文书命名实体识别是智慧司法的关键任务。现有的序列标注模型仅关注字符信息,导致在法律文书命名实体识别任务中无法获得语义和词语的上下文信息,且无法对实体的边界进行限制。因此,该文提出了一个融合外部信息并对边界限制的司法命名实体识别模型(semantic and boundary enhance named entity recognition, SBENER)。该模型收集了40万条盗窃罪法律文书,首先,预训练模型,将获得的司法盗窃罪词向量作为输入模型的外部信息;其次,设计Adapter,将司法盗窃罪的信息融入字符序列以增强语义特征;最后,使用边界指针网络对实体边界进行限制,解决了序列标注模型丢失词语信息及缺少边界限制的问题。该模型在CAILIE 1.0数据集和LegalC orpus数据集上进行实验,结果表明, SBENER模型在2个数据集上的F1值(F1-score)分别达88.70%和87.67%,比其他基线模型取得了更好的效果。SBENER模型能够提升司法领域命名实体识别的效果。
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除