- 年份
- 2024(12311)
- 2023(17528)
- 2022(14604)
- 2021(13463)
- 2020(11043)
- 2019(25171)
- 2018(25010)
- 2017(47676)
- 2016(25951)
- 2015(29453)
- 2014(29492)
- 2013(28542)
- 2012(26169)
- 2011(23255)
- 2010(22956)
- 2009(20688)
- 2008(19950)
- 2007(17281)
- 2006(14883)
- 2005(12659)
- 学科
- 济(101549)
- 经济(101434)
- 管理(77603)
- 业(69313)
- 企(59131)
- 企业(59131)
- 方法(48344)
- 数学(41264)
- 数学方法(40664)
- 财(26961)
- 中国(26636)
- 业经(26630)
- 农(26480)
- 学(22908)
- 理论(19995)
- 地方(19479)
- 制(18326)
- 农业(17713)
- 和(17624)
- 务(17122)
- 财务(17035)
- 财务管理(16994)
- 贸(16606)
- 贸易(16601)
- 技术(16151)
- 企业财务(16132)
- 易(16119)
- 产业(15843)
- 环境(15834)
- 银(14772)
- 机构
- 大学(363251)
- 学院(361527)
- 管理(145750)
- 济(136214)
- 经济(133072)
- 理学(126602)
- 理学院(125204)
- 管理学(122839)
- 管理学院(122148)
- 研究(115269)
- 中国(84520)
- 京(76775)
- 科学(73593)
- 财(63285)
- 农(56884)
- 所(56374)
- 业大(54806)
- 中心(53818)
- 江(52343)
- 研究所(51715)
- 财经(51204)
- 范(49018)
- 师范(48506)
- 北京(47731)
- 经(46645)
- 农业(44695)
- 州(43030)
- 院(42760)
- 经济学(40472)
- 技术(40200)
- 基金
- 项目(257257)
- 科学(201763)
- 研究(188258)
- 基金(185410)
- 家(161613)
- 国家(160255)
- 科学基金(138398)
- 社会(117510)
- 社会科(111309)
- 社会科学(111278)
- 省(101212)
- 基金项目(98152)
- 自然(90282)
- 自然科(88125)
- 自然科学(88102)
- 教育(87223)
- 自然科学基金(86498)
- 划(84636)
- 编号(78447)
- 资助(75891)
- 成果(62965)
- 重点(56864)
- 部(55733)
- 发(53625)
- 创(53270)
- 课题(53044)
- 创新(49600)
- 科研(49178)
- 项目编号(48937)
- 国家社会(48437)
- 期刊
- 济(142072)
- 经济(142072)
- 研究(99610)
- 中国(68601)
- 学报(60498)
- 科学(52529)
- 管理(52196)
- 农(50438)
- 财(48637)
- 大学(45376)
- 教育(44824)
- 学学(42004)
- 农业(35111)
- 技术(33280)
- 图书(27530)
- 融(25390)
- 金融(25390)
- 业经(24552)
- 财经(24152)
- 经济研究(22638)
- 经(20625)
- 书馆(19217)
- 图书馆(19217)
- 问题(18391)
- 业(18116)
- 理论(17566)
- 科技(17463)
- 版(17422)
- 情报(17066)
- 资源(16440)
共检索到516132条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 图书馆建设
[作者]
梁少博 朱慧宁 吴丹
对我国公共数字文化资源中的优秀传统文化内容进行多语言组织与检索,能够有效促进我国优秀传统文化的推广,推动中国优秀传统文化"走出去"。戏剧文化资源是我国公共数字文化资源的重要组成部分,以湖南地方戏剧资源为研究对象,构建了基于湖南地方戏剧资源命名实体的双语词典,采用提问式翻译策略来实现源语言与目标语言的语种统一,实现了对湖南地方戏剧资源的中英文跨语言信息检索,并对其跨语言信息检索结果进行评价,评价结果显示跨语言信息检索方法提升了检索性能,为戏曲文化资源的跨语言信息检索提供了支撑。
[期刊] 图书情报知识
[作者]
吴丹 何大庆 陆伟
综述命名实体识别与翻译研究现状,提出基于信息抽取的命名实体识别与翻译方法,以及对该方法进行一系列集成优化处理,并实现了基于命名实体识别与翻译的跨语言信息检索实验。实验结果显示出命名实体识别与翻译在跨语言信息检索中的重要性,并证明了所提出的翻译加权和网络挖掘未登录命名实体方法的应用能显著提高跨语言信息检索的性能。
关键词:
命名实体 跨语言信息检索 识别 翻译
[期刊] 情报理论与实践
[作者]
徐红姣 王惠临 章成志
双语机读词典是基于查询翻译的跨语言信息检索中的常用资源,但是传统的手工构建词典的方法费时费力,本文利用统计方法从英汉句对齐平行语料库中自动获取翻译词典,以用于查询翻译过程中。
关键词:
跨语言 信息检索 翻译词典
[期刊] 图书情报工作
[作者]
徐红姣 高影繁
针对某网站在线运行的基于词典的查询翻译接口,对接口中实现的3种比较常用的查询翻译消歧算法进行改进,利用性能测试工具Loadrunner对改进前后的查询翻译接口的运行效率进行对比分析,最后总结影响基于词典的查询翻译的运行效率的3个主要因素。
[期刊] 图书馆论坛
[作者]
朱武信 夏翠娟
近年上海图书馆通过数字人文搭建多个知识服务平台,通过关联数据,以知识图谱、GIS等展示方式提供服务。基于关联数据的专业服务对基础数据提出新要求,如数据本体化须具体到人名、地名、时间等实体;数据保留关联性,以关联数据形式存储。在新的数据要求与数据量日益增加的背景下,传统通过人力来加工数据的方法,或提取简单的实体,无法满足需求。为此,研发命名实体识别工具,以上图关联数据为词典,结合HANLP技术,实现文本的实体挖掘。工具投入使用后,可对数据批量进行实体识别,改进了数据处理流程,缩短了数据加工周期。
[期刊] 情报学报
[作者]
刘晓娟 刘群 余梦霞
命名实体识别是自然语言处理的基础性任务,其结果具有广泛的应用。关联数据由于具有丰富的语义知识,能够对现有命名实体识别进一步完善。本文实现了一个基于关联数据的可配置的中英文命名实体识别系统,在识别过程中对实体进行消歧并对识别结果进行扩展,为命名实体识别的进一步完善提供了新的思路。具体包括:基于DBpedia构造了跨领域的中英文命名实体词典;设计了一个基于Hive的分布式管理数据存储模型,基于该模型实现了对DBpedia数据集的组织、存储以及扩展;设计了一个基于图的命名实体识别算法,该算法能够充分利用关联数据的语义关系对命名实体进行消歧,并且基于DBpedia Spotlight NER Corpus对算法进行测试,并将算法结果与DBpedia Spotlight、NERSO以及Zwmanta三个系统进行对比评价,结果表明本文实现的算法在查全率、查准率、F值上具有更好的表现。
关键词:
命名实体识别 命名实体消歧 关联数据
[期刊] 图书情报知识
[作者]
陆伟 鞠源 张晓娟 吴丹
随着互联网经济的飞速发展,信息抽取领域的产品命名实体识别在商务智能领域有着广泛的应用。本文采用条件随机场(CRF)模型,选取词汇、词法和词形上一系列的特征进行训练,通过交叉验证对识别效果进行评价,并通过识别效果指导特征的选取。实验中比较了两种标注方式(BRAND/TYPE和PROD),并取得了令人满意的识别效果。在与最大熵模型对比中,验证了CRF模型对于产品实体识别的优越性。
[期刊] 实验技术与管理
[作者]
蔡伊娜 包先雨 林燕奎 彭锦学 彭智彬 林泳奇 李俊霖 郭云
针对现有命名实体识别存在数据处理效率低的问题,该文提出了一种并行化Block-BAC模型。提出了前处理中的数据分块优化算法,并基于Hadoop实现并行化的运作机制;采用局部注意力优化机制,有效减少模型的隐层节点。与已有的BERT-BAC模型相比,在确保较高F_1值(精确率和召回率的调和平均数)的情况下,该模型训练时间和实体识别时间分别缩短60.36%、39.43%,具有更广泛的实用性。
[期刊] 图书馆论坛
[作者]
林立涛 王东波 刘江峰 李斌 冯敏萱
通用命名实体识别难以满足不同领域研究的需要,特定领域命名实体识别研究对于提升文本挖掘精度具有重要意义。基于Siku BERT预训练模型构建用于典籍动物命名实体识别模型,为典籍动物知识挖掘提供有效方法。利用25部经人工标注动物命名实体的先秦典籍语料,对Siku BERT等由BERT预训练模型发展而来的系列模型以及CRF、Bi-LSTM-CRF进行训练,构建多种用于识别典籍中动物命名实体的模型,并对这些模型进行识别性能测试,比较验证Siku BERT预训练模型的识别性能。结果表明,基于Siku BERT经训练所构建的动物命名实体识别模型效果最优,10折交叉测试的平均调和平均值(F1)为85.46%,最高一次达86.29%,应用于《史记》动物命名实体识别准确率达91.6%。
[期刊] 情报理论与实践
[作者]
张金柱
本文分析了跨语言信息检索的现状,介绍和描述跨语言信息检索的主要问题,并针对万方数据和NSTL的现有资源,构建出基于科技文献的跨语言信息检索原型系统,此原型系统通过字典查询得到检索词翻译,应用Google在线翻译进行标题、摘要翻译,并预留中国科学院自动化所提供的翻译引擎扩展。跨语言信息检索强调检索结果翻译的可读性,帮助用户理解基本大意,不刻意追求准确性,力求在应用过程中促进机器翻译技术的进步和发展,辅助科研。
[期刊] 图书馆杂志
[作者]
范午攸
科研文献正文中包含未被文摘、题录记载的仪器信息,从正文中有效提取此类信息可作为仪器绩效评估等定量研究的依据。文章以化学领域论文与大型分析仪器为对象,实现了通过语义相似度及构词规律从文献中发现未知仪器名、针对PDF排版的仪器名模糊检索,以及基于文献类型、正文结束标识、使用标识词、全称简称对应关系的实际使用仪器与未使用仪器和同名实体的区分,并与人工标注结果比对验证了准确性。
关键词:
全文计量分析 实体识别 大型仪器设备
[期刊] 情报学报
[作者]
范涛 王昊 陈玥彤
地方志作为中华文化的组成部分,是建设文化强国的重要一环,对其进行挖掘研究具有重要意义;同时,有效识别实体对地方志知识组织和知识图谱构建有着重要影响。当前地方志命名实体识别研究主要基于文本,缺乏文本对应的图片,而图片中的内容能够为识别文本中的实体提供额外的信息,从而提升模型识别实体的性能,并且实体识别还面临着已标注语料匮乏的问题。基于此,本文提出了利用深度迁移学习方法,结合地方志中的文本和图片进行多模态命名实体识别。首先,基于人民日报语料库和中文推特多模态数据集,分别预训练结合了自注意力机制的BiLSTM-attention-CRF模型和自适应联合注意力模型,利用基于神经网络的深度迁移学习方法将权重迁移至地方志多模态命名识别模型中,使模型获得提取文本和图片语义特征的能力;然后,结合过滤门对多模态融合特征去噪;最后,将融合后的多模态特征输入CRF (conditional random fields)层进行解码。本文将提出的模型在地方志多模态数据中进行了实证研究,并同相关基线模型作对比,实验结果表明,本文所提出的模型具有一定优势。
关键词:
深度迁移学习 多模态命名实体识别 地方志
[期刊] 华中师范大学学报(自然科学版)
[作者]
朱颢东 杨立志 丁温雪 冯嘉美
近年来,网络媒体微博的迅速发展,为命名实体的识别研究提供了一种全新的载体.针对中文微博文本短、表达不清、网络化严重等特点,论文提出了一种规则与统计相结合的中文微博命名实体识别方法.该方法首先利用中文微博的主题标签对处理后的数据进行筛选,然后再选取合适的特征模板,并利用条件随机场模型(Conditional random fields,CRF)进行实体识别.为了满足实验要求,该文将传统网页爬虫方法与API接口采集方法相结合进行微博数据采集.实验结果表明,该方法能够有效提高中文微博命名实体的识别效果.
关键词:
命名实体 中文微博 主题标签 条件随机场
[期刊] 清华大学学报(自然科学版)
[作者]
张天宇 孙媛媛 杜文玉 邢铁军 林鸿飞 杨亮
法律文书命名实体识别是智慧司法的关键任务。现有的序列标注模型仅关注字符信息,导致在法律文书命名实体识别任务中无法获得语义和词语的上下文信息,且无法对实体的边界进行限制。因此,该文提出了一个融合外部信息并对边界限制的司法命名实体识别模型(semantic and boundary enhance named entity recognition, SBENER)。该模型收集了40万条盗窃罪法律文书,首先,预训练模型,将获得的司法盗窃罪词向量作为输入模型的外部信息;其次,设计Adapter,将司法盗窃罪的信息融入字符序列以增强语义特征;最后,使用边界指针网络对实体边界进行限制,解决了序列标注模型丢失词语信息及缺少边界限制的问题。该模型在CAILIE 1.0数据集和LegalC orpus数据集上进行实验,结果表明, SBENER模型在2个数据集上的F1值(F1-score)分别达88.70%和87.67%,比其他基线模型取得了更好的效果。SBENER模型能够提升司法领域命名实体识别的效果。
[期刊] 图书情报工作
[作者]
高影繁 徐红姣
面对日益膨胀的多语种信息资源,跨语言信息检索已成为实现全球知识存取和共享的关键技术手段。构建一个实用型的跨语言检索查询翻译接口,可方便地嵌入任意的信息检索平台,扩展现有信息检索平台的多语言信息处理能力。该查询翻译接口采用基于最长短语、查询分类和概率词典等多种翻译消歧策略,并从查询翻译的准确性和接口的运行效率两个角度对构建的查询翻译接口进行评测,实验结果验证所采用方法具有可行性。
关键词:
查询翻译消歧 查询翻译接口效率 评测
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除