- 年份
- 2024(10658)
- 2023(15418)
- 2022(13459)
- 2021(12858)
- 2020(10663)
- 2019(24871)
- 2018(24765)
- 2017(47645)
- 2016(25968)
- 2015(29471)
- 2014(29480)
- 2013(28407)
- 2012(25744)
- 2011(22910)
- 2010(22904)
- 2009(20554)
- 2008(19593)
- 2007(16893)
- 2006(14407)
- 2005(12150)
- 学科
- 济(98287)
- 经济(98167)
- 管理(73672)
- 业(68701)
- 企(57120)
- 企业(57120)
- 方法(49575)
- 数学(43522)
- 数学方法(42731)
- 农(26963)
- 财(25898)
- 中国(25380)
- 学(22121)
- 业经(21452)
- 地方(19829)
- 理论(19064)
- 制(18184)
- 农业(18086)
- 贸(16387)
- 贸易(16380)
- 和(15918)
- 易(15905)
- 务(15830)
- 技术(15802)
- 财务(15736)
- 财务管理(15697)
- 企业财务(14819)
- 环境(14806)
- 银(14229)
- 银行(14179)
- 机构
- 大学(356626)
- 学院(355637)
- 管理(143259)
- 济(135384)
- 经济(132374)
- 理学(125458)
- 理学院(124067)
- 管理学(121400)
- 管理学院(120772)
- 研究(113584)
- 中国(82657)
- 京(75068)
- 科学(72503)
- 财(61957)
- 农(57069)
- 所(55632)
- 业大(55029)
- 中心(52391)
- 研究所(51183)
- 江(50500)
- 财经(50122)
- 范(47862)
- 师范(47351)
- 北京(46683)
- 经(45754)
- 农业(44765)
- 院(42081)
- 州(41102)
- 经济学(40330)
- 技术(39763)
- 基金
- 项目(253589)
- 科学(199662)
- 研究(184609)
- 基金(183577)
- 家(160132)
- 国家(158831)
- 科学基金(137279)
- 社会(114307)
- 社会科(108197)
- 社会科学(108169)
- 省(99780)
- 基金项目(97298)
- 自然(91125)
- 自然科(89063)
- 自然科学(89041)
- 自然科学基金(87384)
- 教育(87215)
- 划(84235)
- 资助(76381)
- 编号(76177)
- 成果(60965)
- 重点(56598)
- 部(55676)
- 发(52875)
- 创(52694)
- 课题(52497)
- 创新(49109)
- 科研(48818)
- 教育部(47903)
- 大学(47610)
- 期刊
- 济(140077)
- 经济(140077)
- 研究(99342)
- 中国(66544)
- 学报(57724)
- 科学(52402)
- 管理(51666)
- 农(51013)
- 财(47365)
- 教育(45571)
- 大学(44233)
- 学学(41588)
- 农业(35475)
- 技术(33807)
- 融(25339)
- 金融(25339)
- 业经(24249)
- 财经(23568)
- 经济研究(22748)
- 经(20049)
- 图书(19281)
- 问题(17974)
- 业(17914)
- 科技(17395)
- 版(17130)
- 统计(16826)
- 技术经济(16702)
- 理论(16302)
- 商业(15353)
- 策(15220)
共检索到499927条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 情报学报
[作者]
范涛 王昊 陈玥彤
地方志作为中华文化的组成部分,是建设文化强国的重要一环,对其进行挖掘研究具有重要意义;同时,有效识别实体对地方志知识组织和知识图谱构建有着重要影响。当前地方志命名实体识别研究主要基于文本,缺乏文本对应的图片,而图片中的内容能够为识别文本中的实体提供额外的信息,从而提升模型识别实体的性能,并且实体识别还面临着已标注语料匮乏的问题。基于此,本文提出了利用深度迁移学习方法,结合地方志中的文本和图片进行多模态命名实体识别。首先,基于人民日报语料库和中文推特多模态数据集,分别预训练结合了自注意力机制的BiLSTM-attention-CRF模型和自适应联合注意力模型,利用基于神经网络的深度迁移学习方法将权重迁移至地方志多模态命名识别模型中,使模型获得提取文本和图片语义特征的能力;然后,结合过滤门对多模态融合特征去噪;最后,将融合后的多模态特征输入CRF (conditional random fields)层进行解码。本文将提出的模型在地方志多模态数据中进行了实证研究,并同相关基线模型作对比,实验结果表明,本文所提出的模型具有一定优势。
关键词:
深度迁移学习 多模态命名实体识别 地方志
[期刊] 情报理论与实践
[作者]
张继东 蒋丽萍
[目的/意义]反讽作为一种隐性而间接的情感表达方式,在社交评论中被广泛使用,正确识别用户的反讽情感对于网络平台和服务商具有重要意义。[方法/过程]本文基于深度学习构建多模态反讽识别模型,以在线旅游评论为例,运用深度学习模型分别提取文本、表情符号和图片的特征向量,通过不同的特征融合方式进行反讽识别。[结果/结论]通过与单模态反讽识别模型进行对比实验,发现本文提出的多模态旅游评论反讽识别模型在准确率、召回率等指标上的结果更优,验证了多模态模型比单模态模型反讽识别效果更佳的结论。
[期刊] 实验技术与管理
[作者]
蔡伊娜 包先雨 林燕奎 彭锦学 彭智彬 林泳奇 李俊霖 郭云
针对现有命名实体识别存在数据处理效率低的问题,该文提出了一种并行化Block-BAC模型。提出了前处理中的数据分块优化算法,并基于Hadoop实现并行化的运作机制;采用局部注意力优化机制,有效减少模型的隐层节点。与已有的BERT-BAC模型相比,在确保较高F_1值(精确率和召回率的调和平均数)的情况下,该模型训练时间和实体识别时间分别缩短60.36%、39.43%,具有更广泛的实用性。
[期刊] 情报学报
[作者]
刘晓娟 刘群 余梦霞
命名实体识别是自然语言处理的基础性任务,其结果具有广泛的应用。关联数据由于具有丰富的语义知识,能够对现有命名实体识别进一步完善。本文实现了一个基于关联数据的可配置的中英文命名实体识别系统,在识别过程中对实体进行消歧并对识别结果进行扩展,为命名实体识别的进一步完善提供了新的思路。具体包括:基于DBpedia构造了跨领域的中英文命名实体词典;设计了一个基于Hive的分布式管理数据存储模型,基于该模型实现了对DBpedia数据集的组织、存储以及扩展;设计了一个基于图的命名实体识别算法,该算法能够充分利用关联数据的语义关系对命名实体进行消歧,并且基于DBpedia Spotlight NER Corpus对算法进行测试,并将算法结果与DBpedia Spotlight、NERSO以及Zwmanta三个系统进行对比评价,结果表明本文实现的算法在查全率、查准率、F值上具有更好的表现。
关键词:
命名实体识别 命名实体消歧 关联数据
[期刊] 图书情报知识
[作者]
陆伟 鞠源 张晓娟 吴丹
随着互联网经济的飞速发展,信息抽取领域的产品命名实体识别在商务智能领域有着广泛的应用。本文采用条件随机场(CRF)模型,选取词汇、词法和词形上一系列的特征进行训练,通过交叉验证对识别效果进行评价,并通过识别效果指导特征的选取。实验中比较了两种标注方式(BRAND/TYPE和PROD),并取得了令人满意的识别效果。在与最大熵模型对比中,验证了CRF模型对于产品实体识别的优越性。
[期刊] 情报理论与实践
[作者]
韩普 陈文祺 顾亮 叶东宇 景慎旗
[目的/意义]医学实体识别是医疗健康知识挖掘和知识组织的关键环节。深入挖掘多模态数据间语义关联可以提升医学实体识别效果,进而为领域知识补全和知识推理提供支撑。[方法/过程]提出一种基于双线性注意力融合机制的多模态中文医学实体识别模型BAF-MNER。首先通过视觉和文本编码器进行多模态医学数据的语义特征学习;接着利用双线性注意力网络实现图像和文本跨模态语义交互,并引入门控机制过滤视觉噪声;然后融合基于注意力机制的视觉特征和文本特征进而构建多模态特征表示,同时增加批量归一化层优化深度神经网络;最后将多模态特征向量输入CRF层解码获取预测标签。[结果/结论]本模型能够有效提升中文医学实体识别效果,在多模态医学数据集上的F1值较单模态基线模型提升4.07%,较多模态基线模型提升1.65%;在多模态公开数据集上的实验表明模型具有良好的泛化能力。
[期刊] 实验技术与管理
[作者]
李阳 许凌复 崔渭刚 刘竞宇 刘丽
针对现有3DU-Net网络在脑肿瘤分割中存在的训练过程中损失函数值难以降低,对增强瘤、肿瘤核分割精度较差等问题,该文提出了某模型网络的优化方案。首先使用残差网络结构降低训练难度;进一步引入注意力机制对多模态MRI的融合权值进行自适应学习,充分利用不同模态特征信息;最后在网络解码器部分采用双路卷积结构,提高了网络的特征提取能力。实验结果表明,改进后的网络训练损失函数更容易收敛到较小值,且对3种肿瘤的平均分割Dice系数提高了0.018 9,平均Hausdorff距离缩短了1.197 1,在整体分割性能上优于改进前的网络。
[期刊] 清华大学学报(自然科学版)
[作者]
尹学振 赵慧 赵俊保 姚婉薇 黄泽林
互联网公开数据蕴含着大量高价值的军事情报,成为获取开源军事情报的重要数据源之一。军事领域命名实体识别是进行军事领域信息提取、问答系统、知识图谱等工作的基础性关键任务。相比较于其他领域的命名实体,军事领域命名实体边界模糊,界定困难;互联网媒体中军事术语表达不规范,随意性的简化表达现象较普遍;现阶段面向军事领域的公开语料鲜见。该文提出一种考虑实体模糊边界的标注策略,结合领域专家知识,构建了基于微博数据的军事语料集MilitaryCorpus;提出一种多神经网络协作的军事领域命名实体识别模型,该模型通过基于Transformer的双向编码器(bidirectional encoder representations from transformers, BERT)的字向量表达层获得字级别的特征,通过双向长短时记忆神经网络(bi-directional long short-term memory, BiLSTM)层抽取上下文特征形成特征矩阵,最后由条件随机场层(conditional random field, CRF)生成最优标签序列。实验结果表明:相较于基于CRF的实体识别模型,应用该文提出的BERT-BiLSTM-CRF模型召回率提高28.48%,F值提高18.65%;相较于基于BiLSTM-CRF的实体识别模型,该文模型召回率提高13.91%,F值提高8.69%;相较于基于CNN (convolutional neural networks)-BiLSTM-CRF的实体识别模型,该文模型召回率提高7.08%,F值提高5.15%。
[期刊] 图书馆杂志
[作者]
黎安润泽 牛力 郑金月
地方志作为我国特有的文化遗产和珍贵典籍,承载着完整的地方文化脉络,为人文学者提供了新的研究视角与论据。地方志内容翔实,具有鲜明的多粒度特征与知识价值。因此在方法论层面,首先基于双视角思维提出地方志多粒度知识服务模型,一是在主体视角下探讨知识服务提供者如何实现地方志内容的分步解构,进行不同粒度的内容开发;二是在客体视角下探讨如何针对知识服务接受者的多元化需求,基于不同粒度的内容提供服务。在实证验证层面,以“《浙江通志》中的西湖印记”为案例对象,为提升地方志资源的利用率、透视地区发展历程、推动地域文化的传承与传播提供了路径参考。
[期刊] 图书馆杂志
[作者]
范午攸
科研文献正文中包含未被文摘、题录记载的仪器信息,从正文中有效提取此类信息可作为仪器绩效评估等定量研究的依据。文章以化学领域论文与大型分析仪器为对象,实现了通过语义相似度及构词规律从文献中发现未知仪器名、针对PDF排版的仪器名模糊检索,以及基于文献类型、正文结束标识、使用标识词、全称简称对应关系的实际使用仪器与未使用仪器和同名实体的区分,并与人工标注结果比对验证了准确性。
关键词:
全文计量分析 实体识别 大型仪器设备
[期刊] 图书馆建设
[作者]
梁少博 朱慧宁 吴丹
对我国公共数字文化资源中的优秀传统文化内容进行多语言组织与检索,能够有效促进我国优秀传统文化的推广,推动中国优秀传统文化"走出去"。戏剧文化资源是我国公共数字文化资源的重要组成部分,以湖南地方戏剧资源为研究对象,构建了基于湖南地方戏剧资源命名实体的双语词典,采用提问式翻译策略来实现源语言与目标语言的语种统一,实现了对湖南地方戏剧资源的中英文跨语言信息检索,并对其跨语言信息检索结果进行评价,评价结果显示跨语言信息检索方法提升了检索性能,为戏曲文化资源的跨语言信息检索提供了支撑。
[期刊] 图书馆论坛
[作者]
王娟 王志红 曹树金
命名实体分类和识别是自然语言处理中的关键任务,识别效果将会影响许多下游任务的性能。本文基于现有知识图谱,提出了图情领域9大类实体,并构建了适用于图情领域实体识别的LISERNIE模型。通过开展广泛的实验,结果表明,在预训练阶段注入了图情领域知识的LISERNIE模型能有效识别出命名实体,并且在小规模标注数据集上具有明显的性能优势,在应用到后续的开放域关系抽取实验中,其准确率远高于CORE系统,为进一步构建如知识图谱、问答系统、机器阅读等提供数据支撑。
[期刊] 中国成人教育
[作者]
张淑杰 刘晓怡
随着信息技术的发展,表意资源越来越多模态化,探讨以基于多模态话语的自主学习框架成为必要。系统功能语言学语境理论的话语范围、话语基调、话语方式,在自主学习语境下分别投射为学习目标、师生关系及自主学习环境设计主要是媒体设计、学生在线互动设计及评估与反思设计三个方面。本文从这三个方面对自主学习进行研究,激发学习者自主学习的参与动机、习得学习策略及自我评估能力,从而提升学习者习得表意资源的效率,发展学习者的表意潜势,最终保证教学目标的实现。
关键词:
多模态话语 自主学习 意义潜势
[期刊] 华中师范大学学报(自然科学版)
[作者]
朱颢东 杨立志 丁温雪 冯嘉美
近年来,网络媒体微博的迅速发展,为命名实体的识别研究提供了一种全新的载体.针对中文微博文本短、表达不清、网络化严重等特点,论文提出了一种规则与统计相结合的中文微博命名实体识别方法.该方法首先利用中文微博的主题标签对处理后的数据进行筛选,然后再选取合适的特征模板,并利用条件随机场模型(Conditional random fields,CRF)进行实体识别.为了满足实验要求,该文将传统网页爬虫方法与API接口采集方法相结合进行微博数据采集.实验结果表明,该方法能够有效提高中文微博命名实体的识别效果.
关键词:
命名实体 中文微博 主题标签 条件随机场
[期刊] 图书馆论坛
[作者]
朱武信 夏翠娟
近年上海图书馆通过数字人文搭建多个知识服务平台,通过关联数据,以知识图谱、GIS等展示方式提供服务。基于关联数据的专业服务对基础数据提出新要求,如数据本体化须具体到人名、地名、时间等实体;数据保留关联性,以关联数据形式存储。在新的数据要求与数据量日益增加的背景下,传统通过人力来加工数据的方法,或提取简单的实体,无法满足需求。为此,研发命名实体识别工具,以上图关联数据为词典,结合HANLP技术,实现文本的实体挖掘。工具投入使用后,可对数据批量进行实体识别,改进了数据处理流程,缩短了数据加工周期。
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除