- 年份
- 2024(7249)
- 2023(10444)
- 2022(9254)
- 2021(8785)
- 2020(7337)
- 2019(17003)
- 2018(17316)
- 2017(33064)
- 2016(18198)
- 2015(20550)
- 2014(20852)
- 2013(20187)
- 2012(18414)
- 2011(16440)
- 2010(16263)
- 2009(14722)
- 2008(14059)
- 2007(12170)
- 2006(10499)
- 2005(8989)
- 学科
- 济(66157)
- 经济(66072)
- 管理(51381)
- 业(46588)
- 企(39310)
- 企业(39310)
- 方法(31458)
- 数学(26909)
- 数学方法(26592)
- 农(17989)
- 中国(17440)
- 学(16732)
- 财(16699)
- 业经(14928)
- 地方(13987)
- 制(13134)
- 理论(13126)
- 贸(12287)
- 贸易(12283)
- 易(11927)
- 和(11775)
- 农业(11718)
- 技术(10857)
- 教育(10739)
- 务(10600)
- 环境(10584)
- 财务(10530)
- 财务管理(10509)
- 银(10286)
- 银行(10245)
- 机构
- 大学(251415)
- 学院(250068)
- 管理(101397)
- 济(91608)
- 经济(89355)
- 理学(88140)
- 理学院(87140)
- 管理学(85598)
- 管理学院(85151)
- 研究(82154)
- 中国(59594)
- 京(54281)
- 科学(53663)
- 财(41678)
- 农(41454)
- 所(41233)
- 业大(39628)
- 研究所(37942)
- 中心(37076)
- 江(35835)
- 北京(34164)
- 范(33880)
- 财经(33691)
- 师范(33515)
- 农业(32640)
- 经(30598)
- 院(30334)
- 州(29525)
- 技术(28764)
- 师范大学(27023)
- 基金
- 项目(177255)
- 科学(138032)
- 研究(129988)
- 基金(126615)
- 家(110553)
- 国家(109609)
- 科学基金(93718)
- 社会(78497)
- 社会科(74175)
- 社会科学(74154)
- 省(70190)
- 基金项目(68115)
- 自然(62282)
- 自然科(60794)
- 自然科学(60780)
- 教育(59679)
- 自然科学基金(59647)
- 划(59124)
- 编号(54513)
- 资助(51957)
- 成果(44332)
- 重点(39167)
- 部(38204)
- 课题(37355)
- 发(37082)
- 创(36808)
- 创新(34209)
- 科研(33981)
- 项目编号(33861)
- 大学(32820)
共检索到356707条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 图书情报工作
[作者]
王若佳 赵常煜 王继民
[目的/意义]健康医疗大数据是我国重要的基础性战略资源,本研究对中文电子病历分词与实体识别的探讨与实证较好地完成了医疗数据的信息抽取任务,对今后医疗大数据在语义层面的应用发展具有重要意义。[方法/过程]本研究首先融合权威词表、官方标准、健康网站数据及其他医学补充词库构建了词语数量级达到10万的医学词表;然后对电子病历的字段进行分词,对比了jieba工具、导入词典后的jieba、无监督学习及AC自动机4种模型的分词效果;最后,以自动分词和人工标注结果为语料,实现基于条件随机场的电子病历实体识别研究,并比较不同实体类别以及不同文本特征下的实体识别效果,选出最优模板。[结果/结论]分词结果显示,AC自动机的效果最好,F值可达82%;实体识别结果表明,"检查"和"疾病"实体的识别效果最好,而"症状"的识别效果不太理想。
[期刊] 情报理论与实践
[作者]
张军亮 方雪梅 雒曼 孙晶晶
中文电子病历中存在大量非结构化的文本信息,其中的医学命名实体识别是生物医学领域知识组织和服务的基础。文章首先分析了中文电子病历特征的词语、词性、语素和词的组成等语法特征,以及HowNet语义特征;然后,运用CRF模型,提出了基于CRF医学命名实体的识别方案;最后,实验表明融合HowNet的中文电子病历命名实体识别方法具有较好的效果。
[期刊] 大学图书馆学报
[作者]
张春红 蒋刚苗
本文从概况、内容、功能及服务等方面对国内著名的几个中文电子图书系统——中国数图公司网上图书馆、超星数字图书馆、书生之家“中华图书网”和方正Apabi数字图书馆作了综合和具体的比较研究,以期对中国电子图书的发展有总体的认识。
[期刊] 图书情报工作
[作者]
孙晓玫
随着现代信息技术和数字技术的迅猛发展以及社会需求的变化,图书馆收藏的文献类型也随之发生了变化,中文电子资源作为一种新的载体文献已逐渐成为图书馆馆藏的重要组成部分,艺术类中文电子资源实体光盘的编目及著录成为图书馆编目人员探讨和研究的内容。归纳和总结、区分和辨别艺术类中文电子资源实体光盘所揭示的内容,是编目人员编目及著录的关键。
[期刊] 清华大学学报(自然科学版)
[作者]
王庆人 王银子 仲红 张以文
作为信息抽取的核心任务,命名实体识别能够从文本中识别不同类型命名实体。得益于深度学习在字词表示、特征提取方面的应用,中文命名实体识别任务取得了丰富研究成果。然而,中文命名实体识别任务依旧面临词汇信息缺乏的挑战,主要表现为:1)词汇边界信息和上下文语义信息未充分利用;2)字和自匹配词汇间语义信息未能有效捕获;3)图注意力网络输出信息中不同交互图信息的重要性未被考虑。该文提出一种面向中文的字词组合序列实体识别方法。采用字词组合序列嵌入结构,实现词汇边界信息以及字符与词汇间语义信息的充分捕捉;采用多图注意力融合架构,实现不同图神经网络提取特征重要性的区分。实验表明,相比已有经典方法,该方法在Weibo、 Resume、 OntoNotes4.0及MSRA四个数据集上的F1明显提升,在中文命名实体识别任务上具有可行性。
[期刊] 情报理论与实践
[作者]
梁刚
分词是所有中文信息处理工作的基础,也是汉语信息处理的难点之一,如何识别文中出现的新词更成为当前研究的重点之一。本文综合利用几种传统的机械分词方法,加上统计学的方法,提出了一种从文献中抽取新词的新方法。
[期刊] 图书情报工作
[作者]
奉国和 郑伟
认为分词是文本自动分类、信息检索、信息过滤、文献自动标引、摘要自动生成等中文信息处理的基础与关键技术之一,中文本身复杂性及语言规则的不确定性,使中文分词技术成为分词技术中的难点。全面归纳中文分词算法、歧义消除、未登录词识别、自动分词系统等研究,总结出当前中文分词面临的难点与研究热点。
[期刊] 图书馆论坛
[作者]
庄蕾波 胡小菁
通过分析RDA有关电子资源描述(著录)的条款规定,探寻RDA对中文电子资源著录的实践应用,以了解作为世界范围内资源描述与检索内容标准的RDA对中文电子资源著录的适用性。
关键词:
RDA 中文电子资源 实践应用
[期刊] 清华大学学报(自然科学版)
[作者]
张婧 黄德根 黄锴宇 刘壮 孟祥主
由于面向中文微博的分词标注语料相对较少,导致基于传统方法和深度学习方法的中文分词系统在微博语料上的表现效果很差。针对此问题,该文提出一种主动学习方法,从大规模未标注语料中挑选更具标注价值的微博分词语料。根据微博语料的特点,在主动学习迭代过程中引入参数λ来控制所选的重复样例的个数,以确保所选样例的多样性;同时,根据样例中字标注结果的不确定性和上下文的多样性,采用Max、Avg和AvgMax这3种策略衡量样例整体的标注价值;此外,用于主动学习的初始分词器除使用当前字的上下文作为特征外,还利用字向量自动计算当前
[期刊] 情报理论与实践
[作者]
韩普 陈文祺 顾亮 叶东宇 景慎旗
[目的/意义]医学实体识别是医疗健康知识挖掘和知识组织的关键环节。深入挖掘多模态数据间语义关联可以提升医学实体识别效果,进而为领域知识补全和知识推理提供支撑。[方法/过程]提出一种基于双线性注意力融合机制的多模态中文医学实体识别模型BAF-MNER。首先通过视觉和文本编码器进行多模态医学数据的语义特征学习;接着利用双线性注意力网络实现图像和文本跨模态语义交互,并引入门控机制过滤视觉噪声;然后融合基于注意力机制的视觉特征和文本特征进而构建多模态特征表示,同时增加批量归一化层优化深度神经网络;最后将多模态特征向量输入CRF层解码获取预测标签。[结果/结论]本模型能够有效提升中文医学实体识别效果,在多模态医学数据集上的F1值较单模态基线模型提升4.07%,较多模态基线模型提升1.65%;在多模态公开数据集上的实验表明模型具有良好的泛化能力。
[期刊] 大学图书馆学报
[作者]
张成昱 赵仪 邹荣 曾婷
以清华大学图书馆-超星电子图书系统的开发和应用为基础,讨论中文电子图书系统的研究和开发背景,以及对于基本技术方案的选择,介绍和分析了它的系统结构、运行模式和部分关键技术。
关键词:
电子图书系统 OCR 全文检索
[期刊] 大学图书馆学报
[作者]
段晓林
超星、中文在线、田田网和畅想之星是目前在馆配市场比较有影响的电子书平台,文章对四家平台的资源、功能、运营模式和理念进行了比较,分析其满足图书馆需求的程度。指出四家平台虽各有优势,但都不能完全满足图书馆的需求。图书馆需要一个整合各家优势的第三方综合电子书平台,即可以整合超星的数量优势,中文在线的阅读推广优势,田田网和畅想之星的"纸电同步"理念以及服务于这一理念的采购平台和采购模式。
[期刊] 图书馆杂志
[作者]
詹丽华
对国内中文电子图书书目数据揭示现状进行调查,为规范中文电子图书书目数据、提升用户检索体验和阅读体验提供借鉴。采用网络调查法,对11个中文电子图书平台上书目数据揭示的基本情况、描述的规范性、数据关联性展开调查。题名、创建者、描述三个核心元素在11个平台上均被揭示,而来源、关联、时空范围、馆藏信息均未揭示;题名、创建者等元素著录存在较多不规范;关联数据的广度不够,特别是知识组织工具方面的关联数据十分欠缺。建议:参照信息源尽可能地著录更多的元素、图书馆编目人员严格遵守电子图书著录规则、电子图书出版发行行业做好人员培训、加强关联数据的揭示。
关键词:
电子图书 书目数据 著录 元数据规范
[期刊] 图书馆杂志
[作者]
张会田
我国中文电子书馆配应用已由最初的简单粗放、以量取胜,向注重品质和保护版权的理性化方向发展,但也存在新书品种少、纸电同步率不高、内容格式标准不一、异构平台整合困难、定价机制缺失、供需矛盾突出等问题。分析发现,电子书馆配业务目前面临源自版权保护、市场产业链、新书采购交易、业务应用标准化等方面的四大发展瓶颈。优化中文电子书馆配应用模式应从5个层面施策:建立电子书版权管控认证平台、实施灵活多样的电子书馆配销售模式、推进电子书馆配应用平台标准化建设、构建科学有效的电子书馆配定价机制、实施PDA电子书精准化采购模式。
关键词:
电子图书 馆配市场 馆配业务 优化路径
[期刊] 情报理论与实践
[作者]
罗文森
本文对常用中文电子资源检索系统的用户访问日志功能进行了比较,分析了各系统可以实现的功能、记录内容、表现形式,结合Counter标准,探讨电子资源用户日志系统的建立模式。
关键词:
数字资源 用户 访问日志 比较分析
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除