搜索文献-EPS

年份: 2024(4284); 2023(6258); 2022(5195); 2021(5023); 2020(4114); 2019(9152); 2018(9027); 2017(16141); 2016(9248); 2015(10512); 2014(10687); 2013(10290); 2012(9553); 2011(8638); 2010(8563); 2009(7651); 2008(7371); 2007(6638); 2006(5840); 2005(5228)

作者: 王(26735); 张(22084); 李(21859); 刘(20792); 陈(13925); 杨(10821); 晓(10220); 赵(8478); 周(8477); 华(7977); 吴(7651); 林(7416); 文(7352); 丽(6933); 明(6819); 志(6722); 伟(6708); 徐(6363); 孙(6347); 黄(6342); 平(5597); 玉(5542); 朱(5114); 军(5069); 红(5035); 建(4927); 郭(4874); 胡(4818); 艳(4593); 春(4505)

学科: 济(34689); 经济(34654); 管理(20975); 业(16520); 地方(13982); 学(12773); 企(12584); 企业(12584); 农(9864); 中国(9554); 方法(9407); 地方经济(7885); 业经(7383); 数学(7350); 理论(7295); 数学方法(7222); 农业(6976); 财(6956); 和(6297); 教育(6147); 环境(6124); 教学(5878); 制(5539); 经济学(4755); 发(4394); 融(4325); 金融(4321); 贸(4308); 贸易(4301); 银(4273)

机构: 学院(123509); 大学(122415); 研究(42692); 济(39782); 管理(39691); 经济(38535); 理学(32934); 中国(32348); 理学院(32312); 管理学(31511); 管理学院(31268); 科学(30359); 京(27160); 所(22286); 农(22081); 江(21518); 范(21449); 师范(21221); 中心(20391); 研究所(20145); 财(19301); 业大(18714); 州(17582); 农业(17227); 师范大学(16970); 北京(16862); 技术(16704); 院(15913); 省(15174); 财经(14749)

基金: 项目(80626); 科学(61942); 研究(60987); 基金(54411); 家(47683); 国家(47210); 科学基金(39476); 社会(34931); 省(34381); 社会科(32691); 社会科学(32684); 基金项目(29399); 划(28514); 教育(28464); 编号(27341); 自然(25548); 自然科(24817); 自然科学(24814); 自然科学基金(24301); 成果(23087); 资助(20543); 课题(19526); 发(19006); 重点(18830); 创(16555); 年(16520); 部(15822); 项目编号(15806); 创新(15463); 科研(15343)

期刊: 济(51710); 经济(51710); 研究(36023); 中国(29752); 学报(22738); 教育(21689); 农(19972); 科学(18869); 财(16941); 大学(15848); 学学(14029); 农业(13315); 管理(13069); 图书(12516); 技术(11728); 书馆(9279); 图书馆(9279); 融(9260); 金融(9260); 业经(9045); 资源(8110); 版(7412); 业(7109); 经济研究(6983); 职业(6709); 发(6688); 财经(6610); 问题(6596); 坛(6527); 论坛(6527)

全选本页取消本页

共检索到194789条记录

发布时间倒序

发布时间倒序
相关度优先

文献计量分析

结果分析(前20)
结果分析(前50)
结果分析(前100)
结果分析(前200)
结果分析(前500)

以《汉学引得丛刊》为领域词表的先秦典籍自动分词探讨

[期刊] 图书情报工作 [作者] 黄水清王东波何琳

[目的/意义]在人文计算兴起这一背景下,为了更加深入和精准地从古代典籍中挖掘出相应的知识,针对先秦文献进行自动分词的探究。[方法/过程]基于《汉学引得丛刊》中的《春秋经传注疏引书引得》制定词汇表,在由《春秋左氏传》和《晏子春秋》所构成的训练和测试语料上,通过条件随机场模型,结合使用统计和人工内省方法确定的特征模板,完成对先秦典籍进行自动分词的探究。[结果/结论]在先秦典籍自动分词的整个流程基础上,得到简单特征模板、内部特征模板和组合特征模板下的自动分词模型,最好的分词模型调和平均值达到97.47%,具有较强的推广和应用价值。在构建自动分词模型的过程中,通过融入内部和外部的特征知识,模型的精确率...

关键词：人文计算《汉学引得丛刊》条件随机场模型特征模板

基于多特征知识的先秦典籍词性自动标注研究

[期刊] 图书情报工作 [作者] 王东波黄水清何琳

[目的 /意义]先秦典籍在古代典籍中的地位极为重要。本文提出对先秦典籍进行词性自动标注的解决方法,以便更加准确地挖掘先秦典籍中的潜在知识。[方法 /过程]通过条件随机场模型,结合统计方法确定组合特征模板,并最终得到针对先秦典籍的词性自动标注算法模型。[结果 /结论]在先秦典籍自动分词的整个流程基础上,得到简单特征模板、组合特征模板下的词性自动标注模型,基于组合特征模板的词性标注模型调和平均值F达到94.79%,具有较强的推广和应用价值。在构建词性自动标注模型的过程中,通过融入字词结构、词语拼音和字词长度的

关键词：词性标注先秦古籍条件随机场模型特征模板古文信息处理

面向数字人文的融合外部特征的典籍自动分词研究——以sikuBERT预训练模型为例

[期刊] 图书馆论坛 [作者] 刘畅王东波胡昊天张逸勤李斌

数字人文研究为古籍文献的深度开发与展示提供了良好的平台。精准的文本分词是研究者在古籍文献处理中需要优先解决的问题。文章基于记载春秋至魏晋时期历史的最具有代表性的6部官修史籍构建古文分词语料库，结合预训练和词典信息融合两种策略运用4种深度学习模型进行多组对比实验，以确定不同模型的适用范畴。在此基础上开发面向繁体古文的分词工具，为从事数字人文的研究者提供简单有效的文本分词方法。

关键词：自动分词数字人文 sikuBERT 预训练技术词典信息融合

面向数字人文的先秦两汉典籍自动标点研究——以SIKU-BERT预训练模型为例

[期刊] 图书馆论坛 [作者] 赵连振张逸勤刘江峰王东波冯敏萱李斌

古籍自动标点研究成为推动古籍研究在人文社科领域发展的关键环节。文章利用SIKU-BERT模型，以中国哲学书电子化计划古籍数据中的先秦两汉典籍为数据来源进行自动标点模型训练，探索了基于深度学习技术的古文自动标点模型。实验结果表明，SIKU-BERT模型对先秦两汉典籍自动标点的整体效果均比较优越，对于书名号、冒号、句号以及逗号，预测表现良好，尤其是书名号与问号标签的识别准确率、召回率与F1值表现最为优越，均达到95%以上。文章验证了BERT模型在古籍文本自动标点中的可行性，有助于推动数字人文在古籍研究中的发展。

关键词：数字人文汉语典籍自动标点 SIKU-BERT模型

基于支持向量机的先秦诸子典籍自动分类研究

[期刊] 图书情报工作 [作者] 王东波何琳黄水清

[目的 /意义]在人文计算兴起这一背景下,针对先秦诸子典籍进行自动分类的探究,以更加深入和精准地从古代典籍中挖掘出相应的知识。[方法 /过程]基于《论语》《老子》《管子》《庄子》《孙子》《韩非子》《孟子》《荀子》和《墨子》9种先秦诸子典籍构成的训练和测试语料,采用支持向量机技术,提取TF-IDF、信息增益、卡方统计和互信息为特征,完成针对先秦诸子典籍的自动分类实验。[结果 /结论]基于先秦诸子典籍得到的自动分类模型调和平均值能达到99.21%,效果较好,具有较强的推广和应用价值。

关键词：先秦典籍支持向量机自动分类古文信息处理

基于深度学习的先秦典籍问句自动分类研究

[期刊] 情报学报 [作者] 王东波高瑞卿沈思李斌

近年来,自动问答系统已成为机器学习、信息检索和自然语言处理领域的研究热点。问句分类作为问答系统要处理的第一步,其分类结果的好坏直接影响问答系统的质量,但目前大部分问句分类研究集中在现代汉语领域,针对古文相关内容的问句分类研究相对较少。本文从问句分类的概念出发,构建了古文文献问句分类体系,然后利用TF-IDF提取类别特征词,先后利用支持向量机、条件随机场、深度学习模型完成针对先秦10部典籍的问句自动分类实验。结果表明,3种分类模型中,使用Bi-LSTM模型分类效果最好,在本文提出的7种类别上,达到调和平均值94.78%,具有较强的推广和应用价值。

关键词：先秦典籍数字人文问句分类特征提取深度学习

基于CRFs和词典信息的中古汉语自动分词

[期刊] 数据分析与知识发现 [作者] 王晓玉李斌

【目的】验证中古时期分词一致性和语料类别对CRFs分词效率的影响,在此基础上进一步提高分词效率,降低人工校对的工作量。【方法】以中古时期的史书、佛经、小说类语料为例,针对中古汉语的自动分词问题,优化分词原则,运用CRFs模型和词典相结合的方法,消除中古汉语人工分词结果中易出现的分词不一致问题;同时在CRFs分词中引入字符分类、字典信息两种特征,并通过对比实验选取每种特征最合适的分词模板。【结果】实验结果显示,分词结果的总F值在封闭测试中达到99%以上,开放测试的综合测试中也达到89%-95%。【局限】分词

关键词： CRFs模型分词一致性中古汉语自动分词

国外叙词表宏观结构分析——以理学领域叙词表为例

[期刊] 图书馆论坛 [作者] 张士男

叙词表结构的属性异构为开展知识组织体系的集成服务带来障碍。文章以理学叙词表为例,梳理叙词表属性字段,在此基础上提出知识组织体系集成建设元数据框架,采用核心元素集与扩展元素集共建的设计思路。

关键词：知识组织体系叙词表结构统计分析

面向先秦典籍的历史事件基本实体构件自动识别研究

[期刊] 国家图书馆学刊 [作者] 王东波高瑞卿沈思李斌

结合数字人文的数据获取、标注和分析方法,识别和挖掘先秦典籍中历史事件基本实体构件具有重要的推广和使用价值。本文将先秦时期极具代表性的《公羊传》《谷梁传》《左氏春秋》《吕氏春秋》《晏子春秋》等作为处理语料,对其中的人名、地名、时间实体等进行内部数量统计和外部特征分析,构建特征模板。在已有的465,197个词汇的基础上进行实体抽取训练与测试,选出人名、地名、时间实体识别效果的调和平均数最大(87.37%)的模型,并将其应用于《国语》语料以便检验识别效果,同时将以上过程进行可视化展现。

关键词：条件随机场数字人文命名实体先秦语料库

自动抽词与自动分词

[期刊] 图书馆杂志 [作者] 张琪玉

自动抽词与自动分词既有紧密联系又有重大差别。自动抽词标引除编制题内关键词索引外,至今没有突破性进展,主要是检准率太低。本文指出自动抽词标引研究注重在各种更有效的算法的寻找,而忽视对相关问题的深入、系统的研究,是其进展缓慢的重要原因之一,并具体列举了一些相关问题。

关键词：自动抽词自动分词

基于航天叙词表的领域本体半自动化构建研究

[期刊] 情报理论与实践 [作者] 丁晟春傅柱

文章在基于叙词表的本体构建方法基础上,从该方法本体构建现状研究入手,针对基于叙词表向领域本体转化的一系列问题,如叙词表词间一些不确定关系表示,构建过程的OWL关系表示的细化以及叙词表转化为本体后的维护扩展等,对本体和叙词表的相关知识进行论述,并利用OWL语言来表示和描述叙词表的叙词及词间的相关关系,提出从叙词表向本体转化的理论实践方法。

关键词：叙词表领域本体构建

网络环境中领域叙词表自动编制方案与关键技术研究

[期刊] 情报理论与实践 [作者] 杜慧平朱晓霞何琳

提出了一套适用于网络环境中信息资源组织用领域叙词表自动编制方案,系统地阐述了自动编制过程中的步骤,并介绍了其中的关键技术,包括词表收词选词原则与方法,等同关系、等级关系和相关关系的自动识别方法和技术。最后指出,只有不断地维护和更新才能保证词表具有永久的生命力。

关键词：网络环境叙词表信息抽取信息组织

基于EM算法的汉语自动分词方法

[期刊] 情报学报 [作者] 李家福张亚非

汉语自动分词是中文信息处理中的基础课题。本文首先对汉语分词的基本概念与应用 ,以及汉语分词的基本方法进行了概述。接着引出一种根据词的出现概率、基于极大似然原则构建的汉语自动分词的零阶马尔可夫模型 ,并重点剖析了EM(Expectation Maximization)算法 ,对实验结果进行了分析。最后对算法进行了总结与讨论。

关键词：分词汉语 EM算法语料库 HMM

数字人文视域下先秦典籍植物知识挖掘与组织研究

[期刊] 图书情报工作 [作者] 吴梦成林立涛齐月黄水清王东波刘浏

[目的/意义]挖掘和组织先秦典籍中的植物知识,构建先秦典籍植物知识图谱,对认识我国古代人民社会和生活状态等具有重要意义。[方法/过程]对先秦典籍中植物词进行详尽标注与计量分析;基于条件随机场(CRF)和多种深度学习模型构建古汉语植物命名实体识别模型,比较分析各模型性能以确定最优模型;设计面向知识图谱的古汉语植物知识组织模式。[结果/结论]基于古汉语预训练语言模型SikuRoBERTa构建的古汉语植物命名实体识别模型性能最优,调和平均值达85.44%,为基于实体的植物知识挖掘提供了有效方法;所构建的先秦典籍植物知识图谱可实现对先秦典籍中植物实体及其关联知识的聚合与可视化呈现。

关键词：数字人文先秦典籍植物命名实体深度学习知识图谱

叙词表词汇控制机制变革的探讨

[期刊] 图书馆杂志 [作者] 薛春香侯汉清

新的信息环境引发了检索机制的变革,为适应网络环境中标引和检索的需要,叙词表词汇控制机制发生了相应变化。文章从词类控制、词量控制、词形控制、词义控制、词间关系控制、先组度控制等方面对网络环境下叙词表编制中的词汇控制的变化进行探讨。文章认为网络环境下叙词表词汇控制机制应向受控语言自然语言化方向发展,表现出选词和规范化控制的弱化、结构化控制的强化、控制技术的智能化以及词汇控制与互操作相结合等特点。

关键词：叙词表编制词汇控制受控语言知识组织系统互操作

首页
下一页
尾页
第 页

文献操作() 导出元数据文献计量分析

全选

导出文件格式：WXtxt

作者：

删除

推荐搜索

基于主题词表与百科知识相融合的领域本体自动构建研究机编古籍索引探讨——以《道德经》语词索引自动编纂为例《中国分类主题词表》的修订方案和方法的探讨网络环境下叙词表编制系统中的并发机制探讨面向数字人文的中国古代典籍词性自动标注研究——以SIKU-BERT预训练模型为例数字人文视域下典籍动物命名实体识别研究——以Siku BERT为例基于专长词表的图情领域专家检索与评价基于领域知识词网的学科知识簇实现初探——以武汉理工大学自动化学科知识簇建设为例教育领域信息化的解释学探讨——兼论教育领域信息化本体论构建基于领域情感词典的用户生成内容有用性评价研究——以豆瓣读书为例