标题
  • 标题
  • 作者
  • 关键词
登 录
当前IP:忘记密码?
年份
2024(9981)
2023(14564)
2022(12746)
2021(12142)
2020(10016)
2019(23440)
2018(23298)
2017(44912)
2016(24249)
2015(27393)
2014(27193)
2013(26434)
2012(23847)
2011(21180)
2010(21082)
2009(18771)
2008(17905)
2007(15163)
2006(12905)
2005(10722)
作者
(66871)
(55608)
(55286)
(52551)
(35305)
(26698)
(25175)
(22128)
(21212)
(19695)
(19015)
(18469)
(17465)
(17378)
(17303)
(16766)
(16668)
(16619)
(15870)
(15838)
(13690)
(13545)
(13406)
(12793)
(12480)
(12303)
(12253)
(12167)
(11138)
(11030)
学科
(92749)
经济(92642)
管理(68669)
(64694)
(54765)
企业(54765)
方法(48282)
数学(42537)
数学方法(41783)
(24257)
中国(23140)
(22679)
业经(20623)
(19967)
理论(17985)
地方(17831)
农业(16339)
(15683)
(15569)
贸易(15559)
技术(15279)
(15115)
(15044)
财务(14962)
财务管理(14930)
(14584)
环境(14277)
企业财务(14101)
(13023)
教育(12243)
机构
大学(330866)
学院(330564)
管理(135507)
(125442)
经济(122663)
理学(118993)
理学院(117747)
管理学(115210)
管理学院(114626)
研究(102101)
中国(74417)
(69077)
科学(65448)
(55307)
业大(50708)
(50455)
(49191)
中心(47611)
(46333)
财经(45663)
研究所(45351)
(43923)
师范(43492)
北京(42912)
(41715)
农业(39466)
(38242)
(37936)
经济学(37206)
技术(36886)
基金
项目(237742)
科学(187256)
研究(174033)
基金(171976)
(149468)
国家(148219)
科学基金(128757)
社会(107479)
社会科(101842)
社会科学(101814)
(93700)
基金项目(91476)
自然(85425)
自然科(83495)
自然科学(83476)
教育(82255)
自然科学基金(81927)
(78631)
编号(72288)
资助(71314)
成果(56943)
重点(52835)
(52036)
(49920)
(49632)
课题(49072)
创新(46416)
科研(45657)
教育部(45054)
大学(44992)
期刊
(126862)
经济(126862)
研究(89526)
中国(57929)
学报(52404)
管理(48552)
科学(47299)
(44585)
(41552)
教育(41324)
大学(40350)
学学(37315)
技术(32915)
农业(31576)
(22438)
金融(22438)
业经(22003)
图书(21937)
财经(20929)
经济研究(20422)
(17769)
问题(16327)
(16320)
科技(16267)
技术经济(15964)
理论(15734)
(15385)
统计(15248)
书馆(14869)
图书馆(14869)
共检索到457834条记录
发布时间倒序
  • 发布时间倒序
  • 相关度优先
文献计量分析
  • 结果分析(前20)
  • 结果分析(前50)
  • 结果分析(前100)
  • 结果分析(前200)
  • 结果分析(前500)
[期刊] 图书馆杂志  [作者] 沈立力  姜鹏  王静  
Google AI团队发布的BERT模型在多项自然语言处理任务中取得了研究成果,但在中文文献自动分类领域尚有待探索。本文旨在探索BERT_(base)中文基础模型在中文社科、科技期刊文献分类上的实际分类效果,指出模型在实际应用中存在的问题并提出解决方法。本文选取R大类(医药、卫生)、TG大类(金属学与金属工艺)、F大类(经济)、J大类(艺术)共1 745 000条数据作为训练语料,并以另外9 610条数据作为测试样本,利用BERT模型分别对社科、科技期刊文献进行分类研究。测试结果表明BERT模型在社科文献中的四级准确率为76.95%,科技文献为68.55%。之后引入惩罚策略,为实际工作中免检数据阈值的设定提供参考。BERT_(base)模型在《全国报刊索引》实际分类标引工作中有一定可行性,基本满足当前网络环境下中文文献自动分类的需求。
[期刊] 情报学报  [作者] 王永成  张坤  
本文对作者开发的两个中文文献自动分类系统的工作原理、方法、数学模型和实现技术进行了比较全面的介绍。
[期刊] 情报理论与实践  [作者] 罗鹏程   王继民   聂磊  
[目的/意义]探索有效提高文献资源自动层次分类和跨语言分类效果的方法。[方法/过程]将文献资源分类视为分类号生成任务,利用图书馆编目数据构造训练集和测试集,基于ChatGLM 3、Llama 2等大语言模型在训练集上进行模型的高效微调,并在中英文测试集上分析模型的分类效果。[结果/结论]在不同的输出格式中,微调大语言模型使其直接输出分类号,可以获得最优的分类效果;随着训练样本数量的增加,微调后的大语言模型分类效果不断提升;基于22000个样本微调的大语言模型在中图法一级类目和完整分类号的准确率分别可达0.8848、0.5076,优于通用大语言模型;在中文文献上训练的大语言模型可以有效地分类英文文献,分类效果仅比中文文献略低;大语言模型生成的分类号中有少量不是有效的中图分类号。
[期刊] 情报学报  [作者] 叶新明  
本文通过对现有中文自动分词算法的分析,提出了适于中文文献自动分类的自动分词算法。该算法通过建立机读词表,以《中图法》作为分类标准,对中文文献实现了自动分类。通过对财政金融类文献的测试,其准确率可达79%。
[期刊] 情报理论与实践  [作者] 叶新明  
概要性地论述了中文文献自动分类的问题,提出了中文文献自动分类的一般模式, 同时也分析了要实现中文文献自动分类目前所面临的一些实际问题。
[期刊] 情报学报  [作者] 吴俊  程垚  郝瀚  艾力亚尔·艾则孜  刘菲雪  苏亦坡  
专业术语的识别与自动抽取对于提升专业信息检索精度,构建领域知识图谱发挥着重要基础性作用。为进一步提升中文专业术语识别的精确率和召回率,提出一种端到端的不依赖人工特征选择和领域知识,基于谷歌BERT预训练语言模型及中文预训练字嵌入向量,融合BiLSTM和CRF的中文专业术语抽取模型。以自建的1278条深度学习语料数据为实验对象,该模型对术语提取的F1值为92.96%,相对于传统的浅层机器学习模型(如左右熵与互信息算法、word2vec相似词算法等)和BiLSTM-CRF深度神经网络模型的性能有较为显著的提升。本文也给出了模型应用的具体流程,能够为中文专业术语库的构建提供实践指南。
[期刊] 图书馆杂志  [作者] 李秦  杨文建  谭琳  
探讨相关文献三种实现机制的特点,构建更有效的中文科技文献相关性数据库。借鉴完全内容特征算法,基于词表的分类向量空间模型进行预处理相关文献,并以冶金工业领域为例构建中文科技文献相关性数据库。通过结合系统判定和人工判定结果的对比分析、系统和系统之间的判定结果的对比,分析了基于词表的分类向量空间模型的相关性判定效果,结果表明其具有较高的准确率。基于完全内容特征算法判定相关文献有利于完善知识发现系统功能,提高知识服务水平。
[期刊] 图书馆论坛  [作者] 李湘东  胡逸泉  黄莉  
探索对多种类型文献进行混合分类组织时LDA主题模型的可行性及优越性。以图书、期刊、网页等不同类型的馆藏文献作为实验对象,分别采用LDA主题模型与VSM模型对实验材料进行建模,采用SVM算法实现文本混合自动分类。仿真实验表明:LDA主题模型相对VSM模型具有一定优势,混合自动分类准确率最大差距达19.9%;图书与学术性期刊、网页与非学术性期刊之间的混合分类效果较好,分类准确率可达72%以上。实验证明LDA主题模型对实现多种类型文献统一组织具有较高的可行性和适用性。
[期刊] 图书馆学研究  [作者] 孟梦  黄晴  
RDA已被各国广泛接受,但在中国国内尚未推广实施。RDA与现有中文编目规则在中文期刊独有的著录要素中存在很多差异。用内容类型、媒介类型、载体类型替代一般资料标识(GMD)基本可行,编制样例数据可以验证RDA在中文期刊著录中的适用性。RDA本地化规则的制定还有很多细节需要完善。
[期刊] 会计之友  [作者] 王海洪  吕登辉  任美  王婧  王盈盈  
数字化时代,审计领域专家学者展开了对"大数据审计"的研究,文章通过分析"中国知网(CNKI)—中国期刊网"检索到的发表于2013—2020年有关"大数据审计"的相关核心期刊论文和硕博论文,发现大数据审计受到肯定,专家学者认为大数据技术在内部审计、社会审计、政府审计中都非常有必要。在理论上,大数据审计要确立全量信息、持续审计、风险导向、智能审计、以人为本的思维等,其中风险导向审计模式备受研究关注。专家学者认为风险导向审计模式仍然是大数据审计的基本模式,只是风险评估理念将由假设验证模式转变到数据挖掘模式。在实务上,专家学者提出运用网络爬虫技术、聚类分析、机器学习等技术实施各种领域的大数据审计,审计部门要构建大数据云审计平台,保障实施全面的事前、事中、事后审计。
[期刊] 情报学报  [作者] 杨建林  
本文提出了几个可以改善中文自动文摘系统的文摘效果的措施 :1 将字频统计方法和词频统计方法有机结合起来 ;2 进一步研究人工文摘中理解性文摘句的形成机理 ,完善仿人算法 ;3 将自动聚类的方法引入自动文摘研究。
[期刊] 情报学报  [作者] 于光  于达仁  
本文建立了描述期刊文献发表过程的机理模型—差分方程及其边界条件,通过一个最简单情况下的特解例示了该方程在揭示文献发表内在物理本质方面的有效性,为定量地研究文献发表过程提供了基本工具
[期刊] 情报学报  [作者] 何浩  杨海棠  
本文介绍一种基于n gram技术的、与语言无关的文献分类方法K meansaxiales (KMA) ,及其在中文文献自动分类中的应用。这种方法将文献转换成由n gram(n个连续的字符 )频次构成的向量。为压缩存储空间、提高处理速度 ,我们运用哈希函数将n gram映射为哈希码 ,对文献的分析实际上以哈希码频次为基础运行。采用KMA算法 ,我们对一个中文数据库进行了自动分类的实验研究 ,在比较实验结果的基础上 ,我们对KMA算法初始参数的选择进行了初步探讨。
[期刊] 中国图书馆学报  [作者] 余肖生  周宁  张芳芳  
所谓图像自动分类是指利用图像自动分类器把待分类的图像分配到预定义的图像类的过程。用于图像自动分类的方法有多种。其中K近邻算法是一种基于实例学习的方法,是一种较理想的自动分类器。本文在它的基础上提出了图像自动分类模型,整个图像自动分类过程包括图像预处理、特征表示、机器学习和图像分类4个步骤。表1。图1。参考文献13。
[期刊] 图书馆杂志  [作者] 余馨玲  常娥  
古诗词地名实体识别不仅有助于深度挖掘古诗词文本之间的关联,而且有助于绘制中国诗歌版图分布,推动空间维度的中国古典文学研究。文章围绕南京城系统采集有关古诗词数据,采用BIOES方法进行地名实体标注。针对古诗词领域训练数据匮乏、以字代词等问题,提出一种采用数据增强方法,同时融合预训练模型与条件随机场方法的古诗词地名识别模型,简称DA-BERT-CRF模型。文章将训练数据采用实体交叉互换方法进行数据增强处理,然后通过预训练模型BERT得到古诗词地名的上下文语义信息,最后利用条件随机场CRF实现地名标签约束并生成全局最优地名序列。文章提出的DA-BERT-CRF模型十折交叉实验平均精确率、平均召回率和平均F值分别为86.49%、90.44%、88.35%。
文献操作() 导出元数据 文献计量分析
导出文件格式:WXtxt
作者:
删除