标题
  • 标题
  • 作者
  • 关键词
登 录
当前IP:忘记密码?
年份
2024(8495)
2023(12323)
2022(10932)
2021(10278)
2020(8608)
2019(20031)
2018(19764)
2017(38713)
2016(20677)
2015(23304)
2014(23033)
2013(22445)
2012(20263)
2011(17965)
2010(17483)
2009(15476)
2008(14593)
2007(12031)
2006(10093)
2005(8145)
作者
(56316)
(46822)
(46344)
(44193)
(29736)
(22413)
(21196)
(18645)
(17823)
(16320)
(16084)
(15469)
(14533)
(14518)
(14408)
(14089)
(14007)
(13943)
(13280)
(13179)
(11466)
(11141)
(11138)
(10702)
(10427)
(10312)
(10191)
(10138)
(9327)
(9268)
学科
(79586)
经济(79498)
管理(59701)
(56465)
(47666)
企业(47666)
方法(41976)
数学(37087)
数学方法(36575)
(20599)
(20329)
中国(18953)
业经(17503)
(16507)
地方(15316)
农业(13870)
(13760)
贸易(13754)
(13740)
财务(13672)
财务管理(13644)
理论(13587)
(13355)
技术(13218)
企业财务(12901)
(12845)
环境(12759)
(12085)
(11256)
(10096)
机构
大学(281473)
学院(280160)
管理(118438)
(108839)
经济(106550)
理学(104751)
理学院(103683)
管理学(101757)
管理学院(101259)
研究(85654)
中国(62164)
(58056)
科学(54364)
(47763)
业大(43055)
(41676)
(40644)
中心(39951)
财经(39947)
(37492)
研究所(37441)
(36618)
(36360)
师范(36025)
北京(35675)
农业(32675)
经济学(32249)
(31979)
(30967)
商学(30460)
基金
项目(206571)
科学(163287)
基金(151157)
研究(150758)
(130938)
国家(129887)
科学基金(113401)
社会(94654)
社会科(89749)
社会科学(89724)
基金项目(81461)
(80510)
自然(75256)
自然科(73539)
自然科学(73522)
自然科学基金(72160)
教育(69713)
(67618)
编号(61855)
资助(61811)
成果(47754)
(45557)
重点(45429)
(43329)
(43005)
课题(40978)
创新(40348)
科研(39973)
教育部(39504)
大学(39021)
期刊
(107508)
经济(107508)
研究(75974)
中国(45752)
学报(43624)
管理(41173)
科学(40084)
(36564)
(35597)
大学(33721)
学学(31732)
教育(29712)
农业(26101)
技术(25771)
业经(18751)
(18345)
金融(18345)
财经(18291)
经济研究(17118)
(15468)
图书(15429)
问题(14170)
理论(14051)
科技(14003)
技术经济(13403)
实践(13167)
(13167)
(12807)
(12722)
资源(12390)
共检索到378386条记录
发布时间倒序
  • 发布时间倒序
  • 相关度优先
文献计量分析
  • 结果分析(前20)
  • 结果分析(前50)
  • 结果分析(前100)
  • 结果分析(前200)
  • 结果分析(前500)
[期刊] 图书情报工作  [作者] 钱智勇  周建忠  童国平  苏新宁  
研究古代和现代汉语的自动分词标注技术,用隐马尔科夫模型对《楚辞》进行自动分词标注实验,通过比较分词后的标注词性概率,取最大概率作为最后的分词和词性标注结果,并在其中使用全切分和加值平滑算法。经过实验调整分词标注程序模块和参数,最终得到一个分词标注辅助软件,其开放测试的分词F值为85%,标注F值为55%,高出基准F值14个百分点。
[期刊] 情报理论与实践  [作者] 杨建林  张国梁  
An algorithm for automatic segmentation of Chinese word,which is an improved version of the minimum matching algorithm,is put forward.The key idea of the algorithm is to optimize the word bank and the matching process to enhance the speed and accuracy of word segmentation.By integrating the case ban...
[期刊] 情报学报  [作者] 徐飞  叶文豪  宋英华  
词性自动标注的准确率和召回率直接影响到后续食品安全事件各个层面知识和应对策略挖掘的整体效果,不仅直接影响食品安全事件中术语、实体抽取的性能,而且在一定程度上决定了与食品安全事件相关的分类、聚类和关联知识挖掘的精准度。本文分别基于CRF、RNN、BiLSTM和BiLSTM-CRF等传统机器学习模型与深度学习模型对食品安全事件文本进行词性自动标注实验。四十组实验结果表明,在未加入任何人工特征的条件下,深度学习模型的标注调和平均值高于传统的条件随机场模型,其中RNN和BiLSTM的调和平均值分别高出了2.43%和3.93%。而有机融合了BiLSTM和条件随机场模型两者最优特征的BiLSTM-CRF模型整体性能达到了最优,其中调和平均值比BiLSTM高出了7.12%,并且其中最优模型的调和平均值达到了95.89%。
[期刊] 图书情报工作  [作者] 王东波  黄水清  何琳  
[目的 /意义]先秦典籍在古代典籍中的地位极为重要。本文提出对先秦典籍进行词性自动标注的解决方法,以便更加准确地挖掘先秦典籍中的潜在知识。[方法 /过程]通过条件随机场模型,结合统计方法确定组合特征模板,并最终得到针对先秦典籍的词性自动标注算法模型。[结果 /结论]在先秦典籍自动分词的整个流程基础上,得到简单特征模板、组合特征模板下的词性自动标注模型,基于组合特征模板的词性标注模型调和平均值F达到94.79%,具有较强的推广和应用价值。在构建词性自动标注模型的过程中,通过融入字词结构、词语拼音和字词长度的
[期刊] 图书馆杂志  [作者] 张琪玉  
自动抽词与自动分词既有紧密联系又有重大差别。自动抽词标引除编制题内关键词索引外,至今没有突破性进展,主要是检准率太低。本文指出自动抽词标引研究注重在各种更有效的算法的寻找,而忽视对相关问题的深入、系统的研究,是其进展缓慢的重要原因之一,并具体列举了一些相关问题。
[期刊] 情报学报  [作者] 李家福  张亚非  
汉语自动分词是中文信息处理中的基础课题。本文首先对汉语分词的基本概念与应用 ,以及汉语分词的基本方法进行了概述。接着引出一种根据词的出现概率、基于极大似然原则构建的汉语自动分词的零阶马尔可夫模型 ,并重点剖析了EM(Expectation Maximization)算法 ,对实验结果进行了分析。最后对算法进行了总结与讨论。
[期刊] 情报理论与实践  [作者] 颜端武  李兰彬  曲美娟  
文章提出一种基于N-gram复合分词的领域概念自动获取方法,在中文分词的基础上进行N元复合切分,通过建立一系列过滤规则,提取候选领域概念;然后以改进的TF-IDF作为衡量领域相关性的统计特征值,计算候选概念的领域相关性;最后进行人工辅助判断与筛选。以航空发动机领域语料为样本进行了实践探索,实验结果表明该方法能有效抽取专业领域概念,具有较强的实用性。
[期刊] 数据分析与知识发现  [作者] 王晓玉  李斌  
【目的】验证中古时期分词一致性和语料类别对CRFs分词效率的影响,在此基础上进一步提高分词效率,降低人工校对的工作量。【方法】以中古时期的史书、佛经、小说类语料为例,针对中古汉语的自动分词问题,优化分词原则,运用CRFs模型和词典相结合的方法,消除中古汉语人工分词结果中易出现的分词不一致问题;同时在CRFs分词中引入字符分类、字典信息两种特征,并通过对比实验选取每种特征最合适的分词模板。【结果】实验结果显示,分词结果的总F值在封闭测试中达到99%以上,开放测试的综合测试中也达到89%-95%。【局限】分词
[期刊] 情报学报  [作者] 郭祥昊  钟义信  杨丽  
本文提出了一种快速汉语自动分词算法。其主要思想是利用汉语中两字词占75%的统计规律,提出了两字词根和两字词簇的概念。算法把三音节以上的词用两字词簇来压缩处理,也就是把长词的扫描范围限定在词汇量很小的词簇内,从而不仅提高了分词速度,而且彻底解决了传统最大匹配分词算法中最大匹配词长的设定问题。另外,本文还提出了用两字词簇快速检测交叉歧义的算法。本文的分词算法简洁、速度快、易于实现
[期刊] 图书情报工作  [作者] 陆泉  陈静  丁恒  
以现存的大量图像社会标签为基础,设计基于社会标签的图像情感自动分类标注模型,提出图像社会标签对情感的贡献度、区分度以及标签在情感维度上的权重3个因子及计算方法,实现图像5种基本情感语义的分类标注。在实际社会网络数据集上进行验证实验,结果表明建立的模型方法在自动标注图像情感语义方面具有较高的准确性和应用性。同时还发现,实际数据集中情感分布差异与复合情感对图像自动标注具有影响。
[期刊] 图书馆杂志  [作者] 郭立暄  
明崇祯十一年来圣源刻《楚辞述注》附《九歌图》版画,陈洪绶绘,首洪绶序为其自书上版,刻绘兼美,现存有初印、增刻两种文本书眉均刻有评语,多出来氏,而人数多寡不同。本文利用《萧山来氏宗谱》证明,参评来氏诸人均属一族,其中陈氏好友来风季等为大房一支,陈氏妇翁来斯行等为四房一支。并推测,由于此本出版后,颇受好评,诸子弟以能参与此书批注为荣,纷纷附丽,从而形成此书两种文本。
[期刊] 中国图书馆学报  [作者] 邓三鸿  王昊  秦嘉杭  苏新宁  
中文书目机器自动标引是数字图书馆建设中亟待解决的关键问题之一。本文试图将条件随机场(CRFs)序列标注机器学习算法引入到关键词抽取中,建立面向图书内容、基于字角色标注的中文书目关键词标引模型。将图书内容转化为字序列,进而提出构建关键词角色空间模型和综合利用字序列上下文特征的设计思路。通过实验,从题名和内容提要中分别自动抽取关键词,论证该模型的合理性和实用性。
[期刊] 图书情报工作  [作者] 钱智勇  
结合楚辞古籍文献的特点,分析楚辞书目实体款目相关性的主要内容及款目间的关联关系,利用本体建模元语定义楚辞书目的类、属性、属性关系和实例,构建楚辞书目本体,实现楚辞书目语义关联检索。通过实例列举直接语义关联检索、间接语义关键检索和语义智能推理检索功能及其实现,并对检索结果的关联程度进行数据统计对比分析。最后提出将楚辞数字目录与相关古籍内容关联的进一步构想。
[期刊] 情报学报  [作者] 尹锋  
应用神经网络进行汉语自动分词研究是中文信息处理领域的重要课题。本文从分析神经网络的一个主要模型和算法入手,阐述了基于神经网络的汉语自动分词系统的设计方法,较详细地介绍了该系统的实验结果,并给出了必要的分析。
[期刊] 情报学报  [作者] 张民  李生  王海峰  赵铁军  王铁志  
汉语自动分词是中文信息处理的首要工作。衡量一个分词系统性能优劣指标主要有两个,一个是切分的速度,一个是切分的精度。本文提出的基于知识评价的汉语自动分词算法,可大大提高系统的切分速度,而且利用基于复杂特征集的规则、模式等可处理掉大部分切分歧义。最后,本文对消歧提出了一些设想。
文献操作() 导出元数据 文献计量分析
导出文件格式:WXtxt
作者:
删除