标题
  • 标题
  • 作者
  • 关键词
登 录
当前IP:忘记密码?
年份
2024(6749)
2023(9859)
2022(8836)
2021(8427)
2020(7068)
2019(16621)
2018(16615)
2017(32911)
2016(17766)
2015(19925)
2014(19911)
2013(19728)
2012(17904)
2011(15929)
2010(15674)
2009(14031)
2008(13418)
2007(11548)
2006(9987)
2005(8558)
作者
(49630)
(41126)
(40941)
(39015)
(26184)
(19673)
(18577)
(16357)
(15709)
(14612)
(14121)
(13769)
(13001)
(12933)
(12754)
(12464)
(12321)
(12243)
(11644)
(11629)
(10236)
(9999)
(9788)
(9382)
(9191)
(9122)
(9058)
(9038)
(8268)
(8036)
学科
(71210)
经济(71136)
管理(49630)
(47336)
(38889)
企业(38889)
方法(35450)
数学(31117)
数学方法(30798)
(18253)
中国(17764)
(17594)
(15614)
地方(15308)
业经(14869)
农业(12629)
(12280)
贸易(12272)
(11903)
理论(11639)
(11321)
(10969)
(10859)
环境(10849)
技术(10811)
财务(10802)
财务管理(10783)
企业财务(10156)
教育(9549)
(9442)
机构
大学(245304)
学院(242562)
管理(100963)
(96311)
经济(94259)
理学(88312)
理学院(87366)
管理学(85894)
管理学院(85459)
研究(79440)
中国(57597)
(52294)
科学(50140)
(42710)
(39051)
(37115)
业大(37043)
研究所(35870)
中心(35723)
财经(34702)
(33593)
北京(32947)
(31851)
(31678)
师范(31588)
(29179)
农业(28969)
经济学(28396)
(27626)
财经大学(26024)
基金
项目(173001)
科学(135972)
研究(126878)
基金(125911)
(109352)
国家(108468)
科学基金(93560)
社会(78860)
社会科(74755)
社会科学(74736)
基金项目(67698)
(67009)
自然(61715)
自然科(60277)
自然科学(60266)
自然科学基金(59177)
教育(57762)
(56508)
编号(51989)
资助(51937)
成果(41575)
重点(38174)
(38153)
(36519)
(35884)
课题(34873)
创新(33390)
科研(33226)
教育部(32860)
项目编号(32563)
期刊
(100793)
经济(100793)
研究(71309)
中国(41965)
学报(38628)
管理(36201)
科学(35543)
(33047)
(31320)
大学(29253)
学学(27348)
教育(26827)
农业(23481)
技术(20974)
(17694)
金融(17694)
业经(16308)
经济研究(16219)
财经(16109)
图书(14686)
(13616)
问题(13287)
理论(12934)
科技(12249)
实践(12033)
(12033)
技术经济(12029)
(11679)
情报(11082)
现代(10946)
共检索到343346条记录
发布时间倒序
  • 发布时间倒序
  • 相关度优先
文献计量分析
  • 结果分析(前20)
  • 结果分析(前50)
  • 结果分析(前100)
  • 结果分析(前200)
  • 结果分析(前500)
[期刊] 图书情报工作  [作者] 张梦芸  丁敬达  
[目的 /意义]信息技术的快速发展使得用户评论、患者症状等短文本数据量迅速增长,如何从短文本中挖掘有价值的信息成为文本分类的研究热点。[方法 /过程]以国内某医院各科室患者的病情症状数据为语料集,针对短症状文本包含语义信息不足的问题,从各科室症状词的重要度与关联度出发,将症状文本中低于设定症状词数量的文本作为语义增强对象,采用Word2Vec与基于概率的TF-IDF算法抽取各科室的若干典型症状关键词,将其补充到语义增强对象中形成新语料集,最后利用机器学习算法对症状文本进行分类。[结果 /结论]基于文章语义增强方法构造的新语料集,相较于原始语料集,在支持向量机(Support Vector Machine,SVM)、多项式朴素贝叶斯(Multinomial Naive Bayes,MNB)以及随机森林(Random Forest,RF)上的分类效果均有较大幅度提升,准确率分别提高约10%、9%、10%。
[期刊] 图书情报工作  [作者] 张梦芸  丁敬达  
[目的/意义]信息技术的快速发展使得用户评论、患者症状等短文本数据量迅速增长,如何从短文本中挖掘有价值的信息成为文本分类的研究热点。[方法/过程]以国内某医院各科室患者的病情症状数据为语料集,针对短症状文本包含语义信息不足的问题,从各科室症状词的重要度与关联度出发,将症状文本中低于设定症状词数量的文本作为语义增强对象,采用Word2Vec与基于概率的TF-IDF算法抽取各科室的若干典型症状关键词,将其补充到语义增强对象中形成新语料集,最后利用机器学习算法对症状文本进行分类。[结果/结论]基于文章语义增强方法构造的新语料集,相较于原始语料集,在支持向量机(Support Vector Machine,SVM)、多项式朴素贝叶斯(Multinomial Naive Bayes,MNB)以及随机森林(Random Forest,RF)上的分类效果均有较大幅度提升,准确率分别提高约10%、9%、10%。
[期刊] 图书情报工作  [作者] 张玉洁  白如江  刘明月  于纯良  
[目的/意义]针对SAO结构短文本分类时面临的语义特征短缺和领域知识不足问题,提出一种融合语义联想和BERT的SAO分类方法,以期提高短文本分类效果。[方法/过程]以图情领域SAO短文本为数据源,首先设计了一种包含"扩展-重构-降噪"三环节的语义联想方案,即通过语义扩展和SAO重构延展SAO语义信息,通过语义降噪解决扩展后的噪声干扰问题;然后利用BERT模型对语义联想后的SAO短文本进行训练;最后在分类部分实现自动分类。[结果/结论]在分别对比了不同联想值、学习率和分类器后,实验结果表明当联想值为10、学习率为4e-5时SAO短文本分类效果达到最优,平均F1值为0.852 2,与SVM、LSTM和单纯的BERT相比,F1值分别提高了0.103 1、0.153 8和0.140 5。
[期刊] 图书情报工作  [作者] 张倩  刘怀亮  
为了解决基于向量空间模型构建短文本分类器时造成的文本结构信息的缺失以及大量样本存在的标注瓶颈问题,提出一种基于图结构的半监督学习分类方法,这种方法既能保留短文本的结构语义关系,又能实现未标注样本的充分利用,提高分类器的性能。通过引入半监督学习的思想,将数量规模较大的未标注样本与少量已标注样本相结合进行基于图结构的自训练学习,不断迭代实现训练样本集的扩充,从而构建最终短文本分类器。经对比实验证明,这种方法能够获得较好的分类效果。
[期刊] 情报学报  [作者] 张乐  闫强  吕学强  
移动互联网时代产生海量的简短网络信息,快速、准确地获取这些数据中用户表达的情感信息具有广泛的应用场景。本文考虑人类按顺序阅读文本以获取情感信息的习惯,利用光的折射对此进行模拟,提出一种面向短文本分类的情感折射模型(Sentiment Refraction Model,SRM)。首先,从若干种子情感词出发,利用word2vector及k最近邻分类算法启发式地构建包含喜、怒、哀、乐、惧、恶六类情感的情感词典,认定每类情感词具有同等强度的情感,且这些情感词在不同的上下文中具有一定的情感折射率。其次,针对一条短文
[期刊] 图书情报工作  [作者] 薛春香  张玉芳  
在对文本分类及中文新闻分类概述的基础上,归纳出网络新闻文本特征及当前新闻文本分类特点,并总结新闻文本分类在新闻网站分类导航、话题识别与跟踪、个性化推荐三方面的应用。其后,总结中文新闻分类存在的问题,诸如缺乏通用语料和评价方法、分类体系粗略、分类维度单一等,并提出相应措施。最后,针对当前信息环境,提出新闻分类不仅将朝着多层次、多维度、跨语言方向发展,还将与多媒体信息、大数据、社会化媒体相结合。
[期刊] 情报理论与实践  [作者] 高金勇  徐朝军  冯奕竸  
为了给教育研究和管理提供可靠的决策支持,对网络信息进行分类处理就成为了一种需要。鉴于TFIDF对短文本分类存在的缺陷,本文采用基于迭代的TFIDF算法对文本向量进行了优化。试验结果表明,基于迭代的TFIDF算法可以有效提高短文本文档分类的准确率。
[期刊] 科技管理研究  [作者] 李牧南  王良  赖华鹏  
近年尽管针对中文本文分类的研究成果不少,但基于深度学习对中文政策等长文本进行自动分类的研究还不多见。为此,借鉴和拓展传统的数据增强方法,提出集成新时代人民日报分词语料库(NEPD)、简单数据增强(EDA)算法、word2vec和文本卷积神经网络(TextCNN)的NEWT新型计算框架;实证部分,基于中国地方政府发布的科技政策文本进行算法校验。实验结果显示,在取词长度分别为500、750和1 000词的情况下,应用NEWT算法对中文科技政策文本进行分类的效果优于RCNN、Bi-LSTM和CapsNet等传统深度学习模型,F1值的平均提升比例超过13%;同时,NEWT在较短取词长度下能够实现全文输入的近似效果,可以部分改善传统深度学习模型在中文长文本自动分类任务中的计算效率。
[期刊] 情报学报  [作者] 张贞港   余传明  
文本语义匹配模型在信息检索、文本挖掘等领域已经获得了广泛应用。为解决现有模型主要从文本自身角度判断文本之间的语义关系而忽略对外部知识有效利用的问题,本文提出一种新的基于知识增强的文本语义匹配模型,以知识图谱实体作为外部知识,有效建模文本的外部知识信息,并自适应地过滤外部知识中存在的噪声。针对自然语言推理和释义识别两个文本语义匹配任务,与基线方法相比,本文模型在大多数指标上取得了最优效果。研究结果表明,本文模型有助于揭示知识图谱在文本语义匹配任务中的作用,为将知识图谱应用到智能信息服务领域提供了参考。
[期刊] 图书情报工作  [作者] 赵辉  刘怀亮  
为解决短文本特征词少、概念信号弱的问题,结合维基百科进行特征扩展以辅助中文短文本分类。通过维基百科概念及链接等信息进行词语相关概念集合抽取、概念间相关度计算,利用消歧页结合短文本上下文信息解决一词多义问题,进而以词语间语义相关关系为基础进行特征扩展,以补充文本特征语义信息。最后,给出基于维基百科的中文短文本分类算法,并对其进行实验验证。结果表明,该算法能有效提高中文短文本分类效果。
[期刊] 情报理论与实践  [作者] 李杰  李欢  
[目的/意义]构建在线评论的产品特征提取及情感分类模型,可以为产品设计人员进行产品优化改进提供决策支持。[方法/过程]提出了基于卷积神经网络算法的产品特征提取及情感分类模型。模型采用卷积神经网络进行短文本评论情感分类,以情感分类标签标注相应评论中提取的产品特征词,并利用词向量对产品特征词聚类。通过爬取的笔记本电脑和手机评论对模型进行训练和测试。[结果/结论]结果表明,模型能够实现有效的产品特征提取及高准确率情感分类,是在线评论分析的有效模型。
[期刊] 情报理论与实践  [作者] 王昊  邓三鸿  苏新宁  
关键词:
[期刊] 情报理论与实践  [作者] 周红磊   张海涛   栾宇   苏欣宇  
[目的/意义]丰富的互联网数据为洞悉真实事件提供了多维视角,快速识别突发事件并准确判断其所属类别,有助于各级政府及应急管理部门高效地管理应急情报资源。[方法/过程]研究构建了基于文本—图像增强的突发事件识别及分类的理论模型;通过文本卷积神经网络、视觉几何群网络搭建深度神经网络共同组成Multi-DNN模型;最后以真实的自然灾害类突发事件数据进行实例验证。[结果/结论]通过文本、图像相互增强,多模态特征融合能够提升突发事件识别及分类的准确率,同时在小样本数据的任务处理中仍有良好效果,证明不同模态的数据能够相互补充、相互印证,对其融合处理能够提供比单一模态更为准确和全面的信息分析。
[期刊] 情报学报  [作者] 李跃艳  王昊  邓三鸿  陈艳  
随着互联网医疗的快速发展,数字经济和智能经济成为未来必然发展趋势,医学知识的语义化和规范化是实现智慧医疗和数字医学的重要手段。但现阶段较为成熟的医学本体仅仅描述了一些既定的静态知识,无法揭示医学知识之间的动态关联。因此,以知识表示和知识组织为出发点,构建符合叙事性文本特征的医学知识结构化表示方法具有十分重要的意义。本文在梳理叙事学理论、事件知识表示的基础上,按照是否具有叙事性特征,将医学文本分为叙事性文本和概念性文本;然后,分别对概念性医学文本和叙事性医学文本进行语义建模与表示,构建基于事件本体的医学知识本体模型;最后,根据本文提出的概念模型,实现SARS-CoV-2病毒入侵过程的语义结构化表示。初步标注的实验结果表明,将事件本体模型迁移到医学文本语义结构化描述中,有助于实现医学文本的深层次表示和知识发现,能更好地描述医学知识之间的动态关联,更好地表征医学对象在时间和空间的动态发展特点。
[期刊] 大学图书馆学报  [作者] 王永红  
结合高校图书馆与省级医学情报机构合并,倡导资源共享、相互协作,改变传统服务模式;抓住校园网络建设契机,增强检索咨询情报意识,由封闭式服务转向开放式服务
文献操作() 导出元数据 文献计量分析
导出文件格式:WXtxt
作者:
删除