- 年份
- 2024(9497)
- 2023(13793)
- 2022(11942)
- 2021(11173)
- 2020(9458)
- 2019(21059)
- 2018(20527)
- 2017(39481)
- 2016(21339)
- 2015(23924)
- 2014(23706)
- 2013(23515)
- 2012(21472)
- 2011(19406)
- 2010(19429)
- 2009(18043)
- 2008(16487)
- 2007(14352)
- 2006(12697)
- 2005(11194)
- 学科
- 济(84824)
- 经济(84737)
- 管理(59405)
- 业(56597)
- 企(47776)
- 企业(47776)
- 方法(38013)
- 数学(33099)
- 数学方法(32672)
- 中国(27615)
- 融(26999)
- 金融(26996)
- 银(25017)
- 银行(24962)
- 行(24114)
- 地方(22157)
- 财(21691)
- 农(21256)
- 学(19613)
- 业经(19254)
- 制(17570)
- 理论(14980)
- 农业(14828)
- 务(14555)
- 财务(14493)
- 财务管理(14470)
- 贸(14237)
- 贸易(14223)
- 企业财务(13812)
- 易(13783)
- 机构
- 大学(298770)
- 学院(296629)
- 管理(116448)
- 济(114533)
- 经济(111875)
- 研究(102303)
- 理学(101073)
- 理学院(99924)
- 管理学(97990)
- 管理学院(97495)
- 中国(80538)
- 科学(66106)
- 京(64286)
- 所(52043)
- 财(51959)
- 农(50937)
- 研究所(47907)
- 中心(47613)
- 业大(46509)
- 江(42520)
- 财经(42038)
- 北京(40690)
- 农业(40245)
- 范(39169)
- 师范(38697)
- 经(38228)
- 院(37776)
- 州(35595)
- 经济学(34319)
- 技术(31702)
- 基金
- 项目(210078)
- 科学(164088)
- 基金(151673)
- 研究(150687)
- 家(133858)
- 国家(132761)
- 科学基金(113017)
- 社会(93148)
- 社会科(88268)
- 社会科学(88242)
- 省(82966)
- 基金项目(80680)
- 自然(75261)
- 自然科(73480)
- 自然科学(73460)
- 自然科学基金(72124)
- 划(70318)
- 教育(68245)
- 资助(62964)
- 编号(61118)
- 成果(49088)
- 重点(47714)
- 发(45690)
- 部(45157)
- 创(43840)
- 课题(42447)
- 创新(40956)
- 科研(40653)
- 计划(39108)
- 大学(38581)
- 期刊
- 济(121440)
- 经济(121440)
- 研究(86644)
- 中国(56364)
- 学报(51256)
- 科学(46175)
- 农(45402)
- 管理(41844)
- 大学(37932)
- 财(37614)
- 融(37525)
- 金融(37525)
- 学学(35764)
- 教育(32283)
- 农业(31272)
- 技术(24717)
- 财经(19799)
- 业经(19369)
- 经济研究(19318)
- 经(16772)
- 图书(16292)
- 业(15840)
- 理论(15527)
- 问题(15326)
- 科技(14894)
- 实践(14409)
- 践(14409)
- 版(13672)
- 技术经济(13597)
- 业大(13262)
共检索到433710条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 图书情报工作
[作者]
张玉洁 白如江 刘明月 于纯良
[目的/意义]针对SAO结构短文本分类时面临的语义特征短缺和领域知识不足问题,提出一种融合语义联想和BERT的SAO分类方法,以期提高短文本分类效果。[方法/过程]以图情领域SAO短文本为数据源,首先设计了一种包含"扩展-重构-降噪"三环节的语义联想方案,即通过语义扩展和SAO重构延展SAO语义信息,通过语义降噪解决扩展后的噪声干扰问题;然后利用BERT模型对语义联想后的SAO短文本进行训练;最后在分类部分实现自动分类。[结果/结论]在分别对比了不同联想值、学习率和分类器后,实验结果表明当联想值为10、学习率为4e-5时SAO短文本分类效果达到最优,平均F1值为0.852 2,与SVM、LSTM和单纯的BERT相比,F1值分别提高了0.103 1、0.153 8和0.140 5。
关键词:
SAO 短文本分类 语义联想 BERT
[期刊] 图书情报工作
[作者]
张梦芸 丁敬达
[目的 /意义]信息技术的快速发展使得用户评论、患者症状等短文本数据量迅速增长,如何从短文本中挖掘有价值的信息成为文本分类的研究热点。[方法 /过程]以国内某医院各科室患者的病情症状数据为语料集,针对短症状文本包含语义信息不足的问题,从各科室症状词的重要度与关联度出发,将症状文本中低于设定症状词数量的文本作为语义增强对象,采用Word2Vec与基于概率的TF-IDF算法抽取各科室的若干典型症状关键词,将其补充到语义增强对象中形成新语料集,最后利用机器学习算法对症状文本进行分类。[结果 /结论]基于文章语义增强方法构造的新语料集,相较于原始语料集,在支持向量机(Support Vector Machine,SVM)、多项式朴素贝叶斯(Multinomial Naive Bayes,MNB)以及随机森林(Random Forest,RF)上的分类效果均有较大幅度提升,准确率分别提高约10%、9%、10%。
[期刊] 图书情报工作
[作者]
张梦芸 丁敬达
[目的/意义]信息技术的快速发展使得用户评论、患者症状等短文本数据量迅速增长,如何从短文本中挖掘有价值的信息成为文本分类的研究热点。[方法/过程]以国内某医院各科室患者的病情症状数据为语料集,针对短症状文本包含语义信息不足的问题,从各科室症状词的重要度与关联度出发,将症状文本中低于设定症状词数量的文本作为语义增强对象,采用Word2Vec与基于概率的TF-IDF算法抽取各科室的若干典型症状关键词,将其补充到语义增强对象中形成新语料集,最后利用机器学习算法对症状文本进行分类。[结果/结论]基于文章语义增强方法构造的新语料集,相较于原始语料集,在支持向量机(Support Vector Machine,SVM)、多项式朴素贝叶斯(Multinomial Naive Bayes,MNB)以及随机森林(Random Forest,RF)上的分类效果均有较大幅度提升,准确率分别提高约10%、9%、10%。
[期刊] 图书情报工作
[作者]
张倩 刘怀亮
为了解决基于向量空间模型构建短文本分类器时造成的文本结构信息的缺失以及大量样本存在的标注瓶颈问题,提出一种基于图结构的半监督学习分类方法,这种方法既能保留短文本的结构语义关系,又能实现未标注样本的充分利用,提高分类器的性能。通过引入半监督学习的思想,将数量规模较大的未标注样本与少量已标注样本相结合进行基于图结构的自训练学习,不断迭代实现训练样本集的扩充,从而构建最终短文本分类器。经对比实验证明,这种方法能够获得较好的分类效果。
关键词:
半监督学习 短文本 图结构 自训练
[期刊] 情报理论与实践
[作者]
高金勇 徐朝军 冯奕竸
为了给教育研究和管理提供可靠的决策支持,对网络信息进行分类处理就成为了一种需要。鉴于TFIDF对短文本分类存在的缺陷,本文采用基于迭代的TFIDF算法对文本向量进行了优化。试验结果表明,基于迭代的TFIDF算法可以有效提高短文本文档分类的准确率。
关键词:
文本分类 网络资源 算法
[期刊] 图书情报工作
[作者]
赵辉 刘怀亮
为解决短文本特征词少、概念信号弱的问题,结合维基百科进行特征扩展以辅助中文短文本分类。通过维基百科概念及链接等信息进行词语相关概念集合抽取、概念间相关度计算,利用消歧页结合短文本上下文信息解决一词多义问题,进而以词语间语义相关关系为基础进行特征扩展,以补充文本特征语义信息。最后,给出基于维基百科的中文短文本分类算法,并对其进行实验验证。结果表明,该算法能有效提高中文短文本分类效果。
关键词:
短文本分类 维基百科 词义消歧 特征扩展
[期刊] 情报学报
[作者]
张金柱 李溢峰
为了丰富专利分类的网络和文本语义表示,实现两者更有效的语义融合,提高技术融合预测效果,提出基于专利分类序列和文本语义表示的技术融合预测方法。首先,综合考虑专利分类位置及其上下文语境,直接对专利分类序列进行语义表示,提出基于专利分类序列语义表示的技术融合预测方法;其次,根据专利分类在序列中的重要性排序研究专利分类文本分配方法,形成基于专利分类文本语义表示的技术融合预测方法;在此基础上,设计多种特征融合方法,提出融合专利分类序列结构和文本内容语义表示的技术融合预测方法;最后,基于链路预测的理论和方法对提出的多种技术融合预测方法进行定量评价。在无人机领域的实验证实,专利分类序列语义表示模型的效果明显优于其他网络表示学习方法;依据重要性排序的专利分类文本赋予方式优于文本平均分配方式,基于此的专利分类文本语义表示能更好地进行技术融合预测;“SVM (support vector machine)+哈达玛积”的特征融合方法在所有方法中表现最优,较单一方法均有提高。本文提出的方法能够提高技术融合预测的效果,更好地为技术布局、技术研发提供借鉴和参考。
[期刊] 统计与决策
[作者]
刘苗 谢邦昌
文章从文本特征抽取、分类算法效率和精度两个角度出发,首先利用概率潜在语义分析(PLSA)方法,有效地提取出隐含在文档词频数据中的语义概念信息;然后构建了分类精度较高的Adaboost算法作为分类器。实验结果表明,该方法发挥了两种方法的优势,能够很好地完成对文本的自动分类。
[期刊] 情报理论与实践
[作者]
李杰 李欢
[目的/意义]构建在线评论的产品特征提取及情感分类模型,可以为产品设计人员进行产品优化改进提供决策支持。[方法/过程]提出了基于卷积神经网络算法的产品特征提取及情感分类模型。模型采用卷积神经网络进行短文本评论情感分类,以情感分类标签标注相应评论中提取的产品特征词,并利用词向量对产品特征词聚类。通过爬取的笔记本电脑和手机评论对模型进行训练和测试。[结果/结论]结果表明,模型能够实现有效的产品特征提取及高准确率情感分类,是在线评论分析的有效模型。
[期刊] 情报理论与实践
[作者]
何超 张玉峰
针对传统的中文文本特征提取算法存在的语义丢失和语义缺乏问题,设计了融合领域本体的中文文本语义特征提取算法。该算法利用基于种子—扩展机制的关键词识别与提取算法解决传统算法中利用分词工具进行关键词提取所产生的语义丢失问题;利用基于领域本体的文本概念特征语义映射与聚合算法解决传统算法中利用向量空间模型进行文本表示所产生的高维和语义缺乏问题。实验结果表明,该算法取得了很好的预期效果,能够显著提高文本特征提取的深度和准确性。
关键词:
文本语义特征 领域本体 算法
[期刊] 科技管理研究
[作者]
沈漫竹 于慧娴 李倩 袁红梅
针对专利技术主题识别方法存在缺少语义语境、可解释性弱和主题界定模糊等问题,提出一种融合专利结构数据和文本语义的技术主题识别分析方法。该方法以专利IPC作为结构数据改进纯文本主题建模,获取由IPC和专家分类意见指导的主题词向量,并使用word2vec模型获取专利文本语义词向量,将二者结果进行向量拼接,进而获得易于解释的精准技术主题,满足细粒度分析要求。最后,以非小细胞肺癌治疗领域作为实证研究,证实该方法的科学性、有效性和实用性。
[期刊] 图书情报工作
[作者]
薛春香 张玉芳
在对文本分类及中文新闻分类概述的基础上,归纳出网络新闻文本特征及当前新闻文本分类特点,并总结新闻文本分类在新闻网站分类导航、话题识别与跟踪、个性化推荐三方面的应用。其后,总结中文新闻分类存在的问题,诸如缺乏通用语料和评价方法、分类体系粗略、分类维度单一等,并提出相应措施。最后,针对当前信息环境,提出新闻分类不仅将朝着多层次、多维度、跨语言方向发展,还将与多媒体信息、大数据、社会化媒体相结合。
[期刊] 清华大学学报(自然科学版)
[作者]
赵传君 武美龄 申利华 上官学奎 王彦婕 李杰 王素格 李德玉
用于文本情感分析的深度学习模型如递归神经网络等参数较多,因此需要大量高质量标记训练数据对模型进行训练和优化。在实际应用中,特定领域难以获取高质量带情感标签评论数据。在跨领域文本情感分类任务中,针对不同领域数据分布差异性,提出了基于句法结构迁移和领域融合的跨领域文本情感分类方法,可以解决特定领域对带标签数据依赖问题。句法结构迁移方面,将依存语法特征加入到递归神经网络中,设计了一种可迁移的依存句法递归神经网络模型,通过句法结构迁移有效地迁移跨领域结构信息,为情感迁移提供支撑。领域融合方面,在传统的最大均值差异领域度量方法上细化了跨领域同类别距离度量信息。通过约束源领域和目标领域的分布,可以保证2个领域距离在学习过程中尽可能减小,有效地提取领域通用特征。实验结果表明,该方法比已有方法有效提高了跨领域情感分类准确率。
[期刊] 图书情报工作
[作者]
张玉峰 何超
为提高文本分类的准确性与效率,提出一种基于潜在语义分析和改进的超球支持向量机的文本分类模型。该模型利用潜在语义分析进行特征抽取,消除同义词和多义词在文本表示时所造成的偏差,实现文本向量的降维。针对超球重叠区域的文本分类问题,设计一种新的决策方法—基于密集度的决策策略。实验结果表明,该模型在类别数目较小时具有较好的分类效果,改进的算法有效可行。
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除