- 年份
- 2024(9347)
- 2023(13611)
- 2022(11958)
- 2021(11251)
- 2020(9371)
- 2019(21720)
- 2018(21542)
- 2017(41787)
- 2016(22491)
- 2015(25241)
- 2014(24891)
- 2013(24261)
- 2012(21863)
- 2011(19498)
- 2010(19048)
- 2009(16801)
- 2008(15941)
- 2007(13395)
- 2006(11232)
- 2005(9216)
- 学科
- 济(84287)
- 经济(84198)
- 管理(63485)
- 业(60660)
- 企(50202)
- 企业(50202)
- 方法(43798)
- 数学(38609)
- 数学方法(38043)
- 农(24897)
- 财(21368)
- 中国(20222)
- 学(19245)
- 业经(18733)
- 贸(16688)
- 贸易(16682)
- 易(16240)
- 地方(16160)
- 农业(15377)
- 理论(14836)
- 务(14252)
- 财务(14184)
- 财务管理(14157)
- 技术(13980)
- 和(13725)
- 环境(13499)
- 企业财务(13416)
- 制(13122)
- 划(11983)
- 银(11094)
- 机构
- 大学(306441)
- 学院(305409)
- 管理(126420)
- 济(117511)
- 经济(115016)
- 理学(111554)
- 理学院(110360)
- 管理学(108209)
- 管理学院(107681)
- 研究(96218)
- 中国(69297)
- 京(63548)
- 科学(62091)
- 财(51429)
- 农(48643)
- 业大(48074)
- 所(46423)
- 中心(45088)
- 研究所(43091)
- 财经(42885)
- 江(41584)
- 范(40938)
- 师范(40534)
- 经(39280)
- 北京(39213)
- 农业(38340)
- 院(35972)
- 经济学(34638)
- 州(34185)
- 师范大学(33101)
- 基金
- 项目(224547)
- 科学(177473)
- 基金(164066)
- 研究(162595)
- 家(143225)
- 国家(142087)
- 科学基金(123289)
- 社会(101287)
- 社会科(95974)
- 社会科学(95947)
- 基金项目(88274)
- 省(87620)
- 自然(82568)
- 自然科(80689)
- 自然科学(80671)
- 自然科学基金(79188)
- 教育(75425)
- 划(74178)
- 资助(67016)
- 编号(66686)
- 成果(51683)
- 重点(50160)
- 部(49351)
- 发(47092)
- 创(46895)
- 课题(44799)
- 科研(43801)
- 创新(43712)
- 教育部(42394)
- 大学(42052)
- 期刊
- 济(116776)
- 经济(116776)
- 研究(83111)
- 中国(49951)
- 学报(48981)
- 科学(45381)
- 管理(43671)
- 农(42896)
- 财(37713)
- 大学(37571)
- 学学(35482)
- 教育(34333)
- 农业(30523)
- 技术(27297)
- 业经(20917)
- 融(19782)
- 金融(19782)
- 财经(19469)
- 经济研究(18694)
- 经(16483)
- 图书(16025)
- 业(15574)
- 问题(15545)
- 科技(15258)
- 理论(14823)
- 资源(14314)
- 技术经济(14217)
- 版(14161)
- 实践(13856)
- 践(13856)
共检索到414964条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 情报理论与实践
[作者]
李杰 李欢
[目的/意义]构建在线评论的产品特征提取及情感分类模型,可以为产品设计人员进行产品优化改进提供决策支持。[方法/过程]提出了基于卷积神经网络算法的产品特征提取及情感分类模型。模型采用卷积神经网络进行短文本评论情感分类,以情感分类标签标注相应评论中提取的产品特征词,并利用词向量对产品特征词聚类。通过爬取的笔记本电脑和手机评论对模型进行训练和测试。[结果/结论]结果表明,模型能够实现有效的产品特征提取及高准确率情感分类,是在线评论分析的有效模型。
[期刊] 情报科学
[作者]
周源 刘怀兰 杜朋朋 廖岭
【目的/意义】特征提取会很大程度地影响分类效果,而传统TF-IDF特征提取方法缺乏对特征词上下文环境和对特征词在类之间分布状况的考虑。【方法/过程】本文提出一种改进TF-IDF特征提取的方法:(1)基于文本网络和改进Page Rank算法计算节点重要程度值,解决传统TF-IDF忽略文本结构信息的问题;(2)增加特征值IDF值的方差来衡量特征词w在不同类别文本集中程度的分布情况,解决传统TF-IDF忽略特征词在类之间分布状况的不足。【结果/结论】基于该改进方法构建了文本分类模型,对3D打印数据进行分类实验。
[期刊] 现代情报
[作者]
李昌兵 庞崇鹏 凌永亮 王强
[目的/意义]针对信息过载条件下中文网络产品评论中特征提取性能低以及特征聚类中初始中心点的选取问题。[方法/过程]本研究提出采用基于权重的改进Apriori算法产生候选产品特征集合,再根据独立支持度、频繁项名词非特征规则及基于网络搜索引擎的PMI算法对候选产品特征集合进行过滤。并以基于HowNet的语义相似度和特征观点共现作为衡量产品特征之间关联程度的特征,提出一种改进K-means聚类算法对产品特征进行聚类。[结果/结论]实验结果表明,在特征提取阶段,查准率为69%,查全率为92.64%,综合值达到79
[期刊] 图书情报工作
[作者]
张倩 刘怀亮
为了解决基于向量空间模型构建短文本分类器时造成的文本结构信息的缺失以及大量样本存在的标注瓶颈问题,提出一种基于图结构的半监督学习分类方法,这种方法既能保留短文本的结构语义关系,又能实现未标注样本的充分利用,提高分类器的性能。通过引入半监督学习的思想,将数量规模较大的未标注样本与少量已标注样本相结合进行基于图结构的自训练学习,不断迭代实现训练样本集的扩充,从而构建最终短文本分类器。经对比实验证明,这种方法能够获得较好的分类效果。
关键词:
半监督学习 短文本 图结构 自训练
[期刊] 图书情报工作
[作者]
于津凯 王映雪 陈怀楚
介绍一种改进的文本特征提取及匹配算法。该算法基于N-Gram算法思路进行文本处理和特征提取,设计了gram关联矩阵用于统计与合并特征词,从而在固定长度N-Gram算法的基础上能够提取出不同长度的特征词。实验证明,该特征提取算法能够更为准确地描述文本特征,可应用于文本检索、Web挖掘等信息处理领域。
[期刊] 数据分析与知识发现
[作者]
李昌兵 庞崇鹏 李美平
【目的】解决在海量客户评论信息中抽取产品特征时噪声大的问题。【方法】运用TF-IDF和方差选择的统计方法在众多初步提取出来的特征中进行选择,设置阈值后将各自提取出来的特征取交进行过滤,得到产品特征集合,根据基于矩阵和权重改进的Apriori算法产生频繁项集,设定不同阈值得到最优特征集合,实现对用户评论中产品特征的自动提取。【结果】以手机评论文本为例,从中抽取手机类的产品特征,根据人工标注的183个特征和算法识别出来的特征,查准率P为72.44%,查全率R为77.59%,综合值F为74.93%。【局限】查准
[期刊] 情报理论与实践
[作者]
庞景安
本文对当前有关Web文本特征提取方法的研究和试验进行了简要的综述和分析,比较了每类方法的优势和不足,指出研究中存在的难点和共同探讨的问题,并在此基础上,对该领域未来研究的发展方向和趋势进行了预测。
关键词:
Web文本 文本特征 特征提取 学习算法
[期刊] 实验技术与管理
[作者]
刘丹 叶婧仪 李玲
文章将抑郁症脑电识别作为“云计算与数据挖掘”课程的实验内容,设计了利用机器学习进行抑郁症脑电识别诊断系统,利用信号处理方法进行脑电特征提取。时域采用基于统计特征的近似熵及非线性特征的模糊熵、频域采用基于脑电波段划分的功率谱密度进行特征提取,用以更加精准地提取抑郁症患者的脑电信号特征。最后利用机器学习方法,实现了对抑郁症的快速客观诊断。实验采用Python语言实现,实验结果表明近似熵特征取得了最佳分类结果。
关键词:
数据挖掘 机器学习 抑郁症 脑电信号
[期刊] 图书情报知识
[作者]
商宪丽 王学东
本文针对微博文本的简短、动态性等特征,提出一种新的文本特征提取方法,提升微博话题识别任务中文本聚类算法效果。利用词项共现的思想,针对微博时序文本构建动态共词网络。在动态共词网络中,边权重随着时间推移而线性衰减,并在此基础上利用网络的度中心性计算微博文本特征权重。从新浪微博中采样构建实验数据集进行实验,结果表明动态共词网络特征提取方法相较于文档频率方法,更适宜于提取微博文本特征,能取得更好的微博话题识别效果。
[期刊] 情报理论与实践
[作者]
高金勇 徐朝军 冯奕竸
为了给教育研究和管理提供可靠的决策支持,对网络信息进行分类处理就成为了一种需要。鉴于TFIDF对短文本分类存在的缺陷,本文采用基于迭代的TFIDF算法对文本向量进行了优化。试验结果表明,基于迭代的TFIDF算法可以有效提高短文本文档分类的准确率。
关键词:
文本分类 网络资源 算法
[期刊] 情报理论与实践
[作者]
何超 张玉峰
针对传统的中文文本特征提取算法存在的语义丢失和语义缺乏问题,设计了融合领域本体的中文文本语义特征提取算法。该算法利用基于种子—扩展机制的关键词识别与提取算法解决传统算法中利用分词工具进行关键词提取所产生的语义丢失问题;利用基于领域本体的文本概念特征语义映射与聚合算法解决传统算法中利用向量空间模型进行文本表示所产生的高维和语义缺乏问题。实验结果表明,该算法取得了很好的预期效果,能够显著提高文本特征提取的深度和准确性。
关键词:
文本语义特征 领域本体 算法
[期刊] 图书情报工作
[作者]
张梦芸 丁敬达
[目的 /意义]信息技术的快速发展使得用户评论、患者症状等短文本数据量迅速增长,如何从短文本中挖掘有价值的信息成为文本分类的研究热点。[方法 /过程]以国内某医院各科室患者的病情症状数据为语料集,针对短症状文本包含语义信息不足的问题,从各科室症状词的重要度与关联度出发,将症状文本中低于设定症状词数量的文本作为语义增强对象,采用Word2Vec与基于概率的TF-IDF算法抽取各科室的若干典型症状关键词,将其补充到语义增强对象中形成新语料集,最后利用机器学习算法对症状文本进行分类。[结果 /结论]基于文章语义增强方法构造的新语料集,相较于原始语料集,在支持向量机(Support Vector Machine,SVM)、多项式朴素贝叶斯(Multinomial Naive Bayes,MNB)以及随机森林(Random Forest,RF)上的分类效果均有较大幅度提升,准确率分别提高约10%、9%、10%。
[期刊] 图书情报工作
[作者]
张梦芸 丁敬达
[目的/意义]信息技术的快速发展使得用户评论、患者症状等短文本数据量迅速增长,如何从短文本中挖掘有价值的信息成为文本分类的研究热点。[方法/过程]以国内某医院各科室患者的病情症状数据为语料集,针对短症状文本包含语义信息不足的问题,从各科室症状词的重要度与关联度出发,将症状文本中低于设定症状词数量的文本作为语义增强对象,采用Word2Vec与基于概率的TF-IDF算法抽取各科室的若干典型症状关键词,将其补充到语义增强对象中形成新语料集,最后利用机器学习算法对症状文本进行分类。[结果/结论]基于文章语义增强方法构造的新语料集,相较于原始语料集,在支持向量机(Support Vector Machine,SVM)、多项式朴素贝叶斯(Multinomial Naive Bayes,MNB)以及随机森林(Random Forest,RF)上的分类效果均有较大幅度提升,准确率分别提高约10%、9%、10%。
[期刊] 开放教育研究
[作者]
潘怡 叶辉 邹军华
自本世纪初起,E—learning作为一种灵活、丰富、高效的学习方式,被越来越多的学习者接受,而伴随着学习技术的逐步成熟,学习者对E—learning应用的要求也从最初的知识推送提升到能够在讲授者与学习者之间搭建有效的沟通桥梁,将零反馈的封闭式学习变成多反馈的协作学习。E—learning的评论信息隐含了学习者在学习中遇到的问题和建议,从中可挖掘学习者对学习资源及授课者的意见。这对改善教学模式、完善教学支持服务意义重要。现有E—learning系统所提供的海量评论信息中正面评论与负面评论夹杂,给挖掘学习者的真实意见和需求带来困难。本文对文本情感分类过程进行归纳,构建了一种情感分类应用模型,在完...
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除