- 年份
- 2024(5739)
- 2023(8396)
- 2022(7152)
- 2021(6741)
- 2020(5857)
- 2019(13453)
- 2018(13132)
- 2017(25481)
- 2016(13154)
- 2015(14531)
- 2014(13761)
- 2013(13307)
- 2012(11803)
- 2011(10316)
- 2010(9812)
- 2009(8458)
- 2008(7830)
- 2007(6208)
- 2006(4886)
- 2005(3932)
- 学科
- 济(51558)
- 经济(51510)
- 管理(35221)
- 业(33626)
- 企(28222)
- 企业(28222)
- 方法(27516)
- 数学(25024)
- 数学方法(24583)
- 财(13479)
- 农(12328)
- 中国(11749)
- 学(10750)
- 业经(9959)
- 务(8881)
- 贸(8873)
- 贸易(8867)
- 财务(8839)
- 财务管理(8822)
- 易(8631)
- 地方(8625)
- 企业财务(8408)
- 农业(8189)
- 技术(7870)
- 理论(7560)
- 制(7450)
- 和(7219)
- 环境(7161)
- 划(6548)
- 银(6254)
- 机构
- 大学(170196)
- 学院(168736)
- 管理(69208)
- 济(68957)
- 经济(67786)
- 理学(61334)
- 理学院(60727)
- 管理学(59410)
- 管理学院(59103)
- 研究(53748)
- 中国(39827)
- 京(33958)
- 科学(33896)
- 财(30986)
- 农(27239)
- 业大(26753)
- 中心(26228)
- 财经(25709)
- 所(25190)
- 经(23761)
- 研究所(23460)
- 江(23404)
- 经济学(21708)
- 农业(21292)
- 范(21105)
- 院(20902)
- 师范(20848)
- 北京(20236)
- 经济学院(19810)
- 财经大学(19639)
- 基金
- 项目(129688)
- 科学(103717)
- 基金(97392)
- 研究(91238)
- 家(86206)
- 国家(85584)
- 科学基金(74641)
- 社会(59371)
- 社会科(56479)
- 社会科学(56465)
- 基金项目(52030)
- 自然(50210)
- 省(49746)
- 自然科(49131)
- 自然科学(49119)
- 自然科学基金(48204)
- 教育(42566)
- 划(42510)
- 资助(39231)
- 编号(35138)
- 重点(29669)
- 部(28946)
- 创(27588)
- 发(27141)
- 成果(26343)
- 科研(26161)
- 创新(25853)
- 国家社会(25620)
- 教育部(25057)
- 大学(24491)
共检索到228571条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 图书情报工作
[作者]
于津凯 王映雪 陈怀楚
介绍一种改进的文本特征提取及匹配算法。该算法基于N-Gram算法思路进行文本处理和特征提取,设计了gram关联矩阵用于统计与合并特征词,从而在固定长度N-Gram算法的基础上能够提取出不同长度的特征词。实验证明,该特征提取算法能够更为准确地描述文本特征,可应用于文本检索、Web挖掘等信息处理领域。
[期刊] 情报学报
[作者]
何浩 杨海棠
本文介绍一种基于n gram技术的、与语言无关的文献分类方法K meansaxiales (KMA) ,及其在中文文献自动分类中的应用。这种方法将文献转换成由n gram(n个连续的字符 )频次构成的向量。为压缩存储空间、提高处理速度 ,我们运用哈希函数将n gram映射为哈希码 ,对文献的分析实际上以哈希码频次为基础运行。采用KMA算法 ,我们对一个中文数据库进行了自动分类的实验研究 ,在比较实验结果的基础上 ,我们对KMA算法初始参数的选择进行了初步探讨。
[期刊] 数据分析与知识发现
[作者]
李昌兵 庞崇鹏 李美平
【目的】解决在海量客户评论信息中抽取产品特征时噪声大的问题。【方法】运用TF-IDF和方差选择的统计方法在众多初步提取出来的特征中进行选择,设置阈值后将各自提取出来的特征取交进行过滤,得到产品特征集合,根据基于矩阵和权重改进的Apriori算法产生频繁项集,设定不同阈值得到最优特征集合,实现对用户评论中产品特征的自动提取。【结果】以手机评论文本为例,从中抽取手机类的产品特征,根据人工标注的183个特征和算法识别出来的特征,查准率P为72.44%,查全率R为77.59%,综合值F为74.93%。【局限】查准
[期刊] 情报科学
[作者]
周源 刘怀兰 杜朋朋 廖岭
【目的/意义】特征提取会很大程度地影响分类效果,而传统TF-IDF特征提取方法缺乏对特征词上下文环境和对特征词在类之间分布状况的考虑。【方法/过程】本文提出一种改进TF-IDF特征提取的方法:(1)基于文本网络和改进Page Rank算法计算节点重要程度值,解决传统TF-IDF忽略文本结构信息的问题;(2)增加特征值IDF值的方差来衡量特征词w在不同类别文本集中程度的分布情况,解决传统TF-IDF忽略特征词在类之间分布状况的不足。【结果/结论】基于该改进方法构建了文本分类模型,对3D打印数据进行分类实验。
[期刊] 图书情报工作
[作者]
罗毅辉 熊曙初
尽管目前存在许多文本特征选择方法,但是它们都有着一定的局限性。提出一种新的基于群体增量学习(Population Based Incremental Learning)算法的文本特征选择方法,其特点是无需特征集的先验知识和容易实现,并且由于使用了简单分类器性能作为评价准则,计算复杂度很低。对Reuters-21578文本集的分类实验结果表明,该方法平均分类性能要优于卡方统计量、信息增益和简单遗传算法三种常用的特征选择方法。
[期刊] 统计与决策
[作者]
蔡春,周博,李杨
[期刊] 情报理论与实践
[作者]
李杰 李欢
[目的/意义]构建在线评论的产品特征提取及情感分类模型,可以为产品设计人员进行产品优化改进提供决策支持。[方法/过程]提出了基于卷积神经网络算法的产品特征提取及情感分类模型。模型采用卷积神经网络进行短文本评论情感分类,以情感分类标签标注相应评论中提取的产品特征词,并利用词向量对产品特征词聚类。通过爬取的笔记本电脑和手机评论对模型进行训练和测试。[结果/结论]结果表明,模型能够实现有效的产品特征提取及高准确率情感分类,是在线评论分析的有效模型。
[期刊] 数据分析与知识发现
[作者]
白如江 冷伏海 廖君华
【目的】利用文本语义组块特征提升Cosine文本相似度计算性能。【方法】获取NSF资助的关于碳纳米管研究领域的项目数据,进行词干还原、词性标注等预处理;利用条件随机场模型实现文本内容的语义组块标注;在此基础上实现基于语义组块特征的改进Cosine文本相似度计算,并与未标注的数据进行相似度计算比较,分析实验结果。【结果】实验证明基于语义组块特征的改进Cosine相似度计算结果比原始文本Cosine相似度计算结果相似度均有不同程度的提升,在实验数据中最高的相似度提升了26%。【局限】依赖于语义组块标注性能。【
关键词:
文本相似度 语义组块 向量空间模型 本体
[期刊] 情报理论与实践
[作者]
何超 张玉峰
针对传统的中文文本特征提取算法存在的语义丢失和语义缺乏问题,设计了融合领域本体的中文文本语义特征提取算法。该算法利用基于种子—扩展机制的关键词识别与提取算法解决传统算法中利用分词工具进行关键词提取所产生的语义丢失问题;利用基于领域本体的文本概念特征语义映射与聚合算法解决传统算法中利用向量空间模型进行文本表示所产生的高维和语义缺乏问题。实验结果表明,该算法取得了很好的预期效果,能够显著提高文本特征提取的深度和准确性。
关键词:
文本语义特征 领域本体 算法
[期刊] 数理统计与管理
[作者]
凤丽洲 杨贵军 徐雪 徐玉慧
针对基础词更能表达中文文本所包含的基本信息,更适合于后续的文本挖掘,提出一种基于N-gram的双向匹配中文分词方法。充分挖掘训练语料的词频信息,给出一种组合词迭代切分方法,解决最大匹配分词中长词歧义切分问题,并基于N-gram语言模型,实现最优分词序列的选择。此外,为弥补准确率P这一评价指标受词条长度影响较大而不稳健的问题,在刻画分词方法性能时引入正确切分词条总字数这一因素,提出一个新的测评指标P_n,有效规避了词条长度对分词准确率评价的影响。最后在SIGHAN组织的国际中文自然语言处理竞赛的两个语料上进行实验表明,相较于传统N-gram中文分词方法,本文方法在保证分词效率的前提下,有效地提高了准确率P、召回率R、P_n和F_1值。
[期刊] 现代情报
[作者]
李昌兵 庞崇鹏 凌永亮 王强
[目的/意义]针对信息过载条件下中文网络产品评论中特征提取性能低以及特征聚类中初始中心点的选取问题。[方法/过程]本研究提出采用基于权重的改进Apriori算法产生候选产品特征集合,再根据独立支持度、频繁项名词非特征规则及基于网络搜索引擎的PMI算法对候选产品特征集合进行过滤。并以基于HowNet的语义相似度和特征观点共现作为衡量产品特征之间关联程度的特征,提出一种改进K-means聚类算法对产品特征进行聚类。[结果/结论]实验结果表明,在特征提取阶段,查准率为69%,查全率为92.64%,综合值达到79
[期刊] 北京林业大学学报
[作者]
计智伟 汪杭军 何涛 尹建新
基于图像的智能木材识别方法是通过自动提取木材的识别特征来识别木材,对木材科学和产业具有十分重要的意义。提出了一种基于改进区域生长的木材导管形态特征提取方法:采用分治策略改进区域生长法实现木材横切面显微图像中导管细胞的快速分割,用链码跟踪技术提取了10个导管细胞的形态特征;选取了6种阔叶材树种的横切面显微图像进行仿真实验。实验结果显示:本文方法能提高导管细胞的分割速度;所提取的10个形态特征在给定的树种显微图像上具有较高的区分度,说明将本文方法用于阔叶材树种智能识别具有较强的可行性。
关键词:
区域生长 导管细胞 形态特征
[期刊] 西北农林科技大学学报(自然科学版)
[作者]
张阳 刘永革 景旭
针对SVM法线特征筛选算法仅考虑法线对特征筛选的贡献,而忽略了特征分布对特征筛选的贡献的不足,在对SVM法线算法进行分析的基础上,基于特征在正、负例中出现概率的不同提出了加权SVM法线算法,该算法考虑到了法线和特征的分布。通过试验可以看出,在使用较小的特征空间时,与SVM法线算法和信息增益算法相比,加权SVM法线算法具有更好的特征筛选性能。
[期刊] 清华大学学报(自然科学版)
[作者]
肖熙 周路
语音识别模型中帧间独立假设在给模型计算带来简洁的同时,不可避免地降低了模型精度,增加了识别错误。该文旨在寻找一种既能满足帧间独立假设又能保持语音信息的特征。分别提出了基于k均值和基于归一化类内方差的语音识别自适应聚类特征提取算法,可以自适应地实现聚类特征流的提取。将该自适应特征分别应用在Gauss混合模型-隐Markov模型、基于段长分布的隐Markov模型和上下文相关的深度神经网络模型这3种语音识别模型中,与基线系统进行了实验对比。结果表明:采用基于归一化类内方差的自适应特征可以使得3种语言模型的识别错
[期刊] 图书情报知识
[作者]
商宪丽 王学东
本文针对微博文本的简短、动态性等特征,提出一种新的文本特征提取方法,提升微博话题识别任务中文本聚类算法效果。利用词项共现的思想,针对微博时序文本构建动态共词网络。在动态共词网络中,边权重随着时间推移而线性衰减,并在此基础上利用网络的度中心性计算微博文本特征权重。从新浪微博中采样构建实验数据集进行实验,结果表明动态共词网络特征提取方法相较于文档频率方法,更适宜于提取微博文本特征,能取得更好的微博话题识别效果。
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除