搜索文献-EPS

年份: 2024(5739); 2023(8396); 2022(7152); 2021(6741); 2020(5857); 2019(13453); 2018(13132); 2017(25480); 2016(13153); 2015(14529); 2014(13759); 2013(13307); 2012(11803); 2011(10316); 2010(9812); 2009(8458); 2008(7830); 2007(6208); 2006(4886); 2005(3932)

作者: 王(34294); 张(28904); 李(28694); 刘(27349); 陈(18370); 杨(13958); 晓(12960); 赵(11368); 周(11128); 华(9955); 吴(9909); 文(9724); 伟(9074); 林(9054); 明(8815); 志(8748); 孙(8643); 丽(8475); 黄(8328); 徐(8281); 军(6943); 玉(6877); 平(6869); 朱(6740); 郭(6534); 胡(6477); 建(6223); 红(5980); 春(5728); 艳(5639)

学科: 济(51556); 经济(51508); 管理(35220); 业(33626); 企(28222); 企业(28222); 方法(27514); 数学(25022); 数学方法(24581); 财(13479); 农(12328); 中国(11748); 学(10750); 业经(9959); 务(8881); 贸(8873); 贸易(8867); 财务(8839); 财务管理(8822); 易(8631); 地方(8625); 企业财务(8408); 农业(8189); 技术(7870); 理论(7560); 制(7449); 和(7219); 环境(7161); 划(6548); 银(6252)

机构: 大学(170191); 学院(168731); 管理(69207); 济(68952); 经济(67781); 理学(61334); 理学院(60727); 管理学(59410); 管理学院(59103); 研究(53745); 中国(39826); 京(33957); 科学(33896); 财(30986); 农(27239); 业大(26753); 中心(26226); 财经(25709); 所(25189); 经(23761); 研究所(23459); 江(23404); 经济学(21706); 农业(21292); 范(21105); 院(20902); 师范(20848); 北京(20235); 经济学院(19808); 财经大学(19639)

基金: 项目(129683); 科学(103712); 基金(97387); 研究(91233); 家(86201); 国家(85579); 科学基金(74636); 社会(59367); 社会科(56475); 社会科学(56461); 基金项目(52030); 自然(50205); 省(49746); 自然科(49126); 自然科学(49114); 自然科学基金(48199); 教育(42566); 划(42507); 资助(39226); 编号(35137); 重点(29669); 部(28946); 创(27588); 发(27141); 成果(26341); 科研(26160); 创新(25853); 国家社会(25616); 教育部(25057); 大学(24488)

期刊: 济(63083); 经济(63083); 研究(43745); 学报(28368); 中国(27050); 科学(26169); 管理(25037); 财(24534); 农(22646); 大学(22482); 学学(21424); 技术(15981); 农业(15449); 教育(14902); 财经(12108); 融(11402); 金融(11402); 经济研究(10821); 经(10349); 业经(10177); 业(8702); 问题(8528); 版(8518); 统计(8257); 科技(8207); 资源(7903); 技术经济(7843); 理论(7577); 策(7532); 财会(7512)

全选本页取消本页

共检索到228565条记录

发布时间倒序

发布时间倒序
相关度优先

文献计量分析

结果分析(前20)
结果分析(前50)
结果分析(前100)
结果分析(前200)
结果分析(前500)

一种基于N-Gram改进的文本特征提取算法

[期刊] 图书情报工作 [作者] 于津凯王映雪陈怀楚

介绍一种改进的文本特征提取及匹配算法。该算法基于N-Gram算法思路进行文本处理和特征提取,设计了gram关联矩阵用于统计与合并特征词,从而在固定长度N-Gram算法的基础上能够提取出不同长度的特征词。实验证明,该特征提取算法能够更为准确地描述文本特征,可应用于文本检索、Web挖掘等信息处理领域。

关键词：文本特征提取 N-Gram算法 gram关联矩阵

一种基于N-Gram技术的中文文献自动分类方法

[期刊] 情报学报 [作者] 何浩杨海棠

本文介绍一种基于n gram技术的、与语言无关的文献分类方法K meansaxiales (KMA) ,及其在中文文献自动分类中的应用。这种方法将文献转换成由n gram(n个连续的字符 )频次构成的向量。为压缩存储空间、提高处理速度 ,我们运用哈希函数将n gram映射为哈希码 ,对文献的分析实际上以哈希码频次为基础运行。采用KMA算法 ,我们对一个中文数据库进行了自动分类的实验研究 ,在比较实验结果的基础上 ,我们对KMA算法初始参数的选择进行了初步探讨。

关键词： n-gram 汉字切分哈希码文献向量 KMA 自动分类

基于权重的Apriori算法在文本统计特征提取方法中的应用

[期刊] 数据分析与知识发现 [作者] 李昌兵庞崇鹏李美平

【目的】解决在海量客户评论信息中抽取产品特征时噪声大的问题。【方法】运用TF-IDF和方差选择的统计方法在众多初步提取出来的特征中进行选择,设置阈值后将各自提取出来的特征取交进行过滤,得到产品特征集合,根据基于矩阵和权重改进的Apriori算法产生频繁项集,设定不同阈值得到最优特征集合,实现对用户评论中产品特征的自动提取。【结果】以手机评论文本为例,从中抽取手机类的产品特征,根据人工标注的183个特征和算法识别出来的特征,查准率P为72.44%,查全率R为77.59%,综合值F为74.93%。【局限】查准

关键词：特征提取 Apriori算法 TF-IDF 方差选择

基于改进TF-IDF特征提取的文本分类模型研究

[期刊] 情报科学 [作者] 周源刘怀兰杜朋朋廖岭

【目的/意义】特征提取会很大程度地影响分类效果,而传统TF-IDF特征提取方法缺乏对特征词上下文环境和对特征词在类之间分布状况的考虑。【方法/过程】本文提出一种改进TF-IDF特征提取的方法:(1)基于文本网络和改进Page Rank算法计算节点重要程度值,解决传统TF-IDF忽略文本结构信息的问题;(2)增加特征值IDF值的方差来衡量特征词w在不同类别文本集中程度的分布情况,解决传统TF-IDF忽略特征词在类之间分布状况的不足。【结果/结论】基于该改进方法构建了文本分类模型,对3D打印数据进行分类实验。

关键词：特征提取 TF-IDF 文本分类文本网络 Page Rank

一种基于群体增量学习算法的文本特征选择方法

[期刊] 图书情报工作 [作者] 罗毅辉熊曙初

尽管目前存在许多文本特征选择方法,但是它们都有着一定的局限性。提出一种新的基于群体增量学习(Population Based Incremental Learning)算法的文本特征选择方法,其特点是无需特征集的先验知识和容易实现,并且由于使用了简单分类器性能作为评价准则,计算复杂度很低。对Reuters-21578文本集的分类实验结果表明,该方法平均分类性能要优于卡方统计量、信息增益和简单遗传算法三种常用的特征选择方法。

关键词：群体增量学习特征选择文本分类遗传算法

一范数支持向量机的特征提取算法及应用

[期刊] 统计与决策 [作者] 蔡春,周博,李杨

关键词：特征提取算法支持向量机决策函数线性可分机器学习超平面分类学习分类函数经验风险训练样本集

基于深度学习的短文本评论产品特征提取及情感分类研究

[期刊] 情报理论与实践 [作者] 李杰李欢

[目的/意义]构建在线评论的产品特征提取及情感分类模型,可以为产品设计人员进行产品优化改进提供决策支持。[方法/过程]提出了基于卷积神经网络算法的产品特征提取及情感分类模型。模型采用卷积神经网络进行短文本评论情感分类,以情感分类标签标注相应评论中提取的产品特征词,并利用词向量对产品特征词聚类。通过爬取的笔记本电脑和手机评论对模型进行训练和测试。[结果/结论]结果表明,模型能够实现有效的产品特征提取及高准确率情感分类,是在线评论分析的有效模型。

关键词：产品特征情感分类在线评论卷积神经网络深度学习

融合领域本体的中文文本语义特征提取算法研究

[期刊] 情报理论与实践 [作者] 何超张玉峰

针对传统的中文文本特征提取算法存在的语义丢失和语义缺乏问题,设计了融合领域本体的中文文本语义特征提取算法。该算法利用基于种子—扩展机制的关键词识别与提取算法解决传统算法中利用分词工具进行关键词提取所产生的语义丢失问题;利用基于领域本体的文本概念特征语义映射与聚合算法解决传统算法中利用向量空间模型进行文本表示所产生的高维和语义缺乏问题。实验结果表明,该算法取得了很好的预期效果,能够显著提高文本特征提取的深度和准确性。

关键词：文本语义特征领域本体算法

一种基于语义组块特征的改进Cosine文本相似度计算方法

[期刊] 数据分析与知识发现 [作者] 白如江冷伏海廖君华

【目的】利用文本语义组块特征提升Cosine文本相似度计算性能。【方法】获取NSF资助的关于碳纳米管研究领域的项目数据,进行词干还原、词性标注等预处理;利用条件随机场模型实现文本内容的语义组块标注;在此基础上实现基于语义组块特征的改进Cosine文本相似度计算,并与未标注的数据进行相似度计算比较,分析实验结果。【结果】实验证明基于语义组块特征的改进Cosine相似度计算结果比原始文本Cosine相似度计算结果相似度均有不同程度的提升,在实验数据中最高的相似度提升了26%。【局限】依赖于语义组块标注性能。【

关键词：文本相似度语义组块向量空间模型本体

基于改进特征提取及聚类的网络评论挖掘研究

[期刊] 现代情报 [作者] 李昌兵庞崇鹏凌永亮王强

[目的/意义]针对信息过载条件下中文网络产品评论中特征提取性能低以及特征聚类中初始中心点的选取问题。[方法/过程]本研究提出采用基于权重的改进Apriori算法产生候选产品特征集合,再根据独立支持度、频繁项名词非特征规则及基于网络搜索引擎的PMI算法对候选产品特征集合进行过滤。并以基于HowNet的语义相似度和特征观点共现作为衡量产品特征之间关联程度的特征,提出一种改进K-means聚类算法对产品特征进行聚类。[结果/结论]实验结果表明,在特征提取阶段,查准率为69%,查全率为92.64%,综合值达到79

关键词： Apriori算法特征提取 PMI算法 K-means算法语义相似度

基于改进区域生长的木材导管形态特征提取方法

[期刊] 北京林业大学学报 [作者] 计智伟汪杭军何涛尹建新

基于图像的智能木材识别方法是通过自动提取木材的识别特征来识别木材,对木材科学和产业具有十分重要的意义。提出了一种基于改进区域生长的木材导管形态特征提取方法:采用分治策略改进区域生长法实现木材横切面显微图像中导管细胞的快速分割,用链码跟踪技术提取了10个导管细胞的形态特征;选取了6种阔叶材树种的横切面显微图像进行仿真实验。实验结果显示:本文方法能提高导管细胞的分割速度;所提取的10个形态特征在给定的树种显微图像上具有较高的区分度,说明将本文方法用于阔叶材树种智能识别具有较强的可行性。

关键词：区域生长导管细胞形态特征

基于N-gram的双向匹配中文分词方法

[期刊] 数理统计与管理 [作者] 凤丽洲杨贵军徐雪徐玉慧

针对基础词更能表达中文文本所包含的基本信息,更适合于后续的文本挖掘,提出一种基于N-gram的双向匹配中文分词方法。充分挖掘训练语料的词频信息,给出一种组合词迭代切分方法,解决最大匹配分词中长词歧义切分问题,并基于N-gram语言模型,实现最优分词序列的选择。此外,为弥补准确率P这一评价指标受词条长度影响较大而不稳健的问题,在刻画分词方法性能时引入正确切分词条总字数这一因素,提出一个新的测评指标P_n,有效规避了词条长度对分词准确率评价的影响。最后在SIGHAN组织的国际中文自然语言处理竞赛的两个语料上进行实验表明,相较于传统N-gram中文分词方法,本文方法在保证分词效率的前提下,有效地提高了准确率P、召回率R、P_n和F_1值。

关键词： N-gram模型分词歧义评测指标双向匹配

基于k均值和基于归一化类内方差的语音识别自适应聚类特征提取算法

[期刊] 清华大学学报(自然科学版) [作者] 肖熙周路

语音识别模型中帧间独立假设在给模型计算带来简洁的同时,不可避免地降低了模型精度,增加了识别错误。该文旨在寻找一种既能满足帧间独立假设又能保持语音信息的特征。分别提出了基于k均值和基于归一化类内方差的语音识别自适应聚类特征提取算法,可以自适应地实现聚类特征流的提取。将该自适应特征分别应用在Gauss混合模型-隐Markov模型、基于段长分布的隐Markov模型和上下文相关的深度神经网络模型这3种语音识别模型中,与基线系统进行了实验对比。结果表明:采用基于归一化类内方差的自适应特征可以使得3种语言模型的识别错

关键词：特征提取自适应聚类特征帧间独立假设归一化类内方差

一种改进的线性支持向量机的特征筛选算法

[期刊] 西北农林科技大学学报(自然科学版) [作者] 张阳刘永革景旭

针对SVM法线特征筛选算法仅考虑法线对特征筛选的贡献,而忽略了特征分布对特征筛选的贡献的不足,在对SVM法线算法进行分析的基础上,基于特征在正、负例中出现概率的不同提出了加权SVM法线算法,该算法考虑到了法线和特征的分布。通过试验可以看出,在使用较小的特征空间时,与SVM法线算法和信息增益算法相比,加权SVM法线算法具有更好的特征筛选性能。

关键词：特征筛选支持向量机加权SVM法线算法文本分类

微博话题识别中基于动态共词网络的文本特征提取方法

[期刊] 图书情报知识 [作者] 商宪丽王学东

本文针对微博文本的简短、动态性等特征，提出一种新的文本特征提取方法，提升微博话题识别任务中文本聚类算法效果。利用词项共现的思想，针对微博时序文本构建动态共词网络。在动态共词网络中，边权重随着时间推移而线性衰减，并在此基础上利用网络的度中心性计算微博文本特征权重。从新浪微博中采样构建实验数据集进行实验，结果表明动态共词网络特征提取方法相较于文档频率方法，更适宜于提取微博文本特征，能取得更好的微博话题识别效果。

关键词：微博话题识别动态共词网络特征提取文本聚类

首页
下一页
尾页
第 页

文献操作() 导出元数据文献计量分析

全选

导出文件格式：WXtxt

作者：

删除

推荐搜索

基于LSP与GLCM融合的禾本科牧草种子特征提取算法基于联合聚类与用户特征提取的协同过滤推荐算法基于模糊划分的自组织模糊特征提取算法研究一种基于类别分布信息的文本特征选择模型一种基于特征词聚类的文本分类方法基于并行特征提取和改进BiGRU的网络安全态势评估 Web文本特征提取方法的研究与发展一种基于信用评估数据分布特征的GAσFCM算法一种基于特征的实体统一算法在数据集成中的应用研究一种基于语义的中文文本分类算法