搜索文献-EPS

年份: 2024(9758); 2023(14323); 2022(12606); 2021(11884); 2020(9986); 2019(23200); 2018(23066); 2017(44904); 2016(24219); 2015(27456); 2014(27171); 2013(26510); 2012(23836); 2011(21171); 2010(21029); 2009(18823); 2008(17933); 2007(15278); 2006(12972); 2005(10708)

作者: 王(67841); 张(56537); 李(56249); 刘(53574); 陈(36052); 杨(27258); 晓(25519); 赵(22462); 周(21535); 华(19941); 吴(19365); 文(18854); 林(17842); 明(17689); 伟(17553); 志(17106); 丽(16918); 孙(16875); 徐(16151); 黄(16114); 玉(14005); 平(13744); 军(13713); 朱(12987); 郭(12662); 胡(12461); 红(12414); 建(12410); 春(11307); 艳(11234)

学科: 济(93169); 经济(93069); 管理(68712); 业(65255); 企(55206); 企业(55206); 方法(48646); 数学(42959); 数学方法(42188); 农(24109); 财(23167); 中国(22425); 学(21107); 业经(20494); 地方(17683); 理论(17091); 农业(16187); 贸(15746); 贸易(15736); 务(15468); 财务(15386); 财务管理(15355); 易(15272); 技术(15238); 和(15063); 制(14641); 企业财务(14508); 环境(14427); 划(13020); 银(12142)

机构: 学院(333603); 大学(333242); 管理(136397); 济(126391); 经济(123613); 理学(120049); 理学院(118765); 管理学(116154); 管理学院(115576); 研究(104750); 中国(75935); 京(69518); 科学(68374); 财(56032); 农(52668); 业大(52247); 所(51276); 中心(48575); 研究所(47500); 财经(46436); 江(46218); 范(43910); 师范(43460); 北京(43056); 经(42431); 农业(41415); 院(39025); 州(37901); 经济学(37430); 技术(36530)

基金: 项目(242091); 科学(190928); 基金(176074); 研究(174092); 家(154159); 国家(152923); 科学基金(132475); 社会(107686); 社会科(102046); 社会科学(102017); 省(95210); 基金项目(94008); 自然(89283); 自然科(87262); 自然科学(87243); 自然科学基金(85615); 教育(81561); 划(80376); 资助(73072); 编号(71514); 成果(55798); 重点(54331); 部(52764); 发(50706); 创(50626); 课题(48568); 创新(47152); 科研(47034); 教育部(45268); 大学(45231)

期刊: 济(126663); 经济(126663); 研究(89960); 中国(55746); 学报(53940); 科学(49775); 管理(48085); 农(46177); 财(41869); 大学(41147); 学学(38899); 教育(37899); 农业(32539); 技术(31480); 融(22014); 金融(22014); 业经(21987); 财经(21167); 经济研究(20549); 经(17932); 图书(17273); 业(16866); 科技(16671); 问题(16394); 技术经济(16028); 版(15713); 统计(15699); 资源(15612); 理论(15406); 商业(14400)

全选本页取消本页

共检索到455078条记录

发布时间倒序

发布时间倒序
相关度优先

文献计量分析

结果分析(前20)
结果分析(前50)
结果分析(前100)
结果分析(前200)
结果分析(前500)

基于改进TF-IDF特征提取的文本分类模型研究

[期刊] 情报科学 [作者] 周源刘怀兰杜朋朋廖岭

【目的/意义】特征提取会很大程度地影响分类效果,而传统TF-IDF特征提取方法缺乏对特征词上下文环境和对特征词在类之间分布状况的考虑。【方法/过程】本文提出一种改进TF-IDF特征提取的方法:(1)基于文本网络和改进Page Rank算法计算节点重要程度值,解决传统TF-IDF忽略文本结构信息的问题;(2)增加特征值IDF值的方差来衡量特征词w在不同类别文本集中程度的分布情况,解决传统TF-IDF忽略特征词在类之间分布状况的不足。【结果/结论】基于该改进方法构建了文本分类模型,对3D打印数据进行分类实验。

关键词：特征提取 TF-IDF 文本分类文本网络 Page Rank

改进TF-IDF算法的文本特征项权值计算方法

[期刊] 图书情报工作 [作者] 路永和李焰锋

首先,从特征项重要性和类别区分能力的角度出发,通过分析传统的权重函数TF-IDF(termfrequency-inverse document frequency)及其相关改进算法,研究文本分类中向量化时的特征权重计算,构建权重修正函数TW。其次,通过对特征词的卡方分布和TW作对比实验,验证TW能提高类别中专有词汇的权值,降低常见但对分类不重要的特征的权值。最后,将TW与TF-IDF结合作为新的特征权重算法,通过在中文分类语料库上的实际分类实验,与其他权重算法比较,验证此种算法的有效性。

关键词：文本分类 TF-IDF 特征权重类别区分

基于深度学习的短文本评论产品特征提取及情感分类研究

[期刊] 情报理论与实践 [作者] 李杰李欢

[目的/意义]构建在线评论的产品特征提取及情感分类模型,可以为产品设计人员进行产品优化改进提供决策支持。[方法/过程]提出了基于卷积神经网络算法的产品特征提取及情感分类模型。模型采用卷积神经网络进行短文本评论情感分类,以情感分类标签标注相应评论中提取的产品特征词,并利用词向量对产品特征词聚类。通过爬取的笔记本电脑和手机评论对模型进行训练和测试。[结果/结论]结果表明,模型能够实现有效的产品特征提取及高准确率情感分类,是在线评论分析的有效模型。

关键词：产品特征情感分类在线评论卷积神经网络深度学习

基于LDA模型特征选择的在线医疗社区文本分类及用户聚类研究

[期刊] 情报学报 [作者] 吴江侯绍新靳萌萌胡忠义

随着互联网时代的快速发展,在线医疗社区的出现打破了时空限制,为用户提供了丰富的医疗信息和情感帮助,已经成为社会支持的重要来源,受到用户的广泛关注和参与。对在线医疗社区进行用户文本挖掘能够揭示社区中用户的参与行为,从而优化其用户管理和信息推荐。已有的研究对象主要集中在英文在线医疗社区,鲜有文献对中文在线医疗社区进行研究。基于社会支持理论,本文设计了一个中文用户文本挖掘流程来研究中文在线医疗社区中的社会支持类型和用户参与。利用中文文本挖掘及机器学习方法,对中文糖尿病社区"甜蜜家园"进行研究。本文利用LDA(L

关键词：在线医疗社区 LDA模型特征提取文本分类用户聚类

一种基于N-Gram改进的文本特征提取算法

[期刊] 图书情报工作 [作者] 于津凯王映雪陈怀楚

介绍一种改进的文本特征提取及匹配算法。该算法基于N-Gram算法思路进行文本处理和特征提取,设计了gram关联矩阵用于统计与合并特征词,从而在固定长度N-Gram算法的基础上能够提取出不同长度的特征词。实验证明,该特征提取算法能够更为准确地描述文本特征,可应用于文本检索、Web挖掘等信息处理领域。

关键词：文本特征提取 N-Gram算法 gram关联矩阵

基于用户自然标注的TF-IDF辅助标引算法及实证研究

[期刊] 图书情报工作 [作者] 陈白雪宋培彦

[目的/意义]从用户角度出发,研究基于用户自然标注的TF?IDF辅助标引算法。[方法/过程]首先以核心期刊论文中作者标注的关键词和分类号为源数据,通过对关键词词频进行统计,使用TF?IDF算法构建用户标注词表、形成标引知识库,然后通过IKAnalyzer分词软件对待标引的科技项目数据进行切词和停用词处理,进而使用TF?IDF算法和位置加权算法提取科技项目数据的特征词,最终实现对科技项目数据进行关键词和分类的同步标引。[结果 /结论]实验结果表明,机标关键词与人标关键词的相似比在60%以上的科技项目数据占总

关键词：辅助标引用户自然标注 TF?IDF算法信息组织

会计师事务所联结与企业会计政策相似性——基于TF-IDF的文本相似度分析

[期刊] 审计研究 [作者] 张勇殷健

本文利用TF-IDF的文本相似度分析方法考察了会计师事务所联结对企业会计政策相似性的影响。研究发现,与不存在会计师事务所联结的两家企业相比,存在会计师事务所联结的两家企业的会计政策相似性水平更高;本年度,若两家企业由上年度不存在事务所联结关系变更为存在联结关系,则其会计政策相似性水平会上升。进一步研究表明,在会计师事务所联结的配对企业中,与规模小的会计师事务所相比,规模大的会计师事务所联结的两家企业会计政策相似性水平更高;本年度,若两家企业的事务所规模由上年度的小所变更为大所,则其会计政策相似性水平会上升。事务所向其联结的两家企业派遣的审计师重合程度越高,那么企业之间的会计政策相似性水平越高;若两家企业当年的审计师重合程度高于上年度,则其会计政策相似性水平会上升。

关键词：会计师事务所联结会计政策相似性会计师事务所规模审计师重合度

基于潜在语义分析和改进的HS-SVM的文本分类模型研究

[期刊] 图书情报工作 [作者] 张玉峰何超

为提高文本分类的准确性与效率,提出一种基于潜在语义分析和改进的超球支持向量机的文本分类模型。该模型利用潜在语义分析进行特征抽取,消除同义词和多义词在文本表示时所造成的偏差,实现文本向量的降维。针对超球重叠区域的文本分类问题,设计一种新的决策方法—基于密集度的决策策略。实验结果表明,该模型在类别数目较小时具有较好的分类效果,改进的算法有效可行。

关键词：文本分类潜在语义分析改进的超球支持向量机重叠区域文本

基于改进TF-IDF的中文网页关键词抽取——以新闻网页为例

[期刊] 情报理论与实践 [作者] 钱爱兵江岚

结合新闻网页的内容特征对中文网页关键词的构成特点进行阐述;对经典的TF-IDF加权公式进行改进,构建一个综合考虑多种影响因素的候选关键词评分加权公式;对SharpICTCLAS分词进行改进,增加位置标注;选择评分较高的词作为候选关键词,利用词的位置标注进行关键词抽取优化操作,将"切碎"的候选关键词进行组配,形成正式抽取的关键词。实验结果表明:该方法明显优于基准方法,能够抽取到令人满意的关键词。

关键词：词频逆文档频率新闻网页关键词抽取

基于HLDA-IDF模型的网络文本主题挖掘研究

[期刊] 情报理论与实践 [作者] 陈斌马静

[目的/意义]为了弥补LDA模型建模过程中未考虑到网络文本中文档关注度和质量度这一因素,并增强结果的语义可解释性和主题表示能力,文章提出了一种热度加权的HLDA-IDF的网络文本主题挖掘模型。[方法/过程]本文首先是给出了较为准确的热度定义,并对LDA模型进行热度加权,构建出了HLDA模型,再依据词汇的主题表示能力存在差异这一实际情况,引入TF-IDF算法并改进,构建出HLDA-IDF模型,最后利用实际论坛数据进行实验验证。[结果/结论]实验结果表明该模型的结果语义可解释性和主题表示能力较强。

关键词：热度模型主题挖掘网络文本文本挖掘

基于改进特征提取及聚类的网络评论挖掘研究

[期刊] 现代情报 [作者] 李昌兵庞崇鹏凌永亮王强

[目的/意义]针对信息过载条件下中文网络产品评论中特征提取性能低以及特征聚类中初始中心点的选取问题。[方法/过程]本研究提出采用基于权重的改进Apriori算法产生候选产品特征集合,再根据独立支持度、频繁项名词非特征规则及基于网络搜索引擎的PMI算法对候选产品特征集合进行过滤。并以基于HowNet的语义相似度和特征观点共现作为衡量产品特征之间关联程度的特征,提出一种改进K-means聚类算法对产品特征进行聚类。[结果/结论]实验结果表明,在特征提取阶段,查准率为69%,查全率为92.64%,综合值达到79

关键词： Apriori算法特征提取 PMI算法 K-means算法语义相似度

基于权重的Apriori算法在文本统计特征提取方法中的应用

[期刊] 数据分析与知识发现 [作者] 李昌兵庞崇鹏李美平

【目的】解决在海量客户评论信息中抽取产品特征时噪声大的问题。【方法】运用TF-IDF和方差选择的统计方法在众多初步提取出来的特征中进行选择,设置阈值后将各自提取出来的特征取交进行过滤,得到产品特征集合,根据基于矩阵和权重改进的Apriori算法产生频繁项集,设定不同阈值得到最优特征集合,实现对用户评论中产品特征的自动提取。【结果】以手机评论文本为例,从中抽取手机类的产品特征,根据人工标注的183个特征和算法识别出来的特征,查准率P为72.44%,查全率R为77.59%,综合值F为74.93%。【局限】查准

关键词：特征提取 Apriori算法 TF-IDF 方差选择

Web文本特征提取方法的研究与发展

[期刊] 情报理论与实践 [作者] 庞景安

本文对当前有关Web文本特征提取方法的研究和试验进行了简要的综述和分析,比较了每类方法的优势和不足,指出研究中存在的难点和共同探讨的问题,并在此基础上,对该领域未来研究的发展方向和趋势进行了预测。

关键词： Web文本文本特征特征提取学习算法

数字高程模型在活动断层位置及地表变形变位特征提取研究中的应用

[期刊] 地理科学进展 [作者] 张欣欣

活动断层的位置分布及其地表变形变位特征的准确识别是研究和评价活动断层的基础,国内外学者利用数字高程模型(DEM)对断层提取进行了大量研究。本文基于DEM的活动断层位置的提取方法进行综述,总结了DEM提取断层位置的地貌形态特征分析、图像处理以及综合处理提取方法,突出介绍了高分辨率DEM在详细的断层位置分布提取中的优势,DEM在断层地表变形变位及其特征参数提取研究中的最新应用进展。随着高分辨率DEM的快速发展,DEM及其空间分析技术已成为一种常见的地学研究方法,将其与野外调查、遥感、测年等技术结合进行综合分析,能够促进对活动断层的深入研究,并成为断层定量化研究强有力的技术手段。

关键词：数字高程模型(DEM) 激光雷达活动断层地表变形变位特征

基于改进的SVM文本分类建模

[期刊] 情报理论与实践 [作者] 刘秀松

SVM是一种新的分类工具,可是其核函数在数学上必须满足Mercer条件,使得具有良好全局分类性能的Sigmoid函数在SVM中应用受到限制。本文将Sigmoid核函数与云模型相结合,提出一种简单的核函数的实现方法。此方法不仅提高了SVM文本分类能力,而且明显地减少了平均的CPU执行时间。

关键词：云模型支持向量机文本分类

首页
下一页
尾页
第 页

文献操作() 导出元数据文献计量分析

全选

导出文件格式：WXtxt

作者：

删除

推荐搜索

基于改进区域生长的木材导管形态特征提取方法基于潜在语义分析和HS-SVM的文本分类模型研究 LDA模型在专利文本分类中的应用基于模糊划分的自组织模糊特征提取算法研究融合领域本体的中文文本语义特征提取算法研究基于高斯混合模型的林业信息文本分类算法微博话题识别中基于动态共词网络的文本特征提取方法基于DEM的数字流域特征提取研究进展聚类模型在客户关系管理中的应用以及对特征提取的探讨基于SRTM DEM的汾河流域特征提取研究