- 年份
- 2024(9758)
- 2023(14323)
- 2022(12606)
- 2021(11884)
- 2020(9986)
- 2019(23200)
- 2018(23066)
- 2017(44905)
- 2016(24220)
- 2015(27458)
- 2014(27172)
- 2013(26511)
- 2012(23836)
- 2011(21171)
- 2010(21029)
- 2009(18823)
- 2008(17933)
- 2007(15278)
- 2006(12972)
- 2005(10708)
- 学科
- 济(93172)
- 经济(93072)
- 管理(68712)
- 业(65255)
- 企(55206)
- 企业(55206)
- 方法(48649)
- 数学(42962)
- 数学方法(42191)
- 农(24109)
- 财(23167)
- 中国(22426)
- 学(21107)
- 业经(20494)
- 地方(17683)
- 理论(17091)
- 农业(16187)
- 贸(15746)
- 贸易(15736)
- 务(15468)
- 财务(15386)
- 财务管理(15355)
- 易(15272)
- 技术(15238)
- 和(15063)
- 制(14642)
- 企业财务(14508)
- 环境(14427)
- 划(13020)
- 银(12144)
- 机构
- 学院(333608)
- 大学(333248)
- 管理(136398)
- 济(126397)
- 经济(123619)
- 理学(120049)
- 理学院(118765)
- 管理学(116154)
- 管理学院(115576)
- 研究(104754)
- 中国(75936)
- 京(69519)
- 科学(68374)
- 财(56032)
- 农(52668)
- 业大(52247)
- 所(51278)
- 中心(48578)
- 研究所(47501)
- 财经(46436)
- 江(46218)
- 范(43910)
- 师范(43460)
- 北京(43057)
- 经(42431)
- 农业(41415)
- 院(39025)
- 州(37901)
- 经济学(37432)
- 技术(36530)
- 基金
- 项目(242097)
- 科学(190934)
- 基金(176080)
- 研究(174098)
- 家(154165)
- 国家(152929)
- 科学基金(132481)
- 社会(107691)
- 社会科(102051)
- 社会科学(102022)
- 省(95210)
- 基金项目(94008)
- 自然(89289)
- 自然科(87268)
- 自然科学(87249)
- 自然科学基金(85621)
- 教育(81562)
- 划(80380)
- 资助(73078)
- 编号(71515)
- 成果(55801)
- 重点(54331)
- 部(52765)
- 发(50706)
- 创(50626)
- 课题(48570)
- 创新(47152)
- 科研(47035)
- 教育部(45269)
- 大学(45235)
- 期刊
- 济(126664)
- 经济(126664)
- 研究(89962)
- 中国(55746)
- 学报(53940)
- 科学(49775)
- 管理(48086)
- 农(46177)
- 财(41870)
- 大学(41147)
- 学学(38899)
- 教育(37899)
- 农业(32539)
- 技术(31480)
- 融(22017)
- 金融(22017)
- 业经(21987)
- 财经(21168)
- 经济研究(20549)
- 经(17933)
- 图书(17273)
- 业(16866)
- 科技(16671)
- 问题(16394)
- 技术经济(16028)
- 版(15713)
- 统计(15699)
- 资源(15612)
- 理论(15406)
- 商业(14400)
共检索到455084条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 情报科学
[作者]
周源 刘怀兰 杜朋朋 廖岭
【目的/意义】特征提取会很大程度地影响分类效果,而传统TF-IDF特征提取方法缺乏对特征词上下文环境和对特征词在类之间分布状况的考虑。【方法/过程】本文提出一种改进TF-IDF特征提取的方法:(1)基于文本网络和改进Page Rank算法计算节点重要程度值,解决传统TF-IDF忽略文本结构信息的问题;(2)增加特征值IDF值的方差来衡量特征词w在不同类别文本集中程度的分布情况,解决传统TF-IDF忽略特征词在类之间分布状况的不足。【结果/结论】基于该改进方法构建了文本分类模型,对3D打印数据进行分类实验。
[期刊] 图书情报工作
[作者]
路永和 李焰锋
首先,从特征项重要性和类别区分能力的角度出发,通过分析传统的权重函数TF-IDF(termfrequency-inverse document frequency)及其相关改进算法,研究文本分类中向量化时的特征权重计算,构建权重修正函数TW。其次,通过对特征词的卡方分布和TW作对比实验,验证TW能提高类别中专有词汇的权值,降低常见但对分类不重要的特征的权值。最后,将TW与TF-IDF结合作为新的特征权重算法,通过在中文分类语料库上的实际分类实验,与其他权重算法比较,验证此种算法的有效性。
[期刊] 情报理论与实践
[作者]
李杰 李欢
[目的/意义]构建在线评论的产品特征提取及情感分类模型,可以为产品设计人员进行产品优化改进提供决策支持。[方法/过程]提出了基于卷积神经网络算法的产品特征提取及情感分类模型。模型采用卷积神经网络进行短文本评论情感分类,以情感分类标签标注相应评论中提取的产品特征词,并利用词向量对产品特征词聚类。通过爬取的笔记本电脑和手机评论对模型进行训练和测试。[结果/结论]结果表明,模型能够实现有效的产品特征提取及高准确率情感分类,是在线评论分析的有效模型。
[期刊] 情报学报
[作者]
吴江 侯绍新 靳萌萌 胡忠义
随着互联网时代的快速发展,在线医疗社区的出现打破了时空限制,为用户提供了丰富的医疗信息和情感帮助,已经成为社会支持的重要来源,受到用户的广泛关注和参与。对在线医疗社区进行用户文本挖掘能够揭示社区中用户的参与行为,从而优化其用户管理和信息推荐。已有的研究对象主要集中在英文在线医疗社区,鲜有文献对中文在线医疗社区进行研究。基于社会支持理论,本文设计了一个中文用户文本挖掘流程来研究中文在线医疗社区中的社会支持类型和用户参与。利用中文文本挖掘及机器学习方法,对中文糖尿病社区"甜蜜家园"进行研究。本文利用LDA(L
[期刊] 图书情报工作
[作者]
于津凯 王映雪 陈怀楚
介绍一种改进的文本特征提取及匹配算法。该算法基于N-Gram算法思路进行文本处理和特征提取,设计了gram关联矩阵用于统计与合并特征词,从而在固定长度N-Gram算法的基础上能够提取出不同长度的特征词。实验证明,该特征提取算法能够更为准确地描述文本特征,可应用于文本检索、Web挖掘等信息处理领域。
[期刊] 图书情报工作
[作者]
陈白雪 宋培彦
[目的/意义]从用户角度出发,研究基于用户自然标注的TF?IDF辅助标引算法。[方法/过程]首先以核心期刊论文中作者标注的关键词和分类号为源数据,通过对关键词词频进行统计,使用TF?IDF算法构建用户标注词表、形成标引知识库,然后通过IKAnalyzer分词软件对待标引的科技项目数据进行切词和停用词处理,进而使用TF?IDF算法和位置加权算法提取科技项目数据的特征词,最终实现对科技项目数据进行关键词和分类的同步标引。[结果 /结论]实验结果表明,机标关键词与人标关键词的相似比在60%以上的科技项目数据占总
[期刊] 审计研究
[作者]
张勇 殷健
本文利用TF-IDF的文本相似度分析方法考察了会计师事务所联结对企业会计政策相似性的影响。研究发现,与不存在会计师事务所联结的两家企业相比,存在会计师事务所联结的两家企业的会计政策相似性水平更高;本年度,若两家企业由上年度不存在事务所联结关系变更为存在联结关系,则其会计政策相似性水平会上升。进一步研究表明,在会计师事务所联结的配对企业中,与规模小的会计师事务所相比,规模大的会计师事务所联结的两家企业会计政策相似性水平更高;本年度,若两家企业的事务所规模由上年度的小所变更为大所,则其会计政策相似性水平会上升。事务所向其联结的两家企业派遣的审计师重合程度越高,那么企业之间的会计政策相似性水平越高;若两家企业当年的审计师重合程度高于上年度,则其会计政策相似性水平会上升。
[期刊] 图书情报工作
[作者]
张玉峰 何超
为提高文本分类的准确性与效率,提出一种基于潜在语义分析和改进的超球支持向量机的文本分类模型。该模型利用潜在语义分析进行特征抽取,消除同义词和多义词在文本表示时所造成的偏差,实现文本向量的降维。针对超球重叠区域的文本分类问题,设计一种新的决策方法—基于密集度的决策策略。实验结果表明,该模型在类别数目较小时具有较好的分类效果,改进的算法有效可行。
[期刊] 情报理论与实践
[作者]
钱爱兵 江岚
结合新闻网页的内容特征对中文网页关键词的构成特点进行阐述;对经典的TF-IDF加权公式进行改进,构建一个综合考虑多种影响因素的候选关键词评分加权公式;对SharpICTCLAS分词进行改进,增加位置标注;选择评分较高的词作为候选关键词,利用词的位置标注进行关键词抽取优化操作,将"切碎"的候选关键词进行组配,形成正式抽取的关键词。实验结果表明:该方法明显优于基准方法,能够抽取到令人满意的关键词。
关键词:
词频 逆文档频率 新闻网页 关键词抽取
[期刊] 情报理论与实践
[作者]
陈斌 马静
[目的/意义]为了弥补LDA模型建模过程中未考虑到网络文本中文档关注度和质量度这一因素,并增强结果的语义可解释性和主题表示能力,文章提出了一种热度加权的HLDA-IDF的网络文本主题挖掘模型。[方法/过程]本文首先是给出了较为准确的热度定义,并对LDA模型进行热度加权,构建出了HLDA模型,再依据词汇的主题表示能力存在差异这一实际情况,引入TF-IDF算法并改进,构建出HLDA-IDF模型,最后利用实际论坛数据进行实验验证。[结果/结论]实验结果表明该模型的结果语义可解释性和主题表示能力较强。
关键词:
热度 模型 主题挖掘 网络文本 文本挖掘
[期刊] 现代情报
[作者]
李昌兵 庞崇鹏 凌永亮 王强
[目的/意义]针对信息过载条件下中文网络产品评论中特征提取性能低以及特征聚类中初始中心点的选取问题。[方法/过程]本研究提出采用基于权重的改进Apriori算法产生候选产品特征集合,再根据独立支持度、频繁项名词非特征规则及基于网络搜索引擎的PMI算法对候选产品特征集合进行过滤。并以基于HowNet的语义相似度和特征观点共现作为衡量产品特征之间关联程度的特征,提出一种改进K-means聚类算法对产品特征进行聚类。[结果/结论]实验结果表明,在特征提取阶段,查准率为69%,查全率为92.64%,综合值达到79
[期刊] 数据分析与知识发现
[作者]
李昌兵 庞崇鹏 李美平
【目的】解决在海量客户评论信息中抽取产品特征时噪声大的问题。【方法】运用TF-IDF和方差选择的统计方法在众多初步提取出来的特征中进行选择,设置阈值后将各自提取出来的特征取交进行过滤,得到产品特征集合,根据基于矩阵和权重改进的Apriori算法产生频繁项集,设定不同阈值得到最优特征集合,实现对用户评论中产品特征的自动提取。【结果】以手机评论文本为例,从中抽取手机类的产品特征,根据人工标注的183个特征和算法识别出来的特征,查准率P为72.44%,查全率R为77.59%,综合值F为74.93%。【局限】查准
[期刊] 情报理论与实践
[作者]
庞景安
本文对当前有关Web文本特征提取方法的研究和试验进行了简要的综述和分析,比较了每类方法的优势和不足,指出研究中存在的难点和共同探讨的问题,并在此基础上,对该领域未来研究的发展方向和趋势进行了预测。
关键词:
Web文本 文本特征 特征提取 学习算法
[期刊] 地理科学进展
[作者]
张欣欣
活动断层的位置分布及其地表变形变位特征的准确识别是研究和评价活动断层的基础,国内外学者利用数字高程模型(DEM)对断层提取进行了大量研究。本文基于DEM的活动断层位置的提取方法进行综述,总结了DEM提取断层位置的地貌形态特征分析、图像处理以及综合处理提取方法,突出介绍了高分辨率DEM在详细的断层位置分布提取中的优势,DEM在断层地表变形变位及其特征参数提取研究中的最新应用进展。随着高分辨率DEM的快速发展,DEM及其空间分析技术已成为一种常见的地学研究方法,将其与野外调查、遥感、测年等技术结合进行综合分析,能够促进对活动断层的深入研究,并成为断层定量化研究强有力的技术手段。
[期刊] 情报科学
[作者]
刘小慧 李长玲 冯志刚
【目的/意义】提出一种TF*IDF改进算法,用于全文分词后的语词权重计算,提取高权重语词,分析学科研究热点。【方法/过程】以万方数据库中2015年《情报学报》的载文为例,对每篇文章全文分词,用改进的TF*IDF方法计算语词权重。【结果/结论】发现该改进算法准确可行,且运用该方法分析得到,用户研究、大数据、情报学、社交网络、技术领域、文献作者、突发事件、零被引等,是2015年情报学的研究热点。
关键词:
研究热点 TF*IDF 全文分词 情报学
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除