- 年份
- 2024(6551)
- 2023(9538)
- 2022(8218)
- 2021(7709)
- 2020(6648)
- 2019(15067)
- 2018(15001)
- 2017(28561)
- 2016(15154)
- 2015(17179)
- 2014(16718)
- 2013(16039)
- 2012(14544)
- 2011(12668)
- 2010(12150)
- 2009(10911)
- 2008(10432)
- 2007(8946)
- 2006(7286)
- 2005(6123)
- 学科
- 济(58865)
- 经济(58797)
- 管理(43756)
- 业(41820)
- 企(36242)
- 企业(36242)
- 方法(32814)
- 数学(28947)
- 数学方法(28394)
- 财(15566)
- 学(14300)
- 农(13940)
- 中国(13274)
- 业经(12281)
- 贸(10792)
- 贸易(10786)
- 务(10648)
- 财务(10601)
- 财务管理(10573)
- 易(10526)
- 理论(10293)
- 企业财务(10052)
- 技术(9664)
- 制(9458)
- 和(9330)
- 地方(9230)
- 农业(9132)
- 环境(8382)
- 划(8038)
- 银(7767)
- 机构
- 大学(208379)
- 学院(206221)
- 管理(83644)
- 济(79997)
- 经济(78372)
- 理学(73564)
- 理学院(72792)
- 管理学(71127)
- 管理学院(70766)
- 研究(63715)
- 中国(48252)
- 京(42380)
- 科学(41829)
- 财(36149)
- 农(32932)
- 业大(32362)
- 中心(32000)
- 所(30540)
- 财经(30093)
- 江(29276)
- 研究所(28307)
- 经(27653)
- 范(26628)
- 师范(26276)
- 农业(26046)
- 北京(25405)
- 经济学(24818)
- 院(23963)
- 州(23073)
- 财经大学(22862)
- 基金
- 项目(151704)
- 科学(121196)
- 基金(113842)
- 研究(105716)
- 家(100571)
- 国家(99845)
- 科学基金(87290)
- 社会(68230)
- 社会科(64791)
- 社会科学(64773)
- 基金项目(60570)
- 自然(59357)
- 自然科(58136)
- 自然科学(58120)
- 省(58004)
- 自然科学基金(57041)
- 划(49735)
- 教育(49532)
- 资助(46543)
- 编号(41605)
- 重点(34296)
- 部(33605)
- 成果(31879)
- 创(31846)
- 发(30975)
- 科研(30414)
- 创新(29845)
- 国家社会(29145)
- 教育部(28980)
- 大学(28611)
共检索到283957条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 图书情报知识
[作者]
商宪丽 王学东
本文针对微博文本的简短、动态性等特征,提出一种新的文本特征提取方法,提升微博话题识别任务中文本聚类算法效果。利用词项共现的思想,针对微博时序文本构建动态共词网络。在动态共词网络中,边权重随着时间推移而线性衰减,并在此基础上利用网络的度中心性计算微博文本特征权重。从新浪微博中采样构建实验数据集进行实验,结果表明动态共词网络特征提取方法相较于文档频率方法,更适宜于提取微博文本特征,能取得更好的微博话题识别效果。
[期刊] 数据分析与知识发现
[作者]
李昌兵 庞崇鹏 李美平
【目的】解决在海量客户评论信息中抽取产品特征时噪声大的问题。【方法】运用TF-IDF和方差选择的统计方法在众多初步提取出来的特征中进行选择,设置阈值后将各自提取出来的特征取交进行过滤,得到产品特征集合,根据基于矩阵和权重改进的Apriori算法产生频繁项集,设定不同阈值得到最优特征集合,实现对用户评论中产品特征的自动提取。【结果】以手机评论文本为例,从中抽取手机类的产品特征,根据人工标注的183个特征和算法识别出来的特征,查准率P为72.44%,查全率R为77.59%,综合值F为74.93%。【局限】查准
[期刊] 现代情报
[作者]
李昌兵 庞崇鹏 凌永亮 王强
[目的/意义]针对信息过载条件下中文网络产品评论中特征提取性能低以及特征聚类中初始中心点的选取问题。[方法/过程]本研究提出采用基于权重的改进Apriori算法产生候选产品特征集合,再根据独立支持度、频繁项名词非特征规则及基于网络搜索引擎的PMI算法对候选产品特征集合进行过滤。并以基于HowNet的语义相似度和特征观点共现作为衡量产品特征之间关联程度的特征,提出一种改进K-means聚类算法对产品特征进行聚类。[结果/结论]实验结果表明,在特征提取阶段,查准率为69%,查全率为92.64%,综合值达到79
[期刊] 图书馆
[作者]
马海群 王今
文章首先对已有关于开放数据安全问题的研究进行综述,将其划分为数据安全的法律政策、技术和策略意识三个研究方面,基于此分类将微博作为数据来源进行检索,对相关主题的微博文本数据进行编码分类,并引入神经网络方法建立数据安全相关话题的分类系统,验证该分类及系统的可靠性,从而提高在微博平台进行数据安全相关话题舆情研究的检索质量和效率,及时有效地掌握公众对于数据安全话题的动态。
[期刊] 情报理论与实践
[作者]
庞景安
本文对当前有关Web文本特征提取方法的研究和试验进行了简要的综述和分析,比较了每类方法的优势和不足,指出研究中存在的难点和共同探讨的问题,并在此基础上,对该领域未来研究的发展方向和趋势进行了预测。
关键词:
Web文本 文本特征 特征提取 学习算法
[期刊] 情报理论与实践
[作者]
张建娥
文章通过分析传统关键词提取方法的特点和存在的问题,提出基于多特征融合的中文文本关键词提取方法。该方法通过融合中文文本词语的频率、关联度、词性以及位置多种特征,有效避免了传统关键词提取方法产生的偏差。实验结果表明,该方法在不同测试集上与传统方法相比关键词提取的平均召回率均得到明显提升。
关键词:
中文文档 特征融合 关键词
[期刊] 情报理论与实践
[作者]
李杰 李欢
[目的/意义]构建在线评论的产品特征提取及情感分类模型,可以为产品设计人员进行产品优化改进提供决策支持。[方法/过程]提出了基于卷积神经网络算法的产品特征提取及情感分类模型。模型采用卷积神经网络进行短文本评论情感分类,以情感分类标签标注相应评论中提取的产品特征词,并利用词向量对产品特征词聚类。通过爬取的笔记本电脑和手机评论对模型进行训练和测试。[结果/结论]结果表明,模型能够实现有效的产品特征提取及高准确率情感分类,是在线评论分析的有效模型。
[期刊] 图书情报工作
[作者]
于津凯 王映雪 陈怀楚
介绍一种改进的文本特征提取及匹配算法。该算法基于N-Gram算法思路进行文本处理和特征提取,设计了gram关联矩阵用于统计与合并特征词,从而在固定长度N-Gram算法的基础上能够提取出不同长度的特征词。实验证明,该特征提取算法能够更为准确地描述文本特征,可应用于文本检索、Web挖掘等信息处理领域。
[期刊] 情报科学
[作者]
周源 刘怀兰 杜朋朋 廖岭
【目的/意义】特征提取会很大程度地影响分类效果,而传统TF-IDF特征提取方法缺乏对特征词上下文环境和对特征词在类之间分布状况的考虑。【方法/过程】本文提出一种改进TF-IDF特征提取的方法:(1)基于文本网络和改进Page Rank算法计算节点重要程度值,解决传统TF-IDF忽略文本结构信息的问题;(2)增加特征值IDF值的方差来衡量特征词w在不同类别文本集中程度的分布情况,解决传统TF-IDF忽略特征词在类之间分布状况的不足。【结果/结论】基于该改进方法构建了文本分类模型,对3D打印数据进行分类实验。
[期刊] 图书情报工作
[作者]
王立学 冷伏海
实施共词分析的核心在于设定共现分析的窗口。在标记文献内容结构的前提下,动态共词方法具有三个主要特征:多阶段的文本切分、按位置加权的短语频次、动态调整的共现统计范围。共同结果能更贴切地反映文献集内的主题关联,为情报研究人员提供质量更高的分析结果。
[期刊] 清华大学学报(自然科学版)
[作者]
杨宏宇 张梓锌 张良
针对目前网络安全态势评估方法在特征提取、高效性等方面存在的不足,该文提出了一种基于并行特征提取和改进双向门控循环单元(BiGRU)的网络安全态势评估方法,设计了一个由并行特征提取网络(PFEN)和基于注意力机制改进的BiGRU组成的深度学习模型(PFENABiGRU)。PFEN模块由并行的稀疏编码器组成,用于差异化地提取不同网络威胁的关键信息并将提取的特征与原始信息融合;ABiGRU模块通过注意力机制对关键特征进行加权以提高模型的准确性。将训练好的PFEN-ABiGRU模型用于网络威胁检测,根据威胁检测结果,结合提出的网络安全态势量化指标,计算网络安全态势值。实验结果表明,PFEN-ABiGRU在精确率和召回率上均优于对比的其他模型。
[期刊] 浙江林学院学报
[作者]
方益明 郑红平 冯海林
正确识别木材对木材科学和木材产业具有重要意义。提出一种提取木材显微图像特征并进行识别的新方法。首先进行傅里叶变换得到木材显微图像的傅里叶变换功率谱图,然后进行独立成分分解得到功率谱图的独立基,所提取的特征就是木材显微图像的功率谱图在独立基上的投影系数,最后利用支持向量机对待识别图像在独立基上的投影系数进行分类,实现木材识别。在200幅木材显微图像库上进行小样本实验,取得了较高的识别率。实验结果表明,该方法具有较大应用潜力。
[期刊] 科技管理研究
[作者]
万才超
图像是人类视觉对于物体或事物在系统中进行初步的识别后所形成的最终印象,是人类认识世界及人类本身的重要源泉。随数字化时代的到来,为了能够及时得到快捷并且清晰度较高、不失真等图像,借助现代化技术,数字图像处理技术应运而生。再现性、适用范围广、高效、灵活是数字图像技术最显著的应用优势。数字图像技术特点十分显著,目前在各行各业中发挥着至关重要的作用。
[期刊] 情报学报
[作者]
杨欣谊 王伟 朱恒民
社交平台是网民传达观点和情感的重要途径,分析社交平台话题分布及演化过程能够揭示舆情热点及传播发展过程,对引导公众舆论具有重要的参考作用。本研究利用网络社团演化的方法检测社交平台话题并分析其演化过程。首先,对用户发布的文本内容进行时间切片,构建时序共词网络并提取各时间切片的主干网络,利用Leiden算法检测社团来表示话题。其次,提出基于社团正向和反向转移概率及社团规模的话题演化事件检测方法,识别话题演化中的持续、增长、收缩、合并、分裂、新生以及消亡等事件。以新浪微博平台新冠肺炎疫情相关微博为例,在话题检测中发现,主干网络相较于原始网络能够检测到更多话题,话题内容区分粒度更细。在话题演化分析中,发现了公众情绪由消极转积极、防控和医疗工作专业化、国际疫情蔓延态势及疫情对经济的影响逐步扩大等演化路径。
[期刊] 统计与决策
[作者]
党耀国 侯荻青
多指标面板数据能够较全面的提供研究对象的信息和数据特征,但复杂的数据结构也给其聚类分析带来了一定的困难。针对这一问题,文章提出了基于特征提取的多指标面板数据聚类方法,该方法将能够表征面板数据动态变化的"绝对量"特征、"波动"特征、"偏度"特征、"峰度"特征及"趋势"特征引入动态聚类算法中,可以避免以往采用欧式距离进行聚类的局限性,还可以处理带有缺失数据的面板数据,同时大大提高了聚类效率,并最大限度地保证时间维度信息不受损失。利用该方法分析了2001至2013年我国不同省份道路交通事故的不平衡状况,通过实证分析表明该方法能够解决多指标面板数据聚类的问题。
关键词:
面板数据 特征提取 动态聚类 交通事故
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除