- 年份
- 2024(5352)
- 2023(7664)
- 2022(6621)
- 2021(6158)
- 2020(5308)
- 2019(12150)
- 2018(11863)
- 2017(23192)
- 2016(11900)
- 2015(13196)
- 2014(12751)
- 2013(12223)
- 2012(10834)
- 2011(9305)
- 2010(8680)
- 2009(7720)
- 2008(6872)
- 2007(5314)
- 2006(4121)
- 2005(3107)
- 学科
- 济(47868)
- 经济(47822)
- 管理(34627)
- 业(34462)
- 方法(28164)
- 企(27868)
- 企业(27868)
- 数学(25892)
- 数学方法(25525)
- 农(13287)
- 财(12612)
- 中国(10729)
- 业经(9867)
- 农业(9181)
- 务(8504)
- 财务(8471)
- 财务管理(8452)
- 企业财务(8056)
- 贸(7815)
- 贸易(7808)
- 技术(7768)
- 地方(7635)
- 易(7619)
- 制(7388)
- 学(7142)
- 理论(6884)
- 环境(6777)
- 和(6554)
- 银(6497)
- 银行(6492)
- 机构
- 大学(155557)
- 学院(154743)
- 管理(68571)
- 济(66297)
- 经济(65266)
- 理学(61321)
- 理学院(60809)
- 管理学(59711)
- 管理学院(59410)
- 研究(43875)
- 中国(33564)
- 京(29783)
- 财(28167)
- 科学(25907)
- 业大(24181)
- 财经(24144)
- 农(23783)
- 中心(23519)
- 经(22335)
- 经济学(20937)
- 江(20558)
- 经济管理(19183)
- 经济学院(19178)
- 所(18714)
- 农业(18604)
- 财经大学(18516)
- 范(17934)
- 商学(17786)
- 师范(17706)
- 商学院(17626)
- 基金
- 项目(120713)
- 科学(97764)
- 基金(91824)
- 研究(86742)
- 家(79902)
- 国家(79304)
- 科学基金(70771)
- 社会(58097)
- 社会科(55353)
- 社会科学(55339)
- 基金项目(49365)
- 自然(46713)
- 省(46170)
- 自然科(45764)
- 自然科学(45755)
- 自然科学基金(44926)
- 教育(40549)
- 划(38942)
- 资助(36718)
- 编号(34129)
- 部(27641)
- 重点(26623)
- 创(26155)
- 国家社会(25366)
- 发(24812)
- 成果(24732)
- 教育部(24461)
- 创新(24460)
- 人文(24070)
- 科研(24023)
共检索到200538条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 清华大学学报(自然科学版)
[作者]
方勇 刘道胜 黄诚
互联网上充斥着大量恶意用户,而互联网服务提供商通常有海量的注册用户,使得系统难以从中发现虚假账户。针对海量注册数据中,恶意用户批量注册的虚假账户通常具有相似性的特点。该文提出海量数据中定位虚假账户的系统模型,利用用户名字符串组成模式对海量数据进行预分类,进而对每个分类中元素计算字符串相似度,即计算字符串Levenshtein距离。设置合适的阈值,进行层次聚类分析,从而定位藏匿在海量注册数据中的成组的虚假账户。实验结果表明:该系统模型有效,与现有的模型相比,该系统对数据维度、数据特性依赖较小。
关键词:
数据安全 虚假账户 机器学习 层次聚类
[期刊] 情报理论与实践
[作者]
陈娟 吴卓青 邓胜利
[目的/意义]对“知乎”用户群体进行细分,便于服务商准确锁定目标群体,提供更优质、精确的社会化问答服务。[方法/过程]抓取知乎用户数据,运用层次聚类法对33974个样本数据进行分组,构建以粉丝数为因变量的Tobit模型,识别其粉丝积累途径的差异。[结果/结论]识别了三个细分群体:“信息搜寻型用户”,以信息搜寻为主要目的,回答问题能力不强,可能通过“互粉”进行粉丝积累;“专家型用户”,人数不多,通过提供有用信息来积攒粉丝,通过关注话题和他人完成信息内化及能力提升;“自我学习型”用户,表现中庸,会通过提问获取
关键词:
层次聚类法 用户细分 用户行为 特征分析
[期刊] 情报学报
[作者]
王震宇 朱学芳
为了减少虚假新闻给社会带来的负面影响,虚假新闻检测一直是自然语言处理中的一个重要领域。现有多模态虚假新闻检测方法通常使用预训练模型充当特征提取器,但是这些方法存在以下不足:(1)预训练模型参数在模型训练过程中总是会冻结,但预训练模型并不完美;(2)基于CNN (convolutional neural network)的图像特征提取器结构通常比基于Transformer的文本特征提取器结构更加复杂,图像特征通常被提前存储,使得这些模型的缺点被忽略。为此,本文提出基于端到端训练的多模态Transformer模型,通过使用视觉Transformer代替CNN提取图像特征,统一了不同模态的特征提取过程,利用共同注意力模块实现图像特征和文本特征交叉融合,并且在3个公开数据集上进行了对比实验。实验结果表明,本文模型性能超越了其他基线模型。
[期刊] 图书馆建设
[作者]
彭贤哲 石进
实现多源异构的图书资源的深度融合,有利于拓展图书服务的广度和全面性,促进智慧图书馆体系的建设,其中,多样异构、名称不一的图书元数据的语义聚合是深度融合多来源图书信息的关键所在。为此,本文通过对比分析图书在不同平台分布的元数据的差异性,以BERT-Base-Chinese作为词嵌入模型,从元数据字段本身、属性值两个角度,分析元数据之间的语义相似度和距离,并基于距离矩阵实现层次聚类,自动构建元数据之间的映射对应关系,实现名称或属性相似的图书元数据之间的语义聚合。实验结果表明,该模型识别的映射关系精准度达到了93.33%,大大降低了元数据聚集与融合过程中需付出的人力成本。此外,图书元数据语义聚合方式获得的结果具备横向扩展的空间,聚合过程亦可迭代复用,在其他信息聚合场景也具有一定的兼容性和通用性。
[期刊] 情报杂志
[作者]
裘江南 谷文静 翟劼
[目的/意义]对微博消息进行热点话题挖掘,进而从海量微博文本中实时找出用户关注、讨论的热点事件,是进行舆情监测、应急管理的基础。然而,现有微博热点话题检测研究却大多忽略了不同影响力用户对话题产生及传播的作用,并且检测结果直观性较差。针对此问题,提出了基于用户影响力的热点话题检测方法。[方法/过程]首先识别用户特征要素,构建用户影响力模型,计算用户影响力;然后,综合考虑主题词影响力、影响力增长速度和增长斜率,提出基于用户影响力的微博热点话题主题词抽取方法,抽取主题词簇;之后,识别核心主题词并进行热点话题关键
关键词:
话题挖掘 用户影响力 微博 文本挖掘
[期刊] 清华大学学报(自然科学版)
[作者]
贾凡 严妍 张家琪
针对基础K-means算法在KDD 99数据集中检测罕见攻击效果差且效率低下等问题,该文通过数据统计的方式对数据集中各维度与每类攻击类型的相关分析发现,罕见攻击极易被大量的常见攻击所淹没,而当常见攻击被移去时,这些威胁性更大的罕见攻击则能够被更好地识别出来。基于此,该文提出一种改进的基于K-means分层迭代的检测算法,通过有针对性的特征选择来降低K-means聚类的数据维度,经过多次属性消减的K-means聚类迭代操作可以更加精准地检测到不同异常类型的攻击。在KDD 99数据集上的实验结果表明:该算法对
[期刊] 数据分析与知识发现
[作者]
高永兵 杨贵朋 张娣 马占飞
【目的】针对官方微博数据存在大量不相关信息的问题,过滤博文进而检测事件。【方法】利用Word2Vec机器学习模型训练官方微博记录集,并将博文影响力、词基础权重以及官微相关性相结合,提出官方微博突显词检测方法,计算突显词博文的相似度,利用层次聚类算法对突显词博文聚类后选取合适的突显词描述事件,从而实现事件检测。【结果】实验结果表明,与TF-IDF和TextRank算法相比较,本文的突显词算法在准确率(63.5%)、召回率(85.5%)和F值(73.0%)方面表现更好。【局限】官方微博历史记录太少,初始的训练
[期刊] 图书馆杂志
[作者]
金更达 高跃新
服务是图书馆永恒的主题,既是实现图书馆用户需求的直接手段,也是满足用户需求的最终结果,服务与需求两者的关系是需求决定服务,因此要做好图书馆服务,首先必须研究用户需求,为此本文着重探讨了图书馆用户需求层次。
[期刊] 财会通讯
[作者]
张本照 郄亚美 王海涛
利润操纵识别是企业各方利益相关者十分关注的一个问题。本文在考虑识别指标所含信息准确性和完备性的基础上,引入股权结构指标优化指标体系。同时由于现有模型将利润操纵行为人为地划分为{0,1},而利润操纵是盈余管理超过了一定范围的连续行为,本文运用层次聚类将利润操纵分为严重、轻微两种类型,对企业利润操纵行为的描述更加符合实际。最后,对层次聚类后的两组上市公司配对样本,运用Logistic模型分别进行识别分析,模型的识别率分别达到82.6%和90%,有效改善了传统识别模型。
[期刊] 情报学报
[作者]
陈福集 杨善林
近年来Internet迅猛发展 ,网上的信息急剧膨胀 ,如何高效、高质量地检索到用户所感兴趣的中文信息资源 ,是当前我国Internet资源发现的热点问题之一。本文将神经网络聚类方法之一SOM(Self OrganizingMap ,自组织特征映射 )的思想和方法引入中文Web搜索引擎 ,首先探讨了其网络模型和算法 ,而后提出一种聚类用户所感兴趣的中文Web文档的层次聚类方法 ,从而提高中文Web文档的检索质量
[期刊] 统计与决策
[作者]
宁涛
投资策略的组合优化是量化交易体系中的重要环节,传统的均值-方差模型难以满足实际需求,文章提出了一种基于层次聚类的风险平价方法,并针对典型中高频趋势策略的组合优化进行实证研究,分析结果表明:基于层次聚类的风险平价方法在样本内外一致性、最大回撤和投资组合分散度等评价指标上都显著优于基于均值-方差的最大夏普比率方法,且样本外风险调整后的收益显著高于一般风险平价方法和最大夏普比率方法。
关键词:
投资组合优化 层次聚类 风险平价
[期刊] 商业研究
[作者]
石冠峰 韩宏稳 肖静
本文针对商业企业和零售户的特征构建了零售户价值评价指标体系,并运用层次分析法确定各指标的权重,从当前价值和潜在价值方面分析了零售户价值;通过选择聚类方法对收集到的700名零售户数据进行聚类分析,依据判别得出的结果将零售户进行分类,旨在针对每类客户群的特点提出相应的营销策略建议。
关键词:
零售户 层次分析 聚类分析 判别分析
[期刊] 图书情报工作
[作者]
蒋骁 季绍波
以IS持续使用模型为主要理论基础,结合政府门户网站服务质量方面的研究,将服务质量引入模型。将政府门户网站用户分为基本信息用户、信息交流用户和事务处理用户三类,采用结构方程模型方法对影响这三类用户持续使用意向的因素进行比较分析。结果表明,三类用户模型路径系数及其显著性均存在差异。综合考察服务质量维度对持续使用意向的间接影响总和,信息质量、设计与功能、可靠性分别对三类用户的持续使用意向产生最大的正向影响。
[期刊] 经济师
[作者]
王云婷 王巍 李新宁
针对黑龙江省配送中心的选址需求,使用k-means聚类算法对需求点进行分析,通过比较轮廓值得出两种较优划分方案。基于获得的选址方案,在考虑了能对选址问题产生影响的因素基础上,使用层次分析法对该问题进行目标层、准则层、指标层的划分。将各层影响因素两两比较确定了单层权值,进而综合评价得到了指标层的总权值以便于对备选方案进行评分选择,通过实例分析证明了该方法的适用性和可行性。
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除