- 年份
- 2024(5416)
- 2023(7780)
- 2022(6716)
- 2021(6241)
- 2020(5430)
- 2019(12297)
- 2018(12024)
- 2017(23344)
- 2016(12268)
- 2015(13688)
- 2014(13208)
- 2013(12689)
- 2012(11301)
- 2011(9654)
- 2010(9073)
- 2009(7865)
- 2008(7095)
- 2007(5617)
- 2006(4355)
- 2005(3306)
- 学科
- 济(48506)
- 经济(48460)
- 管理(34787)
- 业(33742)
- 方法(29139)
- 企(28593)
- 企业(28593)
- 数学(26518)
- 数学方法(26067)
- 财(12636)
- 农(11115)
- 中国(10708)
- 业经(9494)
- 学(9463)
- 务(8713)
- 财务(8676)
- 财务管理(8656)
- 企业财务(8230)
- 技术(7997)
- 贸(7991)
- 贸易(7987)
- 易(7793)
- 地方(7572)
- 理论(7461)
- 农业(7449)
- 环境(7036)
- 和(7019)
- 制(6535)
- 划(6292)
- 融(5956)
- 机构
- 大学(160555)
- 学院(159752)
- 管理(67702)
- 济(65504)
- 经济(64398)
- 理学(60415)
- 理学院(59837)
- 管理学(58587)
- 管理学院(58281)
- 研究(46341)
- 中国(34425)
- 京(31377)
- 科学(29065)
- 财(28251)
- 业大(24904)
- 财经(24185)
- 农(24040)
- 中心(23586)
- 经(22282)
- 江(21312)
- 经济学(20989)
- 所(20733)
- 研究所(19382)
- 经济学院(19264)
- 农业(19062)
- 范(18978)
- 师范(18722)
- 财经大学(18471)
- 北京(18104)
- 经济管理(18078)
- 基金
- 项目(123284)
- 科学(99091)
- 基金(93039)
- 研究(87130)
- 家(81379)
- 国家(80783)
- 科学基金(71642)
- 社会(57459)
- 社会科(54799)
- 社会科学(54787)
- 基金项目(49492)
- 自然(47839)
- 省(47515)
- 自然科(46882)
- 自然科学(46868)
- 自然科学基金(46000)
- 教育(40861)
- 划(40263)
- 资助(38033)
- 编号(33999)
- 部(27704)
- 重点(27502)
- 创(26580)
- 发(25597)
- 国家社会(24977)
- 成果(24955)
- 创新(24888)
- 科研(24604)
- 教育部(24245)
- 人文(23754)
共检索到207939条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 数据分析与知识发现
[作者]
高永兵 杨贵朋 张娣 马占飞
【目的】针对官方微博数据存在大量不相关信息的问题,过滤博文进而检测事件。【方法】利用Word2Vec机器学习模型训练官方微博记录集,并将博文影响力、词基础权重以及官微相关性相结合,提出官方微博突显词检测方法,计算突显词博文的相似度,利用层次聚类算法对突显词博文聚类后选取合适的突显词描述事件,从而实现事件检测。【结果】实验结果表明,与TF-IDF和TextRank算法相比较,本文的突显词算法在准确率(63.5%)、召回率(85.5%)和F值(73.0%)方面表现更好。【局限】官方微博历史记录太少,初始的训练
[期刊] 情报杂志
[作者]
张雄宝 陆向艳 练凯迪 刘峻 刘正平
[目的/意义]面对海量的微博数据,及时准确地检测出微博突发事件,对于网络舆情检测有着重要的意义。[方法/过程]在对微博突发事件传播规律的研究分析中,发现事件相关微博文档的发布地域覆盖范围会随事件演变,出现从小开始逐渐扩大,再到出现极值,最后逐渐缩小的规律,根据该规律提出一种基于突发词地域分析的微博突发事件检测方法。该方法从突发词的地域属性和情感属性两个维度去识别微博突发事件,首先通过情感计算过滤非负值文档;然后根据特征词的地域扩散程度对剩余文档进行突发词检测;最后使用新突发事件检测方法,对突发词集进行聚类
[期刊] 情报理论与实践
[作者]
罗鹏程 王一博 王世奇 王继民
[目的/意义]微博是网络舆情传播的重要平台之一,为了对海量微博中的突发舆情事件进行监控预警,并获取开源情报。[方法/过程]文章以短语作为兴趣词项,提出了基于突发短语挖掘的微博舆情事件检测方法。首先,利用自动短语挖掘方法AutoPhrase从微博文本中识别出具有潜在舆情价值的优质短语;然后,基于短语相关统计信息,识别出主题性、流行性、突发性均较大的高舆情价值的突发短语集合;最后,构建突发短语共现网络,利用模块度优化算法对短语聚类,从而得到不同的舆情事件。[结果/结论]基于推特数据的实验结果表明,与基于单词和命名实体的方法相比,该方法可以获得更好的事件检测效果。[局限]仅针对特定主题的英文推特数据进行了实验验证。
[期刊] 情报理论与实践
[作者]
赵洁 马铮 周晓峰 金培权
文章提出了一种新的微博事件检测方法。该方法借鉴信号处理中的频域分析方法,将微博突发词项转换为一系列的时序信号并进行离散傅立叶变换,然后基于频域信号和阈值来检测微博事件。还引入了突发词项合并、突发时间区间检测等技术对事件检测方法进行优化。与以往工作相比,首次采用了信号处理的方法进行微博突发事件检测,更符合微博信息的时序性和实时性特点。并在实际抓取的微博数据集上开展了实验。结果表明所提出的微博突发事件检测方法具有较高的性能。
关键词:
微博 事件检测 突发词项 频域分析
[期刊] 情报理论与实践
[作者]
王征 王林森 赵磊
在分析当前微博突发话题检测模型存在的问题的基础上,提出了基于信息密度的新型检测模型MBID。该模型通过动态滑动窗口采集微博信息流,以话题树进行信息归纳,并最终通过窗口和话题树的信息密度变化进行监测,发现突发话题,并从主题树中抽取描述词。仿真实验表明,MBID模型较之其他两种模型,具有较高的检测精度、全面性和较高的处理效能。
关键词:
突发话题 微博 信息密度 检测
[期刊] 清华大学学报(自然科学版)
[作者]
贾凡 严妍 张家琪
针对基础K-means算法在KDD 99数据集中检测罕见攻击效果差且效率低下等问题,该文通过数据统计的方式对数据集中各维度与每类攻击类型的相关分析发现,罕见攻击极易被大量的常见攻击所淹没,而当常见攻击被移去时,这些威胁性更大的罕见攻击则能够被更好地识别出来。基于此,该文提出一种改进的基于K-means分层迭代的检测算法,通过有针对性的特征选择来降低K-means聚类的数据维度,经过多次属性消减的K-means聚类迭代操作可以更加精准地检测到不同异常类型的攻击。在KDD 99数据集上的实验结果表明:该算法对
[期刊] 清华大学学报(自然科学版)
[作者]
方勇 刘道胜 黄诚
互联网上充斥着大量恶意用户,而互联网服务提供商通常有海量的注册用户,使得系统难以从中发现虚假账户。针对海量注册数据中,恶意用户批量注册的虚假账户通常具有相似性的特点。该文提出海量数据中定位虚假账户的系统模型,利用用户名字符串组成模式对海量数据进行预分类,进而对每个分类中元素计算字符串相似度,即计算字符串Levenshtein距离。设置合适的阈值,进行层次聚类分析,从而定位藏匿在海量注册数据中的成组的虚假账户。实验结果表明:该系统模型有效,与现有的模型相比,该系统对数据维度、数据特性依赖较小。
关键词:
数据安全 虚假账户 机器学习 层次聚类
[期刊] 情报杂志
[作者]
陈雪刚
[目的/意义]针对海量的微博舆情信息及微博在网络舆论场中的重要作用,如何快速、准确地获取微博舆情,是提升网络舆情实时监测及分析能力的关键课题之一。目前已能以较高的准确度获取微博舆情,但仍存在舆情获取耗时长问题,为较有效地解决该问题,提出一种基于大数据技术的微博舆情快速自聚类方法。[方法/过程]该方法首先利用大数据技术抓取和处理海量的微博舆情信息,而后根据构建的微博文本相似度速算模型和文本自主聚类模型快速自主聚类微博舆情。文本相似度速算模型通过两文本间同名的特征词数与其特征词数量较小值的比值来度量文本相似度
[期刊] 情报科学
[作者]
王彦慈
【目的/意义】当前微博已成为重要的舆论场,针对海量微博信息的舆情难以快速获取的问题,提出一种基于云计算的微博舆情流式快速自聚类方法。【方法/过程】该方法首先设计舆情最小距离聚类算法,包括构建舆情相似度计算模型,及构建舆情最佳聚类阈值确定方法;然后构建舆情流式自聚类模型,该模型利用云计算和最小距离聚类算法在横、纵两个方向聚类舆情信息,得到各主题的舆情集合。在横向上,以云计算的多个计算节点为聚类起始,同步并行聚类分配到其上的舆情信息。在纵向上,多个计算节点协同、流水线式聚类同一起始节点的舆情信息;最后在纵向上
[期刊] 西北农林科技大学学报(自然科学版)
[作者]
闫彬 郭文川
【目的】根据‘海沃德’猕猴桃膨大果和未经膨大剂处理的猕猴桃正常果在果萼形状上的差异,建立一种基于K-means聚类算法的猕猴桃膨大果的图像识别方法。【方法】利用K-means聚类算法对猕猴桃的RGB图像进行聚类,以初步分割出猕猴桃果萼;对RGB图像进行灰度化,并采用最大类间方差法对灰度图像进行阈值分割,基于阈值分割后的二值图像提取猕猴桃的边缘区域;基于K-means聚类分割的结果与猕猴桃边缘区域的二值图像提取果萼的聚类,再利用数学形态学处理精确提取出猕猴桃的果萼。求取果萼区域最小外接矩形的长宽比,并根据长宽比进行猕猴桃正常果与膨大果的判断与识别。【结果】对提取的猕猴桃果萼特征的统计分析表明,当猕猴桃果萼区域最小外接矩形的长宽比值大于1.6时为膨大果,否则为正常果,利用该算法对‘海沃德’猕猴桃膨大果的总体正确识别率为91.5%。【结论】基于K-means聚类分割算法和果萼形状上的差异所提出的猕猴桃膨大果无损、便捷检测方法,为猕猴桃膨大果的工业化在线检测及基于手机平台的猕猴桃膨大果识别软件的开发提供了新思路。
[期刊] 清华大学学报(自然科学版)
[作者]
张婧 黄德根 黄锴宇 刘壮 孟祥主
由于面向中文微博的分词标注语料相对较少,导致基于传统方法和深度学习方法的中文分词系统在微博语料上的表现效果很差。针对此问题,该文提出一种主动学习方法,从大规模未标注语料中挑选更具标注价值的微博分词语料。根据微博语料的特点,在主动学习迭代过程中引入参数λ来控制所选的重复样例的个数,以确保所选样例的多样性;同时,根据样例中字标注结果的不确定性和上下文的多样性,采用Max、Avg和AvgMax这3种策略衡量样例整体的标注价值;此外,用于主动学习的初始分词器除使用当前字的上下文作为特征外,还利用字向量自动计算当前
[期刊] 沈阳农业大学学报
[作者]
刘立 孙军
分析了Duffing方程的基本形式以及Duffing振子的混沌运动,阐述了基于相平面变化进行微弱信号检测的工作原理,并推导出系统发生间歇混沌现象的频差条件和相位差对于系统特性的影响。试验证明:该振子对与参考信号频差较小的周期小信号具有敏感性,对白噪声和与参考信号频差较大的干扰信号具有免疫力。
[期刊] 情报理论与实践
[作者]
唐晓波 房小可
伴随着微博的日趋流行,对微博信息的检索逐渐成为人们获取第一消息的手段。其中文本聚类和主题发现是信息检索领域的有效方法,采用适当的方法是影响微博短文本信息检索质量的关键因素。文章针对文本聚类和LDA主题模型的互补特征,综合考虑了微博特殊文体和短文本聚类效率问题,提出了基于频繁词集的文本聚类和基于类簇的LDA主题挖掘相融合的微博检索方法,给出了针对微博文体的一种新的主题检索模型。实验表明,该方法不仅能有效地划分微博文本,并且能清晰地挖掘类簇中潜在主题。
关键词:
文本聚类 主题检索 微博
[期刊] 图书情报工作
[作者]
孙海生
[目的/意义]传统共词分析的聚类算法存在以下不足:1关键词只能被划归一个聚类;2聚类过程对分类数目的确定缺乏严格判断标准。针对以上问题,采用复杂网络理论进行改进研究。[方法/过程]采用连边社团检测算法对关键词进行聚类,以科学计量学为例进行实证研究。[结果/结论]分析结果表明:算法对关键词的聚类结果有较好的改进效果,能够把核心度高的关键词同时划分到不同的研究主题之中,克服传统聚类算法的不足,而且划分密度可为聚类数目的确定提供客观判断依据。
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除