- 年份
- 2024(5092)
- 2023(7338)
- 2022(6291)
- 2021(5947)
- 2020(5064)
- 2019(11864)
- 2018(11656)
- 2017(22977)
- 2016(11758)
- 2015(13084)
- 2014(12676)
- 2013(12161)
- 2012(10760)
- 2011(9444)
- 2010(8722)
- 2009(7530)
- 2008(6757)
- 2007(5250)
- 2006(3933)
- 2005(3120)
- 学科
- 济(46590)
- 经济(46544)
- 管理(34968)
- 业(33340)
- 企(28918)
- 企业(28918)
- 方法(26644)
- 数学(23800)
- 数学方法(23411)
- 财(12236)
- 农(10663)
- 中国(10397)
- 业经(10110)
- 贸(8558)
- 贸易(8557)
- 务(8546)
- 财务(8500)
- 财务管理(8484)
- 易(8364)
- 企业财务(8106)
- 技术(8025)
- 理论(8011)
- 学(7861)
- 和(7434)
- 农业(7162)
- 地方(6981)
- 环境(6611)
- 制(6543)
- 划(6360)
- 融(5843)
- 机构
- 大学(156096)
- 学院(153658)
- 管理(68835)
- 济(64897)
- 经济(63879)
- 理学(61693)
- 理学院(61140)
- 管理学(60080)
- 管理学院(59782)
- 研究(42648)
- 中国(31444)
- 京(29925)
- 财(27987)
- 科学(24826)
- 财经(23995)
- 经(22282)
- 中心(21879)
- 业大(21516)
- 经济学(20419)
- 江(19479)
- 范(19214)
- 师范(19031)
- 经济学院(18679)
- 农(18620)
- 财经大学(18553)
- 商学(18136)
- 经济管理(18086)
- 商学院(17953)
- 所(17780)
- 北京(17486)
- 基金
- 项目(117631)
- 科学(96059)
- 基金(90106)
- 研究(85809)
- 家(77407)
- 国家(76838)
- 科学基金(69210)
- 社会(57527)
- 社会科(54763)
- 社会科学(54749)
- 基金项目(48488)
- 自然(45698)
- 自然科(44764)
- 自然科学(44756)
- 省(44235)
- 自然科学基金(43952)
- 教育(40597)
- 划(37553)
- 资助(35648)
- 编号(34106)
- 部(27123)
- 创(25775)
- 重点(25729)
- 成果(25385)
- 国家社会(24662)
- 教育部(24408)
- 人文(24076)
- 创新(24027)
- 发(23925)
- 科研(23357)
共检索到197971条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 图书情报工作
[作者]
李霞 王连喜 路美秀 刘汉锋 刘俊延
[目的/意义]在海量网络新闻和微博等新媒体文本中自动识别网络热点话题并抽取有意义词串来描述热点事件,对自动识别和描述网络舆情具有重要的研究意义。[方法/过程]在现有热点描述词抽取方法中,利用关联规则或多元词组合方法在抽取过程中存在噪音词较多和特征词语义被放大或转移等问题。本文提出一种基于复合词生成的描述词抽取方法,在所提取的语义更为精确的描述词集合上使用一趟聚类算法对新闻文本进行聚类,自动识别网络热点话题并对热点话题进行排名。[结果/结论]对腾讯新闻事件文本数据集所做的实验结果表明,本文所提出的方法较传统
关键词:
网络热点话题识别 热词抽取 复合词聚类
[期刊] 现代情报
[作者]
游丹丹 陈福集
随着互联网的快速发展,网络舆情对社会的影响不容忽视。若能够及时从海量数据中发现热点话题,追踪热点话题演变以及预测话题的倾向,对于帮助相关部门及时有效地对其引导和控制具有较大意义。本文通过对我国网络舆情热点话题发现的相关文献进行收集、整理及分析,归纳其中的主要研究思想和方法,同时发现存在的不足,并提出进一步的展望,以期对后来研究者提供参考。
关键词:
网络舆情 热点话题发现 发现模型 综述
[期刊] 图书情报工作
[作者]
廖君华 孙克迎 钟丽霞
设计基于网络数据的时序主题演化系统Hot Topics Analysis System(HTAS),实现网络热点话题数据源自动定制、自动获取和自动存储。针对中文话题分析,HTAS集成了Google的开源分词系统IKAnalyzer,批量处理中文文档。采用LDA模型对网络热点话题主题进行提取,并利用时间标签发现热点话题,通过图标形式可视化展示其演化规律。通过"钓鱼岛事件"的实验证明,HTAS系统能快速获取、存储网络热点话题,并能有效地分析其演化趋势。
关键词:
主题模型 话题演化 热点话题 LDA
[期刊] 情报杂志
[作者]
孙海生
[目的/意义]共引分析和共词分析是探测领域研究热点问题常用的文献计量学方法,但是这两种方法都存在一定的局限性。而且,现有研究对共现聚类结果的解读缺乏客观性。针对存在的问题,借鉴超网络理论进行改进研究。[方法/过程]选择最新发表而且最受关注的论文作为样本,提取标识文献内容的特征词,构建超网络模型,根据样本相似度进行聚类分析,计算特征词的描述能力、鉴别能力,识别出聚类主题好的描述符,增强聚类结果解读的客观性。[结果/结论]实证分析结果表明,这种方法能够区分特征词在各个聚类主题中的重要性,有利于提高研究人员对聚
关键词:
超网络 文本聚类 描述能力 鉴别能力
[期刊] 情报科学
[作者]
李慧 王丽婷
【目的/意义】随着网民规模的扩大以及微博数据的增长,获取微博空间的热点话题是一项有价值的任务。本文结合微博的特点提出专门针对中文微博的热点话题发现模型。【过程/方法】本文提出利用词项H指数筛选出热点词项,然后利用BTM建模和VSM建模的结果相融合计算文本相似度,再利用k-means聚类算法发现微博的热点话题。【结果/结论】本文在提取特征阶段既考虑了微博词项的热度又考虑了其短文本性,通过实验验证本文提出的方法有利于发现准确的热点话题。
[期刊] 图书情报工作
[作者]
白华
用户标注具有简洁、交流与共享、自由表达、推荐与检索等特点,但是它的平面结构使其很难适应语义网的需要,因而有必要进行语义建构,建立用户标注模型和语义联系,以便使用元数据与本体语言对用户标注进行语义描述,使之成为标签本体,以适应新一代因特网的发展。
[期刊] 图书情报工作
[作者]
孙明溪 刘春琦
[目的 /意义]在大数据时代面对海量的数据用户有时会束手无策。因此,越来越多的学者们开始关注互联网热点话题发现的算法,帮助用户快速获取热点话题。[方法 /过程]基于DBSCAN算法,通过动态调整参数来优化算法,实现热点话题发现。根据句法结构与句间关系分析构建热点话题过滤模型,过滤包含热点词项的一般话题。[结果 /结论]采用主流网站新闻数据集进行实验,利用错检率、漏检率等评价指标对算法的有效性进行检验,实验结果证明改进算法性能有所提升,能够为信息用户提供科学研究网络数据的高效途径。
[期刊] 数据分析与知识发现
[作者]
方小飞 黄孝喜 王荣波 谌志群 王小华
【目的】运用中文信息处理和话题识别与追踪的方法,从大量移动投诉文本中找出有价值的信息。【方法】从分析投诉文本的特点入手,使用k-means先对文本聚类。利用LDA对每个类进行建模,提取话题,并从词频、词跨度和词长三方面计算每个话题中词的权值,把权重最大的词作为该话题的标签,并计算每个话题的文档分布概率均值。对具有相同标签的话题,先按照均值最大的原则去掉重复标签话题,再对所有话题计算文档支持率,并将文档支持率作为话题的热度,通过热度区分热点话题和一般话题。【结果】对投诉文本进行时间上的建模,通过对比一般话题
[期刊] 清华大学学报(自然科学版)
[作者]
陈舒婷 疏学明 胡俊 解学才 张雷 张伽
网络舆情安全是社会安全的重要组成部分,识别和追踪热点话题是治理突发事件网络舆情的基础。现有研究具有网络舆情事件表征不全面、对于热点话题的识别和追踪局限于语义信息等问题。该研究基于社交、内容、话题、情感4个维度构造超网络模型,并引入时间特征作为网络的连接关系,用于定量表征时序的网络舆情事件;将话题节点在超网络中的中心性及中心性变化率作为话题热度的度量指标,实现热点话题发现及演化跟踪;应用“甘肃白银马拉松”微博舆情案例对模型和指标进行验证分析。研究结果表明:该时序超网络模型能够清晰表征突发网络舆情事件,中心性及中心性变化率指标能够准确识别和跟踪热点话题,并为实时态势研判预警、舆论引导等提供指导。
关键词:
超网络 网络舆情 中心性 微博话题
[期刊] 情报科学
[作者]
魏德志 陈福集 林丽娜
【目的/意义】网络舆情的热点话题对政府和网民有着很大的影响,及时发现热点话题有利于政府监控话题的发展。【方法/过程】本文提出了基于时间序列的话题动态演化两层模型,并将新闻网页内容的相似度和页面链接分析作为话题热度的计算依据,然后利用改进的Single-Pass算法进行增量聚类获得聚类中心,最后根据热度权重将聚类中心进行排序,获得热点话题。【结果/结论】通过实验验证,该算法发现效果好,能够更好地获得热点话题。
[期刊] 武汉金融
[作者]
陈伟 涂有钊
P2P网络借贷是新兴互联网金融领域的一项重大创新,借贷交易中的描述性信息在P2P借贷中起着重要的作用。本文对国内外P2P信息描述的文献进行了梳理,从借款人基本信息中的硬信息、软信息以及借款人信息描述等方面进行了总结,最后对P2P信息描述的未来研究提出了展望。
关键词:
P2P 信息描述 借贷
[期刊] 武汉金融
[作者]
陈伟 涂有钊
P2P网络借贷是新兴互联网金融领域的一项重大创新,借贷交易中的描述性信息在P2P借贷中起着重要的作用。本文对国内外P2P信息描述的文献进行了梳理,从借款人基本信息中的硬信息、软信息以及借款人信息描述等方面进行了总结,最后对P2P信息描述的未来研究提出了展望。
关键词:
P2P 信息描述 借贷
[期刊] 图书馆建设
[作者]
郭瑞华 于卫真
本文介绍了网络信息资源描述的现状,研究了网络信息资源描述的格式语言XML及在国内外影响较 大的元数据规范DC、EAD、TEI、GILS、SMIL等,并在此基础上指出网络信息资源描述的发展策略。
关键词:
网络信息 信息资源描述 元数据 描述策略
[期刊] 统计与决策
[作者]
琚春华 陈沛帅
一、本体论与本体描述本体论原是哲学的分支,是一种对于存在的系统化解释,用于描述事物存在的本质,与认识论相对。认识论研究知识的本质、来源和主观认识,而本体论则侧重于研究客观存在。直观地讲,本体是一个实体,是对某领域应用本体论的方法分析和建模的结果,即把现实世界中的某个领域抽象为一组概念及概念之间的关系。
[期刊] 图书情报知识
[作者]
商宪丽 王学东
本文针对微博文本的简短、动态性等特征,提出一种新的文本特征提取方法,提升微博话题识别任务中文本聚类算法效果。利用词项共现的思想,针对微博时序文本构建动态共词网络。在动态共词网络中,边权重随着时间推移而线性衰减,并在此基础上利用网络的度中心性计算微博文本特征权重。从新浪微博中采样构建实验数据集进行实验,结果表明动态共词网络特征提取方法相较于文档频率方法,更适宜于提取微博文本特征,能取得更好的微博话题识别效果。
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除