- 年份
- 2024(6023)
- 2023(8769)
- 2022(7973)
- 2021(7592)
- 2020(6360)
- 2019(14852)
- 2018(14997)
- 2017(28980)
- 2016(15799)
- 2015(17788)
- 2014(17763)
- 2013(17495)
- 2012(15887)
- 2011(14043)
- 2010(13751)
- 2009(12379)
- 2008(11749)
- 2007(9962)
- 2006(8517)
- 2005(7174)
- 学科
- 济(59100)
- 经济(59033)
- 管理(44651)
- 业(42865)
- 企(36502)
- 企业(36502)
- 方法(29919)
- 数学(25877)
- 数学方法(25585)
- 农(15244)
- 学(14505)
- 中国(14381)
- 财(14256)
- 业经(13246)
- 地方(12163)
- 理论(10768)
- 和(10469)
- 贸(10328)
- 贸易(10323)
- 农业(10288)
- 易(10015)
- 技术(9897)
- 环境(9681)
- 务(9578)
- 财务(9521)
- 财务管理(9506)
- 制(9229)
- 企业财务(9013)
- 教育(8786)
- 划(8537)
- 机构
- 大学(219033)
- 学院(216592)
- 管理(91180)
- 济(80898)
- 理学(80166)
- 理学院(79308)
- 经济(79023)
- 管理学(77959)
- 管理学院(77583)
- 研究(69216)
- 中国(49349)
- 京(46505)
- 科学(45485)
- 财(35208)
- 业大(34233)
- 所(34098)
- 农(33770)
- 研究所(31566)
- 中心(31257)
- 江(29415)
- 财经(29255)
- 北京(29203)
- 范(28903)
- 师范(28622)
- 经(26685)
- 农业(26540)
- 院(25516)
- 州(24522)
- 师范大学(23300)
- 技术(23141)
- 基金
- 项目(157498)
- 科学(123285)
- 研究(114877)
- 基金(113970)
- 家(99140)
- 国家(98312)
- 科学基金(84821)
- 社会(70230)
- 社会科(66450)
- 社会科学(66432)
- 基金项目(61865)
- 省(61675)
- 自然(56822)
- 自然科(55487)
- 自然科学(55473)
- 自然科学基金(54458)
- 教育(52216)
- 划(52035)
- 编号(47728)
- 资助(46771)
- 成果(38010)
- 重点(34614)
- 部(34158)
- 发(32887)
- 创(32840)
- 课题(31922)
- 创新(30511)
- 科研(30349)
- 项目编号(29933)
- 大学(29469)
共检索到297440条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 情报学报
[作者]
祁瑞华 郭旭 刘彩虹
本文针对中文微博篇幅短小、无间隔标记等特点,建立了由词汇特征、浅层句法和深层句法特征集组成的中文微博作者文体特征模型,选取支持向量机、序列最小优化支持向量机、朴素贝叶斯和决策树算法在公开微博语料上进行算法对照实验、特征集组合实验和各组文体特征的作者身份识别实验。实验结果验证了本文模型在中文微博作者身份识别任务中的高准确率、召回率和时间效率。
关键词:
中文 微博 作者身份识别
[期刊] 数据分析与知识发现
[作者]
祁瑞华
【目的】针对网络文本篇幅短小、传统文体特征集稀疏等特点,探讨依存关系在中文微博作者性别识别中的应用。【方法】选取腾讯公开微博作为实验语料,抽取依存关系特征与现有文献中的词汇特征、结构特征、功能词特征、词性标注特征和微博特征进行对照实验。【结果】采用支持向量机、朴素贝叶斯、最近邻和决策树算法的对照实验验证了本文方法在中文微博作者性别识别任务中的准确率、召回率和F-Measure最高。【局限】依存关系在微博作者性别识别中的有效性还需在大规模语料上进一步验证。【结论】本文模型能够避免短文本特征集的稀疏性,与其他
关键词:
依存关系 中文微博 性别识别
[期刊] 图书情报工作
[作者]
祁瑞华 霍跃红 胡润波
[目的/意义]鉴于传统的作者身份识别方法不适用于当前大量涌现的网络文本。综述近年文本作者身份识别的典型方法和关键问题,并进行客观分析和评价,以期为进一步研究提供新的思路。[方法 /过程]分别从应用领域、文体特征选取、作者身份建模和性能评价指标等方面对国内外作者身份识别相关研究现状进行客观分析,梳理相关领域研究发展脉络和趋势。[结果/结论]作者身份识别需要适应短文本、不规范文本、海量、高维和多语种环境,需更具表现和刻画能力的多层面特征和相应的作者身份建模方法,并借助信息检索、机器学习和自然语言处理领域的最新研究成果提高效率和准确率。
[期刊] 图书情报工作
[作者]
祁瑞华 霍跃红 胡润波
[目的/意义]鉴于传统的作者身份识别方法不适用于当前大量涌现的网络文本。综述近年文本作者身份识别的典型方法和关键问题,并进行客观分析和评价,以期为进一步研究提供新的思路。[方法 /过程]分别从应用领域、文体特征选取、作者身份建模和性能评价指标等方面对国内外作者身份识别相关研究现状进行客观分析,梳理相关领域研究发展脉络和趋势。[结果/结论]作者身份识别需要适应短文本、不规范文本、海量、高维和多语种环境,需更具表现和刻画能力的多层面特征和相应的作者身份建模方法,并借助信息检索、机器学习和自然语言处理领域的最新研究成果提高效率和准确率。
[期刊] 图书情报工作
[作者]
贺刚 吕学强 李卓 徐丽萍
指出微博在传播信息的同时,也夹杂着谣言等虚假消息、不实言论。针对微博谣言传播速度快、影响范围广等特点,深层挖掘微博中的隐含信息,提出符号特征、链接特征、关键词分布特征和时间差等新特征,将微博谣言识别形式化为分类问题,综合新提取的特征与微博文本特征、用户特征和传播特征构建多个特征模板,利用SVM分类学习方法对微博进行分类,识别结果可有效辅助人们更好、更快地识别谣言。实验结果表明,在基本特征的基础之上,新提出的特征能有效提高微博谣言识别的正确率。
关键词:
微博 谣言识别 特征模板 SVM
[期刊] 华中师范大学学报(自然科学版)
[作者]
朱颢东 杨立志 丁温雪 冯嘉美
近年来,网络媒体微博的迅速发展,为命名实体的识别研究提供了一种全新的载体.针对中文微博文本短、表达不清、网络化严重等特点,论文提出了一种规则与统计相结合的中文微博命名实体识别方法.该方法首先利用中文微博的主题标签对处理后的数据进行筛选,然后再选取合适的特征模板,并利用条件随机场模型(Conditional random fields,CRF)进行实体识别.为了满足实验要求,该文将传统网页爬虫方法与API接口采集方法相结合进行微博数据采集.实验结果表明,该方法能够有效提高中文微博命名实体的识别效果.
关键词:
命名实体 中文微博 主题标签 条件随机场
[期刊] 清华大学学报(自然科学版)
[作者]
张婧 黄德根 黄锴宇 刘壮 孟祥主
由于面向中文微博的分词标注语料相对较少,导致基于传统方法和深度学习方法的中文分词系统在微博语料上的表现效果很差。针对此问题,该文提出一种主动学习方法,从大规模未标注语料中挑选更具标注价值的微博分词语料。根据微博语料的特点,在主动学习迭代过程中引入参数λ来控制所选的重复样例的个数,以确保所选样例的多样性;同时,根据样例中字标注结果的不确定性和上下文的多样性,采用Max、Avg和AvgMax这3种策略衡量样例整体的标注价值;此外,用于主动学习的初始分词器除使用当前字的上下文作为特征外,还利用字向量自动计算当前
[期刊] 情报科学
[作者]
曾金 陆伟 陈海华 贺国秀
【目的/意义】通过社交媒体用户分享的图像、博文及用户标签进行数据挖掘,来判断和预测用户的真实兴趣,从而更好地为用户做个性化推荐和精准化服务。【方法/过程】在获取微博用户分享的图像、博文及用户标签的基础上,通过使用机器学习的方法利用图像、博文及用户标签数据来表达用户兴趣特征,基于三类特征使用SVM训练得到分类器进行用户兴趣类别预测,主要比较单模数据和多模数据的分类指标,探讨多模数据在有监督学习下的发多分类问题。【结果/结论】实验结果表明,利用图像、博文和用户标签合成的多模数据对用户兴趣进行分类识别,F值达到
[期刊] 图书情报工作
[作者]
朱娜娜 景东 薛涵
[目的 /意义]微博作为一种新兴的社交媒体平台,被互联网用户广泛关注。微博数据中包含着大量的用户信息、用户行为及用户生成内容,基于微博内容自动识别图书名有利于分析用户阅读兴趣、收集用户对图书的评价和挖掘图书相关知识。[方法 /过程]基于微博的数据特点,提出一种基于深度神经网络的表示学习方法,利用微博中候选图书名的上下文连续向量化表示,实现微博内容中的图书名自动识别。[结果 /结论]实验结果表明,所提出的方法显著优于传统基于特征工程的有指导机器学习方法,并达到91.92%的精确率。
关键词:
图书名识别 神经网络 深度学习 微博
[期刊] 情报理论与实践
[作者]
毕凌燕 王腾宇 左文明
热点主题识别旨在确定微博的热点主题,其分析结果对于人们获取即时重要资讯,了解社会关注焦点具有重要的应用价值。文章利用火车头采集工具对微博热点话题进行抓取,提出基于概率模型的微博热点主题识别模型,并比较与词频统计聚类方法在微博主题识别中效果的优劣。实验表明,该模型可以充分地利用概率模型的优点,相比于词频统计聚类算法,更适合应用于微博分析中的主题识别环节。
关键词:
微博 热点主题识别 概率模型 实证研究
[期刊] 图书情报工作
[作者]
李晓军 刘怀亮 杜坤
[目的 /意义]作者身份识别是语言文体学的重要研究方向,利用文本特征的身份识别也是文本挖掘的重要任务。在开放和虚拟网络环境下海量信息的作者身份或发布者的识别难题和传统作者身份识别方法在处理效率和成本等方面存在的问题有待解决。[方法 /过程]将复杂网络理论引入该研究领域,在利用传统文体学特征识别作者身份方法的基础上结合文本词共现网络模型及其指标特征改进相关算法,使用文本文体学特征和文本网络模型度量指标构建作者风格特征集合,通过计算文本间风格相似度进行作者识别。[结果 /结论]基于复杂网络模型的作者身份识别方法可以有效的利用作者风格特征,提高识别的精度,与其他算法的对比试验表明其识别结果的准确性更...
[期刊] 图书情报工作
[作者]
李晓军 刘怀亮 杜坤
[目的/意义]作者身份识别是语言文体学的重要研究方向,利用文本特征的身份识别也是文本挖掘的重要任务。在开放和虚拟网络环境下海量信息的作者身份或发布者的识别难题和传统作者身份识别方法在处理效率和成本等方面存在的问题有待解决。[方法/过程]将复杂网络理论引入该研究领域,在利用传统文体学特征识别作者身份方法的基础上结合文本词共现网络模型及其指标特征改进相关算法,使用文本文体学特征和文本网络模型度量指标构建作者风格特征集合,通过计算文本间风格相似度进行作者识别。[结果 /结论]基于复杂网络模型的作者身份识别方法可以有效的利用作者风格特征,提高识别的精度,与其他算法的对比试验表明其识别结果的准确性更高。
[期刊] 现代情报
[作者]
丁晟春 王楠 吴靓婵媛
[目的]从海量微博舆情信息中准确、高效地发现和挖掘当下的热点主题,以期为政府和企业监控和管理舆情动态提供有价值的参考。[方法]研究首先从维度、特征和度量三方面综合考虑构建"帖子—主题"二模网络模型,其次选择词频、主题权重和词频增长率3个特征来抽取模型所需的有效关键词,然后选取社会网络分析法中的社区发现方法进行基于关键词的主题社区发现,最后综合考虑用户影响力和传播影响力两个属性,通过热度分析确立主题热度,识别热点主题。[结果]实验表明,该方法能有效挖掘网络舆情中的热点主题,检测出的主题结果均正确,验证了本文
[期刊] 情报理论与实践
[作者]
章成志 何陆琳 丁培红
文章以腾讯微博为研究对象,调研用户标签主题表达能力,并针对不同领域的差异进行分析。本研究可进一步丰富信息组织领域的研究内容,并为微博类应用平台的用户标签自动服务提供参考。
关键词:
用户标签 主题表达能力 微博客
[期刊] 情报理论与实践
[作者]
吴青林 周天宏
文章通过话题聚类及情感强度分析中文微博舆情,实现对微博热点问题的预测,有利于公众舆情引导。首先充分考虑微博短文本的特点,在特征值提取基础上克服了微博短文本易发生"文本漂移"的缺点,并根据微博高频词对微博进行排序实现微博的快速聚类,接着从主观和客观两方面对热点话题的情感强度进行了分析,基于灰色模型跟踪并预测公众情感变化倾向。实验结果表明,本文提出的基于话题聚类及情感强度的中文微博舆情分析方法具有一定的可行性。
关键词:
微博 话题聚类 网络舆情
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除