- 年份
- 2024(2759)
- 2023(4065)
- 2022(3518)
- 2021(3470)
- 2020(3048)
- 2019(7282)
- 2018(7377)
- 2017(14592)
- 2016(7924)
- 2015(9024)
- 2014(8816)
- 2013(8424)
- 2012(7392)
- 2011(6589)
- 2010(6923)
- 2009(6143)
- 2008(5899)
- 2007(5122)
- 2006(4392)
- 2005(3802)
- 学科
- 济(32812)
- 经济(32788)
- 管理(21427)
- 业(20017)
- 方法(19337)
- 数学(17962)
- 数学方法(17477)
- 企(16974)
- 企业(16974)
- 中国(7933)
- 农(7315)
- 财(6598)
- 理论(6541)
- 业经(6030)
- 学(5577)
- 贸(5479)
- 贸易(5473)
- 易(5340)
- 地方(5296)
- 技术(4843)
- 农业(4716)
- 制(4709)
- 教学(4636)
- 和(4285)
- 环境(4127)
- 策(4060)
- 划(4049)
- 银(3993)
- 银行(3989)
- 务(3816)
- 机构
- 学院(105596)
- 大学(104448)
- 管理(42835)
- 济(41602)
- 经济(40760)
- 理学(37531)
- 理学院(37143)
- 管理学(36028)
- 管理学院(35837)
- 研究(32445)
- 中国(24505)
- 京(21993)
- 科学(20913)
- 财(17580)
- 业大(16296)
- 农(16202)
- 所(16085)
- 江(15375)
- 中心(15250)
- 研究所(14760)
- 财经(14078)
- 北京(13703)
- 范(13122)
- 师范(12978)
- 经(12868)
- 农业(12668)
- 经济学(12578)
- 技术(12526)
- 州(12322)
- 院(11805)
- 基金
- 项目(74192)
- 科学(58875)
- 基金(53855)
- 研究(52679)
- 家(47297)
- 国家(46969)
- 科学基金(40987)
- 社会(32442)
- 社会科(30875)
- 社会科学(30864)
- 省(29950)
- 自然(28023)
- 基金项目(27966)
- 自然科(27478)
- 自然科学(27474)
- 自然科学基金(26957)
- 教育(26057)
- 划(25194)
- 资助(23447)
- 编号(21664)
- 重点(16839)
- 成果(16688)
- 部(16062)
- 创(15893)
- 发(15570)
- 课题(14981)
- 创新(14764)
- 科研(14293)
- 大学(13971)
- 计划(13969)
共检索到150274条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 情报学报
[作者]
张乐 闫强 吕学强
移动互联网时代产生海量的简短网络信息,快速、准确地获取这些数据中用户表达的情感信息具有广泛的应用场景。本文考虑人类按顺序阅读文本以获取情感信息的习惯,利用光的折射对此进行模拟,提出一种面向短文本分类的情感折射模型(Sentiment Refraction Model,SRM)。首先,从若干种子情感词出发,利用word2vector及k最近邻分类算法启发式地构建包含喜、怒、哀、乐、惧、恶六类情感的情感词典,认定每类情感词具有同等强度的情感,且这些情感词在不同的上下文中具有一定的情感折射率。其次,针对一条短文
[期刊] 图书情报工作
[作者]
张梦芸 丁敬达
[目的 /意义]信息技术的快速发展使得用户评论、患者症状等短文本数据量迅速增长,如何从短文本中挖掘有价值的信息成为文本分类的研究热点。[方法 /过程]以国内某医院各科室患者的病情症状数据为语料集,针对短症状文本包含语义信息不足的问题,从各科室症状词的重要度与关联度出发,将症状文本中低于设定症状词数量的文本作为语义增强对象,采用Word2Vec与基于概率的TF-IDF算法抽取各科室的若干典型症状关键词,将其补充到语义增强对象中形成新语料集,最后利用机器学习算法对症状文本进行分类。[结果 /结论]基于文章语义增强方法构造的新语料集,相较于原始语料集,在支持向量机(Support Vector Machine,SVM)、多项式朴素贝叶斯(Multinomial Naive Bayes,MNB)以及随机森林(Random Forest,RF)上的分类效果均有较大幅度提升,准确率分别提高约10%、9%、10%。
[期刊] 图书情报工作
[作者]
张梦芸 丁敬达
[目的/意义]信息技术的快速发展使得用户评论、患者症状等短文本数据量迅速增长,如何从短文本中挖掘有价值的信息成为文本分类的研究热点。[方法/过程]以国内某医院各科室患者的病情症状数据为语料集,针对短症状文本包含语义信息不足的问题,从各科室症状词的重要度与关联度出发,将症状文本中低于设定症状词数量的文本作为语义增强对象,采用Word2Vec与基于概率的TF-IDF算法抽取各科室的若干典型症状关键词,将其补充到语义增强对象中形成新语料集,最后利用机器学习算法对症状文本进行分类。[结果/结论]基于文章语义增强方法构造的新语料集,相较于原始语料集,在支持向量机(Support Vector Machine,SVM)、多项式朴素贝叶斯(Multinomial Naive Bayes,MNB)以及随机森林(Random Forest,RF)上的分类效果均有较大幅度提升,准确率分别提高约10%、9%、10%。
[期刊] 情报杂志
[作者]
武庆圆 何凌南
[目的/意义]面对互联网与智能移动设备的兴起,谣言尤其是短文本类型的谣言发展速度十分迅猛。短文本谣言具有词语稀疏、语义提取困难等特点,这为精准识别谣言带来了挑战和困难。如何能够有效地鉴别进而控制谣言的传播是目前迫在眉睫的问题。[方法/过程]提出一个在文本与标签之间引入语义层的多标签双词主题模型,用于发现及探究网民发表在公共媒体平台上的短文本属于谣言或欺诈的倾向。该研究专门针对微信等短文本数据,并通过真实数据集对双词主题的提取和建模进行验证。[结果/结论]结果表明:上述模型可以有效鉴别谣言,帮助媒体加强和改
[期刊] 情报科学
[作者]
牟式标 陈志军
【目的/意义】随着微博短文本对社会生活的影响日益增大,结合Delaunay三角网聚类和元胞遗传提出了一种微博短文本倾向性检测模型。【方法/过程】首先,该模型阐述了检测方法采取的数据收集、预处理、特征选择和指标计算四个阶段,并建立了短文本倾向性检测模型。其次,利用Delaunay三角网聚类和元胞遗传对上述模型进行求解。最后,通过仿真实验深入研究了影响该方法的关键因素。【结果/结论】结果表明,相比于层次结构法和神经网络,该方法在准确率、关联率等方面具有较好的适应性。
[期刊] 中国图书馆学报
[作者]
章成志 侯汉清
针对当前Web文本挖掘工具的不足之处,提出了一种基于层次结构、面向概念挖掘的模型,即文本层次模型。该模型具有数据源适应性强、结构灵活、可操作性强、用途广泛优点,具有很强的实用性和一定的可扩展能力。图2。参考文献13。
[期刊] 情报学报
[作者]
沈思 陈猛 冯暑阳 许乾坤 刘江峰 王飞 王东波
随着深度学习的迅速发展和领域数据的快速积累,领域化的预训练模型在知识组织和挖掘中发挥了越来越重要的支撑作用。面向海量的中文政策文本,结合相应的预训练策略构建中文政策文本预训练模型,不仅有助于提升中文政策文本智能化处理的水平,而且为政策文本数据驱动下的精细化和多维度分析与探究奠定了坚实的基础。面向国家级、省级和市级平台上的政策文本,通过自动抓取和人工辅助相结合的方式,在去除非政策文本的基础上,确定了131390份政策文本,总字数为305648206。面向所构建的中文政策文本语料库,基于BERT-base-Chinese和Chinese-RoBERTa-wwm-ext,本研究利用MLM (masked language model)和WWM (whole word masking)任务构建了中文政策文本预训练模型(ChpoBERT),并在Github上对该模型进行了开源。在困惑度评价指标和政策文本自动分词、词性自动标注、命名实体识别下游任务上,ChpoBERT系列模型均表现出了较优的性能,可为政策文本的智能知识挖掘提供领域化的基础计算资源支撑。
[期刊] 数据分析与知识发现
[作者]
程翠琼 徐健
【目的】通过对网络游记进行情感分析,发现游客对旅游地情感倾向的时间分布规律。【应用背景】越来越多人通过浏览大量网络游记来收集信息,制定旅游计划。网络游记成为旅游者搭配旅游地及出游时间的重要参考内容,也为商家提供了商机。【方法】提出面向网络游记时间特征的情感分析模型,分析游客情感的时间变化规律。该模型包括5个模块:网络游记文本内容及旅游时间数据的采集、游记文本预处理、情感标注、按时间段统计游记情感特征分值、游记情感时间特征分析。并从网络抓取4种类型旅游地游记对模型进行实验。【结果】在7类情感中,[好]的情感
关键词:
网络游记 情感分析 情感词典 时间特征
[期刊] 情报理论与实践
[作者]
李杰 李欢
[目的/意义]构建在线评论的产品特征提取及情感分类模型,可以为产品设计人员进行产品优化改进提供决策支持。[方法/过程]提出了基于卷积神经网络算法的产品特征提取及情感分类模型。模型采用卷积神经网络进行短文本评论情感分类,以情感分类标签标注相应评论中提取的产品特征词,并利用词向量对产品特征词聚类。通过爬取的笔记本电脑和手机评论对模型进行训练和测试。[结果/结论]结果表明,模型能够实现有效的产品特征提取及高准确率情感分类,是在线评论分析的有效模型。
[期刊] 情报科学
[作者]
李涵昱 钱力 周鹏飞
【目的/意义】随着电子商务的快速发展,互联网上出现大量商品评论信息,商品评论文本的情感分析与挖掘对于研究商品口碑、进行商品推荐都具有重要的价值。【方法/过程】文中设计商品属性提取与过滤算法、情感词判别算法,分析商品的评论信息并自动抽取用户关注的商品属性和用户对相应属性的评价观点,并进一步将其应用于商品评价文本的情感倾向性分析。【结果/结论】实现了自动化的商品属性和评价情感词抽取,实现了商品评论的情感倾向性分析,在真实数据集上进行测试取得了准确率81.08%,召回率88.23%。
[期刊] 图书情报工作
[作者]
崔娜 雷涯邻 安海忠
分析用户信息需求和新闻文本特点,用时间、地点、主体、事件及其之间的关联表示用户信息需求和新闻文本集信息;参照Card等提出的信息可视化参考模型,构建面向用户需求的新闻文本集信息可视化概念模型,并采用向量空间模型和关联矩阵形式化表示;最后,以新浪网上汶川地震灾后重建新闻文本集为例,进行可视化实现,直观地展示出该文本集中的主要信息,验证所构建的模型。
[期刊] 情报学报
[作者]
吴鹏 应杨 沈思
网民负面情感在网络舆情情感分析中具有重要意义,但已有研究缺乏自动化识别海量短文本中网民负面情感的多分类方法。本文利用词嵌入技术学习词语的特征表示,通过增加文本的情感特征生成具有情感意义的词向量,并训练双向长短期记忆模型得到网民负面情感识别模型,在判断网民情感极性的基础上,识别网民的愤怒、悲伤和恐惧三种负面情感,并结合案例数据与SVM、LSTM和CNN等模型进行对比分析。实验表明,具有情感语义的词向量比词向量更适合情感分析任务;利用双向长短期记忆模型可以得到较好的情感识别效果;判断网民情感极性基础上识别网民负面情感的分类方式优于直接判断网民的负面情感的方式。
[期刊] 运筹与管理
[作者]
杨娜 廖貅武 蔡付龄
针对多属性拍卖中报价的复杂性和现有报价指导模型的局限性,提出了一个以拍卖方的总价值提升为基本约束,以投标人的利润最大化为目标的多属性报价建议模型,并引入二元变量解决了定性属性的推荐问题。当投标人具有不同的投标能力和偏好时,模型可根据投标人的投标要求进行报价推荐;当存在单位价值相同的推荐报价时,模型设置了相应的约束以鼓励早投标行为。最后,还从理论上证明了该模型的稳定性,并通过算例说明了模型的可行性。
[期刊] 中国图书馆学报
[作者]
张卫 王昊 邓三鸿 张宝隆
在跨学科知识范式下,数字人文的研究范畴随着自身学科体系的拓展而不断泛化,采取关键语义技术解析文化对象中的人文内涵与情感知识对于重拾学科"人文性"与"计算性"特质具有重要意义。本文以古诗文本为例,面向汉语诗文及其鉴赏实现大规模人文情感术语的自动化抽取与分析。首先在无标注集环境下提出一种基于"冷启动"的字序列自动标引方法来获取学习语料,随后在字向量(Char2Vec)指导下将汉字特征(部首、拼音等)和BERT语言学模型分别引入机器学习与深度学习模型,并从知识发现的角度定义新术语识别规则。研究发现,将现代鉴赏融入古诗原文显著优化了情感知识的广度与深度,领域术语能够被有效标引。训练的BERT-BiLSTM-CRFs深度学习模型的效果明显优于CRFs机器学习,最佳F1与F1_distinct可分别达到95.63%和85.43%;同时汉字特征的引入也有效提升了传统CRFs效果,以领域特征和基于"竖心旁""心字底"部首约束特征为最优。相较于机器学习抽取出的长篇幅新术语,深度学习能够拓展出更多寄托情感知识的新意象词。源于诗文与鉴赏的情感术语为文学信息资源的情感分析与知识服务提供了参考(人文性),基于汉字语言特征的抽取方案为中文领域自然语言处理技术的深化提供了启迪(计算性)。图11。表6。参考文献30。
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除