- 年份
- 2024(9411)
- 2023(13838)
- 2022(12213)
- 2021(11594)
- 2020(9738)
- 2019(22765)
- 2018(22620)
- 2017(44098)
- 2016(23748)
- 2015(26964)
- 2014(26782)
- 2013(26153)
- 2012(23624)
- 2011(21212)
- 2010(20942)
- 2009(18740)
- 2008(17902)
- 2007(15211)
- 2006(13156)
- 2005(11030)
- 学科
- 济(90593)
- 经济(90497)
- 管理(68349)
- 业(63549)
- 企(53890)
- 企业(53890)
- 方法(47884)
- 数学(42307)
- 数学方法(41561)
- 农(23275)
- 中国(22729)
- 财(22108)
- 学(20631)
- 业经(19910)
- 地方(17620)
- 理论(16784)
- 农业(15644)
- 贸(15378)
- 贸易(15371)
- 和(15327)
- 易(14928)
- 技术(14922)
- 务(14829)
- 财务(14747)
- 财务管理(14716)
- 制(13966)
- 环境(13942)
- 企业财务(13908)
- 划(12715)
- 银(11496)
- 机构
- 大学(329049)
- 学院(326038)
- 管理(135475)
- 济(122980)
- 经济(120213)
- 理学(118723)
- 理学院(117454)
- 管理学(114939)
- 管理学院(114328)
- 研究(99526)
- 中国(71925)
- 京(68565)
- 科学(64252)
- 财(53908)
- 业大(50353)
- 农(49545)
- 所(47961)
- 中心(46352)
- 江(45701)
- 财经(44863)
- 研究所(44332)
- 范(43754)
- 师范(43345)
- 北京(42472)
- 经(40951)
- 农业(38897)
- 州(38406)
- 院(36817)
- 经济学(36308)
- 技术(35551)
- 基金
- 项目(234708)
- 科学(184751)
- 研究(170951)
- 基金(170274)
- 家(148034)
- 国家(146831)
- 科学基金(127569)
- 社会(105796)
- 社会科(100286)
- 社会科学(100258)
- 省(92143)
- 基金项目(90863)
- 自然(84960)
- 自然科(83064)
- 自然科学(83046)
- 自然科学基金(81498)
- 教育(79873)
- 划(77320)
- 编号(71525)
- 资助(70603)
- 成果(56632)
- 重点(51837)
- 部(51177)
- 创(49027)
- 发(48851)
- 课题(47424)
- 创新(45611)
- 科研(45279)
- 项目编号(44683)
- 教育部(44230)
- 期刊
- 济(122511)
- 经济(122511)
- 研究(86293)
- 中国(54658)
- 学报(53527)
- 管理(47083)
- 科学(46324)
- 农(43326)
- 大学(40579)
- 财(40135)
- 教育(36747)
- 学学(36459)
- 图书(35341)
- 技术(30876)
- 农业(30736)
- 书馆(26350)
- 图书馆(26350)
- 业经(21472)
- 融(21120)
- 金融(21120)
- 财经(20493)
- 经济研究(19854)
- 经(17379)
- 情报(16322)
- 问题(15909)
- 科技(15881)
- 业(15710)
- 技术经济(15707)
- 理论(15539)
- 坛(15093)
共检索到453629条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 数据分析与知识发现
[作者]
邓三鸿 傅余洋子 王昊
【目的】利用LSTM模型和字嵌入的方法构建分类系统,提出一种中文图书分类中多标签分类的解决方案。【方法】引入深度学习算法,利用字嵌入方法和LSTM模型构建分类系统,对题名、主题词等字段组成的字符串进行学习以训练模型,并采用构建多个二元分类器的方法解决多标签分类问题,选择3所高校5个类别的书目数据进行实验。【结果】从整体准确率、各类别精度、召回率、F1值多个指标进行分析,本文提出的模型均有良好表现,有较强的实际应用价值。【局限】数据仅涉及中图分类法5个类别,考虑的分类粒度较粗等。【结论】基于LSTM模型的中
[期刊] 数据分析与知识发现
[作者]
涂海丽 唐晓波
【目的】构建社会化电子商务环境下基于标签的个性化商品推荐模型。【方法】综合考虑用户使用标签的频率和时间因素计算用户的兴趣偏好;基于标签层次特征和电子商务网站中关于商品特征的检索条件,构建某一主题商务社区中商品本体;利用本体规范化用户标签语义,并对商品进行分类;寻找含有用户偏好的类簇,计算该类簇中商品与用户偏好商品的相似度,将用户未标注过的商品与用户偏好相似度高的商品推荐给用户。【结果】从翻东西网站上随机选取200个活跃用户关于热门商品的标注信息进行分析,验证该模型的有效性。【局限】在计算用户兴趣偏好时,只
关键词:
用户标签 商品本体 用户偏好 推荐模型
[期刊] 情报杂志
[作者]
武庆圆 何凌南
[目的/意义]面对互联网与智能移动设备的兴起,谣言尤其是短文本类型的谣言发展速度十分迅猛。短文本谣言具有词语稀疏、语义提取困难等特点,这为精准识别谣言带来了挑战和困难。如何能够有效地鉴别进而控制谣言的传播是目前迫在眉睫的问题。[方法/过程]提出一个在文本与标签之间引入语义层的多标签双词主题模型,用于发现及探究网民发表在公共媒体平台上的短文本属于谣言或欺诈的倾向。该研究专门针对微信等短文本数据,并通过真实数据集对双词主题的提取和建模进行验证。[结果/结论]结果表明:上述模型可以有效鉴别谣言,帮助媒体加强和改
[期刊] 管理评论
[作者]
石勇 孟凡 齐志泉
大数据时代,在实际应用中所面临的数据体量大幅增长,由于对数据进行详细标记的难度很大而且成本极高,弱标签数据已经成为了大数据时代所面临的主要数据。比例标签数据作为弱标签数据中的一个重要类型,有着广阔的应用场景,但目前仍未受到广泛关注。已有的比例标签学习模型在处理大规模问题时,计算速度往往较慢。为了提高学习速度,本文提出Lap-Inv Cal模型,利用LapESVR进行比例标签学习。大量实验表明,该模型在保证较高精度的同时,大幅提升了训练速度,能够广泛应用于大规模比例标签学习问题中。
[期刊] 图书情报工作
[作者]
武慧娟 徐宝祥 周兰萍
对国外基于标签的个性化信息推荐模型的研究背景进行述评,根据标签系统中用户、资源、标签组织方式的不同,将基于标签的个性化信息推荐的研究归为三类——基于图论、基于张量和基于主题模型进行分析,详细阐述各自的特征和可能存在的问题等,最后针对目前的研究状况,提出未来需要解决的问题,希望我国图书情报领域能够借鉴国外这一领域相关研究成果。
关键词:
信息推荐 个性化 标签
[期刊] 情报学报
[作者]
吴鹏 李婷 仝冲 沈思
为了解决财经微博文本中网民情感状态转移的时序数据分析问题,本文提出一个基于认知情感评价模型(Ortony,Clore&Collins,OCC)和长短期记忆模型(long short term memory,LSTM)的财经微博文本情感分类模型(OCC-LSTM)。基于OCC模型从网民认知角度建立情感规则,对财经微博文本进行情感标注,并作为LSTM模型进行深度学习的训练集;基于LSTM模型,使用深度学习中的TensorFlow框架和Keras模块建立相应的实验模型,进行海量微博数据情感分类,并结合13家上市公司3年的微博文本数据进行实证研究和模型验证对比。实证研究结果发现本文提出的模型取得了89.45%的准确率,高于采用传统的机器学习方式的支持向量机方法 (support vector machine,SVM)和基于深度学习的半监督RAE方法 (semi-supervised recursive auto encoder)。
[期刊] 情报理论与实践
[作者]
陈婷 胡改丽 陈福集 周敬
文章在分析标签和主题图技术在知识组织的优势的基础上提出主题图技术应用与标签,并进行了可行性分析。同时以超星数字图书馆中的"我的图书馆"社会化标注系统中的标签样本为例,阐明了标签主题图的构建过程,并利用OKS中的可视化工具对标签主题图进行了可视化,以期为基于社会化标注的个人数字图书馆构建基于社会化标签的知识导航提供思路。
关键词:
主题图 社会化标签 数字图书馆 知识组织
[期刊] 图书馆杂志
[作者]
彭玉芳 石进 徐浩 杨海平
为了能更好地组织南海证据性数据,提高南海疆智库的检索性能,便于科研人员对南海问题展开深入研究,本文融合了中国图书馆分类法的族性检索和分面分类法的特性检索,构建了南海文献分类法,应用Bert预训练模型实现细粒度的多标签南海证据性数据的自动分类,并通过数据库技术将南海证据性数据分为12个面进行组配检索。通过以上方法赋予每一条南海证据性数据唯一的分类号和类名,形式化表示为南海证据性数据的数据分类=证据来源分类+证据的数据体系分类+证据的数据分面分类。从更细粒度的视角,实现数据分类,与粗广式文献载体的分类相比,数据分类更有利于展开数据挖掘,找到数据间潜在的关联关系,发现新的研究视角是科学研究创新的基础和保障。
[期刊] 中国科学技术大学学报
[作者]
王进 王鸿 夏翠萍 欧阳卫华 陈乔松 邓欣
随着数据挖掘技术在现实问题中的广泛应用,多标签学习现已成为数据挖掘技术中的一个研究热点.组合分类器链(ECC)算法是一种性能较好的多标签分类方法,其分类效果好、准确度高,但该算法的时空复杂度较高,不能适应大规模多标签数据分类任务.为此提出了一种基于Spark的组合分类器链多标签分类方法,将串行组合分类器链算法的各步骤进行了并行化实现.通过单机实验和集群并行化实验,证明该方法对大规模多标签数据集具有良好的适应能力和加速比,且分类效果不输于传统的串行多标签分类方法.
[期刊] 中国远程教育
[作者]
王萍
Folksonomy(自由分类法)是Web2.0环境下基于社会化书签系统的一种新型信息组织方法,它带来了一种全新的信息交流与资源分享方式。本文采用实例研究法,通过对社会化书签系统del.icio.us的elearning标签数据集的搜集与分析,研究了用户、资源和标签三个元素的性质和特点,基于相似度分析对用户进行学习资源推荐,并分析了资源的分布和elearning标签网络的性质。
[期刊] 图书情报工作
[作者]
石豪 李红娟 赖雯 赵英
重点研究基于Folksonomy的数字资源系统的用户的共性,提出利用用户标签对用户分类的方法,并通过对Flikcr(闪烁照片网)的实证研究,证明通过标签对用户分类的可行性和实用性,为兴趣推送和进一步研究奠定基础。
关键词:
folksonomy 标签 用户分类
[期刊] 清华大学学报(自然科学版)
[作者]
任俊飞 朱桐 陈文亮
多标签文本分类(multi-label text classification, MLTC)旨在从预定义的候选标签中选择一个或多个文本相关的类别,是自然语言处理(natural language processing, NLP)的一项基本任务。前人工作大多基于规范且全面的标注数据集,而这些规范数据集需要严格的质量控制,一般很难获取。在真实的标注过程中,难免会缺失标注一些相关标签,进而导致不完全标注问题。该文提出了一种基于部分标注的自训练多标签文本分类(partial labeling self-training for multi-label text classification, PST)框架,该框架利用教师模型自动地给大规模无标注数据分配标签,同时给不完全标注数据补充缺失标签,最后再利用这些数据反向更新教师模型。在合成数据集和真实数据集上的实验表明,PST框架兼容现有的各类多标签文本分类模型,并且可以缓解不完全标注数据对模型的影响。
关键词:
多标签文本分类 不完全标注 自训练
[期刊] 图书馆杂志
[作者]
沈立力 姜鹏 王静
Google AI团队发布的BERT模型在多项自然语言处理任务中取得了研究成果,但在中文文献自动分类领域尚有待探索。本文旨在探索BERT_(base)中文基础模型在中文社科、科技期刊文献分类上的实际分类效果,指出模型在实际应用中存在的问题并提出解决方法。本文选取R大类(医药、卫生)、TG大类(金属学与金属工艺)、F大类(经济)、J大类(艺术)共1 745 000条数据作为训练语料,并以另外9 610条数据作为测试样本,利用BERT模型分别对社科、科技期刊文献进行分类研究。测试结果表明BERT模型在社科文献中的四级准确率为76.95%,科技文献为68.55%。之后引入惩罚策略,为实际工作中免检数据阈值的设定提供参考。BERT_(base)模型在《全国报刊索引》实际分类标引工作中有一定可行性,基本满足当前网络环境下中文文献自动分类的需求。
[期刊] 情报理论与实践
[作者]
顾晓雪 章成志
文章选取科学网博文的两类标签为研究对象,用户生成标签和用TEXTRANK算法产成机器生成标签,对标签进行统计处理后生成各自的标签词典,根据标签词典用两种相似度计算方法 (余弦向量法和欧式距离法)对标签进行相似度计算,用开源的AP聚类算法对两种不同来源的标签进行聚类,并使用可视化工具对聚类标签进行展示,最后对两种标签聚类结果进行了相应的比较和描述。研究发现,用户生成标签的聚类结果比机器生成标签的聚类结果要更分散,能够通过标签聚类发现一些主题。
关键词:
标签聚类 可视化 博客
[期刊] 情报杂志
[作者]
周朴雄 陈蓓蓉
[目的/意义]互联网的出现满足了人们展示兴趣的需求,为了使具有共同兴趣的人能够聚集在一起,就需要进一步探讨用户的兴趣,发现其潜在需求,建立兴趣预测模型,使其成为人与人、人与信息资源之间互动的桥梁。[方法/过程]借助之前学者提出的标签云系统这个概念,加以改进,将其作为用户兴趣的表达方式,采用共现分析作为主要的预测手段,建立标签集之间的关联关系,最终实现用户兴趣的预测。[结果/结论]以流程图的形式呈现用户兴趣预测模型,即此模型能够描述用户兴趣预测的过程,并通过实验研究,验证模型的可行性。
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除