- 年份
- 2024(5208)
- 2023(7370)
- 2022(6351)
- 2021(5935)
- 2020(5062)
- 2019(11618)
- 2018(11322)
- 2017(22172)
- 2016(11269)
- 2015(12708)
- 2014(12208)
- 2013(11748)
- 2012(10213)
- 2011(8790)
- 2010(8267)
- 2009(7103)
- 2008(6426)
- 2007(5013)
- 2006(3758)
- 2005(2748)
- 学科
- 济(46563)
- 经济(46521)
- 管理(36354)
- 业(35223)
- 企(30319)
- 企业(30319)
- 方法(28052)
- 数学(25458)
- 数学方法(25037)
- 财(11933)
- 农(10915)
- 中国(9630)
- 业经(9420)
- 务(8412)
- 财务(8373)
- 财务管理(8353)
- 贸(8048)
- 贸易(8046)
- 企业财务(7923)
- 易(7878)
- 技术(7680)
- 销(7626)
- 供销(7625)
- 学(7481)
- 农业(7017)
- 环境(6788)
- 和(6759)
- 理论(6715)
- 地方(6695)
- 划(6091)
- 机构
- 学院(149829)
- 大学(149464)
- 管理(66843)
- 济(63064)
- 经济(62083)
- 理学(59669)
- 理学院(59168)
- 管理学(58072)
- 管理学院(57793)
- 研究(40860)
- 中国(30450)
- 京(28943)
- 财(26464)
- 科学(24605)
- 财经(22722)
- 业大(22576)
- 中心(20990)
- 经(20928)
- 农(20056)
- 经济学(19794)
- 江(19085)
- 经济学院(18129)
- 经济管理(17935)
- 财经大学(17414)
- 所(17409)
- 商学(17392)
- 商学院(17236)
- 范(16855)
- 北京(16765)
- 师范(16663)
- 基金
- 项目(115892)
- 科学(94161)
- 基金(88139)
- 研究(82926)
- 家(76401)
- 国家(75846)
- 科学基金(68117)
- 社会(55137)
- 社会科(52611)
- 社会科学(52599)
- 基金项目(46629)
- 自然(45572)
- 自然科(44662)
- 自然科学(44653)
- 省(44554)
- 自然科学基金(43829)
- 教育(38857)
- 划(37462)
- 资助(36047)
- 编号(32270)
- 部(26203)
- 重点(25588)
- 创(25017)
- 发(23918)
- 国家社会(23761)
- 创新(23450)
- 教育部(23165)
- 科研(23141)
- 成果(22979)
- 人文(22922)
共检索到189957条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 中国科学技术大学学报
[作者]
王进 王鸿 夏翠萍 欧阳卫华 陈乔松 邓欣
随着数据挖掘技术在现实问题中的广泛应用,多标签学习现已成为数据挖掘技术中的一个研究热点.组合分类器链(ECC)算法是一种性能较好的多标签分类方法,其分类效果好、准确度高,但该算法的时空复杂度较高,不能适应大规模多标签数据分类任务.为此提出了一种基于Spark的组合分类器链多标签分类方法,将串行组合分类器链算法的各步骤进行了并行化实现.通过单机实验和集群并行化实验,证明该方法对大规模多标签数据集具有良好的适应能力和加速比,且分类效果不输于传统的串行多标签分类方法.
[期刊] 数据分析与知识发现
[作者]
邓三鸿 傅余洋子 王昊
【目的】利用LSTM模型和字嵌入的方法构建分类系统,提出一种中文图书分类中多标签分类的解决方案。【方法】引入深度学习算法,利用字嵌入方法和LSTM模型构建分类系统,对题名、主题词等字段组成的字符串进行学习以训练模型,并采用构建多个二元分类器的方法解决多标签分类问题,选择3所高校5个类别的书目数据进行实验。【结果】从整体准确率、各类别精度、召回率、F1值多个指标进行分析,本文提出的模型均有良好表现,有较强的实际应用价值。【局限】数据仅涉及中图分类法5个类别,考虑的分类粒度较粗等。【结论】基于LSTM模型的中
[期刊] 清华大学学报(自然科学版)
[作者]
任俊飞 朱桐 陈文亮
多标签文本分类(multi-label text classification, MLTC)旨在从预定义的候选标签中选择一个或多个文本相关的类别,是自然语言处理(natural language processing, NLP)的一项基本任务。前人工作大多基于规范且全面的标注数据集,而这些规范数据集需要严格的质量控制,一般很难获取。在真实的标注过程中,难免会缺失标注一些相关标签,进而导致不完全标注问题。该文提出了一种基于部分标注的自训练多标签文本分类(partial labeling self-training for multi-label text classification, PST)框架,该框架利用教师模型自动地给大规模无标注数据分配标签,同时给不完全标注数据补充缺失标签,最后再利用这些数据反向更新教师模型。在合成数据集和真实数据集上的实验表明,PST框架兼容现有的各类多标签文本分类模型,并且可以缓解不完全标注数据对模型的影响。
关键词:
多标签文本分类 不完全标注 自训练
[期刊] 图书馆杂志
[作者]
彭玉芳 石进 徐浩 杨海平
为了能更好地组织南海证据性数据,提高南海疆智库的检索性能,便于科研人员对南海问题展开深入研究,本文融合了中国图书馆分类法的族性检索和分面分类法的特性检索,构建了南海文献分类法,应用Bert预训练模型实现细粒度的多标签南海证据性数据的自动分类,并通过数据库技术将南海证据性数据分为12个面进行组配检索。通过以上方法赋予每一条南海证据性数据唯一的分类号和类名,形式化表示为南海证据性数据的数据分类=证据来源分类+证据的数据体系分类+证据的数据分面分类。从更细粒度的视角,实现数据分类,与粗广式文献载体的分类相比,数据分类更有利于展开数据挖掘,找到数据间潜在的关联关系,发现新的研究视角是科学研究创新的基础和保障。
[期刊] 中国远程教育
[作者]
王萍
Folksonomy(自由分类法)是Web2.0环境下基于社会化书签系统的一种新型信息组织方法,它带来了一种全新的信息交流与资源分享方式。本文采用实例研究法,通过对社会化书签系统del.icio.us的elearning标签数据集的搜集与分析,研究了用户、资源和标签三个元素的性质和特点,基于相似度分析对用户进行学习资源推荐,并分析了资源的分布和elearning标签网络的性质。
[期刊] 图书情报工作
[作者]
石豪 李红娟 赖雯 赵英
重点研究基于Folksonomy的数字资源系统的用户的共性,提出利用用户标签对用户分类的方法,并通过对Flikcr(闪烁照片网)的实证研究,证明通过标签对用户分类的可行性和实用性,为兴趣推送和进一步研究奠定基础。
关键词:
folksonomy 标签 用户分类
[期刊] 图书情报工作
[作者]
乔建忠
针对主题爬行技术中的单一分类算法在面对多主题Web抓取和分类需求时泛化能力不强的局限,设计一种利用多种强分类算法形成的分类器组合,主题爬行器根据当前主题任务在线评估并为分类器排名,从中选择最优分类器分类的策略,并开展在多个主题抓取任务下的分类实验,比较每种分类算法的准确率和组合后的平均分类准确率以及对分类效率等评价指标的综合分析,结果证明该策略对领域局域性有所克服,普适性较强。
[期刊] 图书情报工作
[作者]
宋灵超 黄崑
[目的 /意义]提出利用社会标签自动分类图片情感类型的方法,服务基于情感特征的图像检索与利用。[方法/过程]以Flickr图片为例,利用PMi算法对Word Net-AFFect词表进行预处理形成典型情感词表;结合ekMAN提出的6类基本情感类型,利用标签对图片情感类型进行标注;并且,通过实验对分类标注效果进行验证;最后,讨论图片特点、标注意图、非情感标签数量对分类标注效果的影响。[结果 /结论]研究发现,一幅图片的非情感标签与情感标签在表现图片整体情感类型的倾向性上具有较高一致性;结合PMi算法,利用预处理后的典型情感词表标注图片的结果优于未处理的Word Net-AFFect词表;并且,分...
关键词:
图像 标签 情感标注 PMI
[期刊] 情报资料工作
[作者]
周知 梁宇
文章在概念层面上将标签分为事实型、主观型和个人化3类,根据相关元数据构建词表,并根据标签在用户生成内容中的句法构成制定识别规则,结合二者将标签进行分类。以中国最大的电影标注系统豆瓣网675351位用户的标签数据为例进行实验,实验的召回率为95.01%、准确率为96.19%、F1-measure为95.32%,结果表明这种方法可以较好地实现标签自动分类工作。
关键词:
社会化标签 自建词表 句法规则
[期刊] 图书情报工作
[作者]
陆泉 陈静 丁恒
以现存的大量图像社会标签为基础,设计基于社会标签的图像情感自动分类标注模型,提出图像社会标签对情感的贡献度、区分度以及标签在情感维度上的权重3个因子及计算方法,实现图像5种基本情感语义的分类标注。在实际社会网络数据集上进行验证实验,结果表明建立的模型方法在自动标注图像情感语义方面具有较高的准确性和应用性。同时还发现,实际数据集中情感分布差异与复合情感对图像自动标注具有影响。
[期刊] 情报理论与实践
[作者]
成全 郑抒琳
[目的/意义]用户健康信息需求研究能够发现用户潜在需求,解决用户健康信息盲区,帮助用户实现更好的自我健康管理。研究目标为挖掘识别用户信息需求主题,提取用户特征,促进完善网络社区交互性与多元性发展,为更好地改善健康信息服务提出建议与意见。[方法/过程]针对在线健康社区的母婴群体,提出在线健康社区用户信息需求层级多标签分类模型。通过扎根理论提出在线健康社区用户信息需求主题体系,利用ALBERT对母婴健康需求类数据进行预训练,使用双向GRU与注意力机制构建基础分类器,以此来构建层级多标签分类模型Multi-BiGRU-Attention,实现在线健康社区提问数据的层级多标签分类。[结果/结论]实验对比发现,随着层级的增加,研究提出的模型相比于单层的基础分类器BiGRU-Attention在micro-Precision,micro-Recall,micro-F1等各项指标上均有所提升,说明该模型的层级结构信息能够一定程度上改善模型效果;相比于层级多标签相关模型,在各项指标上均有所提升,说明该模型存在一定的适用性与扩展性。
[期刊] 图书情报工作
[作者]
林立涛 吴梦成 刘畅 胡蝶 王东波 黄水清
[目的/意义]网络学术社区中的用户生成答案质量良莠不齐,难以为用户提供高效的决策支持,筛选高可用性答案能够促进网络学术社区问答知识的高效利用。[方法/过程]从文本主题语义视角出发,提出一种基于深度预训练语言模型和多标签分类技术的问答相关性计算方法,用于实现对网络学术社区用户答案的有用性排序。该方法首先提取问题文本和答案文本的语义向量,然后进一步将其映射到领域化的主题向量空间,从而实现对问题和答案主题相似度的计算。[结果/结论 ]以“小木虫”学术社区论文投稿板块“求助完结”栏目下的所有提问及每条提问下的全部答案为实验数据,以NDCG、Q-Measure为评测指标,将本文方法与Cross-Encoder和Bi-Encoder两种基于语义的常规排序方法进行比较,发现本文方法与常规方法性能相当,但是对标注数据的需求更少。
[期刊] 现代管理科学
[作者]
李勇 许晓晓 赵金涛
客户分类管理,对于银行有效地实施客户关系管理具有重要意义。由于目前分类准确度存在问题,如何有效地对客户进行分类预测就成了十分重要并亟待解决的课题。本文以银行丰富的客户基本信息以及交易行为为对象,建立客户分类预测模型,改进单一或简单组合分类器模型,提出一种基于SOM聚类和决策树的组合分类器方法,建立了客户分类预测模型并对模型进行优化,并探讨该模型的实际应用。
[期刊] 数据分析与知识发现
[作者]
贾杉杉 刘畅 孙连英 刘小安 彭涛
【目的】为了准确地给专利申请书分配IPC分类号,本文提出一种基于多特征多分类器集成的专利自动分类方法。【方法】使用从专利申请书中提取的全词典TFIDF特征、信息增益词典TFIDF特征、段落向量特征、主题模型向量特征,分别训练朴素贝叶斯、支持向量机、AdaBoost分类器,以此构建特征–类别矩阵,并结合F1权重矩阵集成,获得最终IPC预测分类号。【结果】对2014年–2016年"发动机或泵"领域的10个小类进行分类,使用Top Prediction、All Categories和Two Guesses三种评
关键词:
专利分类 段落向量 主题向量 分类器集成
[期刊] 图书情报知识
[作者]
吴江
从当今自由分类的发展和标签等级结构的解决进展出发,提出凝聚子群分析构建自动分类网络地图的新观点和方法,详细分析将标签、资源类聚成网状分类地图的原理和规则设置,绘制选取的120本书标签构成的网状分类地图,并根据结果改进规则。
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除