- 年份
- 2024(4918)
- 2023(7111)
- 2022(6101)
- 2021(5795)
- 2020(4926)
- 2019(11294)
- 2018(11031)
- 2017(21634)
- 2016(11123)
- 2015(12574)
- 2014(12166)
- 2013(11447)
- 2012(10082)
- 2011(8732)
- 2010(8273)
- 2009(6898)
- 2008(6152)
- 2007(4665)
- 2006(3499)
- 2005(2531)
- 学科
- 济(42811)
- 经济(42768)
- 管理(32419)
- 业(30646)
- 企(25806)
- 企业(25806)
- 方法(25115)
- 数学(22964)
- 数学方法(22623)
- 财(12006)
- 农(10670)
- 中国(9718)
- 业经(8668)
- 务(8253)
- 财务(8222)
- 财务管理(8205)
- 贸(7942)
- 贸易(7938)
- 企业财务(7775)
- 易(7762)
- 技术(7180)
- 农业(7077)
- 地方(7053)
- 理论(6553)
- 学(6432)
- 环境(6399)
- 和(6132)
- 制(6039)
- 划(5864)
- 融(5219)
- 机构
- 学院(141302)
- 大学(141270)
- 管理(61866)
- 济(59479)
- 经济(58526)
- 理学(55228)
- 理学院(54744)
- 管理学(53803)
- 管理学院(53529)
- 研究(39271)
- 中国(29638)
- 京(27207)
- 财(26241)
- 科学(22767)
- 财经(22238)
- 经(20591)
- 中心(20509)
- 业大(20380)
- 经济学(18844)
- 江(18507)
- 农(18410)
- 经济学院(17282)
- 财经大学(17148)
- 范(17101)
- 师范(16923)
- 经济管理(16594)
- 所(16516)
- 商学(16357)
- 商学院(16215)
- 北京(15627)
- 基金
- 项目(109325)
- 科学(88773)
- 基金(82715)
- 研究(80440)
- 家(71390)
- 国家(70840)
- 科学基金(63362)
- 社会(53076)
- 社会科(50542)
- 社会科学(50531)
- 基金项目(44581)
- 省(41989)
- 自然(41522)
- 自然科(40646)
- 自然科学(40637)
- 自然科学基金(39881)
- 教育(38200)
- 划(35556)
- 资助(32771)
- 编号(31903)
- 部(25194)
- 重点(24456)
- 创(23852)
- 成果(23316)
- 国家社会(22868)
- 发(22748)
- 教育部(22456)
- 创新(22295)
- 人文(21984)
- 科研(21805)
共检索到183669条记录
相关度优先
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 清华大学学报(自然科学版)
[作者]
任俊飞 朱桐 陈文亮
多标签文本分类(multi-label text classification, MLTC)旨在从预定义的候选标签中选择一个或多个文本相关的类别,是自然语言处理(natural language processing, NLP)的一项基本任务。前人工作大多基于规范且全面的标注数据集,而这些规范数据集需要严格的质量控制,一般很难获取。在真实的标注过程中,难免会缺失标注一些相关标签,进而导致不完全标注问题。该文提出了一种基于部分标注的自训练多标签文本分类(partial labeling self-training for multi-label text classification, PST)框架,该框架利用教师模型自动地给大规模无标注数据分配标签,同时给不完全标注数据补充缺失标签,最后再利用这些数据反向更新教师模型。在合成数据集和真实数据集上的实验表明,PST框架兼容现有的各类多标签文本分类模型,并且可以缓解不完全标注数据对模型的影响。
关键词:
多标签文本分类 不完全标注 自训练
[期刊] 图书情报工作
[作者]
宋灵超 黄崑
[目的 /意义]提出利用社会标签自动分类图片情感类型的方法,服务基于情感特征的图像检索与利用。[方法/过程]以Flickr图片为例,利用PMi算法对Word Net-AFFect词表进行预处理形成典型情感词表;结合ekMAN提出的6类基本情感类型,利用标签对图片情感类型进行标注;并且,通过实验对分类标注效果进行验证;最后,讨论图片特点、标注意图、非情感标签数量对分类标注效果的影响。[结果 /结论]研究发现,一幅图片的非情感标签与情感标签在表现图片整体情感类型的倾向性上具有较高一致性;结合PMi算法,利用预处理后的典型情感词表标注图片的结果优于未处理的Word Net-AFFect词表;并且,分...
关键词:
图像 标签 情感标注 PMI
[期刊] 图书情报工作
[作者]
陆泉 陈静 丁恒
以现存的大量图像社会标签为基础,设计基于社会标签的图像情感自动分类标注模型,提出图像社会标签对情感的贡献度、区分度以及标签在情感维度上的权重3个因子及计算方法,实现图像5种基本情感语义的分类标注。在实际社会网络数据集上进行验证实验,结果表明建立的模型方法在自动标注图像情感语义方面具有较高的准确性和应用性。同时还发现,实际数据集中情感分布差异与复合情感对图像自动标注具有影响。
[期刊] 情报理论与实践
[作者]
包翔 刘桂锋 杨国立
[目的/意义]为了满足对海量专利数据进行自动分类的需求,提出了一种基于多示例学习框架的专利文本分类方法。[方法/过程]将专利文本当作包,专利文本的标题和摘要分别作为两个示例,通过数学建模将专利文本映射成无向图,构建基于无向图的高斯核函数,运用SVM方法训练分类器,完成对无标记专利文本的预测。[结果/结论]实验结果表明,该方法相较于传统的SVM、KNN方法能更加有效准确地预测未标记专利文本的分类,为文本挖掘领域相关方向的研究提供新的视角。[局限]实验样本数量有待进一步丰富。
[期刊] 图书情报工作
[作者]
程慧荣 黄国彬 孙坦
认为标签是一种自由形式的关键词元数据。作为一种标题词,它具有直接揭示内容、提供查找功能、表达精炼(多为词或短语)等特点。从标签的基本理念,标签的呈现界面,标签的组织对象,包括网页(主要是博客)、音频视频资源等,以及标签与信息检索(检索结果处理、相关度排序、搜索引擎、语义处理)等角度揭示国外基于大众标注系统的标签研究进展。
关键词:
标签 大众标注 研究进展 大众标注系统
[期刊] 图书情报工作
[作者]
宣云干 朱庆华
在分析社会化标注系统标签检索研究现状基础上,针对传统方法可计算性不高、完备性不够、无法分辨自然语言的语义模糊性等不足,提出基于潜在语义分析的社会化标注系统标签语义检索模型,改进标签-资源矩阵权重计算算法,完善社会化标注系统的语义标注方法。并以delicious系统为例,抓取数据进行验证分析,通过对比,证明提出的模型和改进的算法能显著提高标签检索效率。
[期刊] 中国科学技术大学学报
[作者]
王进 王鸿 夏翠萍 欧阳卫华 陈乔松 邓欣
随着数据挖掘技术在现实问题中的广泛应用,多标签学习现已成为数据挖掘技术中的一个研究热点.组合分类器链(ECC)算法是一种性能较好的多标签分类方法,其分类效果好、准确度高,但该算法的时空复杂度较高,不能适应大规模多标签数据分类任务.为此提出了一种基于Spark的组合分类器链多标签分类方法,将串行组合分类器链算法的各步骤进行了并行化实现.通过单机实验和集群并行化实验,证明该方法对大规模多标签数据集具有良好的适应能力和加速比,且分类效果不输于传统的串行多标签分类方法.
[期刊] 图书馆论坛
[作者]
查先进 吕彬
大众标注是Web2.0下的一个重要应用,为知识共享提供了一个良好的平台。标注行为与用户头脑中的知识直接相关,与知识表达和共享相互映射,是一个非常复杂的过程。文章选取三个大众标注系统,针对大众标注下形成的标注结果本身,即知识共享行为之后留下的痕迹——标签(tag),分别从标签频次分布、标签类型、标签特征等方面进行分析,寻找统计学意义上的规律,以反映用户的标注行为,促进高效的知识共享实践。
关键词:
大众标注 标签 知识共享 实证分析
[期刊] 图书情报工作
[作者]
林立涛 吴梦成 刘畅 胡蝶 王东波 黄水清
[目的/意义]网络学术社区中的用户生成答案质量良莠不齐,难以为用户提供高效的决策支持,筛选高可用性答案能够促进网络学术社区问答知识的高效利用。[方法/过程]从文本主题语义视角出发,提出一种基于深度预训练语言模型和多标签分类技术的问答相关性计算方法,用于实现对网络学术社区用户答案的有用性排序。该方法首先提取问题文本和答案文本的语义向量,然后进一步将其映射到领域化的主题向量空间,从而实现对问题和答案主题相似度的计算。[结果/结论 ]以“小木虫”学术社区论文投稿板块“求助完结”栏目下的所有提问及每条提问下的全部答案为实验数据,以NDCG、Q-Measure为评测指标,将本文方法与Cross-Encoder和Bi-Encoder两种基于语义的常规排序方法进行比较,发现本文方法与常规方法性能相当,但是对标注数据的需求更少。
[期刊] 实验技术与管理
[作者]
吴舟婷 罗森林
针对深度学习文本表示隐私保护面临可用性与隐私性难以平衡的问题,该文提出一种基于随机掩码和对抗训练的文本表示隐私保护算法RMAT。该算法首先对原始输入文本序列做随机掩盖,之后注入差分隐私噪声,并结合模拟攻击器与任务分类器间的对抗训练,实现深度学习文本表示的隐私脱敏。文章通过理论推导证明了算法满足差分隐私要求,并用5个公开数据集的实验结果验证了算法在提供完备隐私保障的同时提升了脱敏文本的可用性。通过本项实验,学生不仅对深度学习文本表示模型面临的安全风险有了更清晰的认识,还提升了利用深度学习方法分析和解决安全问题的能力。
关键词:
隐私安全 文本表示 差分隐私 对抗训练
[期刊] 数据分析与知识发现
[作者]
邓三鸿 傅余洋子 王昊
【目的】利用LSTM模型和字嵌入的方法构建分类系统,提出一种中文图书分类中多标签分类的解决方案。【方法】引入深度学习算法,利用字嵌入方法和LSTM模型构建分类系统,对题名、主题词等字段组成的字符串进行学习以训练模型,并采用构建多个二元分类器的方法解决多标签分类问题,选择3所高校5个类别的书目数据进行实验。【结果】从整体准确率、各类别精度、召回率、F1值多个指标进行分析,本文提出的模型均有良好表现,有较强的实际应用价值。【局限】数据仅涉及中图分类法5个类别,考虑的分类粒度较粗等。【结论】基于LSTM模型的中
[期刊] 华中师范大学学报(自然科学版)
[作者]
王宇 李延晖
为提高少量样本情况下分类器的性能,提出一种基于多分类器协同的半监督样本选择方法,利用未标注样本实现样本增强,提高分类器泛化能力.依靠多分类器的互相监督和多分类器标签一致的原理,将已标记样本作为训练集,利用SVM和RF两个分类器协同训练,多分类器的类别标签和确定度值作为约束条件,从未标记样本集中筛选出最有代表性的样本构成增强样本集,以准确率为评价标准,验证本算法对分类器泛化性能的影响.本算法在手写数字数据集(Mnist字符库)和Landsat土壤数据集上测试,实验结果表明相比少量原始训练样本构建的分类器,增强样本构建分类器预测的全部类别准确率都得到提升.两个数据集的总体准确率分别提升5.97%和7.02%,Mnist数据集中数字5这类准确率提升最高(提升11.9%,从79.3%到91.2%),Landsat土壤数据集中土壤3这一类准确率提升最明显(提升15.8%,从73.5%到89.3%),结果证明了该算法显著提高了分类器的泛化性能.同时与经典的KNN、Co-training和Co-forest算法对比,所提出的算法能够最大限度地利用未标记样本信息,具有最好的精度表现,证明了该研究提出算法的优越性.
[期刊] 数据分析与知识发现
[作者]
谢梦瑶 潘旭伟
【目的】标签云可用于信息检索推荐和导航,由于用户标注具有时序特征,为有效揭示用户兴趣动态变化,提出基于时序演化的用户动态标签云构建方法。【方法】利用心理学中记忆的遗忘和加强特征构建标签的动态权重,从而建立用户动态标签云以反映用户关注点的变化。【结果】与现有的标签云算法比较,构建的用户动态标签云算法能够根据用户动态变化的兴趣有效地对标签进行排序,在用户兴趣标签的预测效果上明显高于其他算法,并具有更高的推荐准确率。【局限】因为用户兴趣在短时间周期内不会有太大变化,动态的方法在短时间周期内的预测效果不是很显著,
关键词:
社会化标注 标签 用户兴趣 动态标签云
[期刊] 图书馆
[作者]
吴丹 王艳妮
分析社会标签的特点,比较社会标签与主题词、标引词、关键词的概念,分析学术论文标注的作用与典型的学术论文标注系统,以图书情报领域为例,就用户的学术论文标注与学术论文数据库标引进行对比实验,显示出社会标签与受控的主题词的重合率不高的问题。详细分析实验结果,提出对学术论文标注进行规范控制的建议。
[期刊] 图书馆论坛
[作者]
吴丹 林若楠 冯倩然 陈欢
分析图书标注的发展以及中英文图书标注系统,比较社会标注与主题标引的异同,综述国内外图书标签规范性研究的现状,并以图书情报领域为例,就中英文用户的图书标注与图书馆的图书编目进行对比实验,实验显示出社会标签与受控的主题词的重合率不高这一问题。在详细分析实验结果的基础上,提出对图书标注进行规范控制的若干建议。
关键词:
图书标注 社会标签 主题词 规范性
0
文献操作(0)
导出元数据
文献计量分析
导出文件格式:WXtxt