- 年份
- 2024(9180)
- 2023(13508)
- 2022(11741)
- 2021(11129)
- 2020(9167)
- 2019(20793)
- 2018(20751)
- 2017(39613)
- 2016(21226)
- 2015(23749)
- 2014(23242)
- 2013(22650)
- 2012(20305)
- 2011(18212)
- 2010(17872)
- 2009(16362)
- 2008(15357)
- 2007(13119)
- 2006(11290)
- 2005(9556)
- 学科
- 济(78528)
- 经济(78435)
- 管理(62921)
- 业(59480)
- 企(50720)
- 企业(50720)
- 方法(37278)
- 数学(31761)
- 数学方法(31344)
- 农(21279)
- 中国(20429)
- 财(19116)
- 业经(18995)
- 技术(18323)
- 学(18246)
- 贸(15169)
- 贸易(15163)
- 地方(15102)
- 理论(15044)
- 易(14743)
- 农业(14411)
- 和(13503)
- 制(13301)
- 环境(12756)
- 务(12675)
- 财务(12604)
- 财务管理(12584)
- 企业财务(11871)
- 教育(11628)
- 划(11571)
- 机构
- 大学(292465)
- 学院(291638)
- 管理(119289)
- 济(109814)
- 经济(107249)
- 理学(104317)
- 理学院(103198)
- 管理学(101319)
- 管理学院(100795)
- 研究(92668)
- 中国(66210)
- 京(61447)
- 科学(59506)
- 财(48168)
- 所(45140)
- 业大(44146)
- 农(44045)
- 中心(42290)
- 研究所(41509)
- 江(40683)
- 范(39950)
- 财经(39727)
- 师范(39615)
- 北京(38246)
- 经(36253)
- 农业(34566)
- 院(34240)
- 州(33740)
- 技术(32976)
- 师范大学(32024)
- 基金
- 项目(208322)
- 科学(164569)
- 研究(154073)
- 基金(150675)
- 家(130802)
- 国家(129721)
- 科学基金(112428)
- 社会(95968)
- 社会科(90835)
- 社会科学(90815)
- 省(81963)
- 基金项目(80594)
- 自然(73697)
- 自然科(72015)
- 自然科学(72003)
- 教育(71306)
- 自然科学基金(70689)
- 划(68879)
- 编号(64076)
- 资助(60850)
- 成果(50637)
- 重点(46297)
- 部(45295)
- 创(44511)
- 发(43961)
- 课题(43256)
- 创新(41370)
- 项目编号(40006)
- 科研(39769)
- 教育部(39123)
- 期刊
- 济(116503)
- 经济(116503)
- 研究(81656)
- 中国(52628)
- 学报(46092)
- 科学(42430)
- 管理(42297)
- 农(39622)
- 教育(37027)
- 财(35081)
- 大学(34688)
- 学学(32256)
- 农业(28381)
- 技术(27799)
- 业经(20790)
- 融(19398)
- 金融(19398)
- 图书(19005)
- 经济研究(18758)
- 财经(18019)
- 科技(16081)
- 经(15338)
- 技术经济(14920)
- 问题(14551)
- 理论(14367)
- 业(14115)
- 情报(13556)
- 实践(13442)
- 践(13442)
- 版(13333)
共检索到407945条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 图书情报工作
[作者]
林立涛 吴梦成 刘畅 胡蝶 王东波 黄水清
[目的/意义]网络学术社区中的用户生成答案质量良莠不齐,难以为用户提供高效的决策支持,筛选高可用性答案能够促进网络学术社区问答知识的高效利用。[方法/过程]从文本主题语义视角出发,提出一种基于深度预训练语言模型和多标签分类技术的问答相关性计算方法,用于实现对网络学术社区用户答案的有用性排序。该方法首先提取问题文本和答案文本的语义向量,然后进一步将其映射到领域化的主题向量空间,从而实现对问题和答案主题相似度的计算。[结果/结论 ]以“小木虫”学术社区论文投稿板块“求助完结”栏目下的所有提问及每条提问下的全部答案为实验数据,以NDCG、Q-Measure为评测指标,将本文方法与Cross-Encoder和Bi-Encoder两种基于语义的常规排序方法进行比较,发现本文方法与常规方法性能相当,但是对标注数据的需求更少。
[期刊] 情报杂志
[作者]
武庆圆 何凌南
[目的/意义]面对互联网与智能移动设备的兴起,谣言尤其是短文本类型的谣言发展速度十分迅猛。短文本谣言具有词语稀疏、语义提取困难等特点,这为精准识别谣言带来了挑战和困难。如何能够有效地鉴别进而控制谣言的传播是目前迫在眉睫的问题。[方法/过程]提出一个在文本与标签之间引入语义层的多标签双词主题模型,用于发现及探究网民发表在公共媒体平台上的短文本属于谣言或欺诈的倾向。该研究专门针对微信等短文本数据,并通过真实数据集对双词主题的提取和建模进行验证。[结果/结论]结果表明:上述模型可以有效鉴别谣言,帮助媒体加强和改
[期刊] 情报理论与实践
[作者]
成全 郑抒琳
[目的/意义]用户健康信息需求研究能够发现用户潜在需求,解决用户健康信息盲区,帮助用户实现更好的自我健康管理。研究目标为挖掘识别用户信息需求主题,提取用户特征,促进完善网络社区交互性与多元性发展,为更好地改善健康信息服务提出建议与意见。[方法/过程]针对在线健康社区的母婴群体,提出在线健康社区用户信息需求层级多标签分类模型。通过扎根理论提出在线健康社区用户信息需求主题体系,利用ALBERT对母婴健康需求类数据进行预训练,使用双向GRU与注意力机制构建基础分类器,以此来构建层级多标签分类模型Multi-BiGRU-Attention,实现在线健康社区提问数据的层级多标签分类。[结果/结论]实验对比发现,随着层级的增加,研究提出的模型相比于单层的基础分类器BiGRU-Attention在micro-Precision,micro-Recall,micro-F1等各项指标上均有所提升,说明该模型的层级结构信息能够一定程度上改善模型效果;相比于层级多标签相关模型,在各项指标上均有所提升,说明该模型存在一定的适用性与扩展性。
[期刊] 清华大学学报(自然科学版)
[作者]
任俊飞 朱桐 陈文亮
多标签文本分类(multi-label text classification, MLTC)旨在从预定义的候选标签中选择一个或多个文本相关的类别,是自然语言处理(natural language processing, NLP)的一项基本任务。前人工作大多基于规范且全面的标注数据集,而这些规范数据集需要严格的质量控制,一般很难获取。在真实的标注过程中,难免会缺失标注一些相关标签,进而导致不完全标注问题。该文提出了一种基于部分标注的自训练多标签文本分类(partial labeling self-training for multi-label text classification, PST)框架,该框架利用教师模型自动地给大规模无标注数据分配标签,同时给不完全标注数据补充缺失标签,最后再利用这些数据反向更新教师模型。在合成数据集和真实数据集上的实验表明,PST框架兼容现有的各类多标签文本分类模型,并且可以缓解不完全标注数据对模型的影响。
关键词:
多标签文本分类 不完全标注 自训练
[期刊] 情报理论与实践
[作者]
陈斌 马静
[目的/意义]为了弥补LDA模型建模过程中未考虑到网络文本中文档关注度和质量度这一因素,并增强结果的语义可解释性和主题表示能力,文章提出了一种热度加权的HLDA-IDF的网络文本主题挖掘模型。[方法/过程]本文首先是给出了较为准确的热度定义,并对LDA模型进行热度加权,构建出了HLDA模型,再依据词汇的主题表示能力存在差异这一实际情况,引入TF-IDF算法并改进,构建出HLDA-IDF模型,最后利用实际论坛数据进行实验验证。[结果/结论]实验结果表明该模型的结果语义可解释性和主题表示能力较强。
关键词:
热度 模型 主题挖掘 网络文本 文本挖掘
[期刊] 图书情报工作
[作者]
熊回香 邓敏 郭思源
针对标签所具有多样性、模糊性、语义关系缺乏等局限,探索标签与主题图的结合机制,进而将主题图技术应用于中文标签体系中。在阐述标签与主题图结合可行性的基础上,提出两者的构建模型,并选取"豆瓣电影"中的标签实例,同时运用主题图软件工具Ontopia构建中文标签主题图,实现其可视化,从而为用户提供更好的标签导航和浏览机制。
[期刊] 数据分析与知识发现
[作者]
邓三鸿 傅余洋子 王昊
【目的】利用LSTM模型和字嵌入的方法构建分类系统,提出一种中文图书分类中多标签分类的解决方案。【方法】引入深度学习算法,利用字嵌入方法和LSTM模型构建分类系统,对题名、主题词等字段组成的字符串进行学习以训练模型,并采用构建多个二元分类器的方法解决多标签分类问题,选择3所高校5个类别的书目数据进行实验。【结果】从整体准确率、各类别精度、召回率、F1值多个指标进行分析,本文提出的模型均有良好表现,有较强的实际应用价值。【局限】数据仅涉及中图分类法5个类别,考虑的分类粒度较粗等。【结论】基于LSTM模型的中
[期刊] 情报学报
[作者]
张金柱 李溢峰
为了丰富专利分类的网络和文本语义表示,实现两者更有效的语义融合,提高技术融合预测效果,提出基于专利分类序列和文本语义表示的技术融合预测方法。首先,综合考虑专利分类位置及其上下文语境,直接对专利分类序列进行语义表示,提出基于专利分类序列语义表示的技术融合预测方法;其次,根据专利分类在序列中的重要性排序研究专利分类文本分配方法,形成基于专利分类文本语义表示的技术融合预测方法;在此基础上,设计多种特征融合方法,提出融合专利分类序列结构和文本内容语义表示的技术融合预测方法;最后,基于链路预测的理论和方法对提出的多种技术融合预测方法进行定量评价。在无人机领域的实验证实,专利分类序列语义表示模型的效果明显优于其他网络表示学习方法;依据重要性排序的专利分类文本赋予方式优于文本平均分配方式,基于此的专利分类文本语义表示能更好地进行技术融合预测;“SVM (support vector machine)+哈达玛积”的特征融合方法在所有方法中表现最优,较单一方法均有提高。本文提出的方法能够提高技术融合预测的效果,更好地为技术布局、技术研发提供借鉴和参考。
[期刊] 情报学报
[作者]
武帅 杨秀璋 何琳 公佐权
以编目分类和规则匹配为主的古籍文本主题分类方法存在工作效能低、专家知识依赖性强、分类依据单一化、古籍文本主题自动分类难等问题。对此,本文结合古籍文本内容和文字特征,尝试从古籍内容分类得到符合研究者需求的主题,推动数字人文研究范式的转型。首先,参照东汉古籍《说文解字》对文字的分析方式,以前期标注的古籍语料数据集为基础,构建全新的“字音(说)-原文(文)-结构(解)-字形(字)”四维特征数据集。其次,设计四维特征向量提取模型(speaking, word, pattern, and font to vector,SWPF2vec),并结合预训练模型实现对古籍文本细粒度的特征表示。再其次,构建融合卷积神经网络、循环神经网络和多头注意力机制的古籍文本主题分类模型(dianji-recurrent convolutional neural networks for text classification,DJ-TextRCNN)。最后,融入四维语义特征,实现对古籍文本多维度、深层次、细粒度的语义挖掘。在古籍文本主题分类任务上,DJ-TextRCNN模型在不同维度特征下的主题分类准确率均为最优,在“说文解字”四维特征下达到76.23%的准确率,初步实现了对古籍文本的精准主题分类。
[期刊] 情报学报
[作者]
武帅 杨秀璋 何琳
传统编目分类和规则匹配方法存在工作效能低、过度依赖专家知识、缺乏对古籍文本自身语义的深层次挖掘、编目主题边界模糊、较难实现对古籍文本领域主题的精准推荐等问题。为此,本文结合古籍语料特征探究如何实现精准推荐符合研究者需求的文本主题内容的方法,以推动数字人文研究的进一步发展。首先,选取本课题组前期标注的古籍语料数据进行主题类别标注和视图分类;其次,构建融合BERT (bidirectional encoder representation from transformers)预训练模型、改进卷积神经网络、循环神经网络和多头注意力机制的语义挖掘模型;最后,融入“主体-关系-客体”多视图的语义增强模型,构建DJ-TextRCNN (DianJi-recurrent convolutional neural networks for text classification)模型实现对典籍文本更细粒度、更深层次、更多维度的语义挖掘。研究结果发现,DJ-TextRCNN模型在不同视图下的古籍主题推荐任务的准确率均为最优。在“主体-关系-客体”视图下,精确率达到88.54%,初步实现了对古籍文本的精准主题推荐,对中华文化深层次、细粒度的语义挖掘具有一定的指导意义。
[期刊] 图书馆杂志
[作者]
彭玉芳 石进 徐浩 杨海平
为了能更好地组织南海证据性数据,提高南海疆智库的检索性能,便于科研人员对南海问题展开深入研究,本文融合了中国图书馆分类法的族性检索和分面分类法的特性检索,构建了南海文献分类法,应用Bert预训练模型实现细粒度的多标签南海证据性数据的自动分类,并通过数据库技术将南海证据性数据分为12个面进行组配检索。通过以上方法赋予每一条南海证据性数据唯一的分类号和类名,形式化表示为南海证据性数据的数据分类=证据来源分类+证据的数据体系分类+证据的数据分面分类。从更细粒度的视角,实现数据分类,与粗广式文献载体的分类相比,数据分类更有利于展开数据挖掘,找到数据间潜在的关联关系,发现新的研究视角是科学研究创新的基础和保障。
[期刊] 情报理论与实践
[作者]
陈婷 胡改丽 陈福集 周敬
文章在分析标签和主题图技术在知识组织的优势的基础上提出主题图技术应用与标签,并进行了可行性分析。同时以超星数字图书馆中的"我的图书馆"社会化标注系统中的标签样本为例,阐明了标签主题图的构建过程,并利用OKS中的可视化工具对标签主题图进行了可视化,以期为基于社会化标注的个人数字图书馆构建基于社会化标签的知识导航提供思路。
关键词:
主题图 社会化标签 数字图书馆 知识组织
[期刊] 图书情报工作
[作者]
胡潜 石宇
[目的/意义]更全面地理解用户标签使用行为的影响因素,为标签推荐和应用实践提供指导。[方法/过程]采用日志分析法,从人均标签个数、标签类型分布两个方面分析图书主题的影响,并以计算机、心理学、经济学、文学作品、绘画5类图书为例,基于社会化标注社区豆瓣网的用户数据进行实证分析。[结果/结论]图书主题会对用户的标签个数及类型分布具有显著影响:1在标签个数方面,计算机、心理学、经济学、文学作品主题图书的人均标签个数相近,显著高于绘画主题图书;2在标签类型分布上,根据5类图书间的差异可分为3组:计算机、心理学和经济学、文学作品和绘画。这一结论对图书标签推荐及图书分面检索和导航系统的设计具有参考作用。
关键词:
社会化标签 用户行为 图书主题
[期刊] 图书情报工作
[作者]
刘雅姝 滕广青 王东艳 毕强 白淑春
[目的/意义]基于知识网络的核心-边缘结构揭示Folksonomy知识组织模式中标签层级演化的模式与规律,对洞悉开放网络环境下知识组织的层级结构具有重要意义。[方法/过程]以网络思维为指导,基于标签之间的同现关系构建领域知识网络。依据核心-边缘结构分析方法,遵循时间序列对标签层级的演化情况,从描述统计、显著性分析、层级升降演化等方面进行跟踪研究。[结果/结论]标签的核心/边缘层级结构随着领域知识的发展演化变迁,逐渐收敛趋于稳定。标签层级的晋升与淡化主要受知识关联驱动,核心层标签之间的关联关系占有更高的权重
[期刊] 运筹与管理
[作者]
潘旭伟 曾雪梅 李涛
社会化标签的相似性评估是基于标签的链路预测和个性化推荐的基础。针对以向量空间矩阵和基于图或网络的标签共现关系来度量标签之间相似性的现有方法存在的割裂社会化标签系统“用户-资源-标签”三元内在关系及语义联系丢失问题,本文引入能系统刻画“用户-资源-标签”三元内在关系的超网络模型,提出基于超网络的社会化标签相似性评估方法。该方法从用户的社会化标注行为入手,将标签表示为节点,把用户对资源标注表示为超边,构建社会化标签超网络。在此基础上,建立基于超网络的社会化标签相似性度量的两个基本原则:共有超边原则和超边包含节点数原则,并据此构建基于超网络的系列社会化标签相似性度量指标。选取代表性社会化标签应用数据集,利用链路预测的AUC和Precision评价方法对构建的相似性指标进行实验评估,实验结果表明,基于单纯共超边原则以及综合共超边与超边包含节点数原则构建的标签相似性指标优于基于标签共现网络构建的标签相似性度量指标,特别是在Precision评价方面提升明显。
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除