搜索文献-EPS

年份: 2024(9180); 2023(13508); 2022(11741); 2021(11129); 2020(9167); 2019(20793); 2018(20751); 2017(39613); 2016(21226); 2015(23748); 2014(23242); 2013(22649); 2012(20305); 2011(18212); 2010(17872); 2009(16362); 2008(15357); 2007(13119); 2006(11290); 2005(9556)

作者: 王(59140); 张(48977); 李(48885); 刘(46254); 陈(31129); 杨(23409); 晓(22202); 赵(19289); 周(18496); 华(17308); 吴(16708); 文(16272); 林(15420); 明(15196); 伟(15001); 丽(14782); 孙(14677); 志(14677); 徐(14016); 黄(13855); 玉(12141); 平(11838); 军(11641); 朱(11122); 郭(10947); 红(10910); 建(10840); 胡(10747); 春(9786); 艳(9694)

学科: 济(78526); 经济(78433); 管理(62921); 业(59480); 企(50720); 企业(50720); 方法(37276); 数学(31759); 数学方法(31342); 农(21279); 中国(20429); 财(19116); 业经(18995); 技术(18323); 学(18246); 贸(15169); 贸易(15163); 地方(15102); 理论(15044); 易(14743); 农业(14411); 和(13503); 制(13301); 环境(12756); 务(12675); 财务(12604); 财务管理(12584); 企业财务(11871); 教育(11628); 划(11571)

机构: 大学(292463); 学院(291637); 管理(119289); 济(109812); 经济(107247); 理学(104317); 理学院(103198); 管理学(101319); 管理学院(100795); 研究(92666); 中国(66210); 京(61447); 科学(59506); 财(48168); 所(45139); 业大(44146); 农(44045); 中心(42288); 研究所(41509); 江(40683); 范(39950); 财经(39727); 师范(39615); 北京(38246); 经(36253); 农业(34566); 院(34240); 州(33740); 技术(32976); 师范大学(32024)

基金: 项目(208320); 科学(164567); 研究(154071); 基金(150673); 家(130800); 国家(129719); 科学基金(112426); 社会(95966); 社会科(90833); 社会科学(90813); 省(81963); 基金项目(80594); 自然(73695); 自然科(72013); 自然科学(72001); 教育(71305); 自然科学基金(70687); 划(68878); 编号(64076); 资助(60848); 成果(50636); 重点(46297); 部(45294); 创(44511); 发(43961); 课题(43256); 创新(41370); 项目编号(40006); 科研(39769); 教育部(39122)

期刊: 济(116502); 经济(116502); 研究(81655); 中国(52628); 学报(46092); 科学(42430); 管理(42297); 农(39622); 教育(37027); 财(35080); 大学(34688); 学学(32256); 农业(28381); 技术(27799); 业经(20790); 融(19398); 金融(19398); 图书(19005); 经济研究(18758); 财经(18018); 科技(16081); 经(15337); 技术经济(14920); 问题(14551); 理论(14367); 业(14115); 情报(13556); 实践(13442); 践(13442); 版(13333)

全选本页取消本页

共检索到407943条记录

发布时间倒序

发布时间倒序
相关度优先

文献计量分析

结果分析(前20)
结果分析(前50)
结果分析(前100)
结果分析(前200)
结果分析(前500)

文本主题视角下多标签分类技术驱动的网络学术社区答案排序研究

[期刊] 图书情报工作 [作者] 林立涛吴梦成刘畅胡蝶王东波黄水清

[目的/意义]网络学术社区中的用户生成答案质量良莠不齐，难以为用户提供高效的决策支持，筛选高可用性答案能够促进网络学术社区问答知识的高效利用。[方法/过程]从文本主题语义视角出发，提出一种基于深度预训练语言模型和多标签分类技术的问答相关性计算方法，用于实现对网络学术社区用户答案的有用性排序。该方法首先提取问题文本和答案文本的语义向量，然后进一步将其映射到领域化的主题向量空间，从而实现对问题和答案主题相似度的计算。[结果/结论 ]以“小木虫”学术社区论文投稿板块“求助完结”栏目下的所有提问及每条提问下的全部答案为实验数据，以NDCG、Q-Measure为评测指标，将本文方法与Cross-Encoder和Bi-Encoder两种基于语义的常规排序方法进行比较，发现本文方法与常规方法性能相当，但是对标注数据的需求更少。

关键词：网络学术社区用户生成内容主题挖掘答案排序问答相关性多标签分类

基于多标签双词主题模型的短文本谣言分析研究

[期刊] 情报杂志 [作者] 武庆圆何凌南

[目的/意义]面对互联网与智能移动设备的兴起,谣言尤其是短文本类型的谣言发展速度十分迅猛。短文本谣言具有词语稀疏、语义提取困难等特点,这为精准识别谣言带来了挑战和困难。如何能够有效地鉴别进而控制谣言的传播是目前迫在眉睫的问题。[方法/过程]提出一个在文本与标签之间引入语义层的多标签双词主题模型,用于发现及探究网民发表在公共媒体平台上的短文本属于谣言或欺诈的倾向。该研究专门针对微信等短文本数据,并通过真实数据集对双词主题的提取和建模进行验证。[结果/结论]结果表明:上述模型可以有效鉴别谣言,帮助媒体加强和改

关键词：多标签双词短文本谣言主题模型微信语义分析

在线健康社区用户信息需求的层级多标签分类研究

[期刊] 情报理论与实践 [作者] 成全郑抒琳

[目的/意义]用户健康信息需求研究能够发现用户潜在需求，解决用户健康信息盲区，帮助用户实现更好的自我健康管理。研究目标为挖掘识别用户信息需求主题，提取用户特征，促进完善网络社区交互性与多元性发展，为更好地改善健康信息服务提出建议与意见。[方法/过程]针对在线健康社区的母婴群体，提出在线健康社区用户信息需求层级多标签分类模型。通过扎根理论提出在线健康社区用户信息需求主题体系，利用ALBERT对母婴健康需求类数据进行预训练，使用双向GRU与注意力机制构建基础分类器，以此来构建层级多标签分类模型Multi-BiGRU-Attention，实现在线健康社区提问数据的层级多标签分类。[结果/结论]实验对比发现，随着层级的增加，研究提出的模型相比于单层的基础分类器BiGRU-Attention在micro-Precision，micro-Recall，micro-F1等各项指标上均有所提升，说明该模型的层级结构信息能够一定程度上改善模型效果；相比于层级多标签相关模型，在各项指标上均有所提升，说明该模型存在一定的适用性与扩展性。

关键词：信息需求用户需求在线健康社区层级多标签分类

基于部分标注的自训练多标签文本分类框架

[期刊] 清华大学学报(自然科学版) [作者] 任俊飞朱桐陈文亮

多标签文本分类(multi-label text classification, MLTC)旨在从预定义的候选标签中选择一个或多个文本相关的类别，是自然语言处理(natural language processing, NLP)的一项基本任务。前人工作大多基于规范且全面的标注数据集，而这些规范数据集需要严格的质量控制，一般很难获取。在真实的标注过程中，难免会缺失标注一些相关标签，进而导致不完全标注问题。该文提出了一种基于部分标注的自训练多标签文本分类(partial labeling self-training for multi-label text classification, PST)框架，该框架利用教师模型自动地给大规模无标注数据分配标签，同时给不完全标注数据补充缺失标签，最后再利用这些数据反向更新教师模型。在合成数据集和真实数据集上的实验表明，PST框架兼容现有的各类多标签文本分类模型，并且可以缓解不完全标注数据对模型的影响。

关键词：多标签文本分类不完全标注自训练

基于HLDA-IDF模型的网络文本主题挖掘研究

[期刊] 情报理论与实践 [作者] 陈斌马静

[目的/意义]为了弥补LDA模型建模过程中未考虑到网络文本中文档关注度和质量度这一因素,并增强结果的语义可解释性和主题表示能力,文章提出了一种热度加权的HLDA-IDF的网络文本主题挖掘模型。[方法/过程]本文首先是给出了较为准确的热度定义,并对LDA模型进行热度加权,构建出了HLDA模型,再依据词汇的主题表示能力存在差异这一实际情况,引入TF-IDF算法并改进,构建出HLDA-IDF模型,最后利用实际论坛数据进行实验验证。[结果/结论]实验结果表明该模型的结果语义可解释性和主题表示能力较强。

关键词：热度模型主题挖掘网络文本文本挖掘

标签主题图的构建与实现研究

[期刊] 图书情报工作 [作者] 熊回香邓敏郭思源

针对标签所具有多样性、模糊性、语义关系缺乏等局限,探索标签与主题图的结合机制,进而将主题图技术应用于中文标签体系中。在阐述标签与主题图结合可行性的基础上,提出两者的构建模型,并选取"豆瓣电影"中的标签实例,同时运用主题图软件工具Ontopia构建中文标签主题图,实现其可视化,从而为用户提供更好的标签导航和浏览机制。

关键词： Web2.0 标签主题图 Ontopia

基于LSTM模型的中文图书多标签分类研究

[期刊] 数据分析与知识发现 [作者] 邓三鸿傅余洋子王昊

【目的】利用LSTM模型和字嵌入的方法构建分类系统,提出一种中文图书分类中多标签分类的解决方案。【方法】引入深度学习算法,利用字嵌入方法和LSTM模型构建分类系统,对题名、主题词等字段组成的字符串进行学习以训练模型,并采用构建多个二元分类器的方法解决多标签分类问题,选择3所高校5个类别的书目数据进行实验。【结果】从整体准确率、各类别精度、召回率、F1值多个指标进行分析,本文提出的模型均有良好表现,有较强的实际应用价值。【局限】数据仅涉及中图分类法5个类别,考虑的分类粒度较粗等。【结论】基于LSTM模型的中

关键词： LSTM模型深度学习字嵌入图书自动分类多标签分类

专利分类序列和文本语义表示视角下的技术融合预测研究

[期刊] 情报学报 [作者] 张金柱李溢峰

为了丰富专利分类的网络和文本语义表示，实现两者更有效的语义融合，提高技术融合预测效果，提出基于专利分类序列和文本语义表示的技术融合预测方法。首先，综合考虑专利分类位置及其上下文语境，直接对专利分类序列进行语义表示，提出基于专利分类序列语义表示的技术融合预测方法；其次，根据专利分类在序列中的重要性排序研究专利分类文本分配方法，形成基于专利分类文本语义表示的技术融合预测方法；在此基础上，设计多种特征融合方法，提出融合专利分类序列结构和文本内容语义表示的技术融合预测方法；最后，基于链路预测的理论和方法对提出的多种技术融合预测方法进行定量评价。在无人机领域的实验证实，专利分类序列语义表示模型的效果明显优于其他网络表示学习方法；依据重要性排序的专利分类文本赋予方式优于文本平均分配方式，基于此的专利分类文本语义表示能更好地进行技术融合预测；“SVM (support vector machine)+哈达玛积”的特征融合方法在所有方法中表现最优，较单一方法均有提高。本文提出的方法能够提高技术融合预测的效果，更好地为技术布局、技术研发提供借鉴和参考。

关键词：技术融合预测表示学习专利分类序列专利分类文本

基于SWPF2vec和DJ-TextRCNN的古籍文本主题分类研究

[期刊] 情报学报 [作者] 武帅杨秀璋何琳公佐权

以编目分类和规则匹配为主的古籍文本主题分类方法存在工作效能低、专家知识依赖性强、分类依据单一化、古籍文本主题自动分类难等问题。对此，本文结合古籍文本内容和文字特征，尝试从古籍内容分类得到符合研究者需求的主题，推动数字人文研究范式的转型。首先，参照东汉古籍《说文解字》对文字的分析方式，以前期标注的古籍语料数据集为基础，构建全新的“字音（说）-原文（文）-结构（解）-字形（字）”四维特征数据集。其次，设计四维特征向量提取模型（speaking, word, pattern, and font to vector,SWPF2vec），并结合预训练模型实现对古籍文本细粒度的特征表示。再其次，构建融合卷积神经网络、循环神经网络和多头注意力机制的古籍文本主题分类模型（dianji-recurrent convolutional neural networks for text classification,DJ-TextRCNN）。最后，融入四维语义特征，实现对古籍文本多维度、深层次、细粒度的语义挖掘。在古籍文本主题分类任务上，DJ-TextRCNN模型在不同维度特征下的主题分类准确率均为最优，在“说文解字”四维特征下达到76.23%的准确率，初步实现了对古籍文本的精准主题分类。

关键词：多维特征融合古籍文本主题分类 SWPF2vec DJ-TextRCNN

多视图融合DJ-TextRCNN的古籍文本主题推荐研究

[期刊] 情报学报 [作者] 武帅杨秀璋何琳

传统编目分类和规则匹配方法存在工作效能低、过度依赖专家知识、缺乏对古籍文本自身语义的深层次挖掘、编目主题边界模糊、较难实现对古籍文本领域主题的精准推荐等问题。为此，本文结合古籍语料特征探究如何实现精准推荐符合研究者需求的文本主题内容的方法，以推动数字人文研究的进一步发展。首先，选取本课题组前期标注的古籍语料数据进行主题类别标注和视图分类；其次，构建融合BERT (bidirectional encoder representation from transformers)预训练模型、改进卷积神经网络、循环神经网络和多头注意力机制的语义挖掘模型；最后，融入“主体-关系-客体”多视图的语义增强模型，构建DJ-TextRCNN (DianJi-recurrent convolutional neural networks for text classification)模型实现对典籍文本更细粒度、更深层次、更多维度的语义挖掘。研究结果发现，DJ-TextRCNN模型在不同视图下的古籍主题推荐任务的准确率均为最优。在“主体-关系-客体”视图下，精确率达到88.54%，初步实现了对古籍文本的精准主题推荐，对中华文化深层次、细粒度的语义挖掘具有一定的指导意义。

关键词：数字人文古籍文本主题推荐多视图融合 DJ-TextRCNN

基于BERT和分面分类的多标签的南海证据性数据分类研究

[期刊] 图书馆杂志 [作者] 彭玉芳石进徐浩杨海平

为了能更好地组织南海证据性数据，提高南海疆智库的检索性能，便于科研人员对南海问题展开深入研究，本文融合了中国图书馆分类法的族性检索和分面分类法的特性检索，构建了南海文献分类法，应用Bert预训练模型实现细粒度的多标签南海证据性数据的自动分类，并通过数据库技术将南海证据性数据分为12个面进行组配检索。通过以上方法赋予每一条南海证据性数据唯一的分类号和类名，形式化表示为南海证据性数据的数据分类=证据来源分类+证据的数据体系分类+证据的数据分面分类。从更细粒度的视角，实现数据分类，与粗广式文献载体的分类相比，数据分类更有利于展开数据挖掘，找到数据间潜在的关联关系，发现新的研究视角是科学研究创新的基础和保障。

关键词： BERT分面分类数据分类多标签分类南海证据性数据

社会标注环境下的数字图书馆知识组织模型研究——基于标签主题图视角

[期刊] 情报理论与实践 [作者] 陈婷胡改丽陈福集周敬

文章在分析标签和主题图技术在知识组织的优势的基础上提出主题图技术应用与标签,并进行了可行性分析。同时以超星数字图书馆中的"我的图书馆"社会化标注系统中的标签样本为例,阐明了标签主题图的构建过程,并利用OKS中的可视化工具对标签主题图进行了可视化,以期为基于社会化标注的个人数字图书馆构建基于社会化标签的知识导航提供思路。

关键词：主题图社会化标签数字图书馆知识组织

图书主题对用户标签使用行为影响研究

[期刊] 图书情报工作 [作者] 胡潜石宇

［目的／意义］更全面地理解用户标签使用行为的影响因素，为标签推荐和应用实践提供指导。［方法／过程］采用日志分析法，从人均标签个数、标签类型分布两个方面分析图书主题的影响，并以计算机、心理学、经济学、文学作品、绘画５类图书为例，基于社会化标注社区豆瓣网的用户数据进行实证分析。［结果／结论］图书主题会对用户的标签个数及类型分布具有显著影响：１在标签个数方面，计算机、心理学、经济学、文学作品主题图书的人均标签个数相近，显著高于绘画主题图书；２在标签类型分布上，根据５类图书间的差异可分为３组：计算机、心理学和经济学、文学作品和绘画。这一结论对图书标签推荐及图书分面检索和导航系统的设计具有参考作用。

关键词：社会化标签用户行为图书主题

网络文本数据分类技术与实现算法

[期刊] 情报学报 [作者] 李勇桑艳艳

本文主要论述网络文本数据挖掘中的文本分类技术原理、方法 ,同时给出实现文档分类和类型匹配的若干算法 ,最后介绍文本分类正确率评价指标以及网络文本数据检索系统应用实证测评分析。

关键词：数据挖掘文本数据分类技术信息检索模型

文本主题识别关键技术研究综述

[期刊] 情报科学 [作者] 许海云董坤刘春江王超王振蒙

【目的/意义】文本主题自动识别是多种情报分析,如文献分类、检索以及领域前沿识别的基础,因此对文本主题自动识别方法的研究意义显著。【方法/过程】系统调研了当前文本主题识别的关键技术,包括主题词获取方法、知识单元的关联强度计算以及面向多元关系融合的主题分析方法及实践。【结果/结论】在总结当前文本主题识别方法的不足之处的基础上,本文提出综合全面的主题词获取方法,并在抽取范围以及语法、语义层面结合运用;在主题词关联计算中,充分利用已有语义词典和领域本体,将基于语义词典相似度和知识单元共现分析结合,并考虑主题关联的

关键词：主题识别文本分析主题挖掘语义分析多元关系融合

首页
下一页
尾页
第 页

文献操作() 导出元数据文献计量分析

全选

导出文件格式：WXtxt

作者：

删除

推荐搜索

基于知识网络的标签层级演化研究基于标签与关系网络的用户聚类推荐研究基于超网络的社会化标签相似性研究不同标引策略下的文本主题表达质量比较研究网络学习社区用户答案认可度的影响机理研究融合Word2vec和WGRA的社会化问答社区答案有用性排序方法研究——以携程问答为例社会化标签系统中基于社会网络的知识推送网络演化研究技术创新和社会责任标签化时代下的变现能力研究知识网络视角下科学、技术、产业间创新驱动关系识别方法研究技术标准化主题学术关注度及共词网络演化研究