标题
  • 标题
  • 作者
  • 关键词
登 录
当前IP:忘记密码?
年份
2024(10786)
2023(15771)
2022(13699)
2021(12809)
2020(10703)
2019(24929)
2018(24515)
2017(47690)
2016(25385)
2015(28646)
2014(28376)
2013(27673)
2012(24983)
2011(22180)
2010(22323)
2009(20572)
2008(18781)
2007(16091)
2006(13846)
2005(11716)
作者
(70571)
(58535)
(58081)
(55291)
(37152)
(28156)
(26585)
(23080)
(22326)
(20659)
(20004)
(19504)
(18345)
(18300)
(18281)
(17712)
(17402)
(17269)
(16681)
(16663)
(14263)
(14255)
(14206)
(13420)
(13225)
(12944)
(12849)
(12843)
(11785)
(11499)
学科
(98710)
经济(98605)
管理(72974)
(70870)
(60324)
企业(60324)
方法(50053)
数学(44245)
数学方法(43480)
中国(29755)
(27499)
金融(27497)
(26217)
(25878)
银行(25843)
(25652)
(24840)
业经(22731)
地方(21170)
(19836)
(19561)
理论(18671)
(18113)
财务(18029)
财务管理(17993)
农业(17542)
企业财务(17115)
(17027)
贸易(17012)
(16557)
机构
学院(348116)
大学(347101)
管理(141836)
(135885)
经济(132918)
理学(124366)
理学院(123078)
管理学(120484)
管理学院(119877)
研究(108571)
中国(85668)
(72085)
科学(68054)
(61581)
(53498)
业大(52445)
(52404)
中心(52249)
财经(50688)
研究所(48237)
(48203)
(46218)
北京(44846)
(44383)
师范(43934)
农业(41946)
经济学(41165)
(40261)
(39993)
财经大学(38207)
基金
项目(248087)
科学(195759)
研究(180495)
基金(180444)
(156798)
国家(155500)
科学基金(135338)
社会(112848)
社会科(107114)
社会科学(107084)
(97949)
基金项目(95928)
自然(89615)
自然科(87619)
自然科学(87600)
自然科学基金(85966)
教育(84281)
(81896)
资助(75147)
编号(73997)
成果(57936)
重点(55341)
(54196)
(52332)
(52261)
课题(50384)
创新(48677)
科研(47757)
教育部(46943)
大学(46813)
期刊
(137065)
经济(137065)
研究(96500)
中国(61241)
学报(53455)
管理(50695)
科学(49288)
(47491)
(46615)
大学(41327)
学学(39130)
(39046)
金融(39046)
教育(38346)
技术(32766)
农业(32745)
财经(23852)
业经(23346)
经济研究(22404)
(20301)
问题(17464)
理论(16985)
图书(16878)
技术经济(16752)
(16727)
科技(16615)
统计(16608)
实践(15701)
(15701)
(15632)
共检索到487997条记录
发布时间倒序
  • 发布时间倒序
  • 相关度优先
文献计量分析
  • 结果分析(前20)
  • 结果分析(前50)
  • 结果分析(前100)
  • 结果分析(前200)
  • 结果分析(前500)
[期刊] 图书情报工作  [作者] 杨波  邵婉婷  
[目的/意义]针对现有弱信号全自动识别研究尚不完善的问题,提出基于LDA-BERT融合模型的弱信号全自动识别方法。[方法/过程]基于无监督的LDA主题模型对文本数据集进行主题分类,构建主题和术语双层过滤函数从主题分类的结果中提取早期预警信号,通过紧密中心度、主题权重以及主题自相关性三大度量函数评价主题的弱性,并基于主题内术语的归一化频率和概率提取出弱信号。最后,运用BERT深度学习模型从语义层面对弱信号上下文及其类似词进行扩展。[结果/结论]以2021年1月初疫情重爆发事件为例,使用爆发前三月的社交媒体新闻数据集对构建的系统模型进行验证。实验结果表明,该方法可有效检测出相关弱信号,并挖掘出弱信号随时间推移逐渐增强的演化特性。此外,该融合模型在实现弱信号全自动识别的同时,也表现出较单一模型更强的结果可解释能力。
[期刊] 情报理论与实践  [作者] 唐晓波  房小可  
伴随着微博的日趋流行,对微博信息的检索逐渐成为人们获取第一消息的手段。其中文本聚类和主题发现是信息检索领域的有效方法,采用适当的方法是影响微博短文本信息检索质量的关键因素。文章针对文本聚类和LDA主题模型的互补特征,综合考虑了微博特殊文体和短文本聚类效率问题,提出了基于频繁词集的文本聚类和基于类簇的LDA主题挖掘相融合的微博检索方法,给出了针对微博文体的一种新的主题检索模型。实验表明,该方法不仅能有效地划分微博文本,并且能清晰地挖掘类簇中潜在主题。
[期刊] 图书情报工作  [作者] 宫小翠  安新颖  
[目的/意义]随着信息资源在数量和种类上的急剧增长,学科间的交叉融合不断涌现,快速主动地从海量信息资源中识别和判断研究主题的发展演化是实现科技创新的基础。[方法/过程]在相关理论调研的基础上,结合医学领域的资源特点,提出一种基于LDA模型的主题演化探测模型和相应的流程步骤。主要步骤包括医学主题词抽取、主题识别、主题关联、关键主题识别、关键主题的演化主路径识别、演化主路径上主题分裂、融合事件识别,实现深度、细致的主题演化分析。[结果/结论]选用乳腺癌治疗研究文献为实验案例,对判断模型进行试验并对结果进行分析
[期刊] 科技管理研究  [作者] 闫洪波  曹国忠  檀润华  王阔  
针对TRIZ割裂静态的使用因果与功能模型等分析工具导致无法高效准确识别解决工程问题的现状,在TRIZ分析理论的基础上,通过对三轴分析与功能模型的创新融合,形成新的TRIZ分析流程,新流程加强分析工具间的相互作用,及时准确的对问题再定义,锁定问题关键因子,实现对工程核心问题的识别,并用纯电动矿用车能量反馈不足的工程实例分析创新流程的合理性与可实施性,创新流程旨在帮助工程技术人员识别隐藏在问题背后的根原因,找到宏观微观层面的核心关键问题,达到准确定义问题核心与本质的目的。
[期刊] 工业工程与管理  [作者] 黄琳  王丽亚  明新国  
在线评论作为客户购后主要的信息分享方式,潜藏着大量的客户需求,LDA模型常被用来挖掘评论主题,以此导出客户需求。但客户对于产品服务的在线评论往往会与有关产品自身性能的评论混杂在一起,直接应用LDA模型会存在主题指代不明、关键词混乱的问题。本文提出了一种改进的LDA模型,该模型通过将根据客户-产品服务画像得来的先验知识整合进LDA模型中,以此来引导模型学习与产品服务相关的特定主题,进而使导出的产品服务需求更贴合实际需要且更具预测性。
[期刊] 情报理论与实践  [作者] 叶艳  吴鹏  周知  黄炜  张莉曼  
[目的/意义]为了从在线患者评论中识别医疗服务质量主题及其情感,本文提出基于LDA和BiLSTM模型的服务质量主题情感识别模型。[方法/过程]以好大夫在线为例,利用Python收集高血压患者139962条评价数据,采用LDA主题模型得到患者评论的13个主题,并结合相关文献得到6大医疗服务质量主题;根据BiLSTM模型得到各服务质量主题的情感倾向分布;对负向评论较多的服务质量主题进行筛选,分析负向情感产生的原因。[结果/结论]本文提出的方法能帮助医院和医生识别和改善医疗服务质量,提升患者的满意度,从而降低医患纠纷的发生率。
[期刊] 图书情报工作  [作者] 陈伟   王莉晓  
[目的 /意义]依据颠覆性技术发展早期特征建立弱信号识别指标体系,基于不同信号的特征差异和多源数据视角设计多信号过滤器,实现颠覆性技术早期识别。[方法 /过程]构建颠覆性技术弱信号识别漏斗模型,选取新颖性、弱信号潜力性特征指标设计主流技术信号过滤器,选取持续性、高价值性特征指标设计噪声信号过滤器,选取突变性、前瞻性特征指标设计渐进性创新弱信号过滤器,分层过滤掉主流技术信号、噪声信号和渐进性创新弱信号,筛选出颠覆性技术弱信号。[结果 /结论 ]选取储氢领域开展实证分析,通过对储氢领域颠覆性技术弱信号识别结果进行战略规划及权威报告验证,证明了方法的有效性。
[期刊] 北京林业大学学报  [作者] 刘嘉政  王雪峰  王甜  
【目的】在树种图像识别时会存在类内差异、类间相似的现象,因此导致基于单一人工特征的传统识别方法难以达到理想的识别效果。针对这一问题,本文基于卷积神经网络,提出一种将图像深层特征和人工特征融合的树种图像深度学习识别方法。【方法】将6类常见树种(樟子松、山杨、白桦、落叶松、雪松和白皮松)图像作为研究对象。首先,通过裁剪、水平翻转、旋转等操作,对原始树种图像集进行数量扩增,并划分为训练集和测试集,建立本次树种识别实验的图像库;其次,将本文模型设计为3路并列网络,分别选取RGB图像、HSV图像、LBP-HOG图像,从图像像素、色彩、纹理和形状的角度出发,对上述树种图像进行识别。一方面构建适合本文实验的CNN深度学习模型,将训练集样本中RGB图像和相对应的HSV图像作为第1路和第2路CNN模型的输入,进行树种图像深层特征提取;另一方面,对训练集进行高斯滤波去噪和人工提取LBP-HOG特征来代表纹理、形状特征,作为第3路CNN模型的输入。然后,将3路模型各自得到的特征在最后一层全连接层进行汇总,作为softmax分类器的最终分类依据。最后,为检验本文方法的可行性,利用上述特征和训练集对SVM分类器、BP神经网络以及现有的深度学习LeNet-5模型、VGG-16模型进行训练,对测试集进行识别验证,来比较最终的识别效果。【结果】本文提出的多特征融合CNN模型,训练准确率为96.13%,平均验证识别准确率为91.70%。基于单路训练的CNN树种识别模型中,RGB图像作为训练输入值时,识别率最高,为75.21%,HSV特征识别率次之,LBP-HOG特征最差;多特征融合情况下,基于RGB+H通道+LBP条件下,验证识别准确率最高,达到93.50%;RGB+HSV+LBP+HOG组合识别率不增反降,识别率为89.50%。同样的特征或特征组合条件下,SVM、BP神经网络、LeNet-5模型和VGG-16模型所获得的识别率均低于本文模型的识别率。【结论】基于RGB+H通道+LBP特征融合条件下,运用3路并列CNN模型,对本文6类树种图像进行识别的识别率最高,克服了在单一特征情况下识别率低的问题,识别效果也非常理想,实现了从大量不同树种图像中自动识别出具体类别。
[期刊] 情报学报  [作者] 曹高辉  徐元  梁梦丽  胡守敏  
本文界定了基于情境的信息融合的内涵,探索基于情境的信息融合的处理过程,构建一种具有普适性的基于情境的信息融合模型。该模型汇集与用户决策相关的多源情境信息,进行基于情境数据的情境建模,利用黑板结构智能调度情境知识和先验模型,寻求最优融合策略完成多层次、多维度的信息融合决策处理,以期完成复杂问题的决策求解。
[期刊] 图书情报工作  [作者] 魏巍  郑杜  
[目的/意义]社交媒体的出现为医疗健康数据的收集提供了新的途径,应用自然语言处理技术从社交媒体中抽取患者报告的ADR(AdverseDrugReaction,药物不良反应)信号对于改善药物不良反应监测的临床和科学知识具有很大的潜力。然而,从社会媒体中提取患者报告的ADR信号仍然面临重大挑战。为此,开发一个利用高级自然语言处理技术从健康主题社交媒体中抽取ADR信号的研究模型。[方法/过程]该模型首先采用基于多词典源匹配的方法,从嘈杂的社交媒体中识别医学实体;然后采用最短依存路径核函数为基础的统计学习方法提取
[期刊] 图书馆杂志  [作者] 余馨玲  常娥  
古诗词地名实体识别不仅有助于深度挖掘古诗词文本之间的关联,而且有助于绘制中国诗歌版图分布,推动空间维度的中国古典文学研究。文章围绕南京城系统采集有关古诗词数据,采用BIOES方法进行地名实体标注。针对古诗词领域训练数据匮乏、以字代词等问题,提出一种采用数据增强方法,同时融合预训练模型与条件随机场方法的古诗词地名识别模型,简称DA-BERT-CRF模型。文章将训练数据采用实体交叉互换方法进行数据增强处理,然后通过预训练模型BERT得到古诗词地名的上下文语义信息,最后利用条件随机场CRF实现地名标签约束并生成全局最优地名序列。文章提出的DA-BERT-CRF模型十折交叉实验平均精确率、平均召回率和平均F值分别为86.49%、90.44%、88.35%。
[期刊] 情报理论与实践  [作者] 刘萍  郑凯伦  邹德安  
关键词:
[期刊] 数据分析与知识发现  [作者] 方小飞  黄孝喜  王荣波  谌志群  王小华  
【目的】运用中文信息处理和话题识别与追踪的方法,从大量移动投诉文本中找出有价值的信息。【方法】从分析投诉文本的特点入手,使用k-means先对文本聚类。利用LDA对每个类进行建模,提取话题,并从词频、词跨度和词长三方面计算每个话题中词的权值,把权重最大的词作为该话题的标签,并计算每个话题的文档分布概率均值。对具有相同标签的话题,先按照均值最大的原则去掉重复标签话题,再对所有话题计算文档支持率,并将文档支持率作为话题的热度,通过热度区分热点话题和一般话题。【结果】对投诉文本进行时间上的建模,通过对比一般话题
[期刊] 图书情报工作  [作者] 陈燕方  周晓英  
[目的/意义]衍生性网络健康谣言生成门槛低,周期性强,危害影响深远,是网络健康谣言识别与治理中需要优先解决的重点问题之一,也是重要突破口。[方法/过程]借助深度语义表征和聚合方法,探索衍生性网络健康谣言文本内容的六要素特征;通过结合网络健康谣言的分布式语义特征预训练模型,构建包括六个类别、6287个词汇的网络健康谣言文本内容要素词库;在将健康谣言标题特征、内容文本六要素特征以及主体内容文本特征进行统一的向量空间表示与融合后,构建面向多源文本特征融合的网络健康谣言识别模型。[结果/结论]模型的实证研究表明:与已有的对照模型相比,本文所提出的文本特征融合模型使衍生性网络健康谣言识别的准确率有较好的提升,且丰富的可拓展健康谣言要素词库可为后续的研究提供较好的资源支持。
[期刊] 图书馆杂志  [作者] 沈立力  姜鹏  王静  
Google AI团队发布的BERT模型在多项自然语言处理任务中取得了研究成果,但在中文文献自动分类领域尚有待探索。本文旨在探索BERT_(base)中文基础模型在中文社科、科技期刊文献分类上的实际分类效果,指出模型在实际应用中存在的问题并提出解决方法。本文选取R大类(医药、卫生)、TG大类(金属学与金属工艺)、F大类(经济)、J大类(艺术)共1 745 000条数据作为训练语料,并以另外9 610条数据作为测试样本,利用BERT模型分别对社科、科技期刊文献进行分类研究。测试结果表明BERT模型在社科文献中的四级准确率为76.95%,科技文献为68.55%。之后引入惩罚策略,为实际工作中免检数据阈值的设定提供参考。BERT_(base)模型在《全国报刊索引》实际分类标引工作中有一定可行性,基本满足当前网络环境下中文文献自动分类的需求。
文献操作() 导出元数据 文献计量分析
导出文件格式:WXtxt
作者:
删除