- 年份
- 2024(7873)
- 2023(11310)
- 2022(9697)
- 2021(9103)
- 2020(7844)
- 2019(18177)
- 2018(18023)
- 2017(34575)
- 2016(18982)
- 2015(21387)
- 2014(21459)
- 2013(21101)
- 2012(19327)
- 2011(17359)
- 2010(16977)
- 2009(15555)
- 2008(15308)
- 2007(13557)
- 2006(11151)
- 2005(9706)
- 学科
- 济(79147)
- 经济(79060)
- 管理(51507)
- 业(49249)
- 企(40322)
- 企业(40322)
- 方法(39682)
- 数学(35568)
- 数学方法(35075)
- 农(19959)
- 财(19753)
- 中国(18094)
- 地方(17749)
- 学(15566)
- 业经(15507)
- 贸(14413)
- 贸易(14409)
- 易(13999)
- 农业(13459)
- 务(12747)
- 制(12717)
- 财务(12703)
- 财务管理(12671)
- 和(12128)
- 企业财务(12006)
- 理论(11807)
- 环境(11711)
- 融(11088)
- 金融(11085)
- 技术(10974)
- 机构
- 大学(266608)
- 学院(265811)
- 济(107725)
- 经济(105528)
- 管理(104207)
- 理学(91178)
- 理学院(90113)
- 管理学(88398)
- 管理学院(87907)
- 研究(85243)
- 中国(63303)
- 京(54570)
- 科学(53878)
- 财(47672)
- 农(44112)
- 所(42423)
- 中心(41208)
- 业大(40426)
- 财经(38966)
- 研究所(38965)
- 江(38552)
- 范(36134)
- 师范(35759)
- 经(35404)
- 农业(35105)
- 北京(33393)
- 经济学(33346)
- 院(30873)
- 州(30750)
- 经济学院(30389)
- 基金
- 项目(185708)
- 科学(147303)
- 基金(135620)
- 研究(134413)
- 家(118109)
- 国家(117173)
- 科学基金(101241)
- 社会(84718)
- 社会科(80367)
- 社会科学(80344)
- 省(73265)
- 基金项目(72374)
- 自然(66709)
- 自然科(65158)
- 自然科学(65140)
- 自然科学基金(63964)
- 教育(63669)
- 划(62468)
- 资助(55068)
- 编号(54891)
- 成果(43704)
- 重点(42291)
- 部(41621)
- 发(40280)
- 创(38968)
- 课题(37470)
- 科研(36551)
- 创新(36474)
- 教育部(35728)
- 国家社会(35090)
共检索到370126条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 数据分析与知识发现
[作者]
余传明 冯博琳 安璐
【目的】通过在标注资源丰富的源领域中学习,并将目标领域的文档投影到与源领域相同的特征空间中去,从而解决目标领域因数据量较小难以获得好的分类模型的问题。【方法】选择亚马逊在线购物网站在书籍、DVD和音乐类目下的中文、英文和日文评论作为实验数据,在卷积神经网络和结构对应学习的基础上提出跨领域深度表示模型(CDDRM),以实现不同领域环境下的知识迁移,并将其应用到跨领域情感分析任务之中。【结果】实验结果表明,CDDRM在跨领域环境下最优的F值达到0.7368,证明了该模型的有效性。【局限】CDDRM针对长文本的
关键词:
跨领域 知识迁移 深度表示学习 情感分析
[期刊] 图书情报工作
[作者]
余传明
[目的 /意义]通过在标注资源丰富的源领域(Source Domain)中学习,并将目标领域(Target Domain)的文档投影到与源领域相同的特征空间(Feature Space)中去,从而解决目标领域因标注数据量较小而难以获得好的分类模型的问题。[方法 /过程]选择亚马逊在书籍、DVD和音乐类目下的中文评论作为实验数据,以跨领域情感分析作为研究任务,提出一种跨领域深度循环神经网络(Cross Domain Deep Recurrent Neural Network,CD-DRNN)模型,实现不同领域环境下的知识迁移。CD-DRNN模型在跨领域环境下的平均分类准确度达到了81. 70%,优于传统的栈式长短时记忆网络(Stacked Long Short Term Memory,Stacked-LSTM)模型(79. 90%)、双向长短时记忆网络模型(Bidirectional Long Short Term Memory,Bi-LSTM)模型(80. 50%)、卷积神经网络长短时记忆网络串联(Convolution Neural Network with Long Short Term Memory,CNN-LSTM)(74. 70%)模型以及卷积神经网络长短时记忆网络并联(Merged Convolution Neural Network with Long Short Term Memory,Merged-CNNLSTM)模型(80. 90%)。[结果 /结论]源领域和目标领域的知识迁移能够有效解决监督学习在小数据集上难以获得好的分类效果的问题,通过CD-DRNN模型能够从无标注数据中有效地筛选特征,从而大大降低目标领域数据标注相关的工作量。
[期刊] 情报学报
[作者]
易明 刘明 冯翠翠
针对单领域推荐中的数据“稀疏性”和用户“冷启动”问题,提出一种综合利用评分信息和特征信息的跨领域推荐模型。首先,利用异质网络表示学习,针对源领域和目标领域的异质信息网络,通过元路径、DeepWalk算法生成网络表示学习向量,进而利用个性化非线性融合输出源领域和目标领域的物品特征信息向量;其次,利用神经网络模拟CMF (collective matrix factorization),生成用户和物品的评分信息向量,并通过映射函数MLP (multilayer perceptron)将用户评分信息向量映射到不同领域,以突出用户特征在不同领域的差异性;最后,将评分信息和特征信息有机融合,以损失函数为依据,采用梯度下降的方法学习模型的参数,从而完成评分预测。研究结果表明,在豆瓣网和Amazon数据集上,本文模型均优于其他相关算法;在提升推荐效果方面,目标领域RMSE (root mean squared error)和MAE (mean absolute error)下降了1%~15%,源领域RMSE和MAE下降了1%~19%;在用户“冷启动”方面,目标领域的RMSE和MAE下降了1%~14%。
[期刊] 情报理论与实践
[作者]
王兰成 宋容 曾琼
知识表示及其推理是研究知识集成服务的关键技术。本文研究了3个核心问题:一是模糊逻辑知识表示方法;二是将因素空间理论应用于与具体资源相关领域中的知识表示,实现统一的知识表示方法;三是对基于因素空间理论的知识表示方法进行运用,基于这种表示方法实现真值流知识推理机制,为实现语法层面的知识集成提供理论基础。
关键词:
因素空间 知识表示 知识推理 信息资源
[期刊] 情报理论与实践
[作者]
沈思 孙豪 王东波
[目的/意义]针对目前医学文本中疾病—基因等实体关联关系在知识发现中结合主题的研究较少,不足以揭示医学领域知识在主题层面的深层语义关联关系,提出了一套结合全文文本和领域知识主题的语义相似度计算方法。[方法/过程]以肿瘤期刊全文本为研究对象,用TWE模型进行词向量和主题向量的词嵌入表示,基于Siamese Network框架结合文本和领域知识主题进行相似度计算。[结果/结论]实验表明,该研究所提出的相似度计算方法在验证集中的预测F值达94%,最后通过对测试集数据进行聚类分析,从高、中、低频以及未进行临床注册实验的角度对疾病和关联基因进行分析,发现当前的热门研究以及未来可能成为研究热点的靶点基因。
[期刊] 情报理论与实践
[作者]
孙晓玲 丁堃
随着深度学习在自然语言处理、图像识别等领域的成功应用,将其有效的方法引入到知识计量中,可以为知识计量方法研究提供一个新的研究视角和工具。文章对深度学习中的表示学习和知识计量研究进行了综述,探讨将表示学习引入到知识计量中进行知识单元表示,以知识单元表示学习为基础,开展一系列的应用研究,并对未来发展前景进行展望。此研究将在知识单元层面,以语义表示为基础,改进知识计量的研究范式,推动知识计量的发展。
关键词:
知识单元 知识计量 表示学习 深度学习
[期刊] 科技管理研究
[作者]
杨辰 王楚涵 陶琬莹 耿爽
为及时有效地识别潜在技术机会,采用文本挖掘和异常值检测的方法,提出一种基于专利文本的技术机会识别方法。首先采用文本表示模型Doc2vec技术对专利摘要进行建模,以更深层表征文本语义信息;然后利用基于密度的离群值检测算法,识别出具有潜在技术机会的专利方向;最后以深度学习领域潜在技术识别为例,构建专利检索式并收集458条专利文献作为数据集。实证结果总结出4类主题共10个潜在的技术机会,验证了该基于专利的技术机会识别方法的有效性,可为企业相应技术应用、研发和创新提供参考。
[期刊] 情报理论与实践
[作者]
郝雯柯 杨建林
[目的/意义]预测社科领域在未来有发展潜力的研究主题对于科研工作者寻找新的学科增长点和政府部门优化资源配置至关重要。文章提出一种基于语义表示和动态主题模型的社科领域新兴主题预测框架,以期丰富和完善主题预测研究的方法体系。[方法/过程]首先,使用BERT模型和UMAP算法对文本进行语义表示和向量降维,再通过动态主题模型对嵌入向量进行聚类,从而获得全局主题;其次,构建新兴主题指标计算公式,基于Neural Prophet模型和非参数检验方法预测新兴主题;最后,通过划分时间窗将全局主题细化为多个局部主题,以定位最近时间段的新兴词汇。[结果/结论]选取“人口老龄化”领域的学术论文和报纸进行实证研究,并采用资料验证法进行方法有效性分析,结果表明该方法能够快速准确地预测社科领域中的新兴主题。
[期刊] 清华大学学报(自然科学版)
[作者]
余传明 原赛 胡莎莎 安璐
在主题深度表示学习的基础上,该文提出了一种融合双语词嵌入的主题对齐模型(topic alignment model, TAM),通过双语词嵌入扩充语义对齐词汇词典,在传统双语主题模型基础上设计辅助分布用于改进不同词分布的语义共享,以此改善跨语言和跨领域情境下的主题对齐效果;提出了2种新的指标,即双语主题相似度(bilingual topic similarity, BTS)和双语对齐相似度(bilingual alignment similarity, BAS),用于评价辅助分布对齐的效果。相比传统的对齐模型MCTA, TAM在跨语言主题对齐任务中双语对齐相似度提升了约1.5%,在跨领域主题对齐任务中F1值提升了约10%。研究结果对于改进跨语言和跨领域信息处理具有重要意义。
[期刊] 情报理论与实践
[作者]
贾茜 张斌
文章对关键词进行分解,抽取学科意义上的最小不可分词,以此表征主题元。借鉴认知语言学中的层次模型与概念整合的相关研究,详述了主题元的语义表示,同时论述了利用主题元进行认知结构分析的基本过程。在方法论上,研究从物理统计分析层面拓展到认知层面,补充了知识网络方法。
关键词:
认知语言学 主题元 语义表示 结构分析
[期刊] 情报学报
[作者]
李志义 黄子风 许晓绵
以深度学习为代表的表示学习在语音识别、图像分析和自然语言处理领域获得了广泛关注与应用,它不仅推动了人工智能的深入研究和快速发展,而且促使企业思索新的运营与盈利模式。本文拟通过综述的形式对这些研究进行梳理,形成较为完整的综述。通过对国内外相关文献的调查和整理,从信息抽取与表示、跨模态系统建模两维度评述了基于表示学习的跨模态检索与特征抽取方面的研究成果。文章首先概括了自动编码器、稀疏编码、限制玻尔兹曼机、深度信念网络、卷积神经网络等五个经典的表示学习算法,然后从基于共享层建立各模态间的关联、表示空间中各模态间的关联、以深度学习为基础的跨模态建模算法等三方面归纳跨模态系统建模研究的现状,最后总结了跨模态检索的评价指标。研究发现:已有检索研究对于单模态信息检索较为丰富,查询和候选集的内容均属于同一模态;跨模态检索也仅限于对图像、文本两个模态对齐的语料。未来需要增加语音、视频、图像、文本等多模态数据的检索,改进深度学习算法构建多模态检索模型,实现三种或以上的跨模态检索。此外,尚需建立适合多模态检索系统的评价指标。
[期刊] 情报学报
[作者]
余传明 林奥琛 钟韵辞 安璐
为了促进同一学术领域的科研合作团队的组建,提高科研效率,本文基于网络表示学习对多个领域科研合作推荐模型进行研究。将基于节点位置的网络表示学习模型与融合网络结构的网络表示学习模型进行集成,得到新的顶点表示,对两个顶点的表示进行选择二元运算得到边的表示。模型将网络表示学习与机器学习相结合,将节点对的表示作为特征训练逻辑分类器,分类器得到的标签即为链接预测结果。通过对金融和物理领域的论文合作数据进行分析,构建科研合作网络。实验证明,提出的集成模型在AUC值上的表现比单一模型更好,效果最高提升了2.3%;在训练集规模较小的情况下,AUC值仍能达到60%。实验结果表明,该科研合作推荐模型具有可行性,对同一学术领域的科研合作团队的组建能够起到有效辅助作用。
[期刊] 统计与决策
[作者]
万校基 李海林
文章引入动态时间弯曲方法度量金融多元时间序列数据中特征分量之间的相互关系,提出自适应中心线算法来获取一条综合序列,进而反映金融多元时间序列数据中特征分量之间的异步相关性,有效地实现金融多元时间序列的数据降维和特征表示。
[期刊] 图书馆论坛
[作者]
施航海 王琰 罗鹏杰
随着学科交叉发展,传统的中图分类法存在一定的局限性。中图法是一种树状结构的分类方法,每种分类的父类有且仅有一个,而交叉学科理应有多个父类。因此,需要在分类法中引入多层表示方式,以便正确表示图书类别,提高图书借阅时书籍推荐准确率。图书借阅信息由读者的借阅序列构成,每次借阅会包含多个图书类别。这些类别可以是中图法表示的分类号,也可以是对标题词汇进行聚类得到的词汇群。需要引入一种能提供两类关联信息(借阅序列和每次借阅中并发出现的类别)的层次结构。提出一个可扩展的两层神经网络框架Bib2Vec,它能基于图书类别和
[期刊] 清华大学学报(自然科学版)
[作者]
陈鑫 刘喜恩 吴及
药物开发过程存在资本密度高、风险大、周期长的特点,需要投入大量的资金、人力与物力。传统的机器学习方法虽然可以在一定程度上辅助药物开发,但需要分子描述符作为特征输入,而不同的分子描述符的选择对机器学习模型的性能影响较大,因此传统的机器学习方法大多需要进行繁复、耗时的特征工程。近年新兴的深度学习方法,能够从药物的"原始"结构中直接提取特征,从而绕开特征工程,缩短开发周期。该文将现有的药物表示学习方法划分为2类:基于简化分子线性输入规范(SMILES)表达式的药物表示学习和基于分子图的药物表示学习,报告了这两类药物表示学习方法的最新研究进展,阐述了各种方法的创新点与局限性。最后,指出了当前药物表示学习研究中存在的重大挑战,并讨论了可能的解决方案。
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除