- 年份
- 2024(9144)
- 2023(13268)
- 2022(11696)
- 2021(11072)
- 2020(9201)
- 2019(21455)
- 2018(21184)
- 2017(41313)
- 2016(22153)
- 2015(25134)
- 2014(24846)
- 2013(24347)
- 2012(22026)
- 2011(19764)
- 2010(19319)
- 2009(17313)
- 2008(16627)
- 2007(14144)
- 2006(12015)
- 2005(10021)
- 学科
- 济(87268)
- 经济(87173)
- 管理(66595)
- 业(61568)
- 企(52490)
- 企业(52490)
- 方法(45210)
- 数学(39262)
- 数学方法(38666)
- 农(22482)
- 财(21427)
- 中国(20528)
- 学(19501)
- 业经(19407)
- 地方(16558)
- 理论(15559)
- 和(15441)
- 农业(15203)
- 贸(15013)
- 贸易(15005)
- 易(14589)
- 务(14416)
- 财务(14343)
- 财务管理(14312)
- 环境(14232)
- 技术(14221)
- 制(13686)
- 企业财务(13546)
- 划(12650)
- 银(10903)
- 机构
- 大学(311346)
- 学院(309126)
- 管理(129339)
- 济(118800)
- 经济(116228)
- 理学(113703)
- 理学院(112519)
- 管理学(110383)
- 管理学院(109829)
- 研究(96385)
- 中国(69877)
- 京(65128)
- 科学(62031)
- 财(52070)
- 业大(47618)
- 农(47318)
- 所(46726)
- 中心(44549)
- 财经(43508)
- 研究所(43224)
- 江(42283)
- 范(40621)
- 北京(40302)
- 师范(40231)
- 经(39802)
- 农业(37207)
- 院(35792)
- 经济学(34996)
- 州(34900)
- 商学(33272)
- 基金
- 项目(224489)
- 科学(177111)
- 基金(163994)
- 研究(162597)
- 家(142716)
- 国家(141581)
- 科学基金(123090)
- 社会(101677)
- 社会科(96407)
- 社会科学(96380)
- 基金项目(87634)
- 省(87324)
- 自然(82096)
- 自然科(80143)
- 自然科学(80124)
- 自然科学基金(78649)
- 教育(75146)
- 划(73484)
- 资助(67760)
- 编号(66746)
- 成果(52090)
- 重点(49513)
- 部(49421)
- 发(46703)
- 创(46543)
- 课题(44415)
- 科研(43384)
- 创新(43374)
- 教育部(42488)
- 大学(41925)
- 期刊
- 济(120372)
- 经济(120372)
- 研究(83397)
- 中国(52032)
- 学报(49542)
- 管理(45744)
- 科学(45409)
- 农(41330)
- 财(38590)
- 大学(37492)
- 学学(35079)
- 教育(32796)
- 农业(29324)
- 技术(28133)
- 业经(20830)
- 财经(19917)
- 融(19714)
- 金融(19714)
- 经济研究(18863)
- 图书(18855)
- 经(16918)
- 问题(15944)
- 资源(15649)
- 科技(15330)
- 技术经济(15150)
- 理论(14922)
- 业(14719)
- 版(14079)
- 实践(13923)
- 践(13923)
共检索到423454条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 情报理论与实践
[作者]
高影繁 徐红姣 于薇 王惠临
文章以国家图书文献中心(NSTL)的多语种科技语料为研究对象,以一部科技类的英汉双语科技词典为资源工具,提出一种英汉跨语言文本分类系统的构建方法,实验结果验证了采用本方法进行跨语言分类的可行性,也为下一阶段建立跨语言分类实用系统奠定了基础。
关键词:
文本分类 翻译词典 信息资源 算法
[期刊] 情报理论与实践
[作者]
高影繁 王惠临 徐红姣
本文以综述的形式对跨语言文本分类技术目前的发展态势进行了介绍,从应用背景出发,了解跨语言文本分类技术的社会需求;从关键技术出发,了解该项技术的核心问题及解决方案;从已有研究成果得到的结论揭示了该项技术的发展状况,作为一种重要的多语信息组织手段,跨语言文本分类技术发展前景广阔。
关键词:
跨语言文本分类 特征提取 算法
[期刊] 情报理论与实践
[作者]
章成志 储新龙 田亮 储荷婷
[目的/意义]对学科研究方法的自省式分析对于理解学科发展和建立学科自主知识体系至关重要。通过研究国内外学者在研究方法上的使用差异,可以更全面地了解不同地区和文化背景下的研究者在应对不同研究问题所采用的策略和方法,从而促进学术交流和跨国合作,并进一步推动学科的发展与学科知识体系的完善。[方法/过程]以图书情报领域5种高影响力中英文期刊中1990—2021年共30余年的学术论文为研究对象,采用跨语言文本分类方法对这些论文中的研究方法进行自动分类。然后从研究方法的使用频率与演化差异以及适用主题多样性差异两个角度,进行中外比较研究。[结果/结论]国外学者越来越倾向于使用定性方法,而对定量方法的使用正在减少。同时,国内外大多数研究方法的适用主题多样性都在增加。这项研究对于理解图书情报学科的发展、促进学术交流与合作以及提高国内学者的国际影响力具有重要意义。
[期刊] 情报理论与实践
[作者]
包翔 刘桂锋 杨国立
[目的/意义]为了满足对海量专利数据进行自动分类的需求,提出了一种基于多示例学习框架的专利文本分类方法。[方法/过程]将专利文本当作包,专利文本的标题和摘要分别作为两个示例,通过数学建模将专利文本映射成无向图,构建基于无向图的高斯核函数,运用SVM方法训练分类器,完成对无标记专利文本的预测。[结果/结论]实验结果表明,该方法相较于传统的SVM、KNN方法能更加有效准确地预测未标记专利文本的分类,为文本挖掘领域相关方向的研究提供新的视角。[局限]实验样本数量有待进一步丰富。
[期刊] 图书馆论坛
[作者]
李月婷 司莉
互联网信息多语言化已成趋势,跨语言信息检索成为研究热点,对多语言信息进行有序的组织是实现跨语言信息检索的基础。文章分析微观、中观、宏观三种多语言信息组织模式的层次结构,并对多语言语义词典、多语言叙词表等五种实例进行分析,总结这三种模式存在的问题并提出改进建议。
[期刊] 图书情报工作
[作者]
罗新 王兆礼 路永和
面对海量、异构、动态的文本信息,对文本进行自动分类具有重要意义。文本分类的发展与模式识别的发展密切相关。文本分类具有的类目多、样本数目多、噪音多、各类别样本数目不均衡等特点,使各模式识别算法在应用于文本分类时存在许多缺点。近年来逐步发展起来的群集智能(Swarm Intelligence)理论和方法为文本分类提供一种新的智能化手段。将蚁群智能算法尝试性引入文本分类领域,构建基于蚁群智能的文本分类模型,并在文本数据集上进行测试和比较,结果表明该模型可以较好地应用于文本分类。
关键词:
文本分类 群集智能 蚁群智能算法
[期刊] 情报理论与实践
[作者]
姚兴山
本文对文本分类过程中关键的部分进行了改进,在分词阶段,对分词的速度和精度进行了改进,在特征选取阶段,把多种特征选取方法进行了融合,最后对分类器进行了优化,并给出了实验测试的结果,实验的结果表明,文本分类的效率的确有了提高。
关键词:
文本分词 特征选取 文本分类
[期刊] 图书馆建设
[作者]
田亮 李博闻 章成志
自动识别学术论文所使用的研究方法对研究方法的评估、方法使用行为分析、方法检索等均具有重要意义。学术论文研究方法的自动分类离不开大量训练语料,但论文研究方法标注成本高昂,探讨如何充分利用现有标注数据对于降低标注成本具有重要意义。以图书情报领域为研究对象,首先通过实验比较了基于英文摘要的单语言方法和基于全文的跨语言方法,进而说明了使用跨语言方法的必要性;其次比较了两种跨语言方法在跨语言研究方法分类中的效果;最后对本文提出的一种学术论文全文处理方法进行了验证。实验结果表明,基于学术论文全文的跨语言方法明显优于基于英文摘要的单语言方法,基于机器翻译的方法比基于跨语言预训练模型的方法更优。此外,实验表明针对学术论文全文的长文本处理方法相较于基线方法有明显提升。
[期刊] 情报理论与实践
[作者]
伍建军 康耀红
本文阐述了一种基于特征词聚类的降维方式,其主要思想就是把词在文本中的出现看成一个事件,先通过搜索算法计算每一个特征词的分布,合并对分类有相似作用的特征词,从而起到了特征降维的作用。最后通过实验测试分析,提出了一种改进的、考虑全局簇信息的相似度计算公式,将其应用到文本分类中,实验表明提高了文本分类的精度。
关键词:
特征词聚类 文本分类 相似度计算
[期刊] 情报理论与实践
[作者]
是沁 李阳 裴雷 韩旭
[目的/意义]针对专题数据库文本资源主题相近、语义相似度高、知识聚敛度高等特点,提出一种基于预训练模型与Blending集成学习策略的专题数据库文本分类模型。[方法/过程]选择BERT、ERNIE、RoBERTa、ALBERT、XLNet预训练模型提取专题文本的多层次特征,基于Blending集成学习方法组合预训练模型,爬取“新华丝路”专题数据库相关文本资源对集成学习模型的有效性与优越性进行验证。[结果/结论]结果显示,与单模型、传统集成学习方法相比,在专题数据库服务场景下,基于Blending集成学习的文本分类模型具有较高的分类性能。
[期刊] 图书情报工作
[作者]
王文娟 马建霞 陈春 张凌波
[目的 /意义]对引文文本分类的标准、实现方法和应用进行梳理,分析存在的问题,提出可改进的方向。[方法/过程]总结目前引文文本分类的几个重要角度,如基于引用功能、基于情感倾向、基于引文影响力等,对引文文本分类的实现方法进行比较,分析其优缺点。[结果 /结论]目前引文文本没有统一的分类标准和实现方法,引文文本的获取较为困难,计算机分类算法准确率较低,中文引文文本分析文献少。未来研究思路和方向应该是:统一文本分类的标准,提高引文文本计算机处理技术的准确性,扩大应用范围。
关键词:
引文文本分类 引文内容分析 引文分析
[期刊] 清华大学学报(自然科学版)
[作者]
余传明 原赛 胡莎莎 安璐
在主题深度表示学习的基础上,该文提出了一种融合双语词嵌入的主题对齐模型(topic alignment model, TAM),通过双语词嵌入扩充语义对齐词汇词典,在传统双语主题模型基础上设计辅助分布用于改进不同词分布的语义共享,以此改善跨语言和跨领域情境下的主题对齐效果;提出了2种新的指标,即双语主题相似度(bilingual topic similarity, BTS)和双语对齐相似度(bilingual alignment similarity, BAS),用于评价辅助分布对齐的效果。相比传统的对齐模型MCTA, TAM在跨语言主题对齐任务中双语对齐相似度提升了约1.5%,在跨领域主题对齐任务中F1值提升了约10%。研究结果对于改进跨语言和跨领域信息处理具有重要意义。
[期刊] 图书情报工作
[作者]
尹丽英 赵捧未
为减少一词多义现象及训练样本的类偏斜问题对分类性能的影响,提出一种基于语义网络社团划分的中文文本分类算法。通过维基百科知识库对文本特征词进行消歧,构建出训练语义复杂网络以表示文本间的语义关系,再次结合节点特性采用K-means算法对训练集进行社团划分以改善类偏斜问题,进而查找待分类文本的最相近社团并以此为基础进行文本分类。实验结果表明,本文所提出的中文文本分类算法是可行的,且具有较好的分类效果。
关键词:
语义网络 词义消歧 社团结构 文本分类
[期刊] 情报理论与实践
[作者]
刘怀亮 张治国 马志辉 孙蕾
本文详细介绍了中文文本分类过程以及SVM和KNN两种方法在中文文本分类中的具体步骤,给出了中文文本分类的模型。通过实验对SVM算法和传统的KNN算法应用于文本分类效果进行了比较性实证研究。研究表明,SVM分类器较KNN在处理中文文本分类问题上有更良好的分类效果,有较高的查全率和查准率。
关键词:
支持向量机 文本分类 实证研究
[期刊] 统计与决策
[作者]
刘苗 谢邦昌
文章从文本特征抽取、分类算法效率和精度两个角度出发,首先利用概率潜在语义分析(PLSA)方法,有效地提取出隐含在文档词频数据中的语义概念信息;然后构建了分类精度较高的Adaboost算法作为分类器。实验结果表明,该方法发挥了两种方法的优势,能够很好地完成对文本的自动分类。
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除