- 年份
- 2024(10129)
- 2023(14752)
- 2022(12888)
- 2021(12026)
- 2020(10208)
- 2019(23387)
- 2018(23064)
- 2017(44468)
- 2016(23948)
- 2015(27062)
- 2014(26622)
- 2013(26256)
- 2012(24000)
- 2011(21422)
- 2010(21231)
- 2009(19705)
- 2008(17908)
- 2007(15130)
- 2006(12986)
- 2005(10903)
- 学科
- 济(91991)
- 经济(91886)
- 管理(67063)
- 业(64599)
- 企(53987)
- 企业(53987)
- 方法(45673)
- 数学(39880)
- 数学方法(39319)
- 农(24663)
- 中国(23710)
- 财(23512)
- 学(22502)
- 业经(20235)
- 地方(18251)
- 农业(16830)
- 技术(16266)
- 理论(15863)
- 贸(15659)
- 贸易(15652)
- 和(15577)
- 易(15184)
- 制(15090)
- 务(15042)
- 财务(14974)
- 财务管理(14942)
- 环境(14286)
- 企业财务(14185)
- 融(13867)
- 金融(13864)
- 机构
- 大学(334123)
- 学院(331015)
- 管理(132685)
- 济(126677)
- 经济(123928)
- 理学(116204)
- 理学院(114933)
- 管理学(112586)
- 管理学院(112033)
- 研究(111030)
- 中国(81453)
- 科学(72936)
- 京(70912)
- 农(57655)
- 财(56211)
- 所(55479)
- 业大(53882)
- 研究所(51352)
- 中心(51166)
- 江(46652)
- 财经(45995)
- 农业(45586)
- 北京(44082)
- 范(43817)
- 师范(43272)
- 经(42119)
- 院(41321)
- 州(38080)
- 经济学(37542)
- 技术(36317)
- 基金
- 项目(240420)
- 科学(188657)
- 基金(174733)
- 研究(171176)
- 家(154475)
- 国家(153244)
- 科学基金(131141)
- 社会(105935)
- 社会科(100279)
- 社会科学(100248)
- 省(93961)
- 基金项目(93385)
- 自然(88491)
- 自然科(86448)
- 自然科学(86420)
- 自然科学基金(84847)
- 划(80225)
- 教育(78547)
- 资助(72006)
- 编号(69220)
- 成果(54640)
- 重点(54294)
- 部(52423)
- 发(50897)
- 创(50288)
- 课题(47169)
- 科研(47095)
- 创新(46955)
- 计划(45393)
- 大学(44491)
- 期刊
- 济(129307)
- 经济(129307)
- 研究(91778)
- 中国(59765)
- 学报(58794)
- 科学(52679)
- 农(50568)
- 管理(47525)
- 大学(44214)
- 财(41645)
- 学学(41398)
- 教育(35605)
- 农业(35473)
- 技术(29084)
- 融(24915)
- 金融(24915)
- 业经(21397)
- 财经(21338)
- 经济研究(20666)
- 图书(19907)
- 科技(18443)
- 业(18294)
- 经(18153)
- 问题(16678)
- 版(16264)
- 理论(15856)
- 技术经济(15496)
- 业大(15491)
- 资源(15114)
- 实践(14716)
共检索到466418条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 情报理论与实践
[作者]
白如江 王晓笛 王效岳
科技文献通常包括研究目的、方法、结果和结论等信息,如何将科技文献标引上这些信息,帮助科研人员在数量巨大的文献中快速发现符合研究需要的内容显得尤为重要。文章在研究分析科技文献写作特点基础上,提出了基于词、英文(专有名词、缩写词)以及数字的核心特征词提取策略;然后将科技文献标引问题转化为句子分类问题,结合提出的核心特征词,采用支持向量机分类器对科技文献进行句子级别的语义标引。通过对1168篇糖尿病医学类论文实验,证明本文提出的方法能够有效地学习和标引科技文献中的句子,进而有效地对科技文献关键信息点进行自动标引。
关键词:
自动标引 支持向量机 特征提取 科技文献
[期刊] 情报理论与实践
[作者]
高影繁 徐红姣 王惠临
文章提出一种基于多重过滤策略的科技文献自动标引方法,该方法不依赖于大规模训练语料,很容易作为处理模块嵌入到其他文本处理环节中,实验结果验证了方法的可行性。另外,还提出了一种基于二次文献的标引词评价方法。该方法虽然严重依赖于二次文献中给出的摘要和关键词的质量,但在人力和物力资源不足以支持建立一个高质量测试集的条件下是有价值的,制定更加合理有效的评测方案势在必行。
关键词:
多重过滤 科技文献 自动标引
[期刊] 情报学报
[作者]
刘永丹
用于汉语文献自动标引的词典组织结构对自动标引的效率有很大影响,自动标引中运用的词典查找算法有其自身的特点,符合这种特点的词典结构能提高自动标引过程中分词的速度。本文在分析了几种常用的词典结构的空间效率和时间效率之后,提出了一种通用而高效的词典组织方法。采用这种方法的词典,其体积可以减小到原来的0.4倍,分词速度提高到原来的2.5倍。
[期刊] 数据分析与知识发现
[作者]
李伟卿 王伟军
【目的】基于大规模评论数据,提出一种产品特征词典的构建方法,以提升识别产品特征的查准率和查全率。【方法】在人工标注的基础上,基于同义词林的扩展,以及大规模评论文本的词向量训练,计算词语的语义相似度和相关性,进行特征的识别与归并,进而形成产品特征词典。【结果】本文选取手机、相机、图书三类产品的评论数据进行实验,平均查准率和平均查全率分别为0.774和0.855。结果显示,该方法具有一定的普适性。【局限】标注及验证需大量人工参与,自动化程度不够;没有考虑评论中的隐含特征。【结论】通过与已有研究比较,验证了本文
关键词:
产品评论 特征词典 特征提取 观点挖掘
[期刊] 情报理论与实践
[作者]
孙竹梅 华薇娜 汪志兵
[目的/意义]信息的采纳与否和信息自身的特征密切相关,文章旨在探索如何通过信息自身的特征实现对信息采纳的预测。[方法/过程]以清博指数的微信健康类公众号榜单为依据,选取7个公众号实施信息采集,从信息的形式、内容和价值3个方面提取信息特征,根据编码规则形成样本数据集,并利用支持向量机进行预测研究。[结果/结论]通过信息自身的特征能够对信息采纳进行准确度较高的预测。
[期刊] 情报学报
[作者]
牛凯
本文针对目前国内外各种计算机自动标引的理论和方法在知识表达方式、词典结构、词的切分和组配、歧义处理等方面所存在的不足,提出了词典基于静态知识表达的网状结构,较好地解决了词典的完备性与存储空间的矛盾;同时使知识的表达更为简洁实用,为切分歧义难点的根本解决提供了方法论。
[期刊] 沈阳农业大学学报
[作者]
田有文 王滨 唐晓明
针对玉米病害叶片彩色纹理图像的特点,提出一种将支持向量机和色度矩分析应用于玉米病害识别的方法。首先利用色度矩提取玉米病害叶片纹理图像的特征向量,然后将支持向量机分类方法应用于病害的识别。玉米病害纹理图像识别实验结果表明:支持向量机分类方法对于病害分类训练样本较少时,具有良好的分类能力和泛化能力,适合于玉米病害的分类。不同分类核函数的相互比较分析表明,径向基核函数最适合于玉米病害的分类识别。
关键词:
支持向量机 玉米病害 纹理特征 色度矩
[期刊] 图书情报工作
[作者]
宋东桓 李晨英 刘子瑜 韩明杰
[目的/意义]论文摘要是信息组织的重要标引对象,将论文摘要按一定结构进行标引有利于科学传播、知识发现和情报分析。如何对现有非结构式摘要进行精准快速的自动标引是亟待解决的现实问题。[方法/过程]假定不同类别的摘要具有内在一致性,即对结构式摘要的研究可为非结构式摘要自动标引提供方法和技术参考。据此,基于美国国家医学图书馆结构要素标签术语集和标签分类映射关系,提出结构要素BOMRC体系和结构式摘要的识别与规范化标引方法。其次选取研究样本并采用文本挖掘方法对样本语料中的单词、动词、三词词块、四词词块等词汇进行词频、TFIDF值等多个指标的定量统计分析,构建能够进行结构要素识别的语义特征词典。最后利用非结构式摘要测试集进行语义特征词典有效性检验。[结果/结论]结果显示,利用语义特征词典方法能够有效识别非结构式摘要的各类要素,并可用于优化以机器学习方法为核心的自动识别模型。
[期刊] 图书情报工作
[作者]
王星 刘伟
针对中文学术文献,提出一种新的自动标引方法,该方法基于文献之间的引用关系,利用被引文献的标引词,对遗传算法进行改进,实现自动标引,避免利用文献正文、标题等内部文本特征进行自动标引的局限性。通过在大规模真实测试集(中文学术文献)上进行实验,验证该方法的有效性。
[期刊] 情报理论与实践
[作者]
伍建军 康耀红
本文阐述了一种基于特征词聚类的降维方式,其主要思想就是把词在文本中的出现看成一个事件,先通过搜索算法计算每一个特征词的分布,合并对分类有相似作用的特征词,从而起到了特征降维的作用。最后通过实验测试分析,提出了一种改进的、考虑全局簇信息的相似度计算公式,将其应用到文本分类中,实验表明提高了文本分类的精度。
关键词:
特征词聚类 文本分类 相似度计算
[期刊] 情报理论与实践
[作者]
翟东升 张京先 胡等金
[目的/意义]针对技术功效图构建过程中的主要问题和薄弱环节,提出了一种基于SAO结构和词向量的专利技术功效图构建方法。[方法/过程]利用Python程序获取专利摘要中的SAO结构,从中识别技术词和功效词;结合领域词典与专利领域语料库,运用Word2Vec和WordNet计算词语间的语义相似度;利用基于网络关系的主题聚类算法实现主题的自动标引;采用基于SAO结构的共现关系构建技术功效矩阵。[结果/结论]实现了基于SAO结构和词向量的技术功效图自动构建,该构建方法提高了构建技术功效主题的合理性和专利分类标注的准确性,为技术功效图的自动化构建提供新的思路。
[期刊] 情报理论与实践
[作者]
王东波 苏新宁 朱丹浩 年洪东
基于支持向量机学习模型,使用万方期刊数据库中医学、卫生的有关标题和摘要数据,对医学、卫生大类下的R7中的9个小类进行了自动分类研究。在中文信息处理知识和技术的基础上选取分类特征,在分类过程中主要采取了基于低密度多特征的训练方法。在互信息、卡方统计、交叉熵和证据权值4个不同的统计特征量的开放测试中,自动分类的查全率和准确率都取得了相对令人满意的结果。
关键词:
支持向量机 期刊 自动分类
[期刊] 图书情报工作
[作者]
王东波 何琳 黄水清
[目的 /意义]在人文计算兴起这一背景下,针对先秦诸子典籍进行自动分类的探究,以更加深入和精准地从古代典籍中挖掘出相应的知识。[方法 /过程]基于《论语》《老子》《管子》《庄子》《孙子》《韩非子》《孟子》《荀子》和《墨子》9种先秦诸子典籍构成的训练和测试语料,采用支持向量机技术,提取TF-IDF、信息增益、卡方统计和互信息为特征,完成针对先秦诸子典籍的自动分类实验。[结果 /结论]基于先秦诸子典籍得到的自动分类模型调和平均值能达到99.21%,效果较好,具有较强的推广和应用价值。
[期刊] 情报学报
[作者]
王永成 顾晓明 王丽霞
本文介绍了上海交通大学电脑应用技术研究所开发的中文文献主题自动标引系统CSAIS2.1的主要思路、基本算法及其基本结构
关键词:
自动标引,中文文献,主题词
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除