- 年份
- 2024(7884)
- 2023(11501)
- 2022(9759)
- 2021(9134)
- 2020(7835)
- 2019(18082)
- 2018(17962)
- 2017(34363)
- 2016(18411)
- 2015(20598)
- 2014(20112)
- 2013(19495)
- 2012(17714)
- 2011(15621)
- 2010(15280)
- 2009(13686)
- 2008(13016)
- 2007(11205)
- 2006(9433)
- 2005(8120)
- 学科
- 济(72363)
- 经济(72282)
- 管理(48632)
- 业(45637)
- 企(37336)
- 企业(37336)
- 方法(36218)
- 数学(32323)
- 数学方法(31742)
- 财(19039)
- 农(18459)
- 中国(17987)
- 学(17439)
- 业经(13696)
- 地方(13409)
- 制(13201)
- 理论(12326)
- 农业(12314)
- 务(11661)
- 贸(11631)
- 贸易(11623)
- 财务(11602)
- 财务管理(11576)
- 易(11299)
- 企业财务(10964)
- 体(10584)
- 银(10466)
- 技术(10459)
- 银行(10421)
- 和(10377)
- 机构
- 大学(247783)
- 学院(245533)
- 济(98420)
- 经济(96482)
- 管理(94387)
- 研究(84346)
- 理学(82152)
- 理学院(81255)
- 管理学(79358)
- 管理学院(78931)
- 中国(62418)
- 科学(53461)
- 京(51917)
- 财(46164)
- 农(43940)
- 所(42109)
- 业大(39694)
- 中心(39597)
- 研究所(38807)
- 财经(36991)
- 江(36520)
- 农业(34553)
- 经(33838)
- 范(32291)
- 院(31926)
- 师范(31859)
- 北京(31832)
- 经济学(30607)
- 州(28224)
- 财经大学(27752)
- 基金
- 项目(177414)
- 科学(139976)
- 基金(130134)
- 研究(125289)
- 家(116021)
- 国家(115171)
- 科学基金(98400)
- 社会(79258)
- 社会科(75146)
- 社会科学(75130)
- 省(68882)
- 基金项目(68262)
- 自然(65702)
- 自然科(64270)
- 自然科学(64250)
- 自然科学基金(63060)
- 划(59160)
- 教育(59130)
- 资助(53901)
- 编号(49146)
- 重点(41023)
- 部(39407)
- 成果(39298)
- 发(37299)
- 创(36859)
- 科研(35171)
- 课题(34597)
- 创新(34557)
- 计划(33747)
- 国家社会(33597)
共检索到355200条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 图书情报工作
[作者]
罗毅辉 熊曙初
尽管目前存在许多文本特征选择方法,但是它们都有着一定的局限性。提出一种新的基于群体增量学习(Population Based Incremental Learning)算法的文本特征选择方法,其特点是无需特征集的先验知识和容易实现,并且由于使用了简单分类器性能作为评价准则,计算复杂度很低。对Reuters-21578文本集的分类实验结果表明,该方法平均分类性能要优于卡方统计量、信息增益和简单遗传算法三种常用的特征选择方法。
[期刊] 图书情报工作
[作者]
于津凯 王映雪 陈怀楚
介绍一种改进的文本特征提取及匹配算法。该算法基于N-Gram算法思路进行文本处理和特征提取,设计了gram关联矩阵用于统计与合并特征词,从而在固定长度N-Gram算法的基础上能够提取出不同长度的特征词。实验证明,该特征提取算法能够更为准确地描述文本特征,可应用于文本检索、Web挖掘等信息处理领域。
[期刊] 沈阳农业大学学报
[作者]
李晓毅 徐兆棣
自动分类是数据挖掘和机器学习中非常重要的研究领域。针对难以获得大量有类标签的训练集问题,提出了基于小规模训练集的增量式贝叶斯Bayes分类,给出增量式Bayes分类机理参数计算及其算法。对算法分两种情况处理,第一种情况是新增样本有类别标签,利用现有分类器检验其类标签,如果匹配则保留当前分类器,否则利用新样本修正分类器;第二种情况是新增样本无类别标签,则利用现有分类器为其训练类标签,然后利用新样本来修正分类器。试验结果表明,该算法是可行有效的,比Naive Bayes分类算法有更高的精度。增量式Bayes分类算法的提出为分类器的更新提供了一条新途径。
[期刊] 图书情报工作
[作者]
刘海峰 于利军 刘守生
TF-IDF是一种常用的文本特征选择方法。基于该模型的特征选择思想,以特征项的类内分布、类间分布信息为依据,通过引入类内分布及类间分布权重因子对模型的TF及IDF部分进行加权,提出一种基于类别分布信息的文本特征选择模型。新模型使得TF部分含有类内文本频数信息,同时IDF部分含有特征项的类间频数信息。随后的文本分类试验表明,平均查全率、查准率分别提高6.4%、7.8%,F1值提高约7%,验证了本研究提出的基于类别分布的文本特征选择模型的有效性。
[期刊] 情报理论与实践
[作者]
伍建军 康耀红
本文阐述了一种基于特征词聚类的降维方式,其主要思想就是把词在文本中的出现看成一个事件,先通过搜索算法计算每一个特征词的分布,合并对分类有相似作用的特征词,从而起到了特征降维的作用。最后通过实验测试分析,提出了一种改进的、考虑全局簇信息的相似度计算公式,将其应用到文本分类中,实验表明提高了文本分类的精度。
关键词:
特征词聚类 文本分类 相似度计算
[期刊] 图书情报知识
[作者]
沙勇忠 陆莉
冲突检测是在计算机、自动化系统、人机交互技术等的帮助下检测多主体协作活动中参与主体之间、参与主体与系统之间冲突的跨学科、多领域研究问题。本文将多主体协作活动中的冲突检测思想引入群体决策,从公众参与公共事务讨论角度出发,探讨基于会话文本的群体决策冲突检测的若干重要问题。梳理了冲突检测的相关研究进展,阐述了基于会话文本的冲突检测原理和方法,并选取网络论坛中的讨论语段为例,进行相似度计算和冲突存在系数计算,与实例语段中的客观冲突状态进行比对。研究表明,通过该方法计算的冲突存在系数与实例语段中的客观冲突状态大致吻合,证明了该方法具有一定的可行性和有效性。
[期刊] 数据分析与知识发现
[作者]
白如江 冷伏海 廖君华
【目的】利用文本语义组块特征提升Cosine文本相似度计算性能。【方法】获取NSF资助的关于碳纳米管研究领域的项目数据,进行词干还原、词性标注等预处理;利用条件随机场模型实现文本内容的语义组块标注;在此基础上实现基于语义组块特征的改进Cosine文本相似度计算,并与未标注的数据进行相似度计算比较,分析实验结果。【结果】实验证明基于语义组块特征的改进Cosine相似度计算结果比原始文本Cosine相似度计算结果相似度均有不同程度的提升,在实验数据中最高的相似度提升了26%。【局限】依赖于语义组块标注性能。【
关键词:
文本相似度 语义组块 向量空间模型 本体
[期刊] 物流技术
[作者]
刘存
针对“一对多”车货匹配问题,分析了目前车货匹配信息平台中存在的车货信息不对称和不能实时进行车货匹配等问题,提出了一种新的基于深度特征选择模型的车货匹配算法,以深度神经网络为基础模型,在输入层之前加上一层特征选择层,以增强重要因素的影响力,减少无关因素的影响,达到提高匹配正确度的目的。最后将其与传统的基于半马尔科夫的车货匹配算法在匹配准确度和匹配时间效率两个方面进行了比较,实验结果表明,基于深度特征选择的车货匹配算法在匹配准确度和匹配效率上,均明显优于传统的基于半马尔科夫的车货匹配算法。
关键词:
公路货运 车货匹配 深度特征选择模型
[期刊] 中国农业大学学报
[作者]
于峰 林杉 张峻峰 陶红斌 季玥秀
提出一种基于图像特征值算法的叶面积测定简化方法。应用扫描图像RGB三原色灰度值分离理论,根据植物叶片扫描图像像素点的分布特征,选用蓝色灰度值作为特征值,以扫描图像灰度中间值127作为叶面积图像与背景图像灰度值的判读指标,通过叶片像素点的分布比例计算叶片面积。将已知面积的矩形绿纸片分别随机裁剪成多个碎片,用本文方法测定碎片面积,并分别计算每个叶片的碎片面积之和进行系统精度验证,测定结果与标准面积的相对误差小于0.5%。采集60个水稻叶片分别采用本文方法和复印称重法测定叶片面积,对本文方法进行进一步验证,相关性分析结果表明,二者相关系数r=0.997 1,达极显著水平。本文方法具有较高测定精度,满...
[期刊] 情报理论与实践
[作者]
何鹏 陈豫
实体统一对于提高数据的简洁性和准确性具有重要意义。在Web数据集成领域,实体统一是被广泛关注的重点研究方向。文章基于朴素的成对匹配实体统一算法,提出一种新的基于特征的增量式实体统一方法,通过对实体特征的有效区分并定义新的数据结构,提升了算法的准确率,降低了算法时间复杂度,并应用于DBLP论文数据库,结果证明该方法可以有效提升Web数据集成的数据质量。
关键词:
实体统一 特征 领域数据 应用研究
[期刊] 统计与决策
[作者]
郝国英 孔造杰
文章建立了适用于群体决策环境下的供应商选择数学模型,运用粗糙层次分析法解决群体决策情况下定性指标定量化问题,然后进行指数化处理。对定量指标分成两种:一种是跟选择原则正相关的指标直接进行指数化处理,而另一种跟选择原则负相关的指标需要进行转换后再进行指数化处理。
[期刊] 当代财经
[作者]
陈思洲
本文主张用增量比例法代替目前广泛使用的连锁替代法,并对增量比例法的理论依据与方法体系进行了探讨和实证分析。
[期刊] 统计与决策
[作者]
刘颖 唐毓蔓
数据分布特征往往会影响模型的划分结果,聚类分析是获取数据分布情况的有效方法。文章首先比较硬划分聚类、模型聚类、模糊聚类三种聚类算法,寻找适合于信用数据分析的方法;同时,根据变量集中趋势和离散程度利用拉依达准则对数据进行预处理,采用遗传算法优化模型参数,提出适合于信用评价数据分布特征的GAσFCM算法。所提算法在分类精度上相比于传统FCM算法提高近3个百分点,同时为了避免非均衡样本对聚类算法产生的影响,对正样本选取有一定倾向性。算法对比分析表明,基于GAσFCM模糊聚类算法适用于信用风险评估特征分布,有效提高信用风险评估的准确性,动态灵敏的捕捉上市公司的信用变化,是信用风险管理和控制方法的有益补充。
[期刊] 情报理论与实践
[作者]
赵辉 刘怀亮 范云杰 左晓飞
针对向量空间模型中语义缺失问题,将语义词典(知网)应用到文本分类的过程中以提高文本分类的准确度。对于中文文本中的一词多义现象,提出改进的词汇语义相似度计算方法,通过词义排歧选取义项进行词语的相似度计算,将相似度大于阈值的词语进行聚类,对文本特征向量进行降维,给出基于语义的文本分类算法,并对该算法进行实验分析。结果表明,该算法可有效提高中文文本分类效果。
[期刊] 情报学报
[作者]
赵雪峰 胡瑾瑾 吴德林 吴伟伟 孙安东 赵涛
专利价值评估对打击非正常申请、净化市场环境具有重要的现实意义。本文以特征拼接、标签迁移及深度学习组合为中心构建专利价值评估方法,并基于2010—2020年广东省专利申请探究评估方法实际表现,引入多组对比模型进行实验分析。研究结果表明:(1)拼接著录事项信息,可构建出技术特征显现更强的专利研究对象,避免因指标类研究对象未足够体现专利技术本质而引发评估准确率不高的现象;(2)以专利法律视角量化出更具专利价值代表性的价值标签体系,在延展专利标签体系研究深度的同时,解决因引用率、下载访问量等传统标签与专利实际价值不匹配而造成的价值评估错误问题;(3)以高精细度词向量为构建原理,组建以BERT (bidirectional encoder representations from transformers)及LSTM (long short-term memory)为核心的专利价值评估模型,有效解决传统模型特征因提取能力不足而产生评估准确率偏低的弊端。本文从研究对象有效性、标签体系性及模型构建评估率三个方面提出优化改进策略,为专利价值评估提供了新工具,具有较强的实际应用价值。
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除