- 年份
- 2024(4915)
- 2023(7107)
- 2022(6165)
- 2021(5777)
- 2020(4975)
- 2019(11500)
- 2018(11299)
- 2017(22077)
- 2016(11400)
- 2015(12791)
- 2014(12368)
- 2013(11766)
- 2012(10373)
- 2011(8937)
- 2010(8388)
- 2009(7205)
- 2008(6486)
- 2007(5123)
- 2006(3931)
- 2005(2931)
- 学科
- 济(46290)
- 经济(46245)
- 管理(33216)
- 业(32699)
- 方法(27578)
- 企(26731)
- 企业(26731)
- 数学(25144)
- 数学方法(24724)
- 财(12707)
- 农(11627)
- 中国(10048)
- 业经(8786)
- 务(8444)
- 财务(8406)
- 财务管理(8387)
- 农业(8205)
- 企业财务(7990)
- 学(7885)
- 地方(7831)
- 贸(7700)
- 贸易(7698)
- 易(7509)
- 技术(7424)
- 和(6838)
- 环境(6732)
- 理论(6623)
- 制(6285)
- 划(6032)
- 融(5534)
- 机构
- 大学(149737)
- 学院(149028)
- 管理(64968)
- 济(62691)
- 经济(61668)
- 理学(58104)
- 理学院(57563)
- 管理学(56493)
- 管理学院(56210)
- 研究(42258)
- 中国(31107)
- 京(28812)
- 财(26964)
- 科学(25334)
- 财经(23055)
- 业大(22341)
- 中心(21775)
- 经(21291)
- 农(20565)
- 经济学(20115)
- 江(19206)
- 经济学院(18431)
- 所(18260)
- 财经大学(17683)
- 范(17505)
- 经济管理(17378)
- 师范(17308)
- 研究所(17039)
- 商学(16961)
- 商学院(16809)
- 基金
- 项目(115238)
- 科学(93250)
- 基金(87507)
- 研究(82704)
- 家(75982)
- 国家(75412)
- 科学基金(67249)
- 社会(54789)
- 社会科(52213)
- 社会科学(52199)
- 基金项目(46801)
- 自然(44784)
- 省(44027)
- 自然科(43852)
- 自然科学(43843)
- 自然科学基金(43028)
- 教育(38654)
- 划(37321)
- 资助(35462)
- 编号(32147)
- 部(26163)
- 重点(25574)
- 创(24758)
- 发(23786)
- 国家社会(23656)
- 成果(23630)
- 创新(23209)
- 科研(23124)
- 教育部(23093)
- 人文(22797)
共检索到191152条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 统计与决策
[作者]
孟东霞 谢林燕
针对不平衡数据集在实际应用中分类效果较差的问题,文章提出一种基于k近邻中心偏移因子对多数类样本欠采样的数据处理方法。k近邻中心是样本的k个最近邻覆盖区域的中心点,所在位置随着k值的增加而发生偏移,偏移变化的波动程度用中心偏移因子来表示。中心偏移因子的值反映了样本周围的局部密度,数值较小的因子代表样本及其近邻处于密集区域,或近邻在样本的同一侧密集分布,样本可能为冗余样本。为了在不改变原始数据分布的前提下尽可能地删除冗余度较高的多数类样本,首先,移除多数类样本中的噪声点,计算多数类样本的中心偏移因子;然后,将多数类样本按照偏移因子的数值从低到高排序;最后,通过比较样本与k近邻的中心偏移因子来删除部分多数类样本,使数据集趋于平衡。实验使用支持向量机对多种欠采样方法平衡后的14个数据集进行了分类,实验结果表明,所提方法在大多数数据集上表现较优,有效提高了少数类的分类精度。
[期刊] 统计与决策
[作者]
孟东霞 魏晓光 柳凌燕
针对不平衡数据集中的少数类样本在实际应用中分类准确率较低的问题,提出一种利用多数类样本的自然最近邻进行欠采样的数据处理方法。自然最近邻算法根据每个样本的分布特征动态地为样本选择数量不同的自然最近邻样本,通过自然最近邻的个数反映样本分布的疏密程度。文章所提方法先计算多数类样本在整体数据集中的自然最近邻,根据自然最近邻情况移除多数类中的噪声样本和局部密度较小的样本,再计算剩余样本的相似度,保留密集区域中的代表性样本,去掉部分冗余样本,获得平衡数据集。该方法的计算无须预先指定参数,减少了欠采样过程中多数类分类信息的损失。对比实验利用支持向量机对不同欠采样方法平衡后的12个数据集进行分类,结果表明此方法在大多数数据集上具有较优的分类性能,提升了少数类样本的分类准确率。
关键词:
不平衡数据集 欠采样 自然最近邻
[期刊] 图书情报工作
[作者]
张宸
针对当前网络伪舆情难以快速、有效辨识的问题,通过对网络舆情特征的分析,认为不同舆情信息反映不同舆情特征,因此辨识的本质可以看作是一个自动分类问题。构建网络伪舆情指标评价体系,提出一种基于支持向量机与K近邻结合的网络伪舆情辨识方法。实验结果表明,该方法比单纯使用支持向量机具有更高的分类精度,且较好地解决了核函数参数选择的问题。
[期刊] 情报杂志
[作者]
唐华 杨解君 王俊 黄炜
[目的/意义]针对现有的涉恐信息过滤在语义过滤和主题无关性方面还存在一定的不足,建立了基于K近邻分类算法的涉恐信息过滤模型。[方法/过程]通过采用K近邻分类算法、TF-IDF分词系统和语义相似度计算建立了一种新的涉恐信息过滤模型,并从爬取主题的一次过滤到关键词匹配的二次过滤,最终进行语义分析的三次过滤,构建了一套完整的涉恐信息过滤体系。[结果/结论]本模型能够快速高效地获取涉恐信息,克服了语义和主题无关性等因素的干扰,较于传统的涉恐信息过滤在查全率和查准率上面有了很大的提升。
[期刊] 统计与决策
[作者]
王昱 朱芝孺
文章提出一种基于改进K-近邻规则的数据库营销模型。根据数据样本的近邻信息动态确定其最优的近邻个数K,以避免人为设定K这一重要参数可能造成的影响。根据K个近邻距样本的距离,设定不同的投票权重以预测样本属于某一类别的概率。在实际数据集上的实证结果表明,提出的改进K-近邻规则不仅为K值设定提供了一种有效的方法,还能够提高数据库营销的准确性和结果的可解释性,可以有效应用于实际的数据库营销。
关键词:
K-近邻规则 近邻信息 数据库营销
[期刊] 统计与决策
[作者]
朱干江 王桂芝 赵靖
[期刊] 统计与决策
[作者]
吴强
实例约简的目的是移除训练集中的冗余样本。大多数实例约简算法保留了许多内部样本,且难以处理非球形的数据。为此,文章提出了一种基于局部均值k近邻和密度峰值聚类的实例约简算法(IRLMDP)。首先,设计了一种基于局部均值k近邻的裁剪方法LMEM来移除噪声;其次,设计了一种基于局部均值k近邻和密度峰值聚类的压缩方法CMLMDP来保留代表性的边界样本;最后,实验证明,就KNN分类器而言,IRLMDP在分类正确率和样本压缩率上优于6个流行的实例约简算法。
[期刊] 中国科学技术大学学报
[作者]
尹奕 张卫明 俞能海 陈可江
目前,许多深度学习的预训练模型被发布出来用以帮助工程师和研究人员开发基于深度学习的系统或进行研究,从而减少了他们的工作量。过去的工作表明,秘密信息可以被嵌入到神经网络参数中且不影响模型的准确性,恶意开发者可以借此将恶意软件或其他有害信息隐藏到预先训练的模型中。因此,对这些隐写后的预训练模型进行可靠的检测非常重要。我们分析了现有的神经网络隐写方法,发现它们不可避免地会导致参数统计的偏差。针对LSB隐写,实验发现其会造成参数位平面随机性上的偏差;针对COR隐写和SGN隐写,实验发现其会造成参数分布上的偏差。基于这些偏差,我们提出神经网络隐写的隐写分析方法,即从良性和恶性模型中提取特征建立分类器。据我们所知,这是第一个检测神经网络隐写术的工作。实验结果表明,本文提出的检测算法能够可靠地检测出含有嵌入式信息的模型。值得注意的是,我们的检测方法即使在低负载下仍然有效。
关键词:
神经网络 隐写术 隐写分析
[期刊] 统计与决策
[作者]
孟东霞 李玉鑑
针对实际应用中不平衡数据集分类效果较差的问题,文章提出一种基于特征边界信息进行欠采样的数据处理方法。所提方法根据特征边界点的定义获得多数类样本中可构造特征边界的数据点,其分布在最优非线性分类决策面附近,通常包含重要的分类信息,在欠采样时应进行保留,其他多数类样本远离分类决策面,在分类中易于识别,可在聚类后选取部分样本和少数类样本构成平衡数据集。该方法保留了多数类样本的几何分布特征,降低了样本的信息流失率。对比实验利用支持向量机进行分类,实验结果表明该方法有利于提高不平衡数据中少数类的分类精度,验证了算法的有效性。
关键词:
平衡数据集 欠采样 特征边界 聚类
[期刊] 统计与决策
[作者]
周鹏 刘河 黎隽男
自标记方法能用少量有标记样本和大量无标记样本来训练给定分类模型。误标记是自标记方法中的主要挑战。尽管学者们用数据剪辑技术去识别和移除在自标记方法迭代过程中被误预测的样本,但是许多数据剪辑技术严重依赖于特定假设。为了克服误标记问题和相关解决方案中的缺陷,文章提出一种基于近邻规则和粒子群优化的自标记方法 SLM-NNPSO。首先,SLM-NNPSO用有标记集去训练一个给定的分类模型。其次,SLM-NNPSO用近邻规则来发现具有高置信度的无标记样本,并用被训练的分类模型来预测他们。再次,SLM-NNPSO用粒子优化来识别和移除被误预测的样本,并把被正确预测的样本加入有标记集中。上述过程不断迭代,直到SLM-NNPSO没有发现具有高置信度的无标记样本。最后,SLM-NNPSO输出在迭代过程中被训练的分类模型。经仿真实验证明,就训练k近邻分类器的平均分类正确率而言,在来自销售市场、医学检测、图像识别等领域的12个真实数据集上,SLM-NNPSO优于5个流行的自标记方法。
[期刊] 商业研究
[作者]
张颖慧 聂强
通过面板数据分位数回归分析,本文分析了小额信贷的目标偏移问题,从机构层面验证贫困客户有效需求不足对目标偏移的影响。结果表明:目标偏移现象在中端以下市场明显存在,在面向底端市场服务的小额信贷机构中表现得尤为明显;小额信贷机构的资产规模对覆盖深度具有显著负面影响。因此,小额信贷社会绩效管理应集中于中端市场以下部分,对目标市场定位为底端市场的小型小额信贷机构更应给予特别的财税支持与技术服务。
关键词:
目标偏移 覆盖深度 分位数回归
[期刊] 中国科学技术大学学报
[作者]
邱阳 董汉德 陈佳伟 何向南
在推荐系统中,由于数据是从用户行为中收集而来而不是通过合理的实验得到,因此偏差问题是普遍存在的。自动去偏框架(AutoDebias)通过采用元学习寻找适当地去偏置配置(即伪标签和置信权重),已被证明是应对各种偏差的一种通用和有效的解决方案。然而,为每个用户-物品对设置伪标签和权重是一个极度耗时的过程。因此,自动去偏框架面临巨大的计算成本,这使其在实际应用中的适用性较差。虽然使用带有均匀采样器的随机梯度下降可以加速模型训练,但这会显著恶化模型的收敛性和稳定性。为了解决这个问题,我们提出了LightAutoDebias (简称LightAD),它为自动去偏框架配备了一种专门的权重采样策略。该采样器可以自适应地和动态地获取信息量更大的训练样本,这带来的收敛性和稳定性比标准的均匀采样器更好。在三个基准数据集上的广泛实验证明,我们的LightAD可以加速自动去偏框架的训练达几个数量级,同时保持几乎相同的精度。
关键词:
推荐系统 偏差 去偏 采样
[期刊] 金融理论与实践
[作者]
景博玮 赵莉
由抵补利率平价原理得出的远期汇率公式,至今仍是金融业务中计算远期汇率的经验公式。外汇市场多种交易者的存在也对远期汇率的形成产生巨大的作用。从市场微观结构的角度出发,分析了多种交易者行为下的均衡远期汇率,从新的角度解释了利率平价偏离的原因。结果表明:远期汇率市场的均衡是市场力量较量的结果,投机者的进入对远期汇率的影响重大。此外,套期保值和投机者的市场力量越大,远期汇率越偏离利率平价均衡汇率。
[期刊] 金融理论与实践
[作者]
景博玮 赵莉
由抵补利率平价原理得出的远期汇率公式,至今仍是金融业务中计算远期汇率的经验公式。外汇市场多种交易者的存在也对远期汇率的形成产生巨大的作用。从市场微观结构的角度出发,分析了多种交易者行为下的均衡远期汇率,从新的角度解释了利率平价偏离的原因。结果表明:远期汇率市场的均衡是市场力量较量的结果,投机者的进入对远期汇率的影响重大。此外,套期保值和投机者的市场力量越大,远期汇率越偏离利率平价均衡汇率。
[期刊] 财贸研究
[作者]
刘淑琳 王贤彬 黄亮雄
经济增长目标管理是中国政府引领经济发展的重大战略实践。利用2004—2018年274个地级市的数据,系统地考察了目标偏移对经济增长的影响。研究发现,目标偏移显著地抑制了经济增长,且该结论在经过一系列稳健性测试后依然成立。作用机制检验结果表明,经济增长目标偏移通过降低投资和减缓物质资本存量的增速进而抑制了实际经济增长。在中国情境下,实物期权和金融摩擦两种理论可有效解释目标偏移对投资的不利影响,从而间接证实目标偏移之所以会抑制经济增长是因为其引发了市场主体的不确定性预期。拓展性研究结果显示,目标偏移对经济增长的抑制效应在目标下偏、经济下行以及市场化程度高的地区更为明显。
关键词:
经济增长目标 目标偏移 不确定性 投资
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除