- 年份
- 2024(5133)
- 2023(7325)
- 2022(5609)
- 2021(4866)
- 2020(4094)
- 2019(9122)
- 2018(9243)
- 2017(17764)
- 2016(9674)
- 2015(10507)
- 2014(10581)
- 2013(10086)
- 2012(9043)
- 2011(8014)
- 2010(7913)
- 2009(6997)
- 2008(6849)
- 2007(6246)
- 2006(5551)
- 2005(5403)
- 学科
- 济(43910)
- 经济(43883)
- 业(30327)
- 管理(28717)
- 企(24481)
- 企业(24481)
- 方法(17407)
- 数学(14891)
- 数学方法(14757)
- 中国(14010)
- 技术(13032)
- 农(12401)
- 业经(11241)
- 财(9942)
- 产业(9152)
- 农业(8721)
- 地方(8692)
- 学(8687)
- 制(8351)
- 技术管理(7157)
- 银(6812)
- 银行(6793)
- 发(6710)
- 体(6663)
- 融(6626)
- 金融(6626)
- 行(6501)
- 贸(6463)
- 贸易(6460)
- 理论(6455)
- 机构
- 大学(137233)
- 学院(135043)
- 济(59517)
- 经济(58435)
- 管理(52015)
- 研究(48168)
- 理学(45102)
- 理学院(44634)
- 管理学(43800)
- 管理学院(43551)
- 中国(35948)
- 京(29487)
- 科学(28884)
- 财(25379)
- 所(24118)
- 农(22043)
- 研究所(22033)
- 中心(21980)
- 财经(20604)
- 江(20571)
- 业大(19539)
- 经济学(19399)
- 经(18938)
- 北京(18399)
- 范(18178)
- 师范(17961)
- 经济学院(17649)
- 院(17479)
- 农业(17080)
- 州(15863)
- 基金
- 项目(93245)
- 科学(74438)
- 研究(68738)
- 基金(68548)
- 家(60086)
- 国家(59651)
- 科学基金(51370)
- 社会(45319)
- 社会科(43213)
- 社会科学(43200)
- 基金项目(36077)
- 省(35741)
- 自然(31720)
- 自然科(31041)
- 自然科学(31036)
- 教育(30989)
- 自然科学基金(30471)
- 划(30000)
- 编号(27446)
- 资助(26776)
- 成果(22034)
- 重点(21607)
- 发(20963)
- 部(20878)
- 创(20172)
- 国家社会(19944)
- 创新(19016)
- 课题(18198)
- 教育部(18027)
- 科研(17645)
共检索到201779条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 清华大学学报(自然科学版)
[作者]
郝爽 李国良 冯建华 王宁
数据清洗是对脏数据进行检测和纠正的过程,是进行数据分析和管理的基础。该文对经典和新兴的数据清洗技术进行分类和总结,为进一步的研究工作提供方向。形式化定义了数据清洗问题,对数据缺失、数据冗余、数据冲突和数据错误这4种数据噪声的检测技术进行详细阐述。按照数据清洗方式对数据噪声的消除技术进行分类概述,包括基于完整性约束的数据清洗算法、基于规则的数据清洗算法、基于统计的数据清洗算法和人机结合的数据清洗算法。介绍了常用的测评数据集和噪声注入工具,并对未来重点的研究方向进行了探讨和展望。
关键词:
数据清洗 数据噪声 噪声检测 噪声消除
[期刊] 图书情报工作
[作者]
孟旭阳 陈阳 白海燕
[目的/意义]在学术文献检索与阅读场景下,当前学术信息量已远超用户信息处理能力,造成信息堆积。为应对用户阅读效率与知识吸收难题,面向学术文献检索结果集开展内容的综合挖掘揭示。[方法/过程]一方面从阅读体验出发,针对文献检索场景的特点,进行结构化综述表达设计;另一方面从技术方法与内容质量提升出发,利用基于深度学习的文本自动生成技术,构建科技文献数据集,训练并优化文本摘要模型,在此基础上利用大语言模型技术实现结构化的综述文本生成。[结果/结论 ]训练优化后的摘要模型在各指标的召回率和F1值上平均增长2.07%。基于大模型的结构化综述生成,在实际测评中能够有效地提炼、总结和归纳内容要点,验证本文技术路线和应用实践的可行性,为进一步提升学术文献的知识化服务水平、智能辅助阅读与语义内容综合挖掘揭示等方面提供应用实践指南。
[期刊] 图书情报知识
[作者]
陈春颖
论文分析了数字图书馆异构数据源的元数据整合中存在的不一致性和重复性问题的解决方法,设计了期刊元数据整合过程中数据清洗的基本框架、流程、清洗策略及其算法。最后,通过清洗实验来验证清洗策略和算法的可行性和有效的。
关键词:
数据清洗 资源整合 元数据
[期刊] 管理世界
[作者]
毛基业
本文聚焦于质性研究的数据分析方法,主要是基于本届论坛的两个主旨报告,重点阐述结构化的数据分析方法,包括其数据结构的科学哲学假设、本质特征和优势,以及具体应用过程。本文通过对一篇范文的深度分析说明,这个方法强调系统性呈现证据,便于新见解的涌现和理论构建,可在原始数据和结论间形成牢固的证据链,而且相对容易学习借鉴,可显著提升质性研究的质量。此外,本文也对近年来案例论文中常见的3个缺陷进行了剖析,包括与文献对话不足、过度概念化,以及单案例的不当抽样问题。
[期刊] 西南金融
[作者]
熊海帆
文章综述了国内外反洗钱实施中数据挖掘技术的研究与应用概况,指出国内的数据挖掘基础理论研究还相对薄弱,在反洗钱实践中的具体应用也较滞后,提出应通过中国反洗钱监测分析中心的体制变革,提升其在反洗钱信息工作中的统筹协调能力,以促进数据挖掘技术的研究和应用,并推动反洗钱和反恐怖主义融资行动的水平与成效。
关键词:
数据挖掘 反洗钱 反恐融资 外部性
[期刊] 情报理论与实践
[作者]
王永红
定量专利分析工作离不开正确的样本选取和严谨的数据清洗。作为定量专利分析的前提和基础,样本选取和数据清洗影响着专利分析的结论,并决定着专利分析的效果。样本选取和数据清洗的基本步骤是:选择数据来源、限定数据范围、生成样本空间、数据规范、字段拆分以及数据标引。
关键词:
专利 定量分析 样本 数据清洗
[期刊] 情报理论与实践
[作者]
路霞 吴鹏 王曰芬 张金柱
文章旨在构建中文专利数据清洗框架。采用文献分析法探究数据清洗概念框架,根据实地调查法进行专利数据清洗的需求分析,进而设计得到针对专利地址信息相关的中文专利数据清洗框架,针对专利地址信息处理提出相关算法,并利用对照法对该框架进行验证优化。采用UML建模技术构建专利清洗系统模型,实现中文专利数据清洗系统以验证本文专利数据清洗框架的有效性。
关键词:
专利数据 框架 专利信息
[期刊] 中国内部审计
[作者]
王晓波
审计人员在开展审计工作过程中通常需要采集和分析被审计单位信息系统所存储的电子数据。这些数据基本上可分为结构化数据、半结构化数据和非结构化数据三种类型。结构化数据是指存储在数据库中,有一定的逻辑结构,可以用二维表来表示的数据。非结构化数据是指数据结构不固定,无法用二维表结构表示的数据,如档案、通知、合同、规章制度、工作报告、会议纪要、图像、音频和视频等。半结
[期刊] 图书馆工作与研究
[作者]
薛红 唐明元 刁羽
将开放书目数据暴露于搜索引擎是互联网时代提高书目数据利用率的有效途径。目前业界探讨的书目数据建设主要集中于自上而下的模式,但因为种种原因,依据这一模式构建书目数据体系存在难度大、见效慢、周期长等问题。结构化标记技术和Schema.org词汇表的出现,为图书馆书目数据建设提供了一种自下而上、简单便捷的新模式,易于将书目数据暴露在互联网上,从而使图书馆文献资源得到更为高效、充分的利用。
关键词:
结构化数据 标记 书目数据 建设模式
[期刊] 情报理论与实践
[作者]
李慧 颜显森
With the development of Internet,many disadvantages of the traditional relational database have been discovered.Under such circumstances,the non-structure database comes into being.This paper mainly discusses the definition,background,characteristics and advantages of the non-structure database.
[期刊] 情报理论与实践
[作者]
徐佳宁 王婉
文章对开放数据的概念、文件格式进行了辨析,分析了开放数据的结构化、关联化发展现状,评述了开放数据经整合、关联后在科学、社会科学、公共信息、商业等方面的应用实践。
关键词:
开放数据 结构化 关联数据 应用研究
[期刊] 情报理论与实践
[作者]
周军
Web Database is the base of many network applications such as Web information retrieval system,Web information publishing and Electronic Commerce.This article focuses on several popular Web Database technologies such as CGI,ISAPI,IDC,ASP and Java Applet,analyzing and comparing their structure,char...
[期刊] 地理科学进展
[作者]
柏中强 王卷乐 杨飞
人口数据空间化研究旨在发掘和展现人口统计数据中隐含的空间信息,并以地理格网或其他区域划分的形式再现客观世界的人口分布,具有重要的科学意义。人口空间分布数据有助于从不同地理尺度和地理维度对人口统计数据形成有益补充,其应用广泛,相关研究方兴未艾。主要从以下3个方面对人口数据空间化研究进行综述:①主要空间化方法的原理及其适用性;②空间化中用到的建模参考因素,并结合具体应用案例分析其作用机理;③典型人口空间化数据集。在此基础上,分析了现阶段人口数据空间化所运用的输入数据的质量和详细程度、尺度效应及时空分辨率、长时间序列数据集和精度检验等方面存在的问题;并探讨了人口数据空间化未来的研究方向。
关键词:
人口数据 空间化方法 建模要素 数据集
[期刊] 华东经济管理
[作者]
笪尚明 刘西林
从企业技术能力构成角度,给出了企业技术能力六个构成要素,并分别探讨了企业识别技术能力、选择技术能力、获取技术能力、利用技术能力、保护技术能力及技术库。
关键词:
企业 技术能力 结构
[期刊] 金融理论与实践
[作者]
孙森 韩光林
认识是人类在实践的基础上对外在客观世界的能动反映,人类对洗钱和反洗钱的认识,也要在掌握洗钱和反洗钱基本规律的基础上进行。从已有的相关文献看,业界对洗钱和反洗钱的研究深度和广度与人类反洗钱实践水平密切相关。随着人们对洗钱危害、影响及后果的认识越来越深刻,各国政府、国际组织采取的反洗钱措施也就越来越严密。本文重点对洗钱涵义和反洗钱监管制度等方面的研究进行总结评述。
关键词:
洗钱 反洗钱 监管制度
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除