- 年份
- 2024(6793)
- 2023(9945)
- 2022(8886)
- 2021(8321)
- 2020(6977)
- 2019(16165)
- 2018(16333)
- 2017(31352)
- 2016(16986)
- 2015(19193)
- 2014(19256)
- 2013(19178)
- 2012(17450)
- 2011(15679)
- 2010(15353)
- 2009(13753)
- 2008(13280)
- 2007(11415)
- 2006(9876)
- 2005(8569)
- 学科
- 济(67256)
- 经济(67184)
- 管理(51049)
- 业(49476)
- 企(42090)
- 企业(42090)
- 方法(33377)
- 数学(28736)
- 数学方法(28407)
- 农(17098)
- 技术(16473)
- 中国(16420)
- 学(15391)
- 财(15364)
- 业经(14930)
- 地方(13261)
- 理论(12372)
- 农业(11766)
- 贸(11755)
- 贸易(11750)
- 和(11426)
- 易(11392)
- 环境(10851)
- 制(10234)
- 务(10206)
- 财务(10139)
- 财务管理(10124)
- 企业财务(9613)
- 教育(9610)
- 划(9582)
- 机构
- 大学(242377)
- 学院(239307)
- 管理(100191)
- 济(91956)
- 经济(89844)
- 理学(87673)
- 理学院(86742)
- 管理学(85284)
- 管理学院(84860)
- 研究(77993)
- 中国(55609)
- 京(52036)
- 科学(50004)
- 财(39160)
- 所(38824)
- 业大(37141)
- 农(36896)
- 研究所(35676)
- 中心(34989)
- 江(33188)
- 北京(32908)
- 财经(32321)
- 范(32184)
- 师范(31902)
- 经(29469)
- 农业(28947)
- 院(28438)
- 州(27462)
- 技术(26778)
- 经济学(26277)
- 基金
- 项目(170277)
- 科学(133443)
- 研究(125117)
- 基金(122746)
- 家(106594)
- 国家(105715)
- 科学基金(91154)
- 社会(76735)
- 社会科(72757)
- 社会科学(72735)
- 省(66753)
- 基金项目(66265)
- 自然(60293)
- 自然科(58869)
- 自然科学(58858)
- 自然科学基金(57780)
- 教育(57176)
- 划(56014)
- 编号(51643)
- 资助(50364)
- 成果(41009)
- 重点(37576)
- 部(37278)
- 创(36052)
- 发(35782)
- 课题(34859)
- 创新(33553)
- 科研(32504)
- 项目编号(32221)
- 教育部(31891)
共检索到337431条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 图书情报工作
[作者]
奉国和 郑伟
认为分词是文本自动分类、信息检索、信息过滤、文献自动标引、摘要自动生成等中文信息处理的基础与关键技术之一,中文本身复杂性及语言规则的不确定性,使中文分词技术成为分词技术中的难点。全面归纳中文分词算法、歧义消除、未登录词识别、自动分词系统等研究,总结出当前中文分词面临的难点与研究热点。
[期刊] 图书情报工作
[作者]
熊回香 夏立新
首先介绍汉语自动分词技术及基于词索引的中文全文检索技术,接着分别从文献自动标引、文摘自动生成、文本自动分类、文本信息过滤、自然语言检索接口和智能检索等方面详细地阐述汉语自动分词技术在中文全文检索中的应用,并对目前汉语自动分词技术存在的局限性进行分析,提出发展思路,最后对汉语自动分词技术在中文全文检索中的应用前景进行预测。
[期刊] 情报理论与实践
[作者]
庞观松 蒋盛益
文章从文本表示、特征选择、分类算法、常用基准语料以及评估指标等方面对近年来的研究成果进行综述并讨论。认为短文本分类和多语言文本分类管理是新出现的重要且紧迫的问题,并对这两个问题以及数据集偏斜、多层分类、标注瓶颈等几个关键问题进行重点讨论。最后总结并展望这些研究内容。
关键词:
自动分类 文本分类 文本处理 综述
[期刊] 情报理论与实践
[作者]
逯万辉 马建霞 赵迎光
作为话题检测与追踪和舆情监测中的一项基础性工作,识别并处理爆发词对突发检测具有重要的作用,本文综述了该领域目前的研究现状和已有的研究成果并对其进行比较分析,总结了其中亟待解决的关键问题并进行了重点探讨,为后续研究指明了方向。
关键词:
爆发词 热点话题识别 语义合并 综述
[期刊] 经济体制改革
[作者]
高连和
中小企业集群融资作为一种解决群内中小企业由于机会缺失而造成"融资难"问题的新思路,日渐受到越来越多的专家学者和实际工作者的重视。本文对近几年来国内关于中小企业集群融资研究的成果进行了全面的梳理、归纳和总结,并对未来我国中小企业集群融资进一步的研究进行了展望。
[期刊] 情报理论与实践
[作者]
宋宇 真溱
文章把关键词自动抽取拆分为3个阶段的问题:如何进行文本预处理;怎样获得关键词候选词集;该采用什么方法从候选词集中筛选出关键词。首先针对不同阶段的问题,详细地介绍现有的典型方法。然后介绍了关键词自动抽取技术最新的研究进展,并分析了关键词自动抽取技术的发展趋势。最后指出了目前关键词自动抽取技术研究的不足之处。
关键词:
关键词 自动抽取 研究进展 综述
[期刊] 图书情报工作
[作者]
王若佳 赵常煜 王继民
[目的/意义]健康医疗大数据是我国重要的基础性战略资源,本研究对中文电子病历分词与实体识别的探讨与实证较好地完成了医疗数据的信息抽取任务,对今后医疗大数据在语义层面的应用发展具有重要意义。[方法/过程]本研究首先融合权威词表、官方标准、健康网站数据及其他医学补充词库构建了词语数量级达到10万的医学词表;然后对电子病历的字段进行分词,对比了jieba工具、导入词典后的jieba、无监督学习及AC自动机4种模型的分词效果;最后,以自动分词和人工标注结果为语料,实现基于条件随机场的电子病历实体识别研究,并比较不同实体类别以及不同文本特征下的实体识别效果,选出最优模板。[结果/结论]分词结果显示,AC自动机的效果最好,F值可达82%;实体识别结果表明,"检查"和"疾病"实体的识别效果最好,而"症状"的识别效果不太理想。
[期刊] 图书情报工作
[作者]
钱智勇 周建忠 童国平 苏新宁
研究古代和现代汉语的自动分词标注技术,用隐马尔科夫模型对《楚辞》进行自动分词标注实验,通过比较分词后的标注词性概率,取最大概率作为最后的分词和词性标注结果,并在其中使用全切分和加值平滑算法。经过实验调整分词标注程序模块和参数,最终得到一个分词标注辅助软件,其开放测试的分词F值为85%,标注F值为55%,高出基准F值14个百分点。
[期刊] 情报理论与实践
[作者]
傅柱 王曰芬 孙铭丽
随着计算机技术的发展与应用,起源于哲学的本体逐渐在信息科学领域受到广泛关注,其应用的重要性已在许多方面表现出来,而本体合理有效的存储是保证其共享利用的前提。文章在对国内外现有的本体存储技术研究进行文献调研和定量分析的基础上,分别介绍了现有的几种本体存储方法,其中重点叙述了本体在关系数据库中的几种存储模式;对比分析了主要的本体存储方法及本体存储管理系统;总结了现有方法中存在的局限性,并展望了本体存储技术的发展趋势。
关键词:
本体 存储技术 数据库 综述
[期刊] 情报理论与实践
[作者]
高强 游宏梁
作为信息抽取的重要组成部分,事件抽取的研究具有广阔的应用前景和巨大的现实意义。文章阐述事件及事件抽取的基本概念,简单介绍事件抽取的发展历史,并从元事件抽取和主题事件抽取两个方面出发,详细介绍主要的研究方法与研究现状,总结事件抽取发展所面临的挑战,并在此基础上展望事件抽取的研究趋势。
关键词:
事件抽取 信息抽取 信息技术 综述
[期刊] 情报理论与实践
[作者]
杨建林 张国梁
An algorithm for automatic segmentation of Chinese word,which is an improved version of the minimum matching algorithm,is put forward.The key idea of the algorithm is to optimize the word bank and the matching process to enhance the speed and accuracy of word segmentation.By integrating the case ban...
[期刊] 数据分析与知识发现
[作者]
倪维健 孙浩浩 刘彤 曾庆田
【目的】对现有中文分词方法在领域文献上的分词结果进行调整,以提升领域文献上的分词效果。【方法】对传统中文分词方法处理领域文献的不足进行分析,以此为基础设计一个反映领域文献构词特点的分词指标——词频偏差,并基于该指标提出一个无监督的分词结果优化方法。【结果】基于农业领域语料开展实验,结果表明该方法对比ICTCLAS、THULAC和LTP的分词结果 F1值提升2%-3%,并具有实现简单、参数鲁棒性强的特点。【局限】提升召回率方面效果不佳。【结论】基于词频偏差的分词结果优化算法能够有效提升已有分词结果的准确性,
关键词:
领域文献 中文分词 分词优化 词频偏差
[期刊] 图书情报工作
[作者]
曾文 王惠临
认为主题词表有利于信息的组织、信息的利用和信息的检索,传统的手工构建单语言主题词表的方法耗时且成本昂贵,难以满足用户对跨语言信息的处理和使用需求。目前在国内外,如何利用计算机技术,实现跨语言主题词表的自动构建功能是信息检索研究领域需要解决的一个关键问题。在对国内外研究现状进行分析的基础上,较为详细地阐述和分析跨语言主题词表自动构建技术的思想及其技术方法,并提出相关的研究建议。
关键词:
主题词表 跨语言主题词表 自动构建
[期刊] 情报理论与实践
[作者]
曾文 王惠临
目前在国内外,如何利用计算机技术实现主题词表的自动构建功能是信息检索研究领域需要解决的一个关键问题,本文将详细阐述相关研究的进展、设计思想以及方法,希望能给我国的主题词表自动构建工作带来一些启示。
关键词:
主题词表 信息检索 自动构建 共现分析
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除