搜索文献-EPS

年份: 2024(9567); 2023(13721); 2022(12042); 2021(11339); 2020(9394); 2019(21691); 2018(21417); 2017(41563); 2016(22412); 2015(25065); 2014(24963); 2013(24327); 2012(21933); 2011(19539); 2010(19046); 2009(17195); 2008(16251); 2007(13638); 2006(11581); 2005(9622)

作者: 王(62322); 张(51825); 李(51298); 刘(48843); 陈(32856); 杨(24879); 晓(23428); 赵(20599); 周(19764); 华(17988); 吴(17797); 文(17229); 林(16169); 伟(16088); 明(16006); 志(15573); 丽(15555); 孙(15512); 黄(14794); 徐(14714); 玉(12706); 平(12392); 军(12383); 朱(11829); 郭(11537); 胡(11356); 红(11308); 建(11228); 艳(10344); 春(10239)

学科: 济(90145); 经济(90053); 管理(63954); 业(59268); 企(49845); 企业(49845); 方法(45303); 数学(39802); 数学方法(39202); 农(22313); 财(21308); 中国(21272); 地方(19952); 学(19439); 业经(19075); 农业(15202); 理论(15169); 和(14493); 贸(14487); 贸易(14481); 环境(14393); 务(14198); 财务(14128); 财务管理(14097); 技术(14055); 易(14012); 企业财务(13357); 制(13072); 划(12363); 教育(11230)

机构: 大学(309269); 学院(307730); 管理(126992); 济(118574); 经济(116000); 理学(112018); 理学院(110794); 管理学(108571); 管理学院(108024); 研究(97050); 中国(69940); 京(64479); 科学(62832); 财(51553); 业大(47405); 所(46881); 农(46694); 中心(44796); 研究所(43405); 财经(43097); 江(42142); 范(41188); 师范(40807); 北京(39829); 经(39399); 农业(36636); 院(36334); 经济学(35250); 州(34610); 师范大学(33212)

基金: 项目(225584); 科学(178371); 基金(164586); 研究(163601); 家(143412); 国家(142280); 科学基金(123537); 社会(102851); 社会科(97525); 社会科学(97499); 省(88110); 基金项目(88027); 自然(81892); 自然科(79998); 自然科学(79981); 自然科学基金(78480); 教育(75782); 划(74408); 资助(67585); 编号(66906); 成果(52101); 重点(50254); 部(49422); 发(47686); 创(46920); 课题(45075); 创新(43756); 科研(43620); 教育部(42481); 国家社会(42207)

期刊: 济(118885); 经济(118885); 研究(83728); 中国(50737); 学报(49255); 科学(45238); 管理(44168); 农(40782); 财(38020); 大学(37736); 学学(35442); 教育(34046); 农业(29061); 技术(28342); 业经(20282); 融(20081); 金融(20081); 财经(19658); 经济研究(18878); 图书(17260); 经(16672); 问题(15476); 科技(15440); 技术经济(14904); 理论(14872); 资源(14589); 版(14432); 统计(14345); 业(14254); 实践(13887)

全选本页取消本页

共检索到419569条记录

发布时间倒序

发布时间倒序
相关度优先

文献计量分析

结果分析(前20)
结果分析(前50)
结果分析(前100)
结果分析(前200)
结果分析(前500)

基于N-gram复合分词的领域概念自动获取方法研究

[期刊] 情报理论与实践 [作者] 颜端武李兰彬曲美娟

文章提出一种基于N-gram复合分词的领域概念自动获取方法,在中文分词的基础上进行N元复合切分,通过建立一系列过滤规则,提取候选领域概念;然后以改进的TF-IDF作为衡量领域相关性的统计特征值,计算候选概念的领域相关性;最后进行人工辅助判断与筛选。以航空发动机领域语料为样本进行了实践探索,实验结果表明该方法能有效抽取专业领域概念,具有较强的实用性。

关键词：概念概念抽取复合分词领域相关性

基于深度学习的领域本体概念自动获取方法研究

[期刊] 情报理论与实践 [作者] 王思丽祝忠明刘巍杨恒

[目的/意义]实现对领域概念的自动学习抽取,解决领域本体自动化构建的首要基础任务。[方法/过程]以无监督的学习方法和端到端的识别模式为理论技术基础,首先通过对主流词嵌入模型进行对比分析,设计提出了基于Word2Vec和Skip-Gram的领域文本特征词嵌入模型的自动生成方法;其次研究构建了以IOB格式的标注文本作为输入,基于自注意力机制的BLSTM-CRF领域概念自动抽取模型;最后以资源环境学科领域为例进行了实验研究与评估分析。[结果/结论]模型能够实现对领域概念的自动抽取,对领域新概念或术语的自动识别也具有一定的健壮性。[局限]模型精度尚未达到峰值,有待进一步优化提升。

关键词：深度学习领域本体概念自动获取词嵌入自注意力

基于N-gram的双向匹配中文分词方法

[期刊] 数理统计与管理 [作者] 凤丽洲杨贵军徐雪徐玉慧

针对基础词更能表达中文文本所包含的基本信息,更适合于后续的文本挖掘,提出一种基于N-gram的双向匹配中文分词方法。充分挖掘训练语料的词频信息,给出一种组合词迭代切分方法,解决最大匹配分词中长词歧义切分问题,并基于N-gram语言模型,实现最优分词序列的选择。此外,为弥补准确率P这一评价指标受词条长度影响较大而不稳健的问题,在刻画分词方法性能时引入正确切分词条总字数这一因素,提出一个新的测评指标P_n,有效规避了词条长度对分词准确率评价的影响。最后在SIGHAN组织的国际中文自然语言处理竞赛的两个语料上进行实验表明,相较于传统N-gram中文分词方法,本文方法在保证分词效率的前提下,有效地提高了准确率P、召回率R、P_n和F_1值。

关键词： N-gram模型分词歧义评测指标双向匹配

大规模汉语语料库中任意n的n-gram统计算法及知识获取方法

[期刊] 情报学报 [作者] 张民李生赵铁军

本文提出并实现了一种大规模汉语语料库中字、词级任意ｎ的ｎ－ｇｒａｍ统计算法，本算法可以一次性统计出所有不大于任意ｎ（本文ｎ取为２５６）的字、词级ｎ－ｇｒａｍ，可将传统ｎ－ｇｒａｍ统计时的指数空间开销变为线性的，且与所统计的元数无关。基于这种ｎ－ｇｒａｍ的统计，本文还进行了汉语信息熵的计算及字、词级知识获取的研究。本算法及本文的研究结果已应用于我们研制的机译系统中

关键词： n元语法,统计,信息熵,知识获取

一种基于N-Gram技术的中文文献自动分类方法

[期刊] 情报学报 [作者] 何浩杨海棠

本文介绍一种基于n gram技术的、与语言无关的文献分类方法K meansaxiales (KMA) ,及其在中文文献自动分类中的应用。这种方法将文献转换成由n gram(n个连续的字符 )频次构成的向量。为压缩存储空间、提高处理速度 ,我们运用哈希函数将n gram映射为哈希码 ,对文献的分析实际上以哈希码频次为基础运行。采用KMA算法 ,我们对一个中文数据库进行了自动分类的实验研究 ,在比较实验结果的基础上 ,我们对KMA算法初始参数的选择进行了初步探讨。

关键词： n-gram 汉字切分哈希码文献向量 KMA 自动分类

基于词链的自动分词方法

[期刊] 情报理论与实践 [作者] 杨建林张国梁

An algorithm for automatic segmentation of Chinese word,which is an improved version of the minimum matching algorithm,is put forward.The key idea of the algorithm is to optimize the word bank and the matching process to enhance the speed and accuracy of word segmentation.By integrating the case ban...

关键词： automatic word extraction algorithm Chinese

数字环境下通用概念获取方法

[期刊] 图书情报工作 [作者] 常春赖院根

在叙词表、本体等知识组织体系构建过程中,需要获取通用概念。笔者试验了三种获取通用概念的方法,一是继承传统知识组织体系通用概念,二是通过关键词在文献中词频分布情况确定通用概念,三是基于关键词总词频与标准差二维信息获得通用概念。研究结果表明:以上三种方法各有特点及使用范围,在概念获取时可以根据课题具备条件单独使用或组合使用。

关键词：叙词表本体通用概念标准差词频

面向领域文献的无监督中文分词自动优化方法

[期刊] 数据分析与知识发现 [作者] 倪维健孙浩浩刘彤曾庆田

【目的】对现有中文分词方法在领域文献上的分词结果进行调整,以提升领域文献上的分词效果。【方法】对传统中文分词方法处理领域文献的不足进行分析,以此为基础设计一个反映领域文献构词特点的分词指标——词频偏差,并基于该指标提出一个无监督的分词结果优化方法。【结果】基于农业领域语料开展实验,结果表明该方法对比ICTCLAS、THULAC和LTP的分词结果 F1值提升2%-3%,并具有实现简单、参数鲁棒性强的特点。【局限】提升召回率方面效果不佳。【结论】基于词频偏差的分词结果优化算法能够有效提升已有分词结果的准确性,

关键词：领域文献中文分词分词优化词频偏差

基于EM算法的汉语自动分词方法

[期刊] 情报学报 [作者] 李家福张亚非

汉语自动分词是中文信息处理中的基础课题。本文首先对汉语分词的基本概念与应用 ,以及汉语分词的基本方法进行了概述。接着引出一种根据词的出现概率、基于极大似然原则构建的汉语自动分词的零阶马尔可夫模型 ,并重点剖析了EM(Expectation Maximization)算法 ,对实验结果进行了分析。最后对算法进行了总结与讨论。

关键词：分词汉语 EM算法语料库 HMM

基于HMM的楚辞自动分词标注研究

[期刊] 图书情报工作 [作者] 钱智勇周建忠童国平苏新宁

研究古代和现代汉语的自动分词标注技术,用隐马尔科夫模型对《楚辞》进行自动分词标注实验,通过比较分词后的标注词性概率,取最大概率作为最后的分词和词性标注结果,并在其中使用全切分和加值平滑算法。经过实验调整分词标注程序模块和参数,最终得到一个分词标注辅助软件,其开放测试的分词F值为85%,标注F值为55%,高出基准F值14个百分点。

关键词：隐马尔科夫模型楚辞自动分词词性标注古文分词

一种基于N-Gram改进的文本特征提取算法

[期刊] 图书情报工作 [作者] 于津凯王映雪陈怀楚

介绍一种改进的文本特征提取及匹配算法。该算法基于N-Gram算法思路进行文本处理和特征提取,设计了gram关联矩阵用于统计与合并特征词,从而在固定长度N-Gram算法的基础上能够提取出不同长度的特征词。实验证明,该特征提取算法能够更为准确地描述文本特征,可应用于文本检索、Web挖掘等信息处理领域。

关键词：文本特征提取 N-Gram算法 gram关联矩阵

基于自媒体的旅游需求信息分类及本体概念获取研究

[期刊] 图书情报工作 [作者] 李志义杨雄威王冕

［目的／意义］微信、微博等自媒体中隐含着大量的用户旅游消费需求的信息，将这些信息进行分类并依据分类结果构建需求本体，从而帮助企业分析和研究用户需求以获取巨大的商业价值。［方法／过程］利用ＳＶＭ分类算法将微博信息分类并生成分类结果集，这些结果集中包含大量旅游相关概念的词汇，可以作为构建和扩展旅游需求本体的语料；然后通过调查各大旅游网站的类目确定旅游需求的核心概念，抽取分类结果中与旅游相关的概念。［结果／结论］利用抽取结果匹配核心概念，生成扩展后的本体，使用ＨＯＺＯ本体编辑工具进行修改和完善，并呈现部分旅游需求本体。从实验结果看，本文所提方法能较为准确地对包含旅游需求的文本进行分类。

关键词：自媒体旅游需求本体分类概念获取

概念设计中的设计过程知识获取研究

[期刊] 数据分析与知识发现 [作者] 羊柳傅柱王曰芬

【目的】探究概念设计过程知识的获取方法,为设计过程知识的模块化建模和表示提供知识素材,进而实现动态设计过程知识的管理和重用。【方法】从知识内容角度对设计过程知识获取需求进行分析;结合访谈调查法和研究设计的双层流程获取模板对设计过程知识获取实验进行设计;采用访谈调查法初步获取组织内隐性的设计过程知识,利用双层流程获取模板进一步对设计过程知识进行模块化处理。【结果】以某制退机概念设计为例,采用访谈法获取初始设计过程知识;利用设计流程获取模板对设计流程知识进行整理和规范,利用设计步骤获取模板对规范后的设计流程知

关键词：概念设计设计过程知识知识获取访谈法流程获取模板

资源环境领域开放获取仓储目录的分析研究

[期刊] 数字图书馆论坛 [作者] 杨丽娜马建玲李慧佳

本文对开放获取仓储目录中登记的195个资源环境学科领域的开放获取仓储从地区分布、语言分布、开放仓储类型、开源软件类型、资源数量、资源类型、互操作性和更新情况等展开系统的分析研究,讨论该领域开放获取仓储的基本情况和资源特征,揭示该领域开放获取仓储登记的开放学术资源现状,最后提出面向该领域开放学术资源建设的对策和建议。

关键词：开放获取仓储开放资源资源环境资源建设

基于信息抽取的项目记忆获取方法研究

[期刊] 情报理论与实践 [作者] 徐进朱孝文

[目的/意义]项目记忆是项目进行过程中产生和应用的项目知识和信息的集合。传统获取、构建项目记忆的方式依赖人工处理，需要投入大量的人力和时间。如何表示项目记忆，以及如何利用非结构化项目文档这类重要的项目数据源来构建项目记忆，仍然是项目知识管理中的关键挑战。[方法/过程]收集了京沪高铁项目的相关文档1078篇，利用依存句法和规则抽取方法得到项目记忆短语和基础信息，利用LDA模型提取项目文档的主题，并对文档集聚类和描述，达到从项目文档中自动提取项目记忆要素、构建、重现项目记忆的目的。[结果/结论]通过实验和比较分析，验证了所提出框架方法的合理性和有效性。所设计的方法流程一定程度上可以为项目组织、团队及成员进行更加高效的项目知识管理与共享提供支持。

关键词：项目记忆记忆获取知识抽取短语抽取主题建模

首页
下一页
尾页
第 页

文献操作() 导出元数据文献计量分析

全选

导出文件格式：WXtxt

作者：

删除

推荐搜索

基于过程范式的网络信息采集与获取方法研究信息公共获取及其相关概念的梳理基于扩展确定有限自动机的功能需求获取方法基于开放获取的IR联盟研究基于中文学术文献的领域本体概念层次关系抽取研究基于形式概念分析的领域本体构建方法优化研究基于引用背景信息的关键词自动抽取方法研究基于词共现的概念图自动构建研究基于ComGIS的农用地分等单元及属性数据获取方法研究基于机器翻译的专利术语翻译获取方法研究