搜索文献-EPS

年份: 2024(9934); 2023(14386); 2022(12314); 2021(11493); 2020(9552); 2019(21624); 2018(21479); 2017(40944); 2016(22294); 2015(25101); 2014(25083); 2013(24465); 2012(22378); 2011(20065); 2010(20228); 2009(18648); 2008(17085); 2007(14878); 2006(12982); 2005(11386)

作者: 王(64469); 张(53452); 李(52951); 刘(50441); 陈(33777); 杨(25599); 晓(24132); 赵(20993); 周(20486); 华(18922); 吴(18467); 文(17868); 林(16914); 明(16856); 伟(16602); 志(16357); 丽(15813); 孙(15789); 徐(15288); 黄(15096); 玉(13235); 平(13211); 军(12925); 朱(12160); 郭(12006); 建(11796); 胡(11674); 红(11656); 春(10681); 云(10593)

学科: 济(84351); 经济(84253); 管理(61295); 业(57153); 企(47884); 企业(47884); 方法(36670); 数学(31760); 数学方法(31359); 中国(28190); 融(27094); 金融(27085); 银(25368); 银行(25320); 行(24467); 财(22595); 地方(22285); 农(22219); 学(20891); 业经(19197); 制(18892); 理论(15728); 农业(15122); 务(14887); 财务(14812); 财务管理(14789); 企业财务(14108); 贸(13832); 贸易(13819); 和(13732)

机构: 大学(306093); 学院(305530); 管理(119271); 济(115566); 经济(112761); 研究(104114); 理学(103190); 理学院(101983); 管理学(100087); 管理学院(99553); 中国(82324); 科学(67147); 京(65528); 财(54224); 所(52598); 农(50937); 中心(48968); 研究所(48420); 业大(46806); 江(44484); 财经(43544); 范(41576); 北京(41389); 师范(41124); 农业(39969); 经(39558); 院(38522); 州(36878); 经济学(34238); 技术(33726)

基金: 项目(216143); 科学(169128); 研究(157147); 基金(155448); 家(136388); 国家(135254); 科学基金(115414); 社会(96539); 社会科(91402); 社会科学(91378); 省(85504); 基金项目(83028); 自然(76228); 自然科(74411); 自然科学(74395); 自然科学基金(72999); 划(72266); 教育(71591); 编号(64947); 资助(63630); 成果(52517); 重点(49011); 发(46728); 部(46350); 课题(45015); 创(44889); 创新(41891); 科研(41670); 项目编号(40109); 大学(39615)

期刊: 济(123468); 经济(123468); 研究(88987); 中国(58962); 学报(51686); 科学(46608); 农(45570); 管理(42233); 财(39628); 大学(38374); 融(37634); 金融(37634); 学学(36186); 教育(36020); 农业(31061); 技术(25656); 业经(20420); 财经(20240); 经济研究(19437); 经(17126); 图书(16571); 理论(15698); 问题(15565); 业(15375); 科技(15290); 实践(14590); 践(14590); 版(14361); 资源(14133); 现代(13247)

全选本页取消本页

共检索到447136条记录

发布时间倒序

发布时间倒序
相关度优先

文献计量分析

结果分析(前20)
结果分析(前50)
结果分析(前100)
结果分析(前200)
结果分析(前500)

融合领域本体的中文文本语义特征提取算法研究

[期刊] 情报理论与实践 [作者] 何超张玉峰

针对传统的中文文本特征提取算法存在的语义丢失和语义缺乏问题,设计了融合领域本体的中文文本语义特征提取算法。该算法利用基于种子—扩展机制的关键词识别与提取算法解决传统算法中利用分词工具进行关键词提取所产生的语义丢失问题;利用基于领域本体的文本概念特征语义映射与聚合算法解决传统算法中利用向量空间模型进行文本表示所产生的高维和语义缺乏问题。实验结果表明,该算法取得了很好的预期效果,能够显著提高文本特征提取的深度和准确性。

关键词：文本语义特征领域本体算法

基于多特征融合的中文文本关键词提取方法

[期刊] 情报理论与实践 [作者] 张建娥

文章通过分析传统关键词提取方法的特点和存在的问题,提出基于多特征融合的中文文本关键词提取方法。该方法通过融合中文文本词语的频率、关联度、词性以及位置多种特征,有效避免了传统关键词提取方法产生的偏差。实验结果表明,该方法在不同测试集上与传统方法相比关键词提取的平均召回率均得到明显提升。

关键词：中文文档特征融合关键词

基于领域本体和概念向量的中文文本相似性测度研究

[期刊] 中国图书馆学报 [作者] 颜端武成晓甘利人

文本相似性测度被广泛用于计算用户提问与文档资源相关程度以及基于内容相似资源推荐。OCVSM是一种基于领域本体和概念向量相似性测度的方法。该方法将军用飞机领域知识本体OntoAvion的概念集作为词汇抽取特征项,根据本体中概念间的关系确定特征项的相似度,最后利用余弦算法计算文本向量相似度。实验证明,该方法与基于语言学词典的相似性测度方法相比,更接近用户对文本相似性的判断。表10。图5。参考文献10。

关键词：相似性测度领域本体概念向量文本处理

基于领域本体的中文Web文本主题特征抽取方法

[期刊] 情报理论与实践 [作者] 朱恒民马静黄卫东

为了快速有效地自动处理中文Web文本,提出了一种基于领域本体的主题特征抽取方法。该方法针对Web文本特点,介绍了一种领域词典的半自动化构建方法。基于领域词典切分文本,通过对词条的主题映射,采用领域本体的概念表示文本向量,从而有效地降低文本特征向量的维数,提高主题抽取的质量。考虑文本信息的不同位置与频率,计算主题特征的权值,并且基于领域本体的结构,对主题概念的权值进行调整和排序。实例验证了该方法的有效性。

关键词：主题抽取领域本体文本挖掘

融合汉字多语义与文本统计特征的中文医学新词发现研究

[期刊] 图书情报工作 [作者] 王巍洁任慧玲李晓瑛王勖张颖

[目的/意义]为提高机器理解医学文本的能力，提高医学自然语言处理等上层任务效果，保障医学知识内容更新及时性、覆盖完整性，提出一种融合汉字多语义信息与文本统计特征的医学新词发现方法。[方法/过程]以规范用词的医学文献摘要数据为新词发现来源，基于N-gram模型获取N元词串，将词串存入字典树，从词的内部凝固度、词的自由程度、词的语义相似度3个角度同时计算每个N-gram词串的关联置信度、左右邻接熵、多语义相似度（包括汉字细粒度字符语义信息、BERT词向量信息），遍历上述各指标阈值评估N-gram词串为医学新词的可能。[结果/结论 ]从中华医学会收录的截至2022年10月20日的最新1 000篇文摘中发现医学新词3 263个，去除重复项后，共获得764个医学新词。提出的融合汉字多语义与文本统计特征的医学新词发现方法对比现有方法具有一定提升，且在应用上可以有效提高医学分词任务效果，使医学分词后的名词类别更清晰、概念更明确、内涵更丰富。结合汉字内在多语义信息与字词外部统计特征的医学新词发现方法，不仅可以提高计算机的新词发现能力，还可提高计算机面对专业且复杂的医学文本自然语言处理效果，对及时更新领域知识内容等具有重要帮助。

关键词：医学新词发现 N-gram 多语义词向量关联置信度左右信息熵

基于LSP与GLCM融合的禾本科牧草种子特征提取算法

[期刊] 中国农业大学学报 [作者] 陈桐潘新马玉宝闫伟红

针对禾本科牧草种子相似性较高、识别困难的问题,采用局部相似模式(LSP)和灰度共生矩阵(GLCM)的方法,对禾本科牧草种子的分类识别进行研究。结果表明:1)局部相似模式与灰度共生矩阵融合的方法可以有效的提取禾本科牧草种子的纹理特征,能够识别颜色、形状、大小等特征都十分相似的牧草种子,且其识别率优于传统的LSP特征算子和GLCM特征算子。2)与传统LSP算法相比,结合灰度共生矩阵算法后,得到的特征受到相似种类种子图像的影响较小,具有更广泛的适应性。因此,基于LSP和GLCM的融合算法可以有效地提取相似禾本科种子图像的纹理统计特征,采用线性判别分析分类器(LDA)进行分类,识别率最高达到98.64%。

关键词：种子识别纹理特征局部相似模式灰度共生矩阵

一种基于N-Gram改进的文本特征提取算法

[期刊] 图书情报工作 [作者] 于津凯王映雪陈怀楚

介绍一种改进的文本特征提取及匹配算法。该算法基于N-Gram算法思路进行文本处理和特征提取,设计了gram关联矩阵用于统计与合并特征词,从而在固定长度N-Gram算法的基础上能够提取出不同长度的特征词。实验证明,该特征提取算法能够更为准确地描述文本特征,可应用于文本检索、Web挖掘等信息处理领域。

关键词：文本特征提取 N-Gram算法 gram关联矩阵

基于权重的Apriori算法在文本统计特征提取方法中的应用

[期刊] 数据分析与知识发现 [作者] 李昌兵庞崇鹏李美平

【目的】解决在海量客户评论信息中抽取产品特征时噪声大的问题。【方法】运用TF-IDF和方差选择的统计方法在众多初步提取出来的特征中进行选择,设置阈值后将各自提取出来的特征取交进行过滤,得到产品特征集合,根据基于矩阵和权重改进的Apriori算法产生频繁项集,设定不同阈值得到最优特征集合,实现对用户评论中产品特征的自动提取。【结果】以手机评论文本为例,从中抽取手机类的产品特征,根据人工标注的183个特征和算法识别出来的特征,查准率P为72.44%,查全率R为77.59%,综合值F为74.93%。【局限】查准

关键词：特征提取 Apriori算法 TF-IDF 方差选择

Web文本特征提取方法的研究与发展

[期刊] 情报理论与实践 [作者] 庞景安

本文对当前有关Web文本特征提取方法的研究和试验进行了简要的综述和分析,比较了每类方法的优势和不足,指出研究中存在的难点和共同探讨的问题,并在此基础上,对该领域未来研究的发展方向和趋势进行了预测。

关键词： Web文本文本特征特征提取学习算法

基于深度学习的短文本评论产品特征提取及情感分类研究

[期刊] 情报理论与实践 [作者] 李杰李欢

[目的/意义]构建在线评论的产品特征提取及情感分类模型,可以为产品设计人员进行产品优化改进提供决策支持。[方法/过程]提出了基于卷积神经网络算法的产品特征提取及情感分类模型。模型采用卷积神经网络进行短文本评论情感分类,以情感分类标签标注相应评论中提取的产品特征词,并利用词向量对产品特征词聚类。通过爬取的笔记本电脑和手机评论对模型进行训练和测试。[结果/结论]结果表明,模型能够实现有效的产品特征提取及高准确率情感分类,是在线评论分析的有效模型。

关键词：产品特征情感分类在线评论卷积神经网络深度学习

基于改进TF-IDF特征提取的文本分类模型研究

[期刊] 情报科学 [作者] 周源刘怀兰杜朋朋廖岭

【目的/意义】特征提取会很大程度地影响分类效果,而传统TF-IDF特征提取方法缺乏对特征词上下文环境和对特征词在类之间分布状况的考虑。【方法/过程】本文提出一种改进TF-IDF特征提取的方法:(1)基于文本网络和改进Page Rank算法计算节点重要程度值,解决传统TF-IDF忽略文本结构信息的问题;(2)增加特征值IDF值的方差来衡量特征词w在不同类别文本集中程度的分布情况,解决传统TF-IDF忽略特征词在类之间分布状况的不足。【结果/结论】基于该改进方法构建了文本分类模型,对3D打印数据进行分类实验。

关键词：特征提取 TF-IDF 文本分类文本网络 Page Rank

面向新闻领域的中文文本分类研究综述

[期刊] 图书情报工作 [作者] 薛春香张玉芳

在对文本分类及中文新闻分类概述的基础上,归纳出网络新闻文本特征及当前新闻文本分类特点,并总结新闻文本分类在新闻网站分类导航、话题识别与跟踪、个性化推荐三方面的应用。其后,总结中文新闻分类存在的问题,诸如缺乏通用语料和评价方法、分类体系粗略、分类维度单一等,并提出相应措施。最后,针对当前信息环境,提出新闻分类不仅将朝着多层次、多维度、跨语言方向发展,还将与多媒体信息、大数据、社会化媒体相结合。

关键词：新闻分类文本分类机器学习中文信息处理

中文文本数字水印算法的研究

[期刊] 中南林业科技大学学报 [作者] 何岸胡伟刚

为了提高水印的鲁棒性,适应文本完整性检测的需求,很多文献提倡多组水印的冗余嵌入方法,这涉及到文本分块问题。根据中文汉字的结构,研究并提出了一种中文文本分块设计方法以及水印嵌入算法。该方法具有明显的中文文字特色,能有效提高水印的鲁棒性,提高受攻击后水印的恢复能力。

关键词：文本分块汉字结构鲁棒性

一种基于语义的中文文本分类算法

[期刊] 情报理论与实践 [作者] 赵辉刘怀亮范云杰左晓飞

针对向量空间模型中语义缺失问题,将语义词典(知网)应用到文本分类的过程中以提高文本分类的准确度。对于中文文本中的一词多义现象,提出改进的词汇语义相似度计算方法,通过词义排歧选取义项进行词语的相似度计算,将相似度大于阈值的词语进行聚类,对文本特征向量进行降维,给出基于语义的文本分类算法,并对该算法进行实验分析。结果表明,该算法可有效提高中文文本分类效果。

关键词：文本分类语义向量空间向量空间模型语义相似度算法

面向科技文献的多模态语义关联特征提取与表达体系研究

[期刊] 大学图书馆学报 [作者] 王睿佳刘耀

科技文献资源是一种多模态数据,除文本信息外,还包含丰富的图像、表格、公式、音频、视频等多种模态的信息,有利于用户充分理解科技文献资源中的知识。该文把多模态思想引入科技文献的语义表示方面,对科技文献中的图像、表格和公式信息进行语义分析,与文本信息共同表示文献语义内容,通过科技文献中多种模态信息的语义表示及相互关系完善科技文献内容的语义化表示,发展刻画科技文献对象多态性的表达体系。

关键词：多模态科技文献语义相关性语义关联特征

首页
下一页
尾页
第 页

文献操作() 导出元数据文献计量分析

全选

导出文件格式：WXtxt

作者：

删除

推荐搜索

融合语义联想和BERT的图情领域SAO短文本分类研究基于DEM的数字流域特征提取研究进展基于语义相关度的中文文本聚类方法研究基于SRTM DEM的汾河流域特征提取研究基于语义网络社团划分的中文文本分类研究基于模糊划分的自组织模糊特征提取算法研究基于语义关系的本体推理规则研究——以国共合作领域本体库为例融合语义关联挖掘的文本情感分析算法研究语法规则和改进关联规则的中文文本非等级关系提取研究 Web页面中文文本主题的自动提取研究