搜索文献-EPS

年份: 2024(6161); 2023(9057); 2022(8119); 2021(7821); 2020(6555); 2019(15262); 2018(15370); 2017(29996); 2016(16316); 2015(18356); 2014(18318); 2013(18062); 2012(16379); 2011(14671); 2010(14371); 2009(12781); 2008(12220); 2007(10396); 2006(8895); 2005(7540)

作者: 王(45965); 张(37952); 李(37681); 刘(35825); 陈(24204); 杨(18213); 晓(17121); 赵(15099); 周(14504); 华(13433); 吴(13181); 文(12599); 明(11888); 林(11883); 伟(11719); 丽(11453); 志(11410); 孙(11389); 黄(10760); 徐(10682); 玉(9470); 平(9173); 军(9020); 朱(8641); 建(8468); 郭(8453); 红(8354); 胡(8342); 春(7588); 艳(7511)

学科: 济(62028); 经济(61960); 管理(45997); 业(43135); 企(36317); 企业(36317); 方法(31216); 数学(27069); 数学方法(26769); 农(15901); 中国(15547); 财(15153); 学(14085); 业经(13674); 地方(12943); 理论(11020); 和(10803); 贸(10798); 贸易(10792); 农业(10725); 易(10466); 技术(10208); 环境(10082); 制(9831); 务(9749); 财务(9692); 财务管理(9674); 教育(9198); 企业财务(9159); 划(8833)

机构: 大学(225462); 学院(222549); 管理(93476); 济(84126); 经济(82193); 理学(81947); 理学院(81065); 管理学(79687); 管理学院(79288); 研究(71448); 中国(51375); 京(48206); 科学(46441); 财(36944); 所(35111); 业大(34724); 农(34073); 研究所(32406); 中心(32277); 江(30434); 北京(30406); 财经(30339); 范(29814); 师范(29572); 经(27681); 农业(26690); 院(26298); 州(25399); 师范大学(24092); 经济学(24030)

基金: 项目(160883); 科学(125950); 研究(118030); 基金(116311); 家(100945); 国家(100121); 科学基金(86384); 社会(72245); 社会科(68401); 社会科学(68382); 基金项目(63046); 省(62761); 自然(57464); 自然科(56106); 自然科学(56095); 自然科学基金(55055); 教育(53702); 划(52865); 编号(48987); 资助(47656); 成果(39134); 重点(35257); 部(35059); 发(33608); 创(33461); 课题(32678); 创新(31092); 科研(30882); 项目编号(30704); 大学(30068)

期刊: 济(88033); 经济(88033); 研究(63550); 中国(38019); 学报(36469); 管理(33019); 科学(33014); 农(30417); 大学(27450); 财(26378); 教育(25854); 学学(25507); 农业(21837); 技术(19356); 融(15276); 金融(15276); 图书(14996); 业经(14706); 财经(13757); 经济研究(13584); 理论(12299); 科技(11818); 实践(11634); 践(11634); 问题(11523); 经(11510); 情报(11263); 业(10648); 技术经济(10648); 现代(10163)

全选本页取消本页

共检索到310708条记录

发布时间倒序

发布时间倒序
相关度优先

文献计量分析

结果分析(前20)
结果分析(前50)
结果分析(前100)
结果分析(前200)
结果分析(前500)

Web页面中文文本主题的自动提取研究

[期刊] 情报学报 [作者] 韩客松王永成滕伟

Internet上的内容日益增多 ,搜索引擎返回的结果往往冗长。本文首先讨论Web页面文本与一般文本的四个不同点 ,然后介绍一种以统计方法为主、以匹配校验为辅的Web页面中文文本主题自动提取方法 ,它能帮助用户在最短时间内了解当前页面的主题。实验显示 ,所提取的前15个字串 ,反映主题的平均正确率在 85%以上 ,而处理时间仅为几十到几百毫秒。

关键词： Web页面文本主题抽取　加权

一种中文文本自动分类方法的研究

[期刊] 情报理论与实践 [作者] 尹桂秀

This article introduces a Chinese text automatic classification method,including its principle and classification process.The article focuses on some key theoretical problems,such as word classification,keyword collection and keyword matching.

关键词： text mining data mining automatic classificatin

中文文献主题的自动标引

[期刊] 情报学报 [作者] 王永成顾晓明王丽霞

本文介绍了上海交通大学电脑应用技术研究所开发的中文文献主题自动标引系统ＣＳＡＩＳ２．１的主要思路、基本算法及其基本结构

关键词：自动标引,中文文献,主题词

基于领域本体的中文Web文本主题特征抽取方法

[期刊] 情报理论与实践 [作者] 朱恒民马静黄卫东

为了快速有效地自动处理中文Web文本,提出了一种基于领域本体的主题特征抽取方法。该方法针对Web文本特点,介绍了一种领域词典的半自动化构建方法。基于领域词典切分文本,通过对词条的主题映射,采用领域本体的概念表示文本向量,从而有效地降低文本特征向量的维数,提高主题抽取的质量。考虑文本信息的不同位置与频率,计算主题特征的权值,并且基于领域本体的结构,对主题概念的权值进行调整和排序。实例验证了该方法的有效性。

关键词：主题抽取领域本体文本挖掘

语法规则和改进关联规则的中文文本非等级关系提取研究

[期刊] 图书情报工作 [作者] 余凡程虹楼雯

针对目前适用于中文文本非等级关系提取方法偏少以及关联规则筛选方法忽略了集中出现在部分文本集中的领域词汇关系的问题,通过对中文文本的统计分析,尝试定义一套中文非等级关系提取的规则,同时提出一种加入平均值变量的改进的关联规则。实践证明,基于自定义的语法规则提取方法能够有效地从中文文本中提取出主、谓、宾语,进而提取出非等级关系,改进的关联规则方法能够提取出集中出现在部分文本集中的领域词汇非等级关系。

关键词：非等级关系提取语法规则关联规则中文文本

基于网页规划布局的页面主题内容抽取

[期刊] 情报理论与实践 [作者] 聂卉张津华

以净化网页、提取网页主题内容为目标,提出一个基于网页规划布局的网页主题内容抽取算法。该算法依据原始网页的规划布局,通过构造标签树为网页分块分类,进而通过计算内容块的主题相关度,辨别网页主题,剔除不相关信息,提取网页主题内容。实验表明,算法适用于主题型网页的"去噪"及内容提取,具体应用中有较理想的表现。

关键词：网页信息抽取主题分析

基于字频向量的中文文本自动分类系统

[期刊] 情报学报 [作者] 王梦云曹素青

本文提出了一种根据汉字统计特性和基于实例映射的中文文本自动分类方法。该方法采用汉字字频向量作为文本的表示方法。它的显著特点是引入线性最小二乘方估计技术建立文本分类器模型 ,通过对训练集语料的手工分类标引以及对文本和类别间的相关性判定的学习 ,实现了基于全局最小错误率的汉字—类别两个向量空间的映射函数 ,并用该函数对测试文本进行分类。

关键词：文本分类中文自动分类字频向量映射函数语料库汉字

中文文献自动分类研究

[期刊] 情报学报 [作者] 王永成张坤

本文对作者开发的两个中文文献自动分类系统的工作原理、方法、数学模型和实现技术进行了比较全面的介绍。

关键词：自动分类,仿人算法,情报语言学,原理,实现技术

专利文本主题建模中领域停用词自动选取研究

[期刊] 图书情报工作 [作者] 俞琰赵乃瑄

[目的 /意义]针对专利文本主题建模中领域停用词自动选取尚未有充分研究的问题,提出一种新的领域停用词自动选取方法,用于专利文本主题模型分析,以提高专利主题模型的区分度与建模质量。[方法 /过程]领域停用词本质上是信息比较少,在不同类别专利文本中区分度低的词。因此,引入辅助专利文本集,使用类别熵衡量词的分布情况,然后依据词的类别熵进行排序,选取类别熵最大的若干词作为领域停用词。[结果 /结论]实验通过专利文本数据,验证了该方法的可行性与有效性,能够有效地提高专利主题模型的区分度。

关键词：专利文本主题建模领域停用词自动选取

基于隐含狄利克雷分布的文本主题提取对比研究

[期刊] 情报科学 [作者] 王静茹陈震

【目的/意义】目前LDA模型在文本数据挖掘方法中占有重要的地位,已成为数据挖掘领域的研究热点。为了进一步提高LDA模型在文本挖掘中的应用效果,有必要对LDA模型文本主题提取效果进行对比研究。【方法/过程】本文提出了一种基于LDA模型的不同类型文本数据主题提取效果对比评价方法,先通过LDA模型对文本数据进行主题挖掘;再通过定量的主题提取效果评价方法进行对比研究。【结果/结论】本文以期刊论文、网络舆情事件话题、微博文本、调查问卷为文本数据源,实验结果表明LDA模型在处理语义信息明确逻辑关系合理的长文本数据时,

关键词：文本挖掘 LDA模型主题提取效果评价方法

融合领域本体的中文文本语义特征提取算法研究

[期刊] 情报理论与实践 [作者] 何超张玉峰

针对传统的中文文本特征提取算法存在的语义丢失和语义缺乏问题,设计了融合领域本体的中文文本语义特征提取算法。该算法利用基于种子—扩展机制的关键词识别与提取算法解决传统算法中利用分词工具进行关键词提取所产生的语义丢失问题;利用基于领域本体的文本概念特征语义映射与聚合算法解决传统算法中利用向量空间模型进行文本表示所产生的高维和语义缺乏问题。实验结果表明,该算法取得了很好的预期效果,能够显著提高文本特征提取的深度和准确性。

关键词：文本语义特征领域本体算法

面向新闻领域的中文文本分类研究综述

[期刊] 图书情报工作 [作者] 薛春香张玉芳

在对文本分类及中文新闻分类概述的基础上,归纳出网络新闻文本特征及当前新闻文本分类特点,并总结新闻文本分类在新闻网站分类导航、话题识别与跟踪、个性化推荐三方面的应用。其后,总结中文新闻分类存在的问题,诸如缺乏通用语料和评价方法、分类体系粗略、分类维度单一等,并提出相应措施。最后,针对当前信息环境,提出新闻分类不仅将朝着多层次、多维度、跨语言方向发展,还将与多媒体信息、大数据、社会化媒体相结合。

关键词：新闻分类文本分类机器学习中文信息处理

运用图示法自动提取中文专利文本的语义信息

[期刊] 图书情报工作 [作者] 姜春涛

［目的／意义］提出利用图结构的表示法自动挖掘中文专利文本的语义信息，以为基于文本内容的专利智能分析提供语义支持。［方法／过程］设计两种运用图结构的模型：１基于关键词的文本图模型；２基于依存关系树的文本图模型。第一种图模型通过计算关键词之间的相似性关系来定义；第二种图模型则由句中所提取的语法关系来定义。在案例研究中，借助频繁子图挖掘算法，对所建图模型进行子图挖掘，并构建以子图为特征的文本分类器，用来检测所建图模型的表达性和有效性。［结果／结论］将所建的基于图模型的文本分类器应用于４个不同技术领域的专利文本数据集，并与经典文本分类器的测试结果相比较而知：前者在使用明显较少的特征数的基础上，分类性能．．．

关键词：图示法专利信息提取频繁子图挖掘专利分类

中文文献自动分类研究概述

[期刊] 情报理论与实践 [作者] 叶新明

概要性地论述了中文文献自动分类的问题，提出了中文文献自动分类的一般模式，同时也分析了要实现中文文献自动分类目前所面临的一些实际问题。

关键词：自动分类自动抽词自动标引

中文文本分类反馈学习研究

[期刊] 情报理论与实践 [作者] 刘怀亮张治国赵捧未

本文依据反馈学习的思想和支持向量机分类算法,在分析中文文本分类过程的基础上,给出了基于反馈学习的中文文本分类模型,通过实验研究了反馈学习对中文文本分类模型性能的影响。结果表明,反馈学习对分类性能的提高有明显作用,它是对实时变化信息的有效解决方法。

关键词：反馈学习支持向量机文本分类

首页
下一页
尾页
第 页

文献操作() 导出元数据文献计量分析

全选

导出文件格式：WXtxt

作者：

删除

推荐搜索

基于统计的中文文本分类研究中文文本数字水印算法的研究一个中文文本自动分类数学模型基于多特征融合的中文文本关键词提取方法面向领域中文文本信息处理的术语识别与抽取研究综述基于局部线性判别嵌入算法的中文文本分类研究基于语义相关度的中文文本聚类方法研究中文文本聚类常用停用词表对比研究基于语义网络社团划分的中文文本分类研究基于序列比对算法的中文文本相似度计算研究