标题
  • 标题
  • 作者
  • 关键词
登 录
当前IP:忘记密码?
年份
2024(918)
2023(1415)
2022(1227)
2021(1204)
2020(1091)
2019(2289)
2018(2444)
2017(4670)
2016(2313)
2015(2785)
2014(2759)
2013(2675)
2012(2483)
2011(2199)
2010(2218)
2009(2137)
2008(2387)
2007(2112)
2006(1867)
2005(1739)
作者
(7540)
(6149)
(6062)
(5850)
(3947)
(2968)
(2946)
(2409)
(2376)
(2346)
(2203)
(2066)
(1957)
(1936)
(1931)
(1866)
(1847)
(1816)
(1793)
(1745)
(1614)
(1569)
(1496)
(1456)
(1432)
(1413)
(1397)
(1284)
(1267)
(1239)
学科
管理(11121)
(8343)
经济(8338)
(8298)
(7889)
企业(7889)
方法(4354)
(4337)
(3881)
财务(3872)
财务管理(3869)
企业财务(3683)
信息(3482)
数学(3392)
数学方法(3286)
业经(2971)
理论(2627)
(2485)
(2466)
(2084)
工作(2027)
技术(2014)
(1940)
产业(1740)
总论(1661)
信息产业(1635)
图书(1602)
中国(1547)
书馆(1507)
图书馆(1507)
机构
大学(38028)
学院(35944)
管理(15944)
理学(12995)
理学院(12879)
管理学(12608)
管理学院(12531)
(10220)
经济(9904)
研究(9480)
(8471)
中国(7920)
信息(6848)
科学(6554)
(6376)
中心(5659)
(5521)
图书(5497)
北京(5258)
书馆(5239)
图书馆(5238)
业大(5058)
财经(4983)
(4806)
(4699)
(4695)
师范(4655)
(4605)
(4412)
技术(4309)
基金
项目(23173)
科学(17683)
研究(17188)
基金(16696)
(14440)
国家(14345)
科学基金(12548)
社会(10003)
社会科(9460)
社会科学(9457)
基金项目(8734)
编号(8483)
(8337)
自然(8256)
成果(8213)
自然科(8081)
自然科学(8079)
自然科学基金(7943)
教育(7171)
(6980)
项目编号(6697)
资助(6643)
(5325)
研究成果(4955)
重点(4515)
(4478)
信息(4405)
科研(4403)
(4379)
大学(4336)
期刊
(9863)
经济(9863)
图书(9157)
研究(7949)
学报(7392)
情报(7126)
中国(6981)
(6761)
书馆(5997)
图书馆(5997)
管理(4888)
大学(4805)
科学(4402)
学学(4072)
理论(3793)
实践(3715)
(3715)
(3492)
技术(3144)
财会(3079)
教育(3046)
会计(2808)
财经(2444)
农业(2363)
(2361)
金融(2361)
(2303)
论坛(2303)
工作(2202)
情报工作(2128)
共检索到56259条记录
发布时间倒序
  • 发布时间倒序
  • 相关度优先
文献计量分析
  • 结果分析(前20)
  • 结果分析(前50)
  • 结果分析(前100)
  • 结果分析(前200)
  • 结果分析(前500)
[期刊] 图书情报工作  [作者] 姜春涛  
[目的/意义]提出利用图结构的表示法自动挖掘中文专利文本的语义信息,以为基于文本内容的专利智能分析提供语义支持。[方法/过程]设计两种运用图结构的模型:1基于关键词的文本图模型;2基于依存关系树的文本图模型。第一种图模型通过计算关键词之间的相似性关系来定义;第二种图模型则由句中所提取的语法关系来定义。在案例研究中,借助频繁子图挖掘算法,对所建图模型进行子图挖掘,并构建以子图为特征的文本分类器,用来检测所建图模型的表达性和有效性。[结果/结论]将所建的基于图模型的文本分类器应用于4个不同技术领域的专利文本数据集,并与经典文本分类器的测试结果相比较而知:前者在使用明显较少的特征数的基础上,分类性能...
[期刊] 情报学报  [作者] 韩客松  王永成  滕伟  
Internet上的内容日益增多 ,搜索引擎返回的结果往往冗长。本文首先讨论Web页面文本与一般文本的四个不同点 ,然后介绍一种以统计方法为主、以匹配校验为辅的Web页面中文文本主题自动提取方法 ,它能帮助用户在最短时间内了解当前页面的主题。实验显示 ,所提取的前15个字串 ,反映主题的平均正确率在 85%以上 ,而处理时间仅为几十到几百毫秒。
[期刊] 情报理论与实践  [作者] 何超  张玉峰  
针对传统的中文文本特征提取算法存在的语义丢失和语义缺乏问题,设计了融合领域本体的中文文本语义特征提取算法。该算法利用基于种子—扩展机制的关键词识别与提取算法解决传统算法中利用分词工具进行关键词提取所产生的语义丢失问题;利用基于领域本体的文本概念特征语义映射与聚合算法解决传统算法中利用向量空间模型进行文本表示所产生的高维和语义缺乏问题。实验结果表明,该算法取得了很好的预期效果,能够显著提高文本特征提取的深度和准确性。
[期刊] 情报理论与实践  [作者] 杨宏章  付静  
文章从利用专利文本结构化特征的角度提出一种构建专利信息智能语义检索系统的方法,并给出了影响专利检索系统中检索结果相关度的因素。同时,本文还给出了采用计算机通过位置判定和字面相似度匹配的方式对专利文献进行结构化数据加工的方法。
[期刊] 情报理论与实践  [作者] 杨宏章  付静  
关键词:
[期刊] 情报学报  [作者] 张永奎  
从文本中抽取信息的过程可粗略地分解为文本分析和信息抽取两个阶段。我们开发了一个原型系统,可以把一个自由文本转换成一个结构化的文本表示,然后就可用于自动建立数据库,以用于信息检索系统。该系统采用了基于结构化关键词的文本分析方法,并用一个结构模板指定描述部位和控制信息的抽取。
[期刊] 图书情报工作  [作者] 孟令恩  李颖  何彦青  屈鹏  王惠临  
主题自动提取对于专利文献的信息挖掘具有重要的意义。引入语义角色标注信息来辅助自动提取专利文献主题,区别于已有的专利文本分析平台所采用的人工标注或模板方式。为了改善专利文献的语义角色标注,首先描述将专利文献长句自动拆分成简化句的方法;其次,对简化句进行语义角色标注;最后,综合利用简化句语义信息以及自建带语义框架的常用词表,对专利文献进行主题信息抽取,获得必要信息,从而证实本研究的实用价值。
[期刊] 情报学报  [作者] 王梦云  曹素青  
本文提出了一种根据汉字统计特性和基于实例映射的中文文本自动分类方法。该方法采用汉字字频向量作为文本的表示方法。它的显著特点是引入线性最小二乘方估计技术建立文本分类器模型 ,通过对训练集语料的手工分类标引以及对文本和类别间的相关性判定的学习 ,实现了基于全局最小错误率的汉字—类别两个向量空间的映射函数 ,并用该函数对测试文本进行分类。
[期刊] 情报理论与实践  [作者] 尹桂秀  
This article introduces a Chinese text automatic classification method,including its principle and classification process.The article focuses on some key theoretical problems,such as word classification,keyword collection and keyword matching.
[期刊] 图书情报工作  [作者] 谷俊  
为充分发挥知识组织在企业专利战略中的作用,在分析专利文献的基础上,根据中文专利文献句法描述的特点,利用最大串频匹配、蚁群聚类、多层KMeans聚类、改进关联规则计算、基于规则和CRFs的术语关系抽取等算法,设计出一套领域本体的半自动构建系统,包括术语抽取、分类关系抽取、非分类关系抽取、本体形式化等模块,初步实现结构化数据和非结构化文本的本体半自动构建。
[期刊] 情报理论与实践  [作者] 缪建明  贾广威  张运良  
随着我国专利申请数量的迅猛发展,对受理专利实现快速分类的需求也越来越迫切。作为专业性知识极强的科技文献,专利自动分类的正确率远高于普通文本的分类效果。基于专利摘要进行快速自动分类的方法,充分考虑专利类别的层次结构特性,建立不同层次的类别特征中心向量,采用经典的类中心向量分类算法实现专利的快速自动分类。实验结果表明:该方法在专利不同层次上的分类效果明显,时效性大大提高,能够满足专利快速分类的实际需求。
[期刊] 中国远程教育  [作者] 江婷  赵呈领  谈国栋  
本文通过分析Microsoft Office PowerPoint课件结构,提出了一个专用于PowerPoint课件文本信息提取的对象模型,并在该模型的基础上,利用Visual Basic语言开发了一个PowerPoint课件文本信息提取系统。通过该系统实现了对PowerPoint课件文本信息的有效提取,对于建立基于内容的PowerPoint课件检索模型提供了基础。本文重点阐述了两个关键技术环节:PowerPoint课件文本信息对象模型的建立,PowerPoint课件文本信息提取算法的设计与实现。
[期刊] 图书情报工作  [作者] 尹丽英  赵捧未  
为减少一词多义现象及训练样本的类偏斜问题对分类性能的影响,提出一种基于语义网络社团划分的中文文本分类算法。通过维基百科知识库对文本特征词进行消歧,构建出训练语义复杂网络以表示文本间的语义关系,再次结合节点特性采用K-means算法对训练集进行社团划分以改善类偏斜问题,进而查找待分类文本的最相近社团并以此为基础进行文本分类。实验结果表明,本文所提出的中文文本分类算法是可行的,且具有较好的分类效果。
[期刊] 情报理论与实践  [作者] 赵辉  刘怀亮  范云杰  左晓飞  
针对向量空间模型中语义缺失问题,将语义词典(知网)应用到文本分类的过程中以提高文本分类的准确度。对于中文文本中的一词多义现象,提出改进的词汇语义相似度计算方法,通过词义排歧选取义项进行词语的相似度计算,将相似度大于阈值的词语进行聚类,对文本特征向量进行降维,给出基于语义的文本分类算法,并对该算法进行实验分析。结果表明,该算法可有效提高中文文本分类效果。
[期刊] 情报理论与实践  [作者] 杜坤  刘怀亮  王帮金  
[目的/意义]在基于向量空间模型的文本聚类中,文本相似度计算忽略特征项间语义关联,针对此问题,提出一种改进的语义文本相似度计算方法。[方法/过程]新方法利用维基百科知识库计算语义相关度,结合特征项在文本中的表示权重,构造文本相似度语义加权因子,并进行K-means文本聚类实验。[结果/结论]与传统的余弦相似度相比,改进后的语义文本相似度应用在文本聚类上,能有效提高聚类的准确度。[局限]语义相关度的计算没有对词语进行消歧处理。
文献操作() 导出元数据 文献计量分析
导出文件格式:WXtxt
作者:
删除