搜索文献-EPS

年份: 2024(6098); 2023(8947); 2022(8016); 2021(7665); 2020(6421); 2019(15001); 2018(15010); 2017(29253); 2016(15865); 2015(18015); 2014(18012); 2013(17899); 2012(16197); 2011(14571); 2010(14333); 2009(12826); 2008(12314); 2007(10384); 2006(8949); 2005(7571)

作者: 王(45716); 张(37673); 李(37420); 刘(35522); 陈(24033); 杨(18107); 晓(16975); 赵(14979); 周(14363); 华(13343); 吴(13062); 文(12484); 林(11842); 明(11801); 伟(11645); 丽(11450); 志(11308); 孙(11229); 徐(10642); 黄(10631); 玉(9389); 平(9138); 军(8986); 朱(8574); 红(8414); 郭(8393); 建(8369); 胡(8246); 春(7516); 艳(7468)

学科: 济(60550); 经济(60485); 管理(46662); 业(43423); 企(37395); 企业(37395); 方法(30757); 数学(26222); 数学方法(25862); 农(15236); 学(15040); 中国(14602); 财(14145); 业经(13749); 地方(12438); 理论(11607); 和(11475); 技术(11427); 农业(10289); 贸(10276); 贸易(10272); 易(9958); 环境(9607); 务(9446); 财务(9387); 财务管理(9372); 制(9317); 教育(9208); 划(9167); 企业财务(8888)

机构: 大学(224639); 学院(221917); 管理(94165); 理学(82637); 济(82027); 理学院(81760); 管理学(80317); 经济(80085); 管理学院(79929); 研究(70208); 中国(49811); 京(47998); 科学(46067); 财(35716); 所(34622); 业大(34395); 农(33433); 研究所(31989); 中心(31576); 江(30357); 北京(30141); 范(30104); 师范(29862); 财经(29627); 经(26930); 农业(26134); 院(25653); 州(25526); 师范大学(24261); 技术(23686)

基金: 项目(159934); 科学(125466); 研究(117129); 基金(115778); 家(100449); 国家(99608); 科学基金(86118); 社会(71379); 社会科(67573); 社会科学(67555); 基金项目(62667); 省(62301); 自然(57564); 自然科(56215); 自然科学(56204); 自然科学基金(55173); 教育(53300); 划(52556); 编号(48948); 资助(47568); 成果(39492); 重点(34943); 部(34630); 创(33377); 发(33094); 课题(32429); 创新(30979); 项目编号(30854); 科研(30631); 大学(29732)

期刊: 济(85043); 经济(85043); 研究(62240); 中国(37182); 学报(35827); 管理(33296); 科学(33050); 农(29614); 大学(26677); 教育(25853); 财(25046); 学学(24720); 农业(21395); 技术(19497); 图书(16858); 融(14332); 金融(14332); 业经(14310); 财经(13207); 经济研究(12865); 理论(12483); 科技(12190); 情报(12135); 实践(11842); 践(11842); 经(11037); 问题(10998); 书馆(10983); 图书馆(10983); 技术经济(10740)

全选本页取消本页

共检索到307098条记录

发布时间倒序

发布时间倒序
相关度优先

文献计量分析

结果分析(前20)
结果分析(前50)
结果分析(前100)
结果分析(前200)
结果分析(前500)

结合语义知识的藏文网页主题句抽取算法研究

[期刊] 图书馆理论与实践 [作者] 艾金勇

通过分析总结藏文网页的结构特征,在借鉴汉语主题句抽取方法的基础上,提出了结合语义信息的藏文网页主题句抽取算法。该方法根据藏文文本特征实现了网页内容的智能识别,同时,在对识别的文本块进行自动分词后,利用改进TF-IDF方法结合主题词的语义相关性确定了网页文本的主题词,并据此构建了候选主题句集,再通过候选主题句的重要度和分布度计算得到了候选主题句的权值。最后对所有候选主题句按权值大小排序并确定了文本的主题句。

关键词：藏文网页语义信息主题句抽取

融合语义知识的藏文网页关键词提取方法研究

[期刊] 图书馆学研究 [作者] 艾金勇

文章归纳整理了藏文网页的结构特征,在借鉴中英文关键词抽取方法的基础上,设计实现了融合语义知识的藏文网页关键词抽取算法。该算法利用藏文文本特征实现了网页内容模块的智能识别,在对识别的文本块进行自动分词后,采用改进的TF-IDF算法得到基础词集,然后根据词向量特征进行基础词的语义扩展构建候选关键词集,最后利用候选关键词之间的语义相关度值,确立藏文网页的关键词。藏文网页的实验测试结果表明该方法提取的藏文网页关键词具有较高的准确率。

关键词：藏文网页 TF-IDF 语义扩展关键词抽取

基于网页规划布局的页面主题内容抽取

[期刊] 情报理论与实践 [作者] 聂卉张津华

以净化网页、提取网页主题内容为目标,提出一个基于网页规划布局的网页主题内容抽取算法。该算法依据原始网页的规划布局,通过构造标签树为网页分块分类,进而通过计算内容块的主题相关度,辨别网页主题,剔除不相关信息,提取网页主题内容。实验表明,算法适用于主题型网页的"去噪"及内容提取,具体应用中有较理想的表现。

关键词：网页信息抽取主题分析

全自动生成网页信息抽取包装器的主要技术方法研究

[期刊] 情报理论与实践 [作者] 李广建乔建忠

网页信息抽取包装器的生成方法很多,按自动化程度可分为手工、半自动和全自动三类,本文旨在研究全自动生成网页信息抽取包装器的主要技术方法,首先构建了对应的分类体系;其次对近年来主流的15种包装器生成技术进行了定性分析和分类比较;最后提出5点发展趋势。

关键词：信息抽取包装器信息技术深层网

基于文档对象模型与行块分布算法的网页信息抽取

[期刊] 情报理论与实践 [作者] 高庆宁吴鹏张晶晶

［目的］网页所表达的主要信息通常隐藏在大量无关的结构和内容中，使用户不能迅速获取主题内容，限制了网页资源的可用性，使用信息抽取技术解决了这一问题。［方法］基于文档对象模型（ＤＯＭ）的信息抽取技术能够简单准确地从网页中提取所需内容，但依靠网页本身结构；基于行块分布算法的技术摆脱网页结构的限制，克服限定数据源的缺点，但需要人工干预，文章结合ＤＯＭ技术和行块分布算法以及正则表达式，实现网页信息采集与信息抽取。［结论］能够自动准确提取网页信息。［局限］对英文以及结构复杂的网页抽取效果不是很理想，抽取内容仅限于文字。

关键词：文档对象模型算法网页信息抽取

一种基于网页信息抽取的OA期刊资源采集方法研究

[期刊] 数字图书馆论坛 [作者] 黄政张学福

本文结合开放获取期刊(Open Access Journal,OA期刊)资源特点,针对无法通过OAI-PMH协议进行资源采集的OA期刊,提出一种基于网页信息抽取的资源采集策略。本文从网页资源描述的角度总结OA期刊资源特点并对其分类。基于网页信息抽取方法在OA期刊资源采集适用性,提出一种基于OA期刊网页元数据抽取的采集方法,并在此方法的基础上设计了采集系统。通过对国内外不遵循OAI-PMH协议的10本OA期刊的网站实证采集,得到45 785篇论文的元数据,证明该采集方法能有效地应用于此类资源采集。研究丰富了

关键词： OA期刊 OA期刊资源采集网页信息采集 OA期刊资源采集系统

植物物种多样性语义知识抽取研究

[期刊] 数据分析与知识发现 [作者] 刘建华王颖张智雄李传席

【目的】拓展以物种为中心的植物物种多样性抽取框架,探索实现语义知识抽取方法。【方法】结合当前生物多样性抽取的主流研究,以物种为中心,设计包含多种实体及实体间关系的知识抽取框架,利用已有的众多专业数据库,设计并实现相应的识别方法。【结果】设计以物种为核心的知识抽取框架,探索实现多种实体及实体间关系的语义知识抽取方法,拓展植物物种多样性领域抽取内容和思路。【局限】实体识别的完整性和准确性受底层知识库影响较大,且实体间关系的类型局限于共现、上下位类、语法关系几类,还需进一步研究。【结论】本研究拓展了植物物种多样

关键词：植物物种多样性植物物种知识抽取关系识别

基于改进TF-IDF的中文网页关键词抽取——以新闻网页为例

[期刊] 情报理论与实践 [作者] 钱爱兵江岚

结合新闻网页的内容特征对中文网页关键词的构成特点进行阐述;对经典的TF-IDF加权公式进行改进,构建一个综合考虑多种影响因素的候选关键词评分加权公式;对SharpICTCLAS分词进行改进,增加位置标注;选择评分较高的词作为候选关键词,利用词的位置标注进行关键词抽取优化操作,将"切碎"的候选关键词进行组配,形成正式抽取的关键词。实验结果表明:该方法明显优于基准方法,能够抽取到令人满意的关键词。

关键词：词频逆文档频率新闻网页关键词抽取

基于引文的科技文献主题抽取研究

[期刊] 情报理论与实践 [作者] 张思凤梁梦丽曹高辉

[目的/意义]主题抽取的效果对于信息检索、自动标引、自然语言处理具有重要的价值,提高主题抽取的效果,既能改善检索系统主题检索准确性,又能够帮助学者更加高效地了解文献的主要思想。文章研究并探讨了从引用内容中抽取文献主题的有效性。[方法/过程]选取自然语言处理领域文献为研究对象,利用文献之间的引用与被引用关系抽取引用内容,进行分词并计算权重;将引用内容、全文抽取的候选词进行专家打分评价效果并将其与关键词对比,使用F值评价两种语料库抽取候选词的优劣。[结果/结论]通过专家打分及计算F值,发现引用内容在抽取候选词

关键词：科技文献引文主题抽取关键词

基于情感语义特征抽取的在线评论有用性分类算法与应用

[期刊] 数据分析与知识发现 [作者] 张艳丰李贺彭丽徽侯力铁

【目的】针对中文网络平台在线评论,提出一种用于过滤用户评论的有用性排序和分类模型,辅助消费者做出购买决策。【方法】从在线评论情感语义的形式特征和内容特征两个方面,提取影响在线评论有用性的6个指标属性进行量化计算,采用灰色加权关联度分析方法构建在线评论有用性评价体系,通过K-means聚类方法,构建过滤用户在线评论的有用性分类模型。【结果】以亚马逊电子商务平台的手机在线评论为例,通过计算召回率、准确率与F值,验证了本文在线评论有用性分类算法的有效性。实验结果表明本方法能够有效辨别在线评论有用性,尤其对极性评

关键词：灰色加权关联度在线评论分类模型有用性

基于领域本体的Web信息抽取方法的设计与实现——以网易汽车资讯网页信息抽取为例

[期刊] 图书馆论坛 [作者] 吴恒亮

以网易汽车资讯网页信息抽取为例,研究了基于领域本体的Web信息抽取技术的设计与实现。

关键词： Web信息抽取领域本体 Web数据挖掘

基于专家主页的信息源相关信息及关系抽取研究

[期刊] 情报理论与实践 [作者] 李天阳王新

关键词：

基于WMD语义相似度的TextRank改进算法识别论文核心主题句研究

[期刊] 数据分析与知识发现 [作者] 王子璇乐小虬何远标

【目的】自动甄别科技论文中描述研究主题的关键语句。【方法】以论文小节为单位组织句子集,通过训练领域词向量计算句子间WMD距离得到相应语义相似度,优化Text Rank算法迭代过程,利用外部特征对所得权值进行调整,按句子权值降序选取关键主题句。【结果】以气候变化领域科技论文作为实验数据,以人工标注的结果为基准对本文的算法和传统的Text Rank算法进行对比实验,初步结果表明该方法的识别效果(F值)比传统Text Rank算法提升约5%。【局限】句子特征提取有待提高,词向量训练及方法中的相关参数需要做进一步

关键词： WMD TextRank 语义相似主题句识别外部特征

基于词句重要性的中文专利关键词自动抽取研究

[期刊] 情报理论与实践 [作者] 王志宏过弋

[目的/意义]专利关键词是对专利核心内容的概括,高效准确地抽取专利关键词不仅可以辅助人们对专利的快速查找,同时对专利分类、聚类、翻译等具有重要意义。[方法/过程]提出了"关键词在关键句中"的关键词抽取新思路。首先构建了一个联合句网络语义图特征和启发式规则特征的专利摘要句排序模型,然后仅选择Top-KS%的句子参与关键词计算,同时将句子语义权重参数引入到关键词权重计算过程中,从而使得句子的重要性传递到句中的词上。[结果/结论]在真实中文专利数据集中实验表明,从中文专利中选择适当比例关键句参与关键词抽取计算,相较于传统关键词抽取算法F值提升了6%～13%左右,有效地降低原始文档的噪声数据,提升了关键词抽取的效果。

关键词：中文专利关键句句排序专利关键词自动抽取

Web网页识别算法研究

[期刊] 情报学报 [作者] 韩彬斌王培康

WWW上的文本信息挖掘工作是网络信息处理领域的新课题。本文研究了两种机器学习算法———Rocchio算法和Widrow Hoff算法在Web网页识别领域中的应用 ,并对几种网页识别算法进行了比较分析

关键词：特征提取机器学习 WWW 网页识别

首页
下一页
尾页
第 页

文献操作() 导出元数据文献计量分析

全选

导出文件格式：WXtxt

作者：

删除

推荐搜索

以分类主题抽取为视角的学科主题挖掘——基于LDA模型的国外知识流研究结构探讨面向科技文献的混合语义信息抽取方法研究基于语义文本图的论文摘要关键词抽取算法理论术语抽取的深度学习模型及自训练算法研究 Deep Web信息抽取研究基于汉语框架的网络事件抽取及相关算法研究吐蕃藏文金石铭刻知识图谱构建研究融合统计学习和语义过滤的ADR信号抽取模型构建研究基于XML平台的知识元表示与抽取研究基于知识元抽取的中文智库成果描述规则研究