- 年份
- 2024(6098)
- 2023(8947)
- 2022(8016)
- 2021(7665)
- 2020(6421)
- 2019(15001)
- 2018(15010)
- 2017(29253)
- 2016(15865)
- 2015(18016)
- 2014(18012)
- 2013(17900)
- 2012(16197)
- 2011(14571)
- 2010(14333)
- 2009(12826)
- 2008(12314)
- 2007(10384)
- 2006(8949)
- 2005(7571)
- 学科
- 济(60552)
- 经济(60487)
- 管理(46662)
- 业(43423)
- 企(37395)
- 企业(37395)
- 方法(30759)
- 数学(26224)
- 数学方法(25864)
- 农(15236)
- 学(15040)
- 中国(14602)
- 财(14145)
- 业经(13749)
- 地方(12438)
- 理论(11607)
- 和(11475)
- 技术(11427)
- 农业(10289)
- 贸(10276)
- 贸易(10272)
- 易(9958)
- 环境(9607)
- 务(9446)
- 财务(9387)
- 财务管理(9372)
- 制(9317)
- 教育(9208)
- 划(9167)
- 企业财务(8888)
- 机构
- 大学(224641)
- 学院(221918)
- 管理(94165)
- 理学(82637)
- 济(82029)
- 理学院(81760)
- 管理学(80317)
- 经济(80087)
- 管理学院(79929)
- 研究(70210)
- 中国(49811)
- 京(47998)
- 科学(46067)
- 财(35716)
- 所(34623)
- 业大(34395)
- 农(33433)
- 研究所(31989)
- 中心(31578)
- 江(30357)
- 北京(30141)
- 范(30104)
- 师范(29862)
- 财经(29627)
- 经(26930)
- 农业(26134)
- 院(25653)
- 州(25526)
- 师范大学(24261)
- 技术(23686)
- 基金
- 项目(159936)
- 科学(125468)
- 研究(117131)
- 基金(115780)
- 家(100451)
- 国家(99610)
- 科学基金(86120)
- 社会(71381)
- 社会科(67575)
- 社会科学(67557)
- 基金项目(62667)
- 省(62301)
- 自然(57566)
- 自然科(56217)
- 自然科学(56206)
- 自然科学基金(55175)
- 教育(53301)
- 划(52557)
- 编号(48948)
- 资助(47570)
- 成果(39493)
- 重点(34943)
- 部(34631)
- 创(33377)
- 发(33094)
- 课题(32429)
- 创新(30979)
- 项目编号(30854)
- 科研(30631)
- 大学(29734)
- 期刊
- 济(85044)
- 经济(85044)
- 研究(62241)
- 中国(37182)
- 学报(35827)
- 管理(33296)
- 科学(33050)
- 农(29614)
- 大学(26677)
- 教育(25853)
- 财(25047)
- 学学(24720)
- 农业(21395)
- 技术(19497)
- 图书(16858)
- 融(14332)
- 金融(14332)
- 业经(14310)
- 财经(13208)
- 经济研究(12865)
- 理论(12483)
- 科技(12190)
- 情报(12135)
- 实践(11842)
- 践(11842)
- 经(11038)
- 问题(10998)
- 书馆(10983)
- 图书馆(10983)
- 技术经济(10740)
共检索到307100条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 图书馆理论与实践
[作者]
艾金勇
通过分析总结藏文网页的结构特征,在借鉴汉语主题句抽取方法的基础上,提出了结合语义信息的藏文网页主题句抽取算法。该方法根据藏文文本特征实现了网页内容的智能识别,同时,在对识别的文本块进行自动分词后,利用改进TF-IDF方法结合主题词的语义相关性确定了网页文本的主题词,并据此构建了候选主题句集,再通过候选主题句的重要度和分布度计算得到了候选主题句的权值。最后对所有候选主题句按权值大小排序并确定了文本的主题句。
关键词:
藏文网页 语义信息 主题句 抽取
[期刊] 图书馆学研究
[作者]
艾金勇
文章归纳整理了藏文网页的结构特征,在借鉴中英文关键词抽取方法的基础上,设计实现了融合语义知识的藏文网页关键词抽取算法。该算法利用藏文文本特征实现了网页内容模块的智能识别,在对识别的文本块进行自动分词后,采用改进的TF-IDF算法得到基础词集,然后根据词向量特征进行基础词的语义扩展构建候选关键词集,最后利用候选关键词之间的语义相关度值,确立藏文网页的关键词。藏文网页的实验测试结果表明该方法提取的藏文网页关键词具有较高的准确率。
[期刊] 情报理论与实践
[作者]
聂卉 张津华
以净化网页、提取网页主题内容为目标,提出一个基于网页规划布局的网页主题内容抽取算法。该算法依据原始网页的规划布局,通过构造标签树为网页分块分类,进而通过计算内容块的主题相关度,辨别网页主题,剔除不相关信息,提取网页主题内容。实验表明,算法适用于主题型网页的"去噪"及内容提取,具体应用中有较理想的表现。
关键词:
网页 信息抽取 主题分析
[期刊] 情报理论与实践
[作者]
李广建 乔建忠
网页信息抽取包装器的生成方法很多,按自动化程度可分为手工、半自动和全自动三类,本文旨在研究全自动生成网页信息抽取包装器的主要技术方法,首先构建了对应的分类体系;其次对近年来主流的15种包装器生成技术进行了定性分析和分类比较;最后提出5点发展趋势。
关键词:
信息抽取 包装器 信息技术 深层网
[期刊] 情报理论与实践
[作者]
高庆宁 吴鹏 张晶晶
[目的]网页所表达的主要信息通常隐藏在大量无关的结构和内容中,使用户不能迅速获取主题内容,限制了网页资源的可用性,使用信息抽取技术解决了这一问题。[方法]基于文档对象模型(DOM)的信息抽取技术能够简单准确地从网页中提取所需内容,但依靠网页本身结构;基于行块分布算法的技术摆脱网页结构的限制,克服限定数据源的缺点,但需要人工干预,文章结合DOM技术和行块分布算法以及正则表达式,实现网页信息采集与信息抽取。[结论]能够自动准确提取网页信息。[局限]对英文以及结构复杂的网页抽取效果不是很理想,抽取内容仅限于文字。
关键词:
文档对象模型 算法 网页 信息抽取
[期刊] 数字图书馆论坛
[作者]
黄政 张学福
本文结合开放获取期刊(Open Access Journal,OA期刊)资源特点,针对无法通过OAI-PMH协议进行资源采集的OA期刊,提出一种基于网页信息抽取的资源采集策略。本文从网页资源描述的角度总结OA期刊资源特点并对其分类。基于网页信息抽取方法在OA期刊资源采集适用性,提出一种基于OA期刊网页元数据抽取的采集方法,并在此方法的基础上设计了采集系统。通过对国内外不遵循OAI-PMH协议的10本OA期刊的网站实证采集,得到45 785篇论文的元数据,证明该采集方法能有效地应用于此类资源采集。研究丰富了
[期刊] 数据分析与知识发现
[作者]
刘建华 王颖 张智雄 李传席
【目的】拓展以物种为中心的植物物种多样性抽取框架,探索实现语义知识抽取方法。【方法】结合当前生物多样性抽取的主流研究,以物种为中心,设计包含多种实体及实体间关系的知识抽取框架,利用已有的众多专业数据库,设计并实现相应的识别方法。【结果】设计以物种为核心的知识抽取框架,探索实现多种实体及实体间关系的语义知识抽取方法,拓展植物物种多样性领域抽取内容和思路。【局限】实体识别的完整性和准确性受底层知识库影响较大,且实体间关系的类型局限于共现、上下位类、语法关系几类,还需进一步研究。【结论】本研究拓展了植物物种多样
[期刊] 情报理论与实践
[作者]
钱爱兵 江岚
结合新闻网页的内容特征对中文网页关键词的构成特点进行阐述;对经典的TF-IDF加权公式进行改进,构建一个综合考虑多种影响因素的候选关键词评分加权公式;对SharpICTCLAS分词进行改进,增加位置标注;选择评分较高的词作为候选关键词,利用词的位置标注进行关键词抽取优化操作,将"切碎"的候选关键词进行组配,形成正式抽取的关键词。实验结果表明:该方法明显优于基准方法,能够抽取到令人满意的关键词。
关键词:
词频 逆文档频率 新闻网页 关键词抽取
[期刊] 情报理论与实践
[作者]
张思凤 梁梦丽 曹高辉
[目的/意义]主题抽取的效果对于信息检索、自动标引、自然语言处理具有重要的价值,提高主题抽取的效果,既能改善检索系统主题检索准确性,又能够帮助学者更加高效地了解文献的主要思想。文章研究并探讨了从引用内容中抽取文献主题的有效性。[方法/过程]选取自然语言处理领域文献为研究对象,利用文献之间的引用与被引用关系抽取引用内容,进行分词并计算权重;将引用内容、全文抽取的候选词进行专家打分评价效果并将其与关键词对比,使用F值评价两种语料库抽取候选词的优劣。[结果/结论]通过专家打分及计算F值,发现引用内容在抽取候选词
关键词:
科技文献 引文 主题抽取 关键词
[期刊] 数据分析与知识发现
[作者]
张艳丰 李贺 彭丽徽 侯力铁
【目的】针对中文网络平台在线评论,提出一种用于过滤用户评论的有用性排序和分类模型,辅助消费者做出购买决策。【方法】从在线评论情感语义的形式特征和内容特征两个方面,提取影响在线评论有用性的6个指标属性进行量化计算,采用灰色加权关联度分析方法构建在线评论有用性评价体系,通过K-means聚类方法,构建过滤用户在线评论的有用性分类模型。【结果】以亚马逊电子商务平台的手机在线评论为例,通过计算召回率、准确率与F值,验证了本文在线评论有用性分类算法的有效性。实验结果表明本方法能够有效辨别在线评论有用性,尤其对极性评
[期刊] 数据分析与知识发现
[作者]
王子璇 乐小虬 何远标
【目的】自动甄别科技论文中描述研究主题的关键语句。【方法】以论文小节为单位组织句子集,通过训练领域词向量计算句子间WMD距离得到相应语义相似度,优化Text Rank算法迭代过程,利用外部特征对所得权值进行调整,按句子权值降序选取关键主题句。【结果】以气候变化领域科技论文作为实验数据,以人工标注的结果为基准对本文的算法和传统的Text Rank算法进行对比实验,初步结果表明该方法的识别效果(F值)比传统Text Rank算法提升约5%。【局限】句子特征提取有待提高,词向量训练及方法中的相关参数需要做进一步
[期刊] 情报理论与实践
[作者]
王志宏 过弋
[目的/意义]专利关键词是对专利核心内容的概括,高效准确地抽取专利关键词不仅可以辅助人们对专利的快速查找,同时对专利分类、聚类、翻译等具有重要意义。[方法/过程]提出了"关键词在关键句中"的关键词抽取新思路。首先构建了一个联合句网络语义图特征和启发式规则特征的专利摘要句排序模型,然后仅选择Top-KS%的句子参与关键词计算,同时将句子语义权重参数引入到关键词权重计算过程中,从而使得句子的重要性传递到句中的词上。[结果/结论]在真实中文专利数据集中实验表明,从中文专利中选择适当比例关键句参与关键词抽取计算,相较于传统关键词抽取算法F值提升了6%~13%左右,有效地降低原始文档的噪声数据,提升了关键词抽取的效果。
[期刊] 情报学报
[作者]
韩彬斌 王培康
WWW上的文本信息挖掘工作是网络信息处理领域的新课题。本文研究了两种机器学习算法———Rocchio算法和Widrow Hoff算法在Web网页识别领域中的应用 ,并对几种网页识别算法进行了比较分析
关键词:
特征提取 机器学习 WWW 网页识别
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除