- 年份
- 2024(9618)
- 2023(14026)
- 2022(12371)
- 2021(11683)
- 2020(9876)
- 2019(23029)
- 2018(22841)
- 2017(44116)
- 2016(23524)
- 2015(26634)
- 2014(26214)
- 2013(25705)
- 2012(23328)
- 2011(20831)
- 2010(20464)
- 2009(18575)
- 2008(17844)
- 2007(15218)
- 2006(13161)
- 2005(11146)
- 学科
- 济(92659)
- 经济(92564)
- 管理(70360)
- 业(64393)
- 企(54840)
- 企业(54840)
- 方法(46716)
- 数学(40466)
- 数学方法(39813)
- 财(23874)
- 农(23157)
- 中国(22523)
- 学(21438)
- 业经(20450)
- 地方(17508)
- 理论(16961)
- 务(16309)
- 财务(16227)
- 财务管理(16191)
- 和(15970)
- 农业(15671)
- 企业财务(15390)
- 贸(15238)
- 贸易(15230)
- 技术(14817)
- 易(14773)
- 环境(14731)
- 制(14314)
- 划(13027)
- 银(11729)
- 机构
- 大学(329406)
- 学院(325608)
- 管理(134551)
- 济(124297)
- 经济(121578)
- 理学(117533)
- 理学院(116298)
- 管理学(113974)
- 管理学院(113385)
- 研究(104107)
- 中国(76091)
- 京(69905)
- 科学(67341)
- 财(55977)
- 农(51375)
- 所(51283)
- 业大(50791)
- 中心(48207)
- 研究所(47193)
- 财经(46115)
- 江(45866)
- 北京(43594)
- 范(42924)
- 师范(42532)
- 经(42066)
- 农业(40226)
- 院(38664)
- 州(37795)
- 经济学(36538)
- 技术(34765)
- 基金
- 项目(234330)
- 科学(183998)
- 基金(170615)
- 研究(168929)
- 家(149131)
- 国家(147962)
- 科学基金(127928)
- 社会(105075)
- 社会科(99611)
- 社会科学(99582)
- 省(91054)
- 基金项目(91012)
- 自然(85451)
- 自然科(83439)
- 自然科学(83417)
- 自然科学基金(81889)
- 教育(77884)
- 划(76607)
- 资助(70812)
- 编号(69368)
- 成果(54908)
- 重点(51857)
- 部(51235)
- 发(48478)
- 创(48223)
- 课题(46249)
- 科研(45367)
- 创新(44971)
- 教育部(43878)
- 大学(43756)
- 期刊
- 济(126507)
- 经济(126507)
- 研究(89062)
- 中国(57834)
- 学报(55082)
- 科学(48824)
- 管理(47786)
- 农(44671)
- 财(42895)
- 大学(41327)
- 学学(38298)
- 教育(35559)
- 农业(31472)
- 技术(29771)
- 图书(23519)
- 融(21462)
- 金融(21462)
- 财经(21438)
- 业经(21115)
- 经济研究(20197)
- 经(18197)
- 理论(16439)
- 业(16393)
- 问题(16251)
- 科技(16139)
- 情报(16072)
- 技术经济(15876)
- 书馆(15808)
- 图书馆(15808)
- 资源(15711)
共检索到459015条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 数字图书馆论坛
[作者]
黄政 张学福
本文结合开放获取期刊(Open Access Journal,OA期刊)资源特点,针对无法通过OAI-PMH协议进行资源采集的OA期刊,提出一种基于网页信息抽取的资源采集策略。本文从网页资源描述的角度总结OA期刊资源特点并对其分类。基于网页信息抽取方法在OA期刊资源采集适用性,提出一种基于OA期刊网页元数据抽取的采集方法,并在此方法的基础上设计了采集系统。通过对国内外不遵循OAI-PMH协议的10本OA期刊的网站实证采集,得到45 785篇论文的元数据,证明该采集方法能有效地应用于此类资源采集。研究丰富了
[期刊] 情报理论与实践
[作者]
耿焕同 宋庆席 何宏强
随着浏览器/服务器体系结构和动态网页技术的广泛应用,对网页进行快速、准确地信息抽取的技术研究已成为一个热点。结合动态网页的生成特点和针对已有抽取方法的不足,提出了一种基于视觉分块的Web信息抽取方法。
关键词:
网络 信息抽取 视觉分块
[期刊] 情报理论与实践
[作者]
李广建 乔建忠
网页信息抽取包装器的生成方法很多,按自动化程度可分为手工、半自动和全自动三类,本文旨在研究全自动生成网页信息抽取包装器的主要技术方法,首先构建了对应的分类体系;其次对近年来主流的15种包装器生成技术进行了定性分析和分类比较;最后提出5点发展趋势。
关键词:
信息抽取 包装器 信息技术 深层网
[期刊] 情报理论与实践
[作者]
徐文海 温有奎
本文在海量智能分词基础之上,提出了一种基于向量空间模型和TFIDF方法的中文关键词抽取算法。该算法在对文本进行自动分词后,用TFIDF方法对文献空间中的每个词进行权重计算,然后根据计算结果抽取出科技文献的关键词。通过自编软件进行的实验测试表明该算法对中文科技文献的关键词自动抽取成效显著。
关键词:
关键词抽取 向量空间模型 算法
[期刊] 图书情报工作
[作者]
李纲 刘广兴 毛进 叶光辉
指出情感标签由评价对象和情感词组成,包含评论的关键要素,能清楚地表达评价者的观点意见。提出一种针对产品网络评论的情感标签抽取模型,利用依存句法分析设计情感标签抽取算法,通过情感极性计算对抽取出的情感标签进行过滤。通过放宽的抽取规则与情感极性过滤相结合,以提高情感标签的召回率,实现潜在评价对象的抽取。最后用网络抓取的产品评论语料作为测试数据集对模型进行测试,获得较高的抽取准确率和召回率,并对模型中存在的问题进行总结,作为模型改善的指导。
[期刊] 情报理论与实践
[作者]
聂卉 张津华
以净化网页、提取网页主题内容为目标,提出一个基于网页规划布局的网页主题内容抽取算法。该算法依据原始网页的规划布局,通过构造标签树为网页分块分类,进而通过计算内容块的主题相关度,辨别网页主题,剔除不相关信息,提取网页主题内容。实验表明,算法适用于主题型网页的"去噪"及内容提取,具体应用中有较理想的表现。
关键词:
网页 信息抽取 主题分析
[期刊] 情报理论与实践
[作者]
高庆宁 吴鹏 张晶晶
[目的]网页所表达的主要信息通常隐藏在大量无关的结构和内容中,使用户不能迅速获取主题内容,限制了网页资源的可用性,使用信息抽取技术解决了这一问题。[方法]基于文档对象模型(DOM)的信息抽取技术能够简单准确地从网页中提取所需内容,但依靠网页本身结构;基于行块分布算法的技术摆脱网页结构的限制,克服限定数据源的缺点,但需要人工干预,文章结合DOM技术和行块分布算法以及正则表达式,实现网页信息采集与信息抽取。[结论]能够自动准确提取网页信息。[局限]对英文以及结构复杂的网页抽取效果不是很理想,抽取内容仅限于文字。
关键词:
文档对象模型 算法 网页 信息抽取
[期刊] 图书馆理论与实践
[作者]
艾金勇
通过分析总结藏文网页的结构特征,在借鉴汉语主题句抽取方法的基础上,提出了结合语义信息的藏文网页主题句抽取算法。该方法根据藏文文本特征实现了网页内容的智能识别,同时,在对识别的文本块进行自动分词后,利用改进TF-IDF方法结合主题词的语义相关性确定了网页文本的主题词,并据此构建了候选主题句集,再通过候选主题句的重要度和分布度计算得到了候选主题句的权值。最后对所有候选主题句按权值大小排序并确定了文本的主题句。
关键词:
藏文网页 语义信息 主题句 抽取
[期刊] 清华大学学报(自然科学版)
[作者]
周炫余 刘林 卢笑 李璇 张思敏
关键词抽取是指能自动抽取反映文本主题的词或者短语,被广泛应用于文本检索、文本摘要等领域中。目前关键词抽取任务主要依赖于预训练语言模型来获取文本表示,这类语言模型主要基于单一模态的通用文本语料进行训练,存在无法根据下游任务特性进行领域适配和语义表征能力有限的问题。该文提出一种多模态信息增强表示的中文关键词抽取方法MIEnhance-KPE,首先引入Adapter层将偏旁和部首信息集成到预训练语言模型层中,得到领域自适应的文本表示;其次利用卷积神经网络提取汉字的图像特征,同时使用交叉注意力机制融合汉字图像特征和文本特征,实现文本语义表示增强;最后利用CRF(conditional random field)模型进行序列标注任务,并计算词语的位置词频权重对其进行排序获得关键词。与目前十分先进的关键词抽取方法KIEMP相比, MIEnhance-KPE在公开的中文科学文献数据集和自构建的中文教育关键词抽取数据集上的F值分别提升了15.71%和3.40%;消融实验结果表明,所提出的领域自适应模块和视觉语义增强表示模块均能有效提高关键词抽取的准确性。MIEnhance-KPE的提出有助于教育研究者精准了解教育发展趋势,促进教育理论和实践的创新。
[期刊] 图书情报工作
[作者]
刘伟
[目的/意义]鉴于目前同义词抽取方法无法避免抽取结果含有较多的噪音,需要较高的人工代价去除噪音,提出一种对同义词抽取结果排序的方法,使得正确结果排序提前,以达到提高抽取结果准确性及降低人工去噪代价的目的。[方法/过程]将抽取结果转化为抽取关系有向图,基于该有向图计算抽取结果中每个词汇与被抽取词汇的词义相似性,并按照词义相似性高低进行排序。排序方法的最大特点是只利用了当前的同义词抽取方法,不需要人工参与和额外的语义知识。[结果/结论]通过在真实数据集上进行验证,得出排序效果与抽取结果的规模呈正向关系的论点,即一个给定词汇的同义词抽取结果数量越多,排序的效果就会越好。
关键词:
同义词 信息抽取 噪音清洗 结果排序
[期刊] 情报理论与实践
[作者]
钱爱兵 江岚
结合新闻网页的内容特征对中文网页关键词的构成特点进行阐述;对经典的TF-IDF加权公式进行改进,构建一个综合考虑多种影响因素的候选关键词评分加权公式;对SharpICTCLAS分词进行改进,增加位置标注;选择评分较高的词作为候选关键词,利用词的位置标注进行关键词抽取优化操作,将"切碎"的候选关键词进行组配,形成正式抽取的关键词。实验结果表明:该方法明显优于基准方法,能够抽取到令人满意的关键词。
关键词:
词频 逆文档频率 新闻网页 关键词抽取
[期刊] 情报理论与实践
[作者]
徐进 朱孝文
[目的/意义]项目记忆是项目进行过程中产生和应用的项目知识和信息的集合。传统获取、构建项目记忆的方式依赖人工处理,需要投入大量的人力和时间。如何表示项目记忆,以及如何利用非结构化项目文档这类重要的项目数据源来构建项目记忆,仍然是项目知识管理中的关键挑战。[方法/过程]收集了京沪高铁项目的相关文档1078篇,利用依存句法和规则抽取方法得到项目记忆短语和基础信息,利用LDA模型提取项目文档的主题,并对文档集聚类和描述,达到从项目文档中自动提取项目记忆要素、构建、重现项目记忆的目的。[结果/结论]通过实验和比较分析,验证了所提出框架方法的合理性和有效性。所设计的方法流程一定程度上可以为项目组织、团队及成员进行更加高效的项目知识管理与共享提供支持。
[期刊] 情报理论与实践
[作者]
洪娜 张智雄 刘建华
本文通过对国内外OBIE理论和OBIE系统的分析,比较了OBIE技术与传统信息抽取技术的主要区别,归纳了4种主要的技术方法,分别是基于实例的OBIE,基于规则的OBIE以及基于机器学习的OBIE和Ontology驱动的OBIE,并用案例对各种技术方法做了阐释,最后总结了OBIE研究和系统开发中存在的难点问题。
关键词:
本体 信息抽取 信息技术
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除