搜索文献-EPS

年份: 2024(2293); 2023(3450); 2022(2958); 2021(2804); 2020(2299); 2019(5242); 2018(5358); 2017(9110); 2016(5573); 2015(6398); 2014(6750); 2013(6372); 2012(5990); 2011(5302); 2010(5441); 2009(4705); 2008(4739); 2007(4595); 2006(4048); 2005(3714)

作者: 王(18355); 李(15087); 张(14872); 刘(14316); 陈(9586); 杨(7295); 晓(6959); 赵(5828); 周(5734); 华(5649); 文(5117); 林(5078); 吴(5072); 志(4955); 丽(4892); 明(4783); 伟(4633); 徐(4471); 孙(4375); 黄(4375); 玉(3968); 平(3650); 红(3617); 军(3517); 建(3495); 朱(3457); 郭(3326); 胡(3220); 春(3206); 云(3142)

学科: 管理(13837); 济(13537); 经济(13513); 业(12811); 企(10569); 企业(10569); 学(6861); 农(5347); 财(5309); 中国(4903); 理论(4814); 教学(4259); 方法(4196); 制(4166); 教育(3878); 业经(3752); 务(3707); 财务(3697); 财务管理(3677); 农业(3615); 企业财务(3440); 和(3297); 地方(3267); 银(3202); 银行(3187); 行(2963); 环境(2863); 数学(2798); 学法(2695); 教学法(2695)

机构: 学院(75310); 大学(73405); 研究(27143); 中国(21699); 管理(21630); 科学(20751); 济(20664); 经济(19826); 农(19049); 京(17425); 理学(17384); 理学院(17060); 管理学(16433); 管理学院(16309); 所(15804); 农业(15278); 江(14880); 业大(14306); 研究所(14194); 中心(13309); 技术(12599); 省(12193); 财(12145); 州(11577); 范(11544); 师范(11315); 北京(10882); 院(10107); 室(10071); 农业大学(9695)

基金: 项目(46569); 科学(34330); 研究(32441); 基金(30688); 家(28634); 国家(28355); 科学基金(22635); 省(20045); 划(17306); 自然(16478); 社会(16222); 自然科(16051); 自然科学(16044); 基金项目(16018); 教育(15849); 自然科学基金(15723); 社会科(15076); 社会科学(15070); 编号(14949); 成果(13091); 资助(12485); 重点(11206); 课题(11179); 计划(10526); 发(10251); 科技(9917); 创(9475); 科研(9374); 年(9105); 部(8945)

期刊: 济(28638); 经济(28638); 中国(22063); 研究(21488); 学报(18392); 农(17580); 教育(14414); 科学(14050); 大学(12375); 农业(11696); 财(11459); 学学(11387); 管理(8524); 融(7362); 金融(7362); 技术(7285); 图书(7263); 业(6357); 书馆(5327); 图书馆(5327); 版(5319); 业经(5224); 业大(5068); 职业(4455); 财会(4386); 资源(4166); 农业大学(4154); 财经(3992); 经济研究(3766); 情报(3749)

全选本页取消本页

共检索到125868条记录

发布时间倒序

发布时间倒序
相关度优先

文献计量分析

结果分析(前20)
结果分析(前50)
结果分析(前100)
结果分析(前200)
结果分析(前500)

利用新词探测提高中文微博的情感表达抽取

[期刊] 中国科学技术大学学报 [作者] 万琪于中华陈黎宋磊磊丁革建

情感表达抽取工作是细粒度情感挖掘的重要任务之一.中文微博中包含大量网络新词和不规范词,现有的方法在进行微博情感表达抽取任务时不能很好地处理上述情况.通过研究发现,微博中新词大量分布在文本的情感表达部分,于是提出了基于CRF的联合抽取模型,即将新词发现融入到情感表达抽取任务中,从而改进原有工作的不足.实验结果表明,新词探测对微博文本情感表达抽取有很好的指示作用,在电影领域和开放领域的微博数据集上分别进行实验,F1值均提高了2%以上.

关键词：情感分析新词发现条件随机场信息抽取

一种基于TFIDF方法的中文关键词抽取算法

[期刊] 情报理论与实践 [作者] 徐文海温有奎

本文在海量智能分词基础之上,提出了一种基于向量空间模型和TFIDF方法的中文关键词抽取算法。该算法在对文本进行自动分词后,用TFIDF方法对文献空间中的每个词进行权重计算,然后根据计算结果抽取出科技文献的关键词。通过自编软件进行的实验测试表明该算法对中文科技文献的关键词自动抽取成效显著。

关键词：关键词抽取向量空间模型算法

一种多模态信息增强表示的中文关键词抽取方法研究

[期刊] 清华大学学报(自然科学版) [作者] 周炫余刘林卢笑李璇张思敏

关键词抽取是指能自动抽取反映文本主题的词或者短语,被广泛应用于文本检索、文本摘要等领域中。目前关键词抽取任务主要依赖于预训练语言模型来获取文本表示,这类语言模型主要基于单一模态的通用文本语料进行训练,存在无法根据下游任务特性进行领域适配和语义表征能力有限的问题。该文提出一种多模态信息增强表示的中文关键词抽取方法MIEnhance-KPE,首先引入Adapter层将偏旁和部首信息集成到预训练语言模型层中,得到领域自适应的文本表示;其次利用卷积神经网络提取汉字的图像特征,同时使用交叉注意力机制融合汉字图像特征和文本特征,实现文本语义表示增强;最后利用CRF(conditional random field)模型进行序列标注任务,并计算词语的位置词频权重对其进行排序获得关键词。与目前十分先进的关键词抽取方法KIEMP相比, MIEnhance-KPE在公开的中文科学文献数据集和自构建的中文教育关键词抽取数据集上的F值分别提升了15.71%和3.40%;消融实验结果表明,所提出的领域自适应模块和视觉语义增强表示模块均能有效提高关键词抽取的准确性。MIEnhance-KPE的提出有助于教育研究者精准了解教育发展趋势,促进教育理论和实践的创新。

关键词：中文关键词抽取多模态信息多粒度语义特征交叉注意力机制领域自适应

基于词句重要性的中文专利关键词自动抽取研究

[期刊] 情报理论与实践 [作者] 王志宏过弋

[目的/意义]专利关键词是对专利核心内容的概括,高效准确地抽取专利关键词不仅可以辅助人们对专利的快速查找,同时对专利分类、聚类、翻译等具有重要意义。[方法/过程]提出了"关键词在关键句中"的关键词抽取新思路。首先构建了一个联合句网络语义图特征和启发式规则特征的专利摘要句排序模型,然后仅选择Top-KS%的句子参与关键词计算,同时将句子语义权重参数引入到关键词权重计算过程中,从而使得句子的重要性传递到句中的词上。[结果/结论]在真实中文专利数据集中实验表明,从中文专利中选择适当比例关键句参与关键词抽取计算,相较于传统关键词抽取算法F值提升了6%～13%左右,有效地降低原始文档的噪声数据,提升了关键词抽取的效果。

关键词：中文专利关键句句排序专利关键词自动抽取

基于百科资源的多策略中文同义词自动抽取研究

[期刊] 中国图书馆学报 [作者] 陆勇章成志侯汉清

采用实证的方法,以百度百科语料库为实验抽取对象,在对同义词自动抽取技术分析比较的基础上,提出了多策略的中文同义词抽取的思路。综合利用字面相似度方法、特征模式匹配方法和PageRank链接分析方法对中文百科语料库中的同义词进行自动获取,具有多领域适用性、获取同义词类型多样性等特点。实验结果表明,该方法具有可行性,并可应用于其它语种的同义词自动获取中。未来的研究应进一步实现模式的自动定义、完善抽词词典、有效排除噪音数据并构建能真实反映语义关系的词汇矩阵。

关键词：信息抽取中文同义词同义词抽取百科语料库

CRFs字角色标注方法在中文附加关键词抽取中的应用研究

[期刊] 情报理论与实践 [作者] 张海潮王昊唐慧慧薛蔚

[目的/意义]探讨中文社会科学领域题名关键词最佳抽取模型,用以获取引文题名关键词,完成附加关键词的抽取。[方法/过程]文章以2014年CSSCI全部文献的题名为语料,运用条件随机场(CRFs),通过探究不同特征(或集合)和参数对关键词识别的影响,构建字角色标注的题名关键词标引模型,最终迁移应用到引文题名。[结果/结论]通过实验,获得最佳题名关键词标引模型,F1值可达到52.03%,每篇原文可获得附加关键词9个左右。在恰当的特征组合与参数下,构建的标引模型可以有效完成附加关键词的获取工作。[局限]语料中的每个关键词平均出现两次可能会影响机器学习的效果,原文与引文题名的差异可能影响模型的适用性,此外模型得到的附加关键词尚需进一步斟酌选择。

关键词：附加关键词条件随机场关键词抽取题名关键词机器学习

基于可扩展LDA模型的微博话题特征抽取研究

[期刊] 情报科学 [作者] 邱明涛马静张磊姚兆旭

【目的/意义】提出一种基于可扩展LDA模型的微博话题特征抽取方法。【方法/过程】利用词语权重调整方法筛选高贡献度高频词语;基于bootstrap思想,迭代产生特征词条候选集;引入信息熵值理论筛选话题词条;并利用四维泛化分类实现对特征词条的泛化和归类。【结果/结论】本文以真实新浪微博数据为实验对象,实验结果表明基于扩展LDA模型的特征词提取方法可弥补传统LDA模型在话题可解释性上的不足,有效地对微博文本进行话题特征抽取。

关键词： LDA模型微博话题话题特征特征抽取

融合词嵌入表示特征的实体关系抽取方法研究

[期刊] 数据分析与知识发现 [作者] 张琴郭红梅张智雄

【目的】为解决已有方法中单词特征表示不具有语义信息这一问题,对词嵌入表示特征在关系抽取中的作用进行探讨。【方法】考虑词嵌入表示级别、词汇级别和语法级别三种类型特征,利用朴素贝叶斯模型、决策树模型和随机森林模型进行对比实验,并选出代表全部特征的有效特征子集。【结果】使用全部特征时,决策树算法的准确率达到0.48,关系抽取效果最佳,Member-Collection(E_2,E_1)类型关系的F_1值达到0.70,特征排序结果表明依存关系有助于关系抽取。【局限】对小样本量和情况复杂的关系类型识别效果有待提高,

关键词：关系抽取词嵌入表示 Word2Vec

基于改进TF-IDF的中文网页关键词抽取——以新闻网页为例

[期刊] 情报理论与实践 [作者] 钱爱兵江岚

结合新闻网页的内容特征对中文网页关键词的构成特点进行阐述;对经典的TF-IDF加权公式进行改进,构建一个综合考虑多种影响因素的候选关键词评分加权公式;对SharpICTCLAS分词进行改进,增加位置标注;选择评分较高的词作为候选关键词,利用词的位置标注进行关键词抽取优化操作,将"切碎"的候选关键词进行组配,形成正式抽取的关键词。实验结果表明:该方法明显优于基准方法,能够抽取到令人满意的关键词。

关键词：词频逆文档频率新闻网页关键词抽取

不同领域的用户标签主题表达能力差异研究——以中文微博为例

[期刊] 情报理论与实践 [作者] 章成志何陆琳丁培红

文章以腾讯微博为研究对象,调研用户标签主题表达能力,并针对不同领域的差异进行分析。本研究可进一步丰富信息组织领域的研究内容,并为微博类应用平台的用户标签自动服务提供参考。

关键词：用户标签主题表达能力微博客

基于词义的关键词抽取方法研究

[期刊] 情报理论与实践 [作者] 李有梅

In the field of automatic information processing,how to precisely describe the text's content has become a rather critical problem.The vector space presentation,which is widely applied at present,is used to approximately illustrate conceptions and meanings by extracting keywords from the text.

关键词： index mode/keyword extraction word sense tagging semantic tree

词向量聚类加权TextRank的关键词抽取

[期刊] 数据分析与知识发现 [作者] 夏天

【目的】将维基百科蕴涵的世界知识以词向量方式融入TextRank模型,改进单文档关键词抽取效果。【方法】利用Word2Vec模型基于维基百科中文数据,生成词向量模型,对TextRank词图节点的词向量进行聚类以调整簇内节点的投票重要性,结合节点的覆盖和位置因素,计算节点之间的随机跳转概率,生成转移矩阵,最终通过迭代计算获得节点的重要性得分,选取前TopN个词语生成关键词。【结果】当TopN≤7时,词向量聚类加权方法均优于对比方法;TopN=3时,F值取得最大值,比先前最优结果增量提升了3.374%;Top

关键词：抽取词向量 TextRank Word2Vec

基于LDA-WO混合模型的微博话题有序特征抽取研究

[期刊] 情报科学 [作者] 梁珊邱明涛马静

【目的/意义】考虑到使用LDA模型进行主题抽取时,抽取到的特征词是无序的,破坏了原有的主谓宾结构,导致抽取效果不准确,可读性差的缺陷,构造了WO词序模型,并将LDA模型与WO模型结合,提出了基于LDA-WO混合模型的微博主题有序特征抽取算法。【方法/过程】使用LDA模型进行主题建模,获得无序特征词,然后通过WO模型对特征词进行排序,将特征词与原语料进行对比,构造特征词-语料位置矩阵,通过对特征词的位置排序,构造特征词词序权值矩阵,最终获得有序的特征词,完成对话题特征的有序抽取。【结果/结论】本文以真实新浪

关键词： WO-LDA模型微博话题有序特征抽取词序

利用ZMET隐喻抽取技术探讨好看簿对于教师的价值

[期刊] 中国远程教育 [作者] 唐筱璐

随着Web2.0技术的迅猛发展,图文博客、微型博客、SNS等,如雨后春笋般展开。目前,很多教师已经开始从单一的博客网站转移到热闹的教育社区,这些教育社区正逐渐成为教师学习和成长的新环境。在国内发展较好的图片博客——好看簿上,就活跃着这么一个教育社区。在这里聚集了一批敏锐的教育工作者,他们积极利用Web2.0技术创新课堂教学。是什么原因促使这些教师自发地参与到好看簿中来呢?本研究尝试使用ZMET隐喻抽取技术来探究好看簿教师用户的心理深度,了解他们对好看簿的认知,以及好看簿带给他们的真实价值与意义所在。

关键词：教师图文博客好看簿心智模式 ZMET

一种基于句法分析的情感标签抽取方法

[期刊] 图书情报工作 [作者] 李纲刘广兴毛进叶光辉

指出情感标签由评价对象和情感词组成,包含评论的关键要素,能清楚地表达评价者的观点意见。提出一种针对产品网络评论的情感标签抽取模型,利用依存句法分析设计情感标签抽取算法,通过情感极性计算对抽取出的情感标签进行过滤。通过放宽的抽取规则与情感极性过滤相结合,以提高情感标签的召回率,实现潜在评价对象的抽取。最后用网络抓取的产品评论语料作为测试数据集对模型进行测试,获得较高的抽取准确率和召回率,并对模型中存在的问题进行总结,作为模型改善的指导。

关键词：情感标签观点挖掘依存句法分析产品评论

首页
下一页
尾页
第 页

文献操作() 导出元数据文献计量分析

全选

导出文件格式：WXtxt

作者：

删除

推荐搜索

基于清华汉语树库的时间表达式抽取模型构建研究面向中文科技文献非结构化摘要的知识元表示与抽取研究——基于知识元本体理论随波逐流还是特立独行——特殊情境影响下微博观点表达的心理机制技术与情感表达对声乐演唱的意义——评《声乐艺术美学原理与实践探索研究》声乐演唱技巧及情感表达分析——评《声乐演唱与舞台表演探索》利用类甜蛋白基因诱导表达提高马铃薯对晚疫病的抗性研究利用PTVA法提高超氧化物歧化酶基因在毕赤酵母中的表达人微小纤溶酶原cDNA在毕赤酵母中的高效表达及活性检测棉铃虫α-微管蛋白基因的克隆、序列分析及表达模式检测利用酵母表达质粒检测甜菜黄化病毒蛋白质间相互作用的遗传学研究