搜索文献-EPS

年份: 2024(10433); 2023(15249); 2022(13361); 2021(12526); 2020(10528); 2019(24448); 2018(24282); 2017(47216); 2016(25424); 2015(28850); 2014(28479); 2013(27617); 2012(24993); 2011(22232); 2010(22194); 2009(19794); 2008(19053); 2007(16511); 2006(14033); 2005(11777)

作者: 王(71165); 张(59069); 李(58863); 刘(56043); 陈(37622); 杨(28495); 晓(26869); 赵(23509); 周(22518); 华(20911); 吴(20321); 文(19700); 林(18606); 明(18448); 伟(18298); 志(17988); 丽(17888); 孙(17661); 徐(16986); 黄(16916); 玉(14578); 平(14374); 军(14331); 朱(13580); 郭(13240); 胡(13083); 红(13059); 建(12940); 春(11846); 艳(11698)

学科: 济(97644); 经济(97535); 管理(72731); 业(68609); 企(57325); 企业(57325); 方法(50944); 数学(44669); 数学方法(43862); 农(27513); 财(24292); 中国(23525); 学(22305); 业经(21773); 贸(18355); 贸易(18348); 地方(17961); 理论(17941); 易(17858); 农业(17207); 务(16193); 财务(16108); 财务管理(16070); 和(15861); 技术(15765); 制(15665); 企业财务(15168); 环境(14947); 划(13699); 银(13381)

机构: 学院(350335); 大学(349607); 管理(143003); 济(133290); 经济(130373); 理学(125511); 理学院(124171); 管理学(121473); 管理学院(120865); 研究(109414); 中国(80928); 京(73321); 科学(71109); 财(59425); 农(55529); 业大(54460); 所(53600); 中心(51554); 研究所(49503); 财经(49037); 江(48930); 范(45815); 北京(45504); 师范(45365); 经(44745); 农业(43719); 院(40758); 州(40204); 经济学(39322); 技术(38363)

基金: 项目(251598); 科学(198303); 基金(182833); 研究(181627); 家(159719); 国家(158457); 科学基金(137332); 社会(112448); 社会科(106621); 社会科学(106591); 省(98550); 基金项目(97132); 自然(92004); 自然科(89921); 自然科学(89902); 自然科学基金(88214); 教育(84655); 划(83139); 资助(76122); 编号(75161); 成果(58882); 重点(56190); 部(54735); 发(52312); 创(52197); 课题(50646); 科研(48945); 创新(48662); 教育部(46890); 大学(46826)

期刊: 济(134432); 经济(134432); 研究(94506); 中国(59652); 学报(55814); 科学(51366); 管理(50300); 农(48915); 财(44637); 大学(42518); 学学(40039); 教育(39036); 农业(34550); 技术(33116); 业经(23871); 融(23590); 金融(23590); 财经(22265); 经济研究(21917); 图书(19548); 经(18903); 业(18286); 统计(18035); 问题(17407); 科技(17111); 技术经济(17064); 理论(16664); 版(16342); 策(16214); 资源(16015)

全选本页取消本页

共检索到483443条记录

发布时间倒序

发布时间倒序
相关度优先

文献计量分析

结果分析(前20)
结果分析(前50)
结果分析(前100)
结果分析(前200)
结果分析(前500)

基于大规模评论数据的产品特征词典构建方法研究

[期刊] 数据分析与知识发现 [作者] 李伟卿王伟军

【目的】基于大规模评论数据,提出一种产品特征词典的构建方法,以提升识别产品特征的查准率和查全率。【方法】在人工标注的基础上,基于同义词林的扩展,以及大规模评论文本的词向量训练,计算词语的语义相似度和相关性,进行特征的识别与归并,进而形成产品特征词典。【结果】本文选取手机、相机、图书三类产品的评论数据进行实验,平均查准率和平均查全率分别为0.774和0.855。结果显示,该方法具有一定的普适性。【局限】标注及验证需大量人工参与,自动化程度不够;没有考虑评论中的隐含特征。【结论】通过与已有研究比较,验证了本文

关键词：产品评论特征词典特征提取观点挖掘

英文科技论文摘要的语义特征词典构建

[期刊] 图书情报工作 [作者] 宋东桓李晨英刘子瑜韩明杰

[目的/意义]论文摘要是信息组织的重要标引对象,将论文摘要按一定结构进行标引有利于科学传播、知识发现和情报分析。如何对现有非结构式摘要进行精准快速的自动标引是亟待解决的现实问题。[方法/过程]假定不同类别的摘要具有内在一致性,即对结构式摘要的研究可为非结构式摘要自动标引提供方法和技术参考。据此,基于美国国家医学图书馆结构要素标签术语集和标签分类映射关系,提出结构要素BOMRC体系和结构式摘要的识别与规范化标引方法。其次选取研究样本并采用文本挖掘方法对样本语料中的单词、动词、三词词块、四词词块等词汇进行词频、TFIDF值等多个指标的定量统计分析,构建能够进行结构要素识别的语义特征词典。最后利用非结构式摘要测试集进行语义特征词典有效性检验。[结果/结论]结果显示,利用语义特征词典方法能够有效识别非结构式摘要的各类要素,并可用于优化以机器学习方法为核心的自动识别模型。

关键词：科技论文论文摘要结构要素语义特征特征词典

一种基于特征词聚类的文本分类方法

[期刊] 情报理论与实践 [作者] 伍建军康耀红

本文阐述了一种基于特征词聚类的降维方式,其主要思想就是把词在文本中的出现看成一个事件,先通过搜索算法计算每一个特征词的分布,合并对分类有相似作用的特征词,从而起到了特征降维的作用。最后通过实验测试分析,提出了一种改进的、考虑全局簇信息的相似度计算公式,将其应用到文本分类中,实验表明提高了文本分类的精度。

关键词：特征词聚类文本分类相似度计算

基于支持向量机和核心特征词的科技文献自动标引研究

[期刊] 情报理论与实践 [作者] 白如江王晓笛王效岳

科技文献通常包括研究目的、方法、结果和结论等信息,如何将科技文献标引上这些信息,帮助科研人员在数量巨大的文献中快速发现符合研究需要的内容显得尤为重要。文章在研究分析科技文献写作特点基础上,提出了基于词、英文(专有名词、缩写词)以及数字的核心特征词提取策略;然后将科技文献标引问题转化为句子分类问题,结合提出的核心特征词,采用支持向量机分类器对科技文献进行句子级别的语义标引。通过对1168篇糖尿病医学类论文实验,证明本文提出的方法能够有效地学习和标引科技文献中的句子,进而有效地对科技文献关键信息点进行自动标引。

关键词：自动标引支持向量机特征提取科技文献

一种基于HowNet语义计算的综合特征词权重计算方法

[期刊] 统计与决策 [作者] 孙丽莉张小刚

传统文本特征词提取方法采用TF-IDF计算文本特征词的权重,但TF-IDF方法只使用了文本中的词频因素,体现不出特征词的位置信息,也忽略了特征词之间的语义相似关系,降低了提取特征词的准确性。针对此问题,文章提出了一种综合的文本特征词权重计算方法,该方法在计算特征词权重时兼顾了特征词的词频、位置和词义信息。实验结果表明,该方法是有效的,且能在一定程度上提高文本相似度结果的区分度和聚类效果。

关键词：知网词频与反文档频率权重计算语义相似度计算

基于网络结构特征的大规模虚假评论群组识别

[期刊] 运筹与管理 [作者] 魏瑾瑞王若彤王晗

目前识别虚假评论的方法主要基于评论内容的文本特征和评论者的行为特征，然而评论文本与评论者行为容易被伪造和模仿，且这两类方法只能对虚假评论逐个识别，本文考虑了虚假评论的网络结构特征，通过分析评论者的网络行为及评论者节点间的网络结构特征定义相邻节点多样性与自相似性，利用累积分布函数估计其概率并合成网络行为得分，以得分高的可疑产品为种子建立2-hop子图，筛选子图中高度相似的虚假评论候选群组，利用GroupStrainer、HDBSCAN等算法对其进行聚类合并，以发现隐藏的虚假评论群组。以亚马逊四类最畅销的产品数据集为样本进行实证分析的结果表明，文中提出的方法能够有效识别隐藏较深的大规模虚假评论群组，综合群组内容的统计特征分析发现，虚假评论群组对目标产品的攻击模式存在产品类别差异，虚假评论群组比真实评论者对目标产品具有更强的集中度，但同时也会利用其它非目标产品对自身进行伪装以弱化其可疑性。

关键词：评论网络结构虚假评论群组网络行为得分

基于平行语料的查询翻译词典改进方法研究

[期刊] 图书情报工作 [作者] 高影繁徐红姣王惠临

面对基于双语词典的跨语言检索查询翻译方法中固有的一对多等翻译模糊问题,已有研究成果存在对于非组合型复合词无法进行准确翻译、双语词典和其他翻译资源联合使用引入较大计算开销等弊端。为建立英汉双向跨语言检索实用性系统,在现有的一部包含若干科技词汇和短语的双语科技词典的基础上,着重研究如何引入平行语料来改进已有的双语词典问题。目标是生成一部基于句对齐平行语料的科技类双语概率词典,为跨语言检索查询翻译消歧提供实时性支持。

关键词：查询翻译机读词典句对齐平行语料

基于中文语义词典的语义相关度方法比较研究

[期刊] 情报理论与实践 [作者] 裘江南罗志成王延章

词语语义相关度的计算,一种比较常用的方法是使用分类体系的语义词典,而国内外学者已经提出了多种基于语义相关的度量方法。这些方法对于词典和语言环境的依赖性是一个值得研究的问题。本文汇总了多种基于语义词典的方法,全面地概括分析了这类方法的特点。基于哈尔滨工业大学信息检索实验室提供的《同义词词林》扩展版,本文在真人单词对相关度判断实验中比较了多种方法的效果,从而找出了《同义词词林》扩展版中的较好方法。

关键词：相关语义词典度量方法比较研究

汉语文本特征词的抽取方法

[期刊] 情报学报 [作者] 薛翠芳郭炳炎

本文从自动文摘的需求出发 ,探讨特征词自动抽取的方法和技术 ,设计并实现了两种不同的特征词自动抽取算法。这些方法对文本的自动分类和全文检索也有一定的借鉴意义。

关键词：特征词加权函数自动文摘

大规模数据的L_1惩罚分位数回归方法研究——基于特征筛选和随机抽样方法

[期刊] 数理统计与管理 [作者] 蔡超王康宁

为解决大规模数据在进行回归分析时存在的计算内存不足和运行时间较长的问题,提出两个新的回归分析方法:先筛选后抽样的大规模数据L_1惩罚分位数回归方法(FSSLQR)和先抽样后筛选的大规模数据L_1惩罚分位数回归方法(SFSLQR),其数值模拟和实际应用结果表明:FSSLQR和SFSLQR方法不仅能够显著降低计算内存和运行时间,而且其估计预测和变量选择的结果与全量L_1惩罚分位数回归基本一致。此外,与Xu等(2018)提出的大规模数据的L_1惩罚分位数回归方法(SLQR)相比,FSSLQR和SFSLQR方法在估计预测、变量选择和运行时间等方面都更具优势。

关键词： L_1惩罚分位数回归大规模数据特征筛选随机抽样

大规模主题词自动标引方法

[期刊] 情报学报 [作者] 韩红旗桂婕张运良翁梦娟薛陕悦林东

现有的主题标引方法一般只能抽取文本中出现的词汇，无法从几万或数十万主题词中选择语义关联强且未出现的词汇；基于机器学习的多标签分类算法则需要每一个标签下有训练数据，限制了它们在主题标引上的应用。面向大规模主题词在海量文献上的标引需求，提出一个基于分布式词向量的混合型自动标引方法，利用大规模语料训练的词向量生成同维度的主题词表示向量和文本表示向量，实现主题词与文本语义相似度的计算。基于大规模语料构建主题词与普通词的映射表，使文本向量只和少量的语义强相关主题词向量比较，大大减少了计算量，提高了标引效率。开发的自动标引工具对近亿篇文献进行了主题标引，达到了较高的速度。与结巴关键词的实验对比结果显示，本文方法抽取的主题词与作者关键词重合度较低，且在去除结巴关键词中的非主题词后，取得了比结巴关键词更高的标引准确率；与人工标引的实验对比结果显示，随着人工标引词数量的增加，本文方法的效果、结果与人工标引结果的一致性在不断增加。

关键词：主题标引分布式词向量多标签文本分类关键词抽取语义标签

技术融合距离的聚类特征与影响因素——基于大规模专利数据的实证研究

[期刊] 管理评论 [作者] 冯科曾德明

建设工业4. 0需要推动新兴信息技术与其他领域技术的深度融合。然而跨领域、远距离的技术融合面临较大的风险与挑战。采用电子信息、汽车、装备制造产业1985-2014年约240万专利数据,以三大产业中的技术领域为研究对象,基于聚类分析研究其技术融合距离动态发展过程中的聚类特征,利用Tobit模型解析其技术融合距离的影响因素。实证研究表明,融合距离最远的技术领域,其动态发展过程表现出多元化、差异化的聚类特征;申请人合作团队规模、产学合作、专利积累、政府科技计划投入显著促进技术融合距离的延伸;发明人团队规模则对技术融合距离先提升、后抑制。应鼓励合作创新、优先关注前期积累丰富的技术领域、构建多目标结合的融合性技术领域财政资金投入组合。

关键词：技术融合距离聚类特征影响因素 Tobit模型

基于极性等级法的观点词词典自动扩展研究

[期刊] 情报理论与实践 [作者] 史伟

在大多数与观点挖掘和情感分析相关的任务中,都必须计算某些观点表达的语义倾向(比如正面或负面评价)。最近的一些研究表明语义倾向依赖于应用领域,文章认为语义倾向更依赖于特定的目标——特征。介绍了一种以半监督方式在特定领域中构建特征级观点词词典的方法:从一小部分已标注的文档开始归纳词汇,然后使用一种新的基于排序算法(极性等级法)的图,从更大部分未标注的文档中自动将观点词词典进行扩展。选择了两个不同领域(手机和婚纱摄影)的评论集进行了构建方法的效果评估。最后得到的方法仅使用少量已标注的文档,产生的特征级的观点词词典领域独立,并具有更好的查准率和查全率。

关键词：观点词词典极性等级法特征级自动扩展情感分析文本语义特征

论大型英汉双语词典数据的结构模型

[期刊] 情报学报 [作者] 王华风

本文分析了大型英汉双语词典数据的组成和特点，讨论了词典数据组织的几种模型，据此提出一种新的数据模型，即采用仿ＳＧＭＬ的标记语言描述词典数据结构，在网络环境下，用ＦＤＢ（Ｆｉｌｅ＋ＤａｔａＢａｓｅ）模型可以较好地组织数据。

关键词：词典数据模型,语料库,SGML

跨语言信息检索查询翻译词典自动构建研究

[期刊] 情报理论与实践 [作者] 徐红姣王惠临章成志

双语机读词典是基于查询翻译的跨语言信息检索中的常用资源,但是传统的手工构建词典的方法费时费力,本文利用统计方法从英汉句对齐平行语料库中自动获取翻译词典,以用于查询翻译过程中。

关键词：跨语言信息检索翻译词典

首页
下一页
尾页
第 页

文献操作() 导出元数据文献计量分析

全选

导出文件格式：WXtxt

作者：

删除

推荐搜索

网络舆情意见挖掘中极性词典构建和极性识别方法研究基于全信息词典的自动文摘系统研究与实现基于产品特征树和LSTM模型的产品评论情感分析基于Logit模型的大规模个性化定制方法研究国际视域下大规模在线开放课程特征分析——基于中、英、美、加、澳五国MOOC的比较研究大规模指标下的环境效率评价方法研究基于双语词典和歧义消解的中英双语专利信息检索研究基于中介词典的网络图书分类体系映射研究基于词典和统计的语料库词汇级对齐算法文本自动分类中抽词词典的约简算法研究