- 年份
- 2024(10433)
- 2023(15249)
- 2022(13361)
- 2021(12526)
- 2020(10528)
- 2019(24448)
- 2018(24282)
- 2017(47217)
- 2016(25425)
- 2015(28852)
- 2014(28480)
- 2013(27618)
- 2012(24993)
- 2011(22232)
- 2010(22194)
- 2009(19794)
- 2008(19053)
- 2007(16511)
- 2006(14033)
- 2005(11777)
- 学科
- 济(97647)
- 经济(97538)
- 管理(72731)
- 业(68609)
- 企(57325)
- 企业(57325)
- 方法(50947)
- 数学(44672)
- 数学方法(43865)
- 农(27513)
- 财(24292)
- 中国(23526)
- 学(22305)
- 业经(21773)
- 贸(18355)
- 贸易(18348)
- 地方(17961)
- 理论(17941)
- 易(17858)
- 农业(17207)
- 务(16193)
- 财务(16108)
- 财务管理(16070)
- 和(15861)
- 技术(15765)
- 制(15666)
- 企业财务(15168)
- 环境(14947)
- 划(13699)
- 银(13383)
- 机构
- 学院(350340)
- 大学(349613)
- 管理(143004)
- 济(133296)
- 经济(130379)
- 理学(125511)
- 理学院(124171)
- 管理学(121473)
- 管理学院(120865)
- 研究(109418)
- 中国(80929)
- 京(73322)
- 科学(71109)
- 财(59425)
- 农(55529)
- 业大(54460)
- 所(53602)
- 中心(51557)
- 研究所(49504)
- 财经(49037)
- 江(48930)
- 范(45815)
- 北京(45505)
- 师范(45365)
- 经(44745)
- 农业(43719)
- 院(40758)
- 州(40204)
- 经济学(39324)
- 技术(38363)
- 基金
- 项目(251604)
- 科学(198309)
- 基金(182839)
- 研究(181633)
- 家(159725)
- 国家(158463)
- 科学基金(137338)
- 社会(112453)
- 社会科(106626)
- 社会科学(106596)
- 省(98550)
- 基金项目(97132)
- 自然(92010)
- 自然科(89927)
- 自然科学(89908)
- 自然科学基金(88220)
- 教育(84656)
- 划(83143)
- 资助(76128)
- 编号(75162)
- 成果(58885)
- 重点(56190)
- 部(54736)
- 发(52312)
- 创(52197)
- 课题(50648)
- 科研(48946)
- 创新(48662)
- 教育部(46891)
- 大学(46830)
- 期刊
- 济(134433)
- 经济(134433)
- 研究(94508)
- 中国(59652)
- 学报(55814)
- 科学(51366)
- 管理(50301)
- 农(48915)
- 财(44638)
- 大学(42518)
- 学学(40039)
- 教育(39036)
- 农业(34550)
- 技术(33116)
- 业经(23871)
- 融(23593)
- 金融(23593)
- 财经(22266)
- 经济研究(21917)
- 图书(19548)
- 经(18904)
- 业(18286)
- 统计(18035)
- 问题(17407)
- 科技(17111)
- 技术经济(17064)
- 理论(16664)
- 版(16342)
- 策(16214)
- 资源(16015)
共检索到483449条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 数据分析与知识发现
[作者]
李伟卿 王伟军
【目的】基于大规模评论数据,提出一种产品特征词典的构建方法,以提升识别产品特征的查准率和查全率。【方法】在人工标注的基础上,基于同义词林的扩展,以及大规模评论文本的词向量训练,计算词语的语义相似度和相关性,进行特征的识别与归并,进而形成产品特征词典。【结果】本文选取手机、相机、图书三类产品的评论数据进行实验,平均查准率和平均查全率分别为0.774和0.855。结果显示,该方法具有一定的普适性。【局限】标注及验证需大量人工参与,自动化程度不够;没有考虑评论中的隐含特征。【结论】通过与已有研究比较,验证了本文
关键词:
产品评论 特征词典 特征提取 观点挖掘
[期刊] 图书情报工作
[作者]
宋东桓 李晨英 刘子瑜 韩明杰
[目的/意义]论文摘要是信息组织的重要标引对象,将论文摘要按一定结构进行标引有利于科学传播、知识发现和情报分析。如何对现有非结构式摘要进行精准快速的自动标引是亟待解决的现实问题。[方法/过程]假定不同类别的摘要具有内在一致性,即对结构式摘要的研究可为非结构式摘要自动标引提供方法和技术参考。据此,基于美国国家医学图书馆结构要素标签术语集和标签分类映射关系,提出结构要素BOMRC体系和结构式摘要的识别与规范化标引方法。其次选取研究样本并采用文本挖掘方法对样本语料中的单词、动词、三词词块、四词词块等词汇进行词频、TFIDF值等多个指标的定量统计分析,构建能够进行结构要素识别的语义特征词典。最后利用非结构式摘要测试集进行语义特征词典有效性检验。[结果/结论]结果显示,利用语义特征词典方法能够有效识别非结构式摘要的各类要素,并可用于优化以机器学习方法为核心的自动识别模型。
[期刊] 情报理论与实践
[作者]
伍建军 康耀红
本文阐述了一种基于特征词聚类的降维方式,其主要思想就是把词在文本中的出现看成一个事件,先通过搜索算法计算每一个特征词的分布,合并对分类有相似作用的特征词,从而起到了特征降维的作用。最后通过实验测试分析,提出了一种改进的、考虑全局簇信息的相似度计算公式,将其应用到文本分类中,实验表明提高了文本分类的精度。
关键词:
特征词聚类 文本分类 相似度计算
[期刊] 情报理论与实践
[作者]
白如江 王晓笛 王效岳
科技文献通常包括研究目的、方法、结果和结论等信息,如何将科技文献标引上这些信息,帮助科研人员在数量巨大的文献中快速发现符合研究需要的内容显得尤为重要。文章在研究分析科技文献写作特点基础上,提出了基于词、英文(专有名词、缩写词)以及数字的核心特征词提取策略;然后将科技文献标引问题转化为句子分类问题,结合提出的核心特征词,采用支持向量机分类器对科技文献进行句子级别的语义标引。通过对1168篇糖尿病医学类论文实验,证明本文提出的方法能够有效地学习和标引科技文献中的句子,进而有效地对科技文献关键信息点进行自动标引。
关键词:
自动标引 支持向量机 特征提取 科技文献
[期刊] 统计与决策
[作者]
孙丽莉 张小刚
传统文本特征词提取方法采用TF-IDF计算文本特征词的权重,但TF-IDF方法只使用了文本中的词频因素,体现不出特征词的位置信息,也忽略了特征词之间的语义相似关系,降低了提取特征词的准确性。针对此问题,文章提出了一种综合的文本特征词权重计算方法,该方法在计算特征词权重时兼顾了特征词的词频、位置和词义信息。实验结果表明,该方法是有效的,且能在一定程度上提高文本相似度结果的区分度和聚类效果。
[期刊] 图书情报工作
[作者]
高影繁 徐红姣 王惠临
面对基于双语词典的跨语言检索查询翻译方法中固有的一对多等翻译模糊问题,已有研究成果存在对于非组合型复合词无法进行准确翻译、双语词典和其他翻译资源联合使用引入较大计算开销等弊端。为建立英汉双向跨语言检索实用性系统,在现有的一部包含若干科技词汇和短语的双语科技词典的基础上,着重研究如何引入平行语料来改进已有的双语词典问题。目标是生成一部基于句对齐平行语料的科技类双语概率词典,为跨语言检索查询翻译消歧提供实时性支持。
关键词:
查询翻译 机读词典 句对齐平行语料
[期刊] 情报理论与实践
[作者]
裘江南 罗志成 王延章
词语语义相关度的计算,一种比较常用的方法是使用分类体系的语义词典,而国内外学者已经提出了多种基于语义相关的度量方法。这些方法对于词典和语言环境的依赖性是一个值得研究的问题。本文汇总了多种基于语义词典的方法,全面地概括分析了这类方法的特点。基于哈尔滨工业大学信息检索实验室提供的《同义词词林》扩展版,本文在真人单词对相关度判断实验中比较了多种方法的效果,从而找出了《同义词词林》扩展版中的较好方法。
关键词:
相关 语义词典 度量方法 比较研究
[期刊] 运筹与管理
[作者]
魏瑾瑞 王若彤 王晗
目前识别虚假评论的方法主要基于评论内容的文本特征和评论者的行为特征,然而评论文本与评论者行为容易被伪造和模仿,且这两类方法只能对虚假评论逐个识别,本文考虑了虚假评论的网络结构特征,通过分析评论者的网络行为及评论者节点间的网络结构特征定义相邻节点多样性与自相似性,利用累积分布函数估计其概率并合成网络行为得分,以得分高的可疑产品为种子建立2-hop子图,筛选子图中高度相似的虚假评论候选群组,利用GroupStrainer、HDBSCAN等算法对其进行聚类合并,以发现隐藏的虚假评论群组。以亚马逊四类最畅销的产品数据集为样本进行实证分析的结果表明,文中提出的方法能够有效识别隐藏较深的大规模虚假评论群组,综合群组内容的统计特征分析发现,虚假评论群组对目标产品的攻击模式存在产品类别差异,虚假评论群组比真实评论者对目标产品具有更强的集中度,但同时也会利用其它非目标产品对自身进行伪装以弱化其可疑性。
关键词:
评论网络结构 虚假评论群组 网络行为得分
[期刊] 情报学报
[作者]
薛翠芳 郭炳炎
本文从自动文摘的需求出发 ,探讨特征词自动抽取的方法和技术 ,设计并实现了两种不同的特征词自动抽取算法。这些方法对文本的自动分类和全文检索也有一定的借鉴意义。
关键词:
特征词 加权函数 自动文摘
[期刊] 数理统计与管理
[作者]
蔡超 王康宁
为解决大规模数据在进行回归分析时存在的计算内存不足和运行时间较长的问题,提出两个新的回归分析方法:先筛选后抽样的大规模数据L_1惩罚分位数回归方法(FSSLQR)和先抽样后筛选的大规模数据L_1惩罚分位数回归方法(SFSLQR),其数值模拟和实际应用结果表明:FSSLQR和SFSLQR方法不仅能够显著降低计算内存和运行时间,而且其估计预测和变量选择的结果与全量L_1惩罚分位数回归基本一致。此外,与Xu等(2018)提出的大规模数据的L_1惩罚分位数回归方法(SLQR)相比,FSSLQR和SFSLQR方法在估计预测、变量选择和运行时间等方面都更具优势。
[期刊] 情报学报
[作者]
韩红旗 桂婕 张运良 翁梦娟 薛陕 悦林东
现有的主题标引方法一般只能抽取文本中出现的词汇,无法从几万或数十万主题词中选择语义关联强且未出现的词汇;基于机器学习的多标签分类算法则需要每一个标签下有训练数据,限制了它们在主题标引上的应用。面向大规模主题词在海量文献上的标引需求,提出一个基于分布式词向量的混合型自动标引方法,利用大规模语料训练的词向量生成同维度的主题词表示向量和文本表示向量,实现主题词与文本语义相似度的计算。基于大规模语料构建主题词与普通词的映射表,使文本向量只和少量的语义强相关主题词向量比较,大大减少了计算量,提高了标引效率。开发的自动标引工具对近亿篇文献进行了主题标引,达到了较高的速度。与结巴关键词的实验对比结果显示,本文方法抽取的主题词与作者关键词重合度较低,且在去除结巴关键词中的非主题词后,取得了比结巴关键词更高的标引准确率;与人工标引的实验对比结果显示,随着人工标引词数量的增加,本文方法的效果、结果与人工标引结果的一致性在不断增加。
[期刊] 情报理论与实践
[作者]
史伟
在大多数与观点挖掘和情感分析相关的任务中,都必须计算某些观点表达的语义倾向(比如正面或负面评价)。最近的一些研究表明语义倾向依赖于应用领域,文章认为语义倾向更依赖于特定的目标——特征。介绍了一种以半监督方式在特定领域中构建特征级观点词词典的方法:从一小部分已标注的文档开始归纳词汇,然后使用一种新的基于排序算法(极性等级法)的图,从更大部分未标注的文档中自动将观点词词典进行扩展。选择了两个不同领域(手机和婚纱摄影)的评论集进行了构建方法的效果评估。最后得到的方法仅使用少量已标注的文档,产生的特征级的观点词词典领域独立,并具有更好的查准率和查全率。
[期刊] 情报学报
[作者]
王华风
本文分析了大型英汉双语词典数据的组成和特点,讨论了词典数据组织的几种模型,据此提出一种新的数据模型,即采用仿SGML的标记语言描述词典数据结构,在网络环境下,用FDB(File+DataBase)模型可以较好地组织数据。
关键词:
词典数据模型,语料库,SGML
[期刊] 管理评论
[作者]
冯科 曾德明
建设工业4. 0需要推动新兴信息技术与其他领域技术的深度融合。然而跨领域、远距离的技术融合面临较大的风险与挑战。采用电子信息、汽车、装备制造产业1985-2014年约240万专利数据,以三大产业中的技术领域为研究对象,基于聚类分析研究其技术融合距离动态发展过程中的聚类特征,利用Tobit模型解析其技术融合距离的影响因素。实证研究表明,融合距离最远的技术领域,其动态发展过程表现出多元化、差异化的聚类特征;申请人合作团队规模、产学合作、专利积累、政府科技计划投入显著促进技术融合距离的延伸;发明人团队规模则对技术融合距离先提升、后抑制。应鼓励合作创新、优先关注前期积累丰富的技术领域、构建多目标结合的融合性技术领域财政资金投入组合。
[期刊] 情报理论与实践
[作者]
徐红姣 王惠临 章成志
双语机读词典是基于查询翻译的跨语言信息检索中的常用资源,但是传统的手工构建词典的方法费时费力,本文利用统计方法从英汉句对齐平行语料库中自动获取翻译词典,以用于查询翻译过程中。
关键词:
跨语言 信息检索 翻译词典
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除