- 年份
- 2024(6062)
- 2023(8789)
- 2022(7563)
- 2021(7164)
- 2020(6261)
- 2019(14616)
- 2018(14173)
- 2017(27514)
- 2016(14279)
- 2015(15948)
- 2014(15378)
- 2013(14888)
- 2012(13339)
- 2011(11830)
- 2010(11363)
- 2009(10150)
- 2008(9562)
- 2007(7921)
- 2006(6572)
- 2005(5679)
- 学科
- 济(56872)
- 经济(56779)
- 管理(40724)
- 业(37542)
- 企(31957)
- 企业(31957)
- 方法(30182)
- 数学(26883)
- 数学方法(26387)
- 财(15395)
- 农(13482)
- 中国(13326)
- 学(11360)
- 业经(10896)
- 制(10721)
- 务(9725)
- 财务(9678)
- 财务管理(9655)
- 贸(9490)
- 贸易(9485)
- 易(9256)
- 企业财务(9194)
- 理论(8985)
- 地方(8944)
- 农业(8698)
- 技术(8634)
- 和(8095)
- 体(7676)
- 融(7648)
- 金融(7646)
- 机构
- 大学(192442)
- 学院(188971)
- 济(77732)
- 管理(77131)
- 经济(76306)
- 理学(67660)
- 理学院(66961)
- 管理学(65567)
- 管理学院(65196)
- 研究(59421)
- 中国(44672)
- 京(39419)
- 财(36204)
- 科学(35899)
- 财经(29452)
- 业大(28758)
- 农(28747)
- 中心(28709)
- 所(27892)
- 经(26987)
- 江(26684)
- 研究所(25525)
- 经济学(24720)
- 北京(23987)
- 范(23673)
- 师范(23427)
- 院(22707)
- 农业(22388)
- 经济学院(22382)
- 财经大学(22237)
- 基金
- 项目(138172)
- 科学(109804)
- 基金(103054)
- 研究(99422)
- 家(90318)
- 国家(89638)
- 科学基金(78027)
- 社会(64639)
- 社会科(61352)
- 社会科学(61337)
- 基金项目(54445)
- 省(52242)
- 自然(51202)
- 自然科(50114)
- 自然科学(50099)
- 自然科学基金(49170)
- 教育(46285)
- 划(44734)
- 资助(42055)
- 编号(39118)
- 部(31246)
- 重点(30977)
- 成果(30700)
- 创(29039)
- 发(28213)
- 国家社会(27695)
- 科研(27402)
- 教育部(27246)
- 创新(27196)
- 大学(26462)
共检索到266702条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 图书情报工作
[作者]
张均胜 石崇德 徐红姣 高影繁 何彦青
文本主观题自动阅卷的关键是提高考生答案文本和试题标准答案文本之间相似度计算结果的准确率。参考文本试题人工阅卷方法,提出一种结合人工制定文本相似标准、词语集合及词语次序和同义词的短文本相似度计算方法,设计并实现相应文本主观题阅卷系统。建立试题人工评分标准库,并在387道银行培训领域真实考题数据集上进行自动阅卷与人工阅卷结果对比实验。结果显示,文本试题自动阅卷结果与人工阅卷结果相比,完全相同的达到58%,准确率达到80%左右。
关键词:
短文本 相似度 主观题 自动阅卷
[期刊] 数据分析与知识发现
[作者]
白如江 冷伏海 廖君华
【目的】利用文本语义组块特征提升Cosine文本相似度计算性能。【方法】获取NSF资助的关于碳纳米管研究领域的项目数据,进行词干还原、词性标注等预处理;利用条件随机场模型实现文本内容的语义组块标注;在此基础上实现基于语义组块特征的改进Cosine文本相似度计算,并与未标注的数据进行相似度计算比较,分析实验结果。【结果】实验证明基于语义组块特征的改进Cosine相似度计算结果比原始文本Cosine相似度计算结果相似度均有不同程度的提升,在实验数据中最高的相似度提升了26%。【局限】依赖于语义组块标注性能。【
关键词:
文本相似度 语义组块 向量空间模型 本体
[期刊] 情报理论与实践
[作者]
彭继东 谭宗颖
介绍了专利相似度测量的现状及其局限性;在此基础上提出了基于文本挖掘技术,以专利标题、摘要、权利要求和说明书4个文本元素的加权相似度作为专利相似度的测量方法;最后讨论了该方法的应用价值,并以碳纳米管技术领域为例作了实证研究。
关键词:
专利 文本挖掘 测量方法 应用
[期刊] 工业工程与管理
[作者]
潘浩 高英铭 潘尔顺
在常用评论特征的基础上,提出了一种基于搜索引擎(如百度)的文本相似性方法获取评论与产品标题之间的相似性,并作为新的评论特征建立评论推荐模型。实验证明,引入评论与产品相似性特征可明显改进评论推荐机制的有效性,同时文本相似性评价的准确性可以借助搜索引擎得到较大提升。
[期刊] 图书情报工作
[作者]
赵辉 刘怀亮
为解决短文本特征词少、概念信号弱的问题,结合维基百科进行特征扩展以辅助中文短文本分类。通过维基百科概念及链接等信息进行词语相关概念集合抽取、概念间相关度计算,利用消歧页结合短文本上下文信息解决一词多义问题,进而以词语间语义相关关系为基础进行特征扩展,以补充文本特征语义信息。最后,给出基于维基百科的中文短文本分类算法,并对其进行实验验证。结果表明,该算法能有效提高中文短文本分类效果。
关键词:
短文本分类 维基百科 词义消歧 特征扩展
[期刊] 地方财政研究
[作者]
王志刚 谢恺 朱慧
近年来,根据国务院的相关部署,我国各地开启了降成本工作,本文基于初步构建的文本数据库和文本相似度计算原理,对中央和省级层面"降成本"政策的文本进行梳理和分析,从政策文本角度较全面的展示了"降成本"工作的进展和效果。分析发现,现有"降成本"政策偏重于降低制度性交易成本和降低税费负担,中央政策重"减税"、地方政策重"降费"。各类降制度性交易成本的制度文件产生了切实的效果,制度改革力度大的地方,减少行政审批时间效果显著。此外,本文还就中央和省级政策文本相似度进行分析,为地方政府政策执行力度和因地制宜程度提供了一个新的观察角度。
关键词:
降成本 政府政策 文本相似度
[期刊] 数据分析与知识发现
[作者]
陈二静 姜恩波
【目的】分析文本相似度计算方法,了解该领域的发展态势。【文献范围】在CNKI和Web of Science中分别以检索式"篇名:文本相似度OR篇名:词汇相似度OR篇名:语义相似度"和"TI:‘text similarity’or‘semantic similarity’or‘lexical similarity’"并限定文献类型进行检索,最终得到69篇重点文献。【方法】对文本相似度计算方法进行系统梳理,分析重点方法的基本思想、特点并总结未来发展方向。【结果】形成了较为全面的分类描述体系,文本相似度计算方法
[期刊] 情报理论与实践
[作者]
黄文彬 车尚锟
[目的/意义]文本间的相似度是信息检索、文档检测和文本挖掘等任务核心参考的指标之一。梳理现有计算文本相似度的方法、分类体系及应用,有助于研究人员选择合适的计算方法提高特定场景应用的性能。[方法/过程]文章将算法利用文本语义信息的程度、基础语义信息类型、模型类型以及关联关系类型作为划分依据构建方法体系,并从原理和应用上梳理算法间的异同。[结果/结论]将文本相似度计算方法分为无语义信息、基于浅层语义信息、基于深层语义信息三个大类,对参考的语义信息、算法的基本原理和该类的典型应用做了探索分析。[创新/价值]使文本相似度计算方法具有更清晰和完整的体系,使研究人员能更好地区分相似度计算方法间的计算需求与应用场景的差异。
[期刊] 图书情报工作
[作者]
赵登鹏 熊回香 田丰收 李昕然
[目的/意义]针对序列比对算法在文本相似度中的应用,改进全局比对算法并提高该算法的准确性,同时,应用局部比对算法有效解决内容差异或长短差异较大的两文本进行比对的问题。[方法/过程]首先,利用HanLP中的CRF模型对在线学术资源中文文本数据集进行规范化处理,构成中文序列集;然后,使用最新的中文维基百科语料训练Word2Vec模型来构建语词对打分矩阵;最后,基于打分矩阵和改进的打分规则,对进行全局比对/局部比对的两中文序列进行比对并获得比对的最优解,回溯该最优解,获取最优解的比对路径,计算两中文序列的相似度。[结果/结论]实验结果表明,相较于目前全局比对算法的相关研究,本文基于词性标注的结果与Word2Vec构建的语词对打分矩阵进一步提升了全局比对算法计算文本相似度的准确性,同时,应用于文本相似度计算的局部比对算法能够有效解决内容差异或长短差异较大的两文本进行比对的问题。
[期刊] 情报科学
[作者]
牟式标 陈志军
【目的/意义】随着微博短文本对社会生活的影响日益增大,结合Delaunay三角网聚类和元胞遗传提出了一种微博短文本倾向性检测模型。【方法/过程】首先,该模型阐述了检测方法采取的数据收集、预处理、特征选择和指标计算四个阶段,并建立了短文本倾向性检测模型。其次,利用Delaunay三角网聚类和元胞遗传对上述模型进行求解。最后,通过仿真实验深入研究了影响该方法的关键因素。【结果/结论】结果表明,相比于层次结构法和神经网络,该方法在准确率、关联率等方面具有较好的适应性。
[期刊] 情报理论与实践
[作者]
尹桂秀
This article introduces a Chinese text automatic classification method,including its principle and classification process.The article focuses on some key theoretical problems,such as word classification,keyword collection and keyword matching.
[期刊] 图书情报工作
[作者]
李吉 黄微 郭苏琳
[目的 /意义]微博对用户获取信息和建立社交网络具有重要作用。提出一种基于相似度和信任度融合的微博内容推荐方法,能够从用户需求出发进行个性化微博内容推荐,对提高微博服务质量、改善信息过载问题具有意义。[方法/过程]基于相似度和信任度融合算法,构建微博内容推荐模型,以新浪微博为研究对象,采用编程方式获取汽车、体育、运动健身、互联网和财经5个领域的数据,展开用户相似度与信任度计算的实验分析和比较。[结果/结论]分析结果显示该方法可以有效表示和挖掘微博内容,改善微博推荐的准确性和用户满意度。
关键词:
相似度 信任度 微博 内容推荐
[期刊] 湖南农业大学学报(自然科学版)
[作者]
刘楚达 孙海涛
为开发出实现容易、成本低、实用性强的计算机中文自动文摘系统 ,经过研究 ,设计了一个基于统计的中文自动文摘系统模型 ,提出了一种新的特征词加权函数和一种新的句子重要性加权函数 ,该系统能对任意领域、任意体裁、任意长度的文章以任意比例提取文摘 .
[期刊] 情报理论与实践
[作者]
周瑛
本文利用词频矩阵、模糊相似矩阵和模糊聚类中的最大树方法 ,在基于相关性检索的一组文档中 ,用绝对值减数法计算文本的相似度 ,并用一个实例与常用的余弦计算法进行了比较 ,取得了较好的结果。
关键词:
信息检索 模糊算法/绝对值减数法 相似度
[期刊] 数量经济技术经济研究
[作者]
樊福卓
本文发展了一种改进的产业结构相似度测度方法——产业结构相似指数,该指标具有一般性,改进克鲁格曼指数是其在2地区模型的一个特例。研究发现,在用于多地区模型时,研究者容易掉入产业结构相似系数、改进克鲁格曼指数等指标的"用法陷阱"。对这些指标予以两种方式的灵活应用,则可避免掉入"用法陷阱"。本文还发现,在讨论区域分工问题时,地区的相对规模因素具有重要的影响;如果忽略城市的相对规模因素,则会高估长江三角洲地区工业分工水平。
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除