- 年份
- 2024(9023)
- 2023(13111)
- 2022(11571)
- 2021(10991)
- 2020(9209)
- 2019(21437)
- 2018(21120)
- 2017(41313)
- 2016(22116)
- 2015(25033)
- 2014(24889)
- 2013(24243)
- 2012(21818)
- 2011(19518)
- 2010(19055)
- 2009(17140)
- 2008(16324)
- 2007(13761)
- 2006(11718)
- 2005(9760)
- 学科
- 济(85104)
- 经济(84978)
- 管理(64530)
- 业(60182)
- 企(50818)
- 企业(50818)
- 方法(43865)
- 数学(38589)
- 数学方法(37997)
- 农(22324)
- 财(22311)
- 中国(20752)
- 业经(18622)
- 学(18608)
- 地方(16036)
- 制(15487)
- 农业(14740)
- 贸(14563)
- 贸易(14558)
- 理论(14537)
- 务(14395)
- 财务(14320)
- 财务管理(14289)
- 易(14148)
- 技术(13960)
- 和(13661)
- 企业财务(13550)
- 环境(13347)
- 划(11956)
- 银(11703)
- 机构
- 大学(307381)
- 学院(304811)
- 管理(126134)
- 济(118382)
- 经济(115854)
- 理学(111041)
- 理学院(109883)
- 管理学(107788)
- 管理学院(107239)
- 研究(95159)
- 中国(68965)
- 京(63672)
- 科学(60297)
- 财(53501)
- 业大(46754)
- 农(46395)
- 所(45671)
- 中心(44072)
- 财经(44035)
- 研究所(42089)
- 江(41482)
- 经(40237)
- 范(39702)
- 北京(39380)
- 师范(39327)
- 农业(36378)
- 经济学(35499)
- 院(35416)
- 州(34094)
- 财经大学(33158)
- 基金
- 项目(221302)
- 科学(174457)
- 基金(161890)
- 研究(161074)
- 家(140543)
- 国家(139415)
- 科学基金(121067)
- 社会(101126)
- 社会科(95765)
- 社会科学(95741)
- 基金项目(86645)
- 省(85818)
- 自然(80144)
- 自然科(78283)
- 自然科学(78265)
- 自然科学基金(76829)
- 教育(74434)
- 划(72449)
- 资助(66452)
- 编号(65738)
- 成果(51706)
- 重点(48928)
- 部(48873)
- 创(46159)
- 发(45848)
- 课题(44003)
- 创新(43042)
- 科研(42748)
- 教育部(42275)
- 大学(41766)
- 期刊
- 济(120285)
- 经济(120285)
- 研究(83946)
- 中国(51025)
- 学报(48395)
- 管理(44510)
- 科学(44408)
- 农(41153)
- 财(40221)
- 大学(37336)
- 学学(35135)
- 教育(32299)
- 农业(28805)
- 技术(27269)
- 融(21231)
- 金融(21231)
- 财经(20716)
- 业经(20386)
- 经济研究(18830)
- 经(17537)
- 图书(16350)
- 问题(15851)
- 科技(15040)
- 理论(14978)
- 技术经济(14311)
- 版(14215)
- 业(14047)
- 实践(13925)
- 践(13925)
- 资源(13233)
共检索到418025条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 图书情报工作
[作者]
赵登鹏 熊回香 田丰收 李昕然
[目的/意义]针对序列比对算法在文本相似度中的应用,改进全局比对算法并提高该算法的准确性,同时,应用局部比对算法有效解决内容差异或长短差异较大的两文本进行比对的问题。[方法/过程]首先,利用HanLP中的CRF模型对在线学术资源中文文本数据集进行规范化处理,构成中文序列集;然后,使用最新的中文维基百科语料训练Word2Vec模型来构建语词对打分矩阵;最后,基于打分矩阵和改进的打分规则,对进行全局比对/局部比对的两中文序列进行比对并获得比对的最优解,回溯该最优解,获取最优解的比对路径,计算两中文序列的相似度。[结果/结论]实验结果表明,相较于目前全局比对算法的相关研究,本文基于词性标注的结果与Word2Vec构建的语词对打分矩阵进一步提升了全局比对算法计算文本相似度的准确性,同时,应用于文本相似度计算的局部比对算法能够有效解决内容差异或长短差异较大的两文本进行比对的问题。
[期刊] 中国图书馆学报
[作者]
颜端武 成晓 甘利人
文本相似性测度被广泛用于计算用户提问与文档资源相关程度以及基于内容相似资源推荐。OCVSM是一种基于领域本体和概念向量相似性测度的方法。该方法将军用飞机领域知识本体OntoAvion的概念集作为词汇抽取特征项,根据本体中概念间的关系确定特征项的相似度,最后利用余弦算法计算文本向量相似度。实验证明,该方法与基于语言学词典的相似性测度方法相比,更接近用户对文本相似性的判断。表10。图5。参考文献10。
关键词:
相似性测度 领域本体 概念向量 文本处理
[期刊] 情报理论与实践
[作者]
周瑛
本文利用词频矩阵、模糊相似矩阵和模糊聚类中的最大树方法 ,在基于相关性检索的一组文档中 ,用绝对值减数法计算文本的相似度 ,并用一个实例与常用的余弦计算法进行了比较 ,取得了较好的结果。
关键词:
信息检索 模糊算法/绝对值减数法 相似度
[期刊] 地方财政研究
[作者]
王志刚 谢恺 朱慧
近年来,根据国务院的相关部署,我国各地开启了降成本工作,本文基于初步构建的文本数据库和文本相似度计算原理,对中央和省级层面"降成本"政策的文本进行梳理和分析,从政策文本角度较全面的展示了"降成本"工作的进展和效果。分析发现,现有"降成本"政策偏重于降低制度性交易成本和降低税费负担,中央政策重"减税"、地方政策重"降费"。各类降制度性交易成本的制度文件产生了切实的效果,制度改革力度大的地方,减少行政审批时间效果显著。此外,本文还就中央和省级政策文本相似度进行分析,为地方政府政策执行力度和因地制宜程度提供了一个新的观察角度。
关键词:
降成本 政府政策 文本相似度
[期刊] 数据分析与知识发现
[作者]
陈二静 姜恩波
【目的】分析文本相似度计算方法,了解该领域的发展态势。【文献范围】在CNKI和Web of Science中分别以检索式"篇名:文本相似度OR篇名:词汇相似度OR篇名:语义相似度"和"TI:‘text similarity’or‘semantic similarity’or‘lexical similarity’"并限定文献类型进行检索,最终得到69篇重点文献。【方法】对文本相似度计算方法进行系统梳理,分析重点方法的基本思想、特点并总结未来发展方向。【结果】形成了较为全面的分类描述体系,文本相似度计算方法
[期刊] 福建农林大学学报(自然科学版)
[作者]
林敏 钟一文 林娟
对Smith-Waterman算法的计算公式进行了改进以适应GPU并行的特点,并提出新的基于BLOCK分块的并行前缀扫描法;通过UP-DOWN步骤、BLOCK间调整、Eij微调等步骤在O(logn)时间内计算出行中每一个元素的前缀最大值;最后将回溯过程置于GPU端,避免了CPU与GPU间内存的拷贝.与传统的Smith-Waterman算法相比,该算法在低端的GPU平台性能提升90倍;与同样基于GPU的SWAT算法相比,性能也有较大的提升.
[期刊] 数据分析与知识发现
[作者]
白如江 冷伏海 廖君华
【目的】利用文本语义组块特征提升Cosine文本相似度计算性能。【方法】获取NSF资助的关于碳纳米管研究领域的项目数据,进行词干还原、词性标注等预处理;利用条件随机场模型实现文本内容的语义组块标注;在此基础上实现基于语义组块特征的改进Cosine文本相似度计算,并与未标注的数据进行相似度计算比较,分析实验结果。【结果】实验证明基于语义组块特征的改进Cosine相似度计算结果比原始文本Cosine相似度计算结果相似度均有不同程度的提升,在实验数据中最高的相似度提升了26%。【局限】依赖于语义组块标注性能。【
关键词:
文本相似度 语义组块 向量空间模型 本体
[期刊] 图书情报工作
[作者]
张均胜 石崇德 徐红姣 高影繁 何彦青
文本主观题自动阅卷的关键是提高考生答案文本和试题标准答案文本之间相似度计算结果的准确率。参考文本试题人工阅卷方法,提出一种结合人工制定文本相似标准、词语集合及词语次序和同义词的短文本相似度计算方法,设计并实现相应文本主观题阅卷系统。建立试题人工评分标准库,并在387道银行培训领域真实考题数据集上进行自动阅卷与人工阅卷结果对比实验。结果显示,文本试题自动阅卷结果与人工阅卷结果相比,完全相同的达到58%,准确率达到80%左右。
关键词:
短文本 相似度 主观题 自动阅卷
[期刊] 中南林业科技大学学报
[作者]
何岸 胡伟刚
为了提高水印的鲁棒性,适应文本完整性检测的需求,很多文献提倡多组水印的冗余嵌入方法,这涉及到文本分块问题。根据中文汉字的结构,研究并提出了一种中文文本分块设计方法以及水印嵌入算法。该方法具有明显的中文文字特色,能有效提高水印的鲁棒性,提高受攻击后水印的恢复能力。
关键词:
文本分块 汉字结构 鲁棒性
[期刊] 情报理论与实践
[作者]
范少萍 李迎迎 郑春厚
流形学习算法作为一种非线性降维方法,目标是发现嵌入在高维数据空间中的低维流形结构,并给出一个低维表示。文章尝试将流形学习算法应用于中文文本分类领域,利用局部线性判别嵌入方法对所选文本数据集进行特征降维。然后,分别利用K近邻分类器(KNN),支持向量机分类器(SVM)对文本进行分类实验。实验结果证明该方法是有效可行的,进一步验证了中文文本空间向量数据符合流形分布。
关键词:
流形学习 文本分类 算法
[期刊] 情报理论与实践
[作者]
黄文彬 车尚锟
[目的/意义]文本间的相似度是信息检索、文档检测和文本挖掘等任务核心参考的指标之一。梳理现有计算文本相似度的方法、分类体系及应用,有助于研究人员选择合适的计算方法提高特定场景应用的性能。[方法/过程]文章将算法利用文本语义信息的程度、基础语义信息类型、模型类型以及关联关系类型作为划分依据构建方法体系,并从原理和应用上梳理算法间的异同。[结果/结论]将文本相似度计算方法分为无语义信息、基于浅层语义信息、基于深层语义信息三个大类,对参考的语义信息、算法的基本原理和该类的典型应用做了探索分析。[创新/价值]使文本相似度计算方法具有更清晰和完整的体系,使研究人员能更好地区分相似度计算方法间的计算需求与应用场景的差异。
[期刊] 情报理论与实践
[作者]
杜坤 刘怀亮 王帮金
[目的/意义]在基于向量空间模型的文本聚类中,文本相似度计算忽略特征项间语义关联,针对此问题,提出一种改进的语义文本相似度计算方法。[方法/过程]新方法利用维基百科知识库计算语义相关度,结合特征项在文本中的表示权重,构造文本相似度语义加权因子,并进行K-means文本聚类实验。[结果/结论]与传统的余弦相似度相比,改进后的语义文本相似度应用在文本聚类上,能有效提高聚类的准确度。[局限]语义相关度的计算没有对词语进行消歧处理。
[期刊] 情报理论与实践
[作者]
姚兴山
本文对文本分类过程中关键的部分进行了改进,在分词阶段,对分词的速度和精度进行了改进,在特征选取阶段,把多种特征选取方法进行了融合,最后对分类器进行了优化,并给出了实验测试的结果,实验的结果表明,文本分类的效率的确有了提高。
关键词:
文本分词 特征选取 文本分类
[期刊] 图书情报工作
[作者]
张涛 马海群 易扬
[目的/意义]大数据政策的制定与实施是国家推动大数据产业发展的重要手段,因此对大数据的政策研究也受到了社会广泛关注。[方法/过程]以文本相似度为视角对国务院发布的《促进大数据发展行动纲要》和我国22个地区发布的大数据政策文本进行比较研究。[结果/结论]数据表明:广东省、福建省所制定的政策最为完整和全面,数据开放共享和安全保障在各地区大数据政策制定层面整体关注最高,呈现出相似性,在内蒙古自治区、四川省等地区大数据政策制定中区域特色较为突出,呈现出差异性。随着各地区相继颁布人工智能政策,未来对人工智能视域下大数据政策的研究将成为新方向。
[期刊] 情报理论与实践
[作者]
赵辉 刘怀亮 范云杰 左晓飞
针对向量空间模型中语义缺失问题,将语义词典(知网)应用到文本分类的过程中以提高文本分类的准确度。对于中文文本中的一词多义现象,提出改进的词汇语义相似度计算方法,通过词义排歧选取义项进行词语的相似度计算,将相似度大于阈值的词语进行聚类,对文本特征向量进行降维,给出基于语义的文本分类算法,并对该算法进行实验分析。结果表明,该算法可有效提高中文文本分类效果。
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除