- 年份
- 2024(9934)
- 2023(14386)
- 2022(12314)
- 2021(11493)
- 2020(9552)
- 2019(21624)
- 2018(21479)
- 2017(40945)
- 2016(22294)
- 2015(25103)
- 2014(25083)
- 2013(24466)
- 2012(22378)
- 2011(20065)
- 2010(20228)
- 2009(18648)
- 2008(17085)
- 2007(14878)
- 2006(12982)
- 2005(11386)
- 学科
- 济(84353)
- 经济(84255)
- 管理(61295)
- 业(57153)
- 企(47884)
- 企业(47884)
- 方法(36672)
- 数学(31762)
- 数学方法(31361)
- 中国(28191)
- 融(27095)
- 金融(27086)
- 银(25369)
- 银行(25321)
- 行(24468)
- 财(22595)
- 地方(22285)
- 农(22219)
- 学(20891)
- 业经(19197)
- 制(18892)
- 理论(15728)
- 农业(15122)
- 务(14887)
- 财务(14812)
- 财务管理(14789)
- 企业财务(14108)
- 贸(13832)
- 贸易(13819)
- 和(13732)
- 机构
- 大学(306097)
- 学院(305533)
- 管理(119271)
- 济(115570)
- 经济(112765)
- 研究(104116)
- 理学(103190)
- 理学院(101983)
- 管理学(100087)
- 管理学院(99553)
- 中国(82324)
- 科学(67147)
- 京(65528)
- 财(54224)
- 所(52599)
- 农(50937)
- 中心(48970)
- 研究所(48420)
- 业大(46806)
- 江(44484)
- 财经(43544)
- 范(41576)
- 北京(41389)
- 师范(41124)
- 农业(39969)
- 经(39558)
- 院(38522)
- 州(36878)
- 经济学(34240)
- 技术(33726)
- 基金
- 项目(216147)
- 科学(169132)
- 研究(157151)
- 基金(155452)
- 家(136392)
- 国家(135258)
- 科学基金(115418)
- 社会(96543)
- 社会科(91406)
- 社会科学(91382)
- 省(85504)
- 基金项目(83028)
- 自然(76232)
- 自然科(74415)
- 自然科学(74399)
- 自然科学基金(73003)
- 划(72269)
- 教育(71592)
- 编号(64948)
- 资助(63634)
- 成果(52519)
- 重点(49011)
- 发(46728)
- 部(46351)
- 课题(45015)
- 创(44889)
- 创新(41891)
- 科研(41671)
- 项目编号(40110)
- 大学(39617)
共检索到447140条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 情报理论与实践
[作者]
何超 张玉峰
针对传统的中文文本特征提取算法存在的语义丢失和语义缺乏问题,设计了融合领域本体的中文文本语义特征提取算法。该算法利用基于种子—扩展机制的关键词识别与提取算法解决传统算法中利用分词工具进行关键词提取所产生的语义丢失问题;利用基于领域本体的文本概念特征语义映射与聚合算法解决传统算法中利用向量空间模型进行文本表示所产生的高维和语义缺乏问题。实验结果表明,该算法取得了很好的预期效果,能够显著提高文本特征提取的深度和准确性。
关键词:
文本语义特征 领域本体 算法
[期刊] 情报理论与实践
[作者]
张建娥
文章通过分析传统关键词提取方法的特点和存在的问题,提出基于多特征融合的中文文本关键词提取方法。该方法通过融合中文文本词语的频率、关联度、词性以及位置多种特征,有效避免了传统关键词提取方法产生的偏差。实验结果表明,该方法在不同测试集上与传统方法相比关键词提取的平均召回率均得到明显提升。
关键词:
中文文档 特征融合 关键词
[期刊] 中国图书馆学报
[作者]
颜端武 成晓 甘利人
文本相似性测度被广泛用于计算用户提问与文档资源相关程度以及基于内容相似资源推荐。OCVSM是一种基于领域本体和概念向量相似性测度的方法。该方法将军用飞机领域知识本体OntoAvion的概念集作为词汇抽取特征项,根据本体中概念间的关系确定特征项的相似度,最后利用余弦算法计算文本向量相似度。实验证明,该方法与基于语言学词典的相似性测度方法相比,更接近用户对文本相似性的判断。表10。图5。参考文献10。
关键词:
相似性测度 领域本体 概念向量 文本处理
[期刊] 情报理论与实践
[作者]
朱恒民 马静 黄卫东
为了快速有效地自动处理中文Web文本,提出了一种基于领域本体的主题特征抽取方法。该方法针对Web文本特点,介绍了一种领域词典的半自动化构建方法。基于领域词典切分文本,通过对词条的主题映射,采用领域本体的概念表示文本向量,从而有效地降低文本特征向量的维数,提高主题抽取的质量。考虑文本信息的不同位置与频率,计算主题特征的权值,并且基于领域本体的结构,对主题概念的权值进行调整和排序。实例验证了该方法的有效性。
关键词:
主题抽取 领域本体 文本挖掘
[期刊] 图书情报工作
[作者]
王巍洁 任慧玲 李晓瑛 王勖 张颖
[目的/意义]为提高机器理解医学文本的能力,提高医学自然语言处理等上层任务效果,保障医学知识内容更新及时性、覆盖完整性,提出一种融合汉字多语义信息与文本统计特征的医学新词发现方法。[方法/过程]以规范用词的医学文献摘要数据为新词发现来源,基于N-gram模型获取N元词串,将词串存入字典树,从词的内部凝固度、词的自由程度、词的语义相似度3个角度同时计算每个N-gram词串的关联置信度、左右邻接熵、多语义相似度(包括汉字细粒度字符语义信息、BERT词向量信息),遍历上述各指标阈值评估N-gram词串为医学新词的可能。[结果/结论 ]从中华医学会收录的截至2022年10月20日的最新1 000篇文摘中发现医学新词3 263个,去除重复项后,共获得764个医学新词。提出的融合汉字多语义与文本统计特征的医学新词发现方法对比现有方法具有一定提升,且在应用上可以有效提高医学分词任务效果,使医学分词后的名词类别更清晰、概念更明确、内涵更丰富。结合汉字内在多语义信息与字词外部统计特征的医学新词发现方法,不仅可以提高计算机的新词发现能力,还可提高计算机面对专业且复杂的医学文本自然语言处理效果,对及时更新领域知识内容等具有重要帮助。
[期刊] 中国农业大学学报
[作者]
陈桐 潘新 马玉宝 闫伟红
针对禾本科牧草种子相似性较高、识别困难的问题,采用局部相似模式(LSP)和灰度共生矩阵(GLCM)的方法,对禾本科牧草种子的分类识别进行研究。结果表明:1)局部相似模式与灰度共生矩阵融合的方法可以有效的提取禾本科牧草种子的纹理特征,能够识别颜色、形状、大小等特征都十分相似的牧草种子,且其识别率优于传统的LSP特征算子和GLCM特征算子。2)与传统LSP算法相比,结合灰度共生矩阵算法后,得到的特征受到相似种类种子图像的影响较小,具有更广泛的适应性。因此,基于LSP和GLCM的融合算法可以有效地提取相似禾本科种子图像的纹理统计特征,采用线性判别分析分类器(LDA)进行分类,识别率最高达到98.64%。
[期刊] 图书情报工作
[作者]
于津凯 王映雪 陈怀楚
介绍一种改进的文本特征提取及匹配算法。该算法基于N-Gram算法思路进行文本处理和特征提取,设计了gram关联矩阵用于统计与合并特征词,从而在固定长度N-Gram算法的基础上能够提取出不同长度的特征词。实验证明,该特征提取算法能够更为准确地描述文本特征,可应用于文本检索、Web挖掘等信息处理领域。
[期刊] 数据分析与知识发现
[作者]
李昌兵 庞崇鹏 李美平
【目的】解决在海量客户评论信息中抽取产品特征时噪声大的问题。【方法】运用TF-IDF和方差选择的统计方法在众多初步提取出来的特征中进行选择,设置阈值后将各自提取出来的特征取交进行过滤,得到产品特征集合,根据基于矩阵和权重改进的Apriori算法产生频繁项集,设定不同阈值得到最优特征集合,实现对用户评论中产品特征的自动提取。【结果】以手机评论文本为例,从中抽取手机类的产品特征,根据人工标注的183个特征和算法识别出来的特征,查准率P为72.44%,查全率R为77.59%,综合值F为74.93%。【局限】查准
[期刊] 图书情报工作
[作者]
薛春香 张玉芳
在对文本分类及中文新闻分类概述的基础上,归纳出网络新闻文本特征及当前新闻文本分类特点,并总结新闻文本分类在新闻网站分类导航、话题识别与跟踪、个性化推荐三方面的应用。其后,总结中文新闻分类存在的问题,诸如缺乏通用语料和评价方法、分类体系粗略、分类维度单一等,并提出相应措施。最后,针对当前信息环境,提出新闻分类不仅将朝着多层次、多维度、跨语言方向发展,还将与多媒体信息、大数据、社会化媒体相结合。
[期刊] 情报理论与实践
[作者]
庞景安
本文对当前有关Web文本特征提取方法的研究和试验进行了简要的综述和分析,比较了每类方法的优势和不足,指出研究中存在的难点和共同探讨的问题,并在此基础上,对该领域未来研究的发展方向和趋势进行了预测。
关键词:
Web文本 文本特征 特征提取 学习算法
[期刊] 情报理论与实践
[作者]
李杰 李欢
[目的/意义]构建在线评论的产品特征提取及情感分类模型,可以为产品设计人员进行产品优化改进提供决策支持。[方法/过程]提出了基于卷积神经网络算法的产品特征提取及情感分类模型。模型采用卷积神经网络进行短文本评论情感分类,以情感分类标签标注相应评论中提取的产品特征词,并利用词向量对产品特征词聚类。通过爬取的笔记本电脑和手机评论对模型进行训练和测试。[结果/结论]结果表明,模型能够实现有效的产品特征提取及高准确率情感分类,是在线评论分析的有效模型。
[期刊] 情报科学
[作者]
周源 刘怀兰 杜朋朋 廖岭
【目的/意义】特征提取会很大程度地影响分类效果,而传统TF-IDF特征提取方法缺乏对特征词上下文环境和对特征词在类之间分布状况的考虑。【方法/过程】本文提出一种改进TF-IDF特征提取的方法:(1)基于文本网络和改进Page Rank算法计算节点重要程度值,解决传统TF-IDF忽略文本结构信息的问题;(2)增加特征值IDF值的方差来衡量特征词w在不同类别文本集中程度的分布情况,解决传统TF-IDF忽略特征词在类之间分布状况的不足。【结果/结论】基于该改进方法构建了文本分类模型,对3D打印数据进行分类实验。
[期刊] 中南林业科技大学学报
[作者]
何岸 胡伟刚
为了提高水印的鲁棒性,适应文本完整性检测的需求,很多文献提倡多组水印的冗余嵌入方法,这涉及到文本分块问题。根据中文汉字的结构,研究并提出了一种中文文本分块设计方法以及水印嵌入算法。该方法具有明显的中文文字特色,能有效提高水印的鲁棒性,提高受攻击后水印的恢复能力。
关键词:
文本分块 汉字结构 鲁棒性
[期刊] 情报理论与实践
[作者]
赵辉 刘怀亮 范云杰 左晓飞
针对向量空间模型中语义缺失问题,将语义词典(知网)应用到文本分类的过程中以提高文本分类的准确度。对于中文文本中的一词多义现象,提出改进的词汇语义相似度计算方法,通过词义排歧选取义项进行词语的相似度计算,将相似度大于阈值的词语进行聚类,对文本特征向量进行降维,给出基于语义的文本分类算法,并对该算法进行实验分析。结果表明,该算法可有效提高中文文本分类效果。
[期刊] 大学图书馆学报
[作者]
王睿佳 刘耀
科技文献资源是一种多模态数据,除文本信息外,还包含丰富的图像、表格、公式、音频、视频等多种模态的信息,有利于用户充分理解科技文献资源中的知识。该文把多模态思想引入科技文献的语义表示方面,对科技文献中的图像、表格和公式信息进行语义分析,与文本信息共同表示文献语义内容,通过科技文献中多种模态信息的语义表示及相互关系完善科技文献内容的语义化表示,发展刻画科技文献对象多态性的表达体系。
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除