- 年份
- 2024(11948)
- 2023(17167)
- 2022(14859)
- 2021(13843)
- 2020(11516)
- 2019(26314)
- 2018(26042)
- 2017(50050)
- 2016(27438)
- 2015(30450)
- 2014(30521)
- 2013(29642)
- 2012(27172)
- 2011(24370)
- 2010(23932)
- 2009(21706)
- 2008(20786)
- 2007(17999)
- 2006(15449)
- 2005(13235)
- 学科
- 济(105381)
- 经济(105254)
- 管理(76387)
- 业(70296)
- 企(58562)
- 企业(58562)
- 方法(49848)
- 数学(43450)
- 数学方法(42835)
- 农(27404)
- 中国(27250)
- 财(26930)
- 学(25883)
- 地方(22848)
- 业经(22692)
- 制(19511)
- 理论(18803)
- 农业(18348)
- 贸(17223)
- 贸易(17218)
- 务(17102)
- 财务(17020)
- 财务管理(16984)
- 和(16855)
- 易(16671)
- 技术(16551)
- 环境(16385)
- 企业财务(16139)
- 银(15711)
- 银行(15646)
- 机构
- 大学(379863)
- 学院(377740)
- 管理(146786)
- 济(144028)
- 经济(140823)
- 研究(128596)
- 理学(128165)
- 理学院(126665)
- 管理学(124022)
- 管理学院(123357)
- 中国(93005)
- 科学(84161)
- 京(80786)
- 农(67644)
- 财(65385)
- 所(65089)
- 业大(61341)
- 研究所(60070)
- 中心(58308)
- 江(54754)
- 农业(53566)
- 财经(53064)
- 范(50808)
- 师范(50151)
- 北京(50088)
- 经(48505)
- 院(47678)
- 州(44128)
- 经济学(43152)
- 技术(42253)
- 基金
- 项目(271508)
- 科学(212703)
- 基金(196623)
- 研究(193025)
- 家(174298)
- 国家(172925)
- 科学基金(147430)
- 社会(120133)
- 社会科(113714)
- 社会科学(113684)
- 省(106935)
- 基金项目(104088)
- 自然(98669)
- 自然科(96380)
- 自然科学(96349)
- 自然科学基金(94571)
- 划(91004)
- 教育(89591)
- 资助(81116)
- 编号(77762)
- 成果(62256)
- 重点(61569)
- 部(59072)
- 发(57810)
- 创(56309)
- 课题(54265)
- 科研(52802)
- 创新(52606)
- 计划(51125)
- 教育部(49959)
- 期刊
- 济(150354)
- 经济(150354)
- 研究(105888)
- 中国(70714)
- 学报(68470)
- 科学(60230)
- 农(60170)
- 管理(52737)
- 大学(51070)
- 财(49395)
- 学学(48168)
- 教育(44603)
- 农业(41661)
- 技术(33118)
- 融(28536)
- 金融(28536)
- 财经(25163)
- 业经(25110)
- 经济研究(24419)
- 经(21526)
- 业(21377)
- 图书(19834)
- 问题(19492)
- 版(19369)
- 科技(19024)
- 业大(18239)
- 理论(17054)
- 技术经济(17027)
- 资源(16694)
- 统计(16583)
共检索到536860条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 中国图书馆学报
[作者]
颜端武 成晓 甘利人
文本相似性测度被广泛用于计算用户提问与文档资源相关程度以及基于内容相似资源推荐。OCVSM是一种基于领域本体和概念向量相似性测度的方法。该方法将军用飞机领域知识本体OntoAvion的概念集作为词汇抽取特征项,根据本体中概念间的关系确定特征项的相似度,最后利用余弦算法计算文本向量相似度。实验证明,该方法与基于语言学词典的相似性测度方法相比,更接近用户对文本相似性的判断。表10。图5。参考文献10。
关键词:
相似性测度 领域本体 概念向量 文本处理
[期刊] 图书情报工作
[作者]
赵登鹏 熊回香 田丰收 李昕然
[目的/意义]针对序列比对算法在文本相似度中的应用,改进全局比对算法并提高该算法的准确性,同时,应用局部比对算法有效解决内容差异或长短差异较大的两文本进行比对的问题。[方法/过程]首先,利用HanLP中的CRF模型对在线学术资源中文文本数据集进行规范化处理,构成中文序列集;然后,使用最新的中文维基百科语料训练Word2Vec模型来构建语词对打分矩阵;最后,基于打分矩阵和改进的打分规则,对进行全局比对/局部比对的两中文序列进行比对并获得比对的最优解,回溯该最优解,获取最优解的比对路径,计算两中文序列的相似度。[结果/结论]实验结果表明,相较于目前全局比对算法的相关研究,本文基于词性标注的结果与Word2Vec构建的语词对打分矩阵进一步提升了全局比对算法计算文本相似度的准确性,同时,应用于文本相似度计算的局部比对算法能够有效解决内容差异或长短差异较大的两文本进行比对的问题。
[期刊] 情报理论与实践
[作者]
何超 张玉峰
针对传统的中文文本特征提取算法存在的语义丢失和语义缺乏问题,设计了融合领域本体的中文文本语义特征提取算法。该算法利用基于种子—扩展机制的关键词识别与提取算法解决传统算法中利用分词工具进行关键词提取所产生的语义丢失问题;利用基于领域本体的文本概念特征语义映射与聚合算法解决传统算法中利用向量空间模型进行文本表示所产生的高维和语义缺乏问题。实验结果表明,该算法取得了很好的预期效果,能够显著提高文本特征提取的深度和准确性。
关键词:
文本语义特征 领域本体 算法
[期刊] 情报学报
[作者]
唐琳 郭崇慧 陈静锋 孙磊磊
基于学术文献构建领域本体对促进领域学科发展具有重要的意义。本文提出了一种以中文学术文献为数据源,半自动化抽取领域本体层次关系的框架方法。首先,构建了一个通用的领域本体层次关系的细粒度研究框架。其次,设计了一种新的概念表示方法,融合了深度学习方法得到的概念语义特征和上下文的时间序列词频。进一步结合了AP聚类、Prim算法和Web搜索引擎的查询数据,提出了基于规则推理的本体概念层次关系抽取算法(RROCHE),实现了半自动化概念层次关系抽取。最后,基于中文分词领域的中文学术文献数据,通过数值实验方法讨论了方法的可行性和有效性。本文提出的框架方法也非常容易推广并应用到各领域本体层次关系任务中。
[期刊] 情报理论与实践
[作者]
周瑛
本文利用词频矩阵、模糊相似矩阵和模糊聚类中的最大树方法 ,在基于相关性检索的一组文档中 ,用绝对值减数法计算文本的相似度 ,并用一个实例与常用的余弦计算法进行了比较 ,取得了较好的结果。
关键词:
信息检索 模糊算法/绝对值减数法 相似度
[期刊] 情报理论与实践
[作者]
朱恒民 马静 黄卫东
为了快速有效地自动处理中文Web文本,提出了一种基于领域本体的主题特征抽取方法。该方法针对Web文本特点,介绍了一种领域词典的半自动化构建方法。基于领域词典切分文本,通过对词条的主题映射,采用领域本体的概念表示文本向量,从而有效地降低文本特征向量的维数,提高主题抽取的质量。考虑文本信息的不同位置与频率,计算主题特征的权值,并且基于领域本体的结构,对主题概念的权值进行调整和排序。实例验证了该方法的有效性。
关键词:
主题抽取 领域本体 文本挖掘
[期刊] 情报理论与实践
[作者]
王思丽 祝忠明 刘巍 杨恒
[目的/意义]实现对领域概念的自动学习抽取,解决领域本体自动化构建的首要基础任务。[方法/过程]以无监督的学习方法和端到端的识别模式为理论技术基础,首先通过对主流词嵌入模型进行对比分析,设计提出了基于Word2Vec和Skip-Gram的领域文本特征词嵌入模型的自动生成方法;其次研究构建了以IOB格式的标注文本作为输入,基于自注意力机制的BLSTM-CRF领域概念自动抽取模型;最后以资源环境学科领域为例进行了实验研究与评估分析。[结果/结论]模型能够实现对领域概念的自动抽取,对领域新概念或术语的自动识别也具有一定的健壮性。[局限]模型精度尚未达到峰值,有待进一步优化提升。
[期刊] 图书情报工作
[作者]
张云中 徐宝祥
针对基于形式概念分析(FCA)的领域本体构建方法的优化问题进行论述,解决优化的四个难点,应用并行开发的工程思想,采用"分而治之、映射集成"的具体手段,提出一种新的基于FCA的领域本体构建方法并建立"增量模型"。该方法将整个领域本体构建过程分解成核心本体和若干个并行开发的增量本体的构建过程,而后将核心本体和增量本体通过本体映射和本体集成的手段进行按需组合,最终得到用户所需领域本体。
关键词:
形式概念分析 领域本体构建方法 增量模型
[期刊] 情报学报
[作者]
王梦云 曹素青
本文提出了一种根据汉字统计特性和基于实例映射的中文文本自动分类方法。该方法采用汉字字频向量作为文本的表示方法。它的显著特点是引入线性最小二乘方估计技术建立文本分类器模型 ,通过对训练集语料的手工分类标引以及对文本和类别间的相关性判定的学习 ,实现了基于全局最小错误率的汉字—类别两个向量空间的映射函数 ,并用该函数对测试文本进行分类。
[期刊] 图书情报工作
[作者]
王娟 曹树金 姜灵敏 胡青
以提高领域概念相关性判断的准确度为研究宗旨,提出综合利用中文维基百科的分类体系结构和概念释义内容进行概念间语义相关度计算的方法。选取中文维基百科分类体系下的图书情报领域的概念为实验对象,将基于分类信息和文本信息的加权算法与单独基于分类信息的语义距离算法和信息量算法,以及基于文本信息的文本重叠算法进行对比分析。实验结果表明:加权算法能取得更好的效果,可为实现面向领域的信息检索、领域本体构建等应用提供重要技术支持。
[期刊] 审计研究
[作者]
张勇 殷健
本文利用TF-IDF的文本相似度分析方法考察了会计师事务所联结对企业会计政策相似性的影响。研究发现,与不存在会计师事务所联结的两家企业相比,存在会计师事务所联结的两家企业的会计政策相似性水平更高;本年度,若两家企业由上年度不存在事务所联结关系变更为存在联结关系,则其会计政策相似性水平会上升。进一步研究表明,在会计师事务所联结的配对企业中,与规模小的会计师事务所相比,规模大的会计师事务所联结的两家企业会计政策相似性水平更高;本年度,若两家企业的事务所规模由上年度的小所变更为大所,则其会计政策相似性水平会上升。事务所向其联结的两家企业派遣的审计师重合程度越高,那么企业之间的会计政策相似性水平越高;若两家企业当年的审计师重合程度高于上年度,则其会计政策相似性水平会上升。
[期刊] 工业工程与管理
[作者]
潘浩 高英铭 潘尔顺
在常用评论特征的基础上,提出了一种基于搜索引擎(如百度)的文本相似性方法获取评论与产品标题之间的相似性,并作为新的评论特征建立评论推荐模型。实验证明,引入评论与产品相似性特征可明显改进评论推荐机制的有效性,同时文本相似性评价的准确性可以借助搜索引擎得到较大提升。
[期刊] 数字图书馆论坛
[作者]
郭红梅 袁国华 胡正银
在对概念语义相似度方法调研的基础上,本文提出基于概念向量的文本语义相似度测度方法,借助MetaMap工具抽取文本中的概念术语,将概念术语通过词表层级结构转化为概念向量,通过计算两文本中概念向量的语义相似度来测度两文本的语义相似度。为验证基于概念向量文本语义相似度方法的准确性,选取TREC-05 genomics track数据进行实验,实验结果表明,本文提出的方法较常用的余弦方法更优,与专家评估方法更接近,在测度文本语义相似度上具有一定的可行性和有效性。
关键词:
概念向量 语义相似度 文本相似度
[期刊] 图书情报工作
[作者]
宋雯斐 王洋 双林平
利用分类主题一体化的主题词表构建领域本体,并通过概念间的关系定义及语义相似度公式,引入调整因子,确定概念相似度算法,再通过余弦系数法进一步得到文献间的相似度。对于本算法的结果,与领域专家预测的相似度进行比较,结果证实该算法有效。
关键词:
领域本体 文献相似度 概念相似度
[期刊] 图书情报工作
[作者]
薛春香 张玉芳
在对文本分类及中文新闻分类概述的基础上,归纳出网络新闻文本特征及当前新闻文本分类特点,并总结新闻文本分类在新闻网站分类导航、话题识别与跟踪、个性化推荐三方面的应用。其后,总结中文新闻分类存在的问题,诸如缺乏通用语料和评价方法、分类体系粗略、分类维度单一等,并提出相应措施。最后,针对当前信息环境,提出新闻分类不仅将朝着多层次、多维度、跨语言方向发展,还将与多媒体信息、大数据、社会化媒体相结合。
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除