- 年份
- 2024(6639)
- 2023(9651)
- 2022(8234)
- 2021(7859)
- 2020(6529)
- 2019(14937)
- 2018(14966)
- 2017(28248)
- 2016(15305)
- 2015(17370)
- 2014(17518)
- 2013(16367)
- 2012(14734)
- 2011(12916)
- 2010(12486)
- 2009(10872)
- 2008(10171)
- 2007(8857)
- 2006(7121)
- 2005(5869)
- 学科
- 济(54655)
- 经济(54582)
- 管理(43997)
- 业(39333)
- 企(32937)
- 企业(32937)
- 方法(27523)
- 数学(24318)
- 数学方法(23944)
- 财(16331)
- 农(15384)
- 中国(14603)
- 业经(11990)
- 制(11691)
- 理论(11058)
- 学(11011)
- 务(10682)
- 财务(10627)
- 财务管理(10593)
- 地方(10229)
- 企业财务(9977)
- 农业(9916)
- 贸(9358)
- 贸易(9354)
- 体(9325)
- 易(9098)
- 技术(9097)
- 银(8846)
- 银行(8827)
- 和(8718)
- 机构
- 学院(200125)
- 大学(197449)
- 管理(78860)
- 济(76741)
- 经济(75044)
- 理学(68315)
- 理学院(67637)
- 管理学(66290)
- 管理学院(65914)
- 研究(59700)
- 中国(45521)
- 京(40228)
- 财(36600)
- 科学(36584)
- 农(31003)
- 江(30325)
- 中心(29956)
- 业大(29792)
- 财经(29357)
- 所(28011)
- 经(26760)
- 范(26032)
- 师范(25695)
- 研究所(25385)
- 农业(24241)
- 北京(24113)
- 技术(23978)
- 州(23874)
- 经济学(23502)
- 院(22732)
- 基金
- 项目(141249)
- 科学(111598)
- 研究(105959)
- 基金(101655)
- 家(88022)
- 国家(87261)
- 科学基金(76067)
- 社会(65998)
- 社会科(62455)
- 社会科学(62442)
- 省(56745)
- 基金项目(53941)
- 教育(50710)
- 自然(49196)
- 自然科(48088)
- 自然科学(48074)
- 自然科学基金(47185)
- 划(47085)
- 编号(44587)
- 资助(40984)
- 成果(35058)
- 重点(31722)
- 部(31101)
- 课题(30394)
- 创(30274)
- 发(29904)
- 创新(28227)
- 项目编号(27475)
- 科研(27444)
- 大学(27223)
共检索到284977条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 图书馆
[作者]
黄显堂
本文探讨了本体与语义Web的关系、本体在语义Web文本分类中的作用,并重点探讨了基于本体的语义Web文本分类的特点以及Web文本分类器的一般工作原理。
关键词:
本体 语义Web 文本分类
[期刊] 财会通讯
[作者]
吕薇
XBRL作为一种源于XML的语言,具有跨平台、易于传输、支持智能处理等优点,目前在金融、会计、审计和管理中广泛应用,相关研究成果方兴未艾。XBRL应用的质量取决于其底层数据结构——XBRL分类标准,但是,目前XBRL分类标准还没有一种理论化、定量化的质量评价方式。本文首次提出了一种基于本体论的XBRL语义评价方法,并基于这一方法,对上海证券交易所(SSE)现行的分类标准进行评价,并对评价结果进行了讨论,检验了该方法的有效性。
关键词:
XBRL 分类标准 本体论
[期刊] 图书情报工作
[作者]
尹丽英 赵捧未
为减少一词多义现象及训练样本的类偏斜问题对分类性能的影响,提出一种基于语义网络社团划分的中文文本分类算法。通过维基百科知识库对文本特征词进行消歧,构建出训练语义复杂网络以表示文本间的语义关系,再次结合节点特性采用K-means算法对训练集进行社团划分以改善类偏斜问题,进而查找待分类文本的最相近社团并以此为基础进行文本分类。实验结果表明,本文所提出的中文文本分类算法是可行的,且具有较好的分类效果。
关键词:
语义网络 词义消歧 社团结构 文本分类
[期刊] 情报理论与实践
[作者]
赵辉 刘怀亮 范云杰 左晓飞
针对向量空间模型中语义缺失问题,将语义词典(知网)应用到文本分类的过程中以提高文本分类的准确度。对于中文文本中的一词多义现象,提出改进的词汇语义相似度计算方法,通过词义排歧选取义项进行词语的相似度计算,将相似度大于阈值的词语进行聚类,对文本特征向量进行降维,给出基于语义的文本分类算法,并对该算法进行实验分析。结果表明,该算法可有效提高中文文本分类效果。
[期刊] 统计与决策
[作者]
刘苗 谢邦昌
文章从文本特征抽取、分类算法效率和精度两个角度出发,首先利用概率潜在语义分析(PLSA)方法,有效地提取出隐含在文档词频数据中的语义概念信息;然后构建了分类精度较高的Adaboost算法作为分类器。实验结果表明,该方法发挥了两种方法的优势,能够很好地完成对文本的自动分类。
[期刊] 图书情报工作
[作者]
阮光册
为弥补改进传统Web文本挖掘方法缺乏对文本语义理解的不足,采用本体与Web文本挖掘相结合的方法,探讨基于领域本体的Web文本挖掘方法。首先创建Web文本的本体结构,然后引入领域本体"概念-概念"相似度矩阵,并就概念间关系识别进行描述,最后给出Web文本挖掘的实现方法,发现Web文本信息的内涵。实验中以网络媒体报道为例,通过文本挖掘得出相关结论。
关键词:
本体 Web文本挖掘 领域本体
[期刊] 情报理论与实践
[作者]
朱恒民 马静 黄卫东
为了快速有效地自动处理中文Web文本,提出了一种基于领域本体的主题特征抽取方法。该方法针对Web文本特点,介绍了一种领域词典的半自动化构建方法。基于领域词典切分文本,通过对词条的主题映射,采用领域本体的概念表示文本向量,从而有效地降低文本特征向量的维数,提高主题抽取的质量。考虑文本信息的不同位置与频率,计算主题特征的权值,并且基于领域本体的结构,对主题概念的权值进行调整和排序。实例验证了该方法的有效性。
关键词:
主题抽取 领域本体 文本挖掘
[期刊] 图书情报工作
[作者]
张玉峰 何超
为提高文本分类的准确性与效率,提出一种基于潜在语义分析和改进的超球支持向量机的文本分类模型。该模型利用潜在语义分析进行特征抽取,消除同义词和多义词在文本表示时所造成的偏差,实现文本向量的降维。针对超球重叠区域的文本分类问题,设计一种新的决策方法—基于密集度的决策策略。实验结果表明,该模型在类别数目较小时具有较好的分类效果,改进的算法有效可行。
[期刊] 情报理论与实践
[作者]
张玉峰 何超
为了提高文本分类的准确性和效率,提出了一种基于潜在语义分析和超球支持向量机的文本分类模型。针对SVM对大规模文本分类时收敛速度较慢这一缺点,本文将超球支持向量机应用于文本分类,采用基于增量学习的超球支持向量机分类学习算法进行训练和分类。实验结果表明,超球支持向量机是一种解决SVM问题的有效方法,在文本分类应用中具有与SVM相当的精度,但是明显降低了模型复杂度和训练时间。
关键词:
文本分类 潜在语义分析 支持向量机
[期刊] 中国图书馆学报
[作者]
董慧 唐敏
目前Web2.0服务虽能调动大众用户的力量,但所提供的检索方式单一,不能很好地解读用户的需求,也不利于信息的跨平台检索。语义检索是针对概念及概念之间关系的检索,能实现基于语义的匹配和推理,将语义检索应用于Web2.0服务中,能很好地调动用户互动参与,增强信息搜索的准确度,使服务更具个性化。而通过Web2.0,非专业用户能为语义检索的实现贡献力量,用户使用反馈也能逐步提高语义检索的质量。本文在分析Web2.0服务所提供的检索和语义检索各自优劣势的基础上,从语义信息的生成、存储和检索三方面探讨两者结合的方法,并对其应用优势进行展望。
关键词:
语义检索 Web2.0 语义标注 本体
[期刊] 情报理论与实践
[作者]
郑建国 黄奇
在充分理解产品分类意义的基础上,指出了产品分类存在的五大问题,描述了产品分类的体系结构。针对这五大问题提出了产品分类本体构建语义分析模型,对每一要素进行了分析,重点突出了概念划分、类的处理、属性处理和语义细化,阐述了语义关系之间细微的语义差异。通过对产品分类进行语义分析,构建产品分类本体。
关键词:
产品分类 体系结构 本体构建 语义分析
[期刊] 中国图书馆学报
[作者]
宋宁远 王晓光
叙事性文本是对现实世界的记录,也是人文学者的研究对象与基础,对叙事性文本的阐释更是人文学术研究的基本任务。随着数字人文的发展,人文学者对远距离阅读与策略型阅读的需求与日俱增。作为构成叙事性文本的基本单元,事件和情节是文本解读的重点。为了更好地适应人文学者阅读需求的转变,建构叙事性文本智慧数据,支撑数字人文研究,以情节为视角,以事件为基础,对广泛存在的叙事性文本进行深层次语义表示与结构化处理显得尤为重要。但现阶段较为成熟的文本表示方法更适用于结构相对清晰、统一的科学文本,不能很好地表示叙事性文本中存在的复杂叙事结构,因此,以知识表示与知识组织为出发点,构建符合叙事性文本特征的语义结构化表示方法具有十分重要的意义。本文在梳理叙事学基本理论与概念,以及事件知识表示、事件本体与叙事本体等理论研究的基础上,对叙事文本中存在的事件、事件间关系进行语义建模与表示,同时完善了对情节的定义,构建了基于事件的情节本体EBPO,提出了叙事性文本的"层次—网络"结构模型,用以实现对叙事性文本的语义结构化表示。初步标注的实验结果表明,借助情节本体及结构模型,可以实现对叙事性文本的语义结构化处理。图8。表4。参考文献61。
[期刊] 图书情报工作
[作者]
张梦芸 丁敬达
[目的 /意义]信息技术的快速发展使得用户评论、患者症状等短文本数据量迅速增长,如何从短文本中挖掘有价值的信息成为文本分类的研究热点。[方法 /过程]以国内某医院各科室患者的病情症状数据为语料集,针对短症状文本包含语义信息不足的问题,从各科室症状词的重要度与关联度出发,将症状文本中低于设定症状词数量的文本作为语义增强对象,采用Word2Vec与基于概率的TF-IDF算法抽取各科室的若干典型症状关键词,将其补充到语义增强对象中形成新语料集,最后利用机器学习算法对症状文本进行分类。[结果 /结论]基于文章语义增强方法构造的新语料集,相较于原始语料集,在支持向量机(Support Vector Machine,SVM)、多项式朴素贝叶斯(Multinomial Naive Bayes,MNB)以及随机森林(Random Forest,RF)上的分类效果均有较大幅度提升,准确率分别提高约10%、9%、10%。
[期刊] 图书情报工作
[作者]
张梦芸 丁敬达
[目的/意义]信息技术的快速发展使得用户评论、患者症状等短文本数据量迅速增长,如何从短文本中挖掘有价值的信息成为文本分类的研究热点。[方法/过程]以国内某医院各科室患者的病情症状数据为语料集,针对短症状文本包含语义信息不足的问题,从各科室症状词的重要度与关联度出发,将症状文本中低于设定症状词数量的文本作为语义增强对象,采用Word2Vec与基于概率的TF-IDF算法抽取各科室的若干典型症状关键词,将其补充到语义增强对象中形成新语料集,最后利用机器学习算法对症状文本进行分类。[结果/结论]基于文章语义增强方法构造的新语料集,相较于原始语料集,在支持向量机(Support Vector Machine,SVM)、多项式朴素贝叶斯(Multinomial Naive Bayes,MNB)以及随机森林(Random Forest,RF)上的分类效果均有较大幅度提升,准确率分别提高约10%、9%、10%。
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除