- 年份
- 2024(10678)
- 2023(15503)
- 2022(13231)
- 2021(12254)
- 2020(10118)
- 2019(23123)
- 2018(22920)
- 2017(43619)
- 2016(23574)
- 2015(26458)
- 2014(26342)
- 2013(26090)
- 2012(24284)
- 2011(21936)
- 2010(22369)
- 2009(20594)
- 2008(19209)
- 2007(16926)
- 2006(15137)
- 2005(13704)
- 学科
- 济(96319)
- 经济(96222)
- 管理(63840)
- 业(63580)
- 企(51850)
- 企业(51850)
- 方法(38326)
- 中国(33778)
- 数学(32540)
- 数学方法(32134)
- 融(27901)
- 金融(27899)
- 地方(27201)
- 银(26723)
- 银行(26678)
- 农(26278)
- 行(25843)
- 财(23473)
- 业经(23056)
- 学(21523)
- 制(19995)
- 农业(18207)
- 贸(17114)
- 贸易(17095)
- 易(16523)
- 理论(16307)
- 环境(15506)
- 和(15345)
- 务(15268)
- 技术(15233)
- 机构
- 大学(329131)
- 学院(328746)
- 济(129034)
- 管理(127545)
- 经济(125963)
- 研究(115734)
- 理学(109135)
- 理学院(107842)
- 管理学(105894)
- 管理学院(105318)
- 中国(92053)
- 科学(72581)
- 京(71744)
- 财(60375)
- 所(58874)
- 农(54495)
- 中心(53858)
- 研究所(53574)
- 江(49249)
- 业大(48582)
- 财经(47666)
- 北京(46221)
- 范(45545)
- 师范(45097)
- 经(43204)
- 农业(42279)
- 院(42254)
- 州(41142)
- 经济学(37925)
- 师范大学(36563)
- 基金
- 项目(222931)
- 科学(174376)
- 研究(163873)
- 基金(159354)
- 家(139085)
- 国家(137863)
- 科学基金(117709)
- 社会(101125)
- 社会科(95841)
- 社会科学(95816)
- 省(88160)
- 基金项目(84970)
- 自然(76499)
- 自然科(74668)
- 自然科学(74654)
- 教育(74288)
- 划(74250)
- 自然科学基金(73269)
- 编号(67732)
- 资助(65595)
- 成果(55144)
- 发(51499)
- 重点(50423)
- 部(47864)
- 课题(47275)
- 创(46179)
- 创新(43042)
- 科研(42553)
- 项目编号(41662)
- 国家社会(40834)
- 期刊
- 济(145677)
- 经济(145677)
- 研究(102235)
- 中国(68296)
- 学报(52024)
- 农(49802)
- 科学(48350)
- 管理(47298)
- 财(43450)
- 融(42525)
- 金融(42525)
- 教育(39785)
- 大学(39012)
- 学学(36481)
- 农业(34214)
- 技术(28399)
- 业经(24641)
- 经济研究(22740)
- 财经(22335)
- 图书(18945)
- 经(18945)
- 问题(18492)
- 业(17530)
- 理论(17012)
- 科技(16249)
- 实践(15702)
- 践(15702)
- 统计(15552)
- 技术经济(15292)
- 资源(15186)
共检索到504839条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 图书情报工作
[作者]
王巍洁 任慧玲 李晓瑛 王勖 张颖
[目的/意义]为提高机器理解医学文本的能力,提高医学自然语言处理等上层任务效果,保障医学知识内容更新及时性、覆盖完整性,提出一种融合汉字多语义信息与文本统计特征的医学新词发现方法。[方法/过程]以规范用词的医学文献摘要数据为新词发现来源,基于N-gram模型获取N元词串,将词串存入字典树,从词的内部凝固度、词的自由程度、词的语义相似度3个角度同时计算每个N-gram词串的关联置信度、左右邻接熵、多语义相似度(包括汉字细粒度字符语义信息、BERT词向量信息),遍历上述各指标阈值评估N-gram词串为医学新词的可能。[结果/结论 ]从中华医学会收录的截至2022年10月20日的最新1 000篇文摘中发现医学新词3 263个,去除重复项后,共获得764个医学新词。提出的融合汉字多语义与文本统计特征的医学新词发现方法对比现有方法具有一定提升,且在应用上可以有效提高医学分词任务效果,使医学分词后的名词类别更清晰、概念更明确、内涵更丰富。结合汉字内在多语义信息与字词外部统计特征的医学新词发现方法,不仅可以提高计算机的新词发现能力,还可提高计算机面对专业且复杂的医学文本自然语言处理效果,对及时更新领域知识内容等具有重要帮助。
[期刊] 情报理论与实践
[作者]
张建娥
文章通过分析传统关键词提取方法的特点和存在的问题,提出基于多特征融合的中文文本关键词提取方法。该方法通过融合中文文本词语的频率、关联度、词性以及位置多种特征,有效避免了传统关键词提取方法产生的偏差。实验结果表明,该方法在不同测试集上与传统方法相比关键词提取的平均召回率均得到明显提升。
关键词:
中文文档 特征融合 关键词
[期刊] 情报理论与实践
[作者]
何超 张玉峰
针对传统的中文文本特征提取算法存在的语义丢失和语义缺乏问题,设计了融合领域本体的中文文本语义特征提取算法。该算法利用基于种子—扩展机制的关键词识别与提取算法解决传统算法中利用分词工具进行关键词提取所产生的语义丢失问题;利用基于领域本体的文本概念特征语义映射与聚合算法解决传统算法中利用向量空间模型进行文本表示所产生的高维和语义缺乏问题。实验结果表明,该算法取得了很好的预期效果,能够显著提高文本特征提取的深度和准确性。
关键词:
文本语义特征 领域本体 算法
[期刊] 图书情报工作
[作者]
李楠 孙济庆 吉久明
突破传统的文献知识发现思路,从语言学视角分析汉语语境下领域知识发现的有效路径。通过对领域术语的词素、语义进行分析寻找知识关联的线索,并以化学领域为切入点分析其可行性,提出基于领域术语词素分析的知识发现研究思路。
关键词:
知识发现 汉语词素 领域术语
[期刊] 图书馆
[作者]
张孝飞
文章通过分析传统关键词提取方法的特点及不足,提出了融合多元特征的中文网页关键词提取方法。该方法既综合了中文网页文档词语的词频、词性、词长以及词位置等特征,又考虑了文档中出现的同义词、组合词现象的关键词评分,有效提高了传统关键词提取算法的精度。实验结果表明该算法优于传统方法,在网络情报监测中具有较大应用价值。
关键词:
提取 多元特征 同义词 组合词
[期刊] 图书情报工作
[作者]
王馨 王煜 王亮
[目的 /意义]随着网络新闻的广泛快速传播,通过辨析网络新词,及时掌握新闻热点关键词,对于了解新闻热点和社会舆情的预警控制具有十分重要的意义。[方法 /过程]利用改进的关联规则算法对网络新闻标题进行挖掘,相邻、有序地输出频繁字符串集合。根据互信息计算字符串的相似度,形成热点新闻的关键词集合,以实际的网络新闻为语料进行实验。[结果 /结论]实验结果表明,本文所提出的方法不仅能有效地发现词典中不存在的新词汇以及当前网络中流行的热词,而且有效地区别词汇集合中的复合式新词,继而可通过热词集合的热点度计算对网络新闻热点进行排名。
关键词:
关联规则 未登录词 互信息 热点度
[期刊] 图书情报知识
[作者]
张军亮
[目的/意义]将不同系统、不同类型的医学信息资源统一关联起来,挖掘和发现其中的医学信息和知识,为临床医生的临床决策和科学研究提供信息服务。[研究设计/方法]在分析医学信息资源发现服务存在问题的基础上,针对临床医生的信息需求和医学信息资源的特点,构建了包含资源层、资源融合层、资源服务层和医学语义与医学知识库的基于语义关联的多源医学信息资源发现服务系统模型;就中文医学语义映射、语义存储结构、语义采集和基于语义关联的资源发现等系统关键技术进行了研究和设计;从语义解释空间和知识关联进行了实例分析。[结论/发现]该资源发现服务系统模型从语义层次实现了语义关联发现。[创新/价值]将医学语义引入医学信息资源服务系统中,为人口健康信息平台的医疗健康大数据深度挖掘和广泛应用等提供一定借鉴。
[期刊] 情报理论与实践
[作者]
刘江峰 王希羽 张君冬 孔玲 裴雷 王东波
[目的/意义]从文献深层语义特征角度分析特定领域期刊研究内容中蕴含的新兴主题,对科研工作者了解领域研究热点、寻找进一步研究的方向具有重要意义。[方法/过程]首先,以图书情报领域期刊JASIST为例,从文献句子的语义特征角度出发,使用BERT及其衍生模型进行关键句子的识别;其次,基于MLM提出语言模型的增强方案;最后,使用BERTopic在识别结果的基础上进行面向关键研究语句和摘要的新兴主题发掘及演化分析。[结果/结论]整体句子识别性能F1值超80%,基于MLM的领域模型在关键句子识别上较基准模型性能提升约1~2个百分点,基于BERTopic发现7个新兴热点研究主题。本文提出的关键句子识别和基于BERTopic的主题计算方案能够有效挖掘新兴主题,为科研工作者提供辅助。
[期刊] 情报学报
[作者]
杨辰 刘婷婷 刘雷 牛奔 孙见山
随着知识爆炸时代的到来,电子文献数据库的负荷将急剧扩大,用户在库中搜寻所需资源也将越发困难。因此,开发电子文献资源推荐系统从而辅助电子数据库的管理受到研究者的广泛重视。协同过滤作为时下数据库的常用推荐技术,由于仅仅考虑了用户对于文章的历史评分的相似度,忽略了用户在语义层面和社交关系的距离等重要因素因而推荐效果有限。为了在推荐系统中融入这些影响因素,本文在基于用户的协同过滤的方法基础上引入了基于主题模型的文本相似度和两种社会化的用户相似度(用户标签相似度与用户群组相似度),运用非监督的融合策略对这些相似度进行了整合。本文提出的融合文本特征与社会化指标的方法在真实数据集上展示了多源信息对于推荐准确度的增强和提升效应,对于电子文献资源的管理和传播具有较强的启示意义。
[期刊] 情报理论与实践
[作者]
祝清松 冷伏海
评价对于非相关文献知识发现的发展具有重要促进作用。通过评价可以发现不同系统的优势和不足,引导非相关文献知识发现的研究方向。但是,目前的评价方法局限于某个系统,不能进行多个系统之间的比较。文章在对各种评价方法分析的基础上,认为当前建立一套标准的评价方法具有很大挑战性,依据融合评价原则,提出一个以统计评价方法为主、其他方法为辅的多方法融合评价策略。
关键词:
非相关文献 知识发现 评价方法
[期刊] 情报理论与实践
[作者]
沈思 孙豪 王东波
[目的/意义]针对目前医学文本中疾病—基因等实体关联关系在知识发现中结合主题的研究较少,不足以揭示医学领域知识在主题层面的深层语义关联关系,提出了一套结合全文文本和领域知识主题的语义相似度计算方法。[方法/过程]以肿瘤期刊全文本为研究对象,用TWE模型进行词向量和主题向量的词嵌入表示,基于Siamese Network框架结合文本和领域知识主题进行相似度计算。[结果/结论]实验表明,该研究所提出的相似度计算方法在验证集中的预测F值达94%,最后通过对测试集数据进行聚类分析,从高、中、低频以及未进行临床注册实验的角度对疾病和关联基因进行分析,发现当前的热门研究以及未来可能成为研究热点的靶点基因。
[期刊] 情报学报
[作者]
林泽斐 欧石燕
命名实体链接是利用知识库进行命名实体消歧,将文本中的实体指称映射至知识库中正确义项的一种方法。现有的命名实体链接研究与实践多利用维基百科实现西文实体的消歧,缺乏对中文命名实体消歧的研究。本文以百度百科作为基础知识库,提出了一种中文命名实体链接方法,该方法融合了单实体消歧和多实体消歧特征,并根据不同文本长度选用不同的特征组合,同时,在传统一阶段式消歧的基础上添加了第二阶段消歧以改善消歧结果。在真实中文语料上的实验表明,多特征叠加和两段式消歧可较大程度地提升消歧准确率。对比实验显示,本文提出的命名实体链接方法的总体性能优于当前主流同类系统的水平。
[期刊] 图书情报工作
[作者]
甘小红 张兆年
提出一种具有特征级别的领域特征集合的情感资源挖掘方法,将基于HowNet词典的分类法构建的情感特征与基于机器学习的特征分类方法中的无内容特征以及领域特征相融合,并将该集合放入支持向量机中进行情感分类实验,实验结果表明,使用抽取模式以及多特征融合的分类方法,可增强中文情感分类效果,验证两种分类方法综合研究的正确性与有效性,弥补目前特征级别的中文情感分类研究的不足。
关键词:
情感分类 情感特征 无内容特征 领域特征
[期刊] 情报学报
[作者]
潘俊 吴宗大
针对中文词汇历时语义的知识挖掘问题,本研究设计了一个面向知识发现的可扩展框架,该框架基于松耦合的可配置服务式架构,底层提供数据清洗、数据规范化、历时词向量训练等服务,中间层通过XML (extensible markup language)配置来定制基础数据的抽取策略并实现界面映射,顶层通过对关键服务的组合调用,构建知识发现与可视化的应用模块。以《人民日报》词汇历时语义挖掘实践为例,给出了该框架的一个具体实现,展示了历时词向量在数字人文和社会计算研究中的可能应用模式。该方法框架及其实现具有较好的通用性,通过二次开发,能灵活构建各类面向知识发现的词汇历时语义挖掘应用,并可推广到对其他历时语料的知识挖掘。
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除