- 年份
- 2024(3908)
- 2023(5689)
- 2022(5126)
- 2021(4693)
- 2020(4267)
- 2019(10046)
- 2018(10001)
- 2017(18977)
- 2016(10312)
- 2015(12080)
- 2014(12449)
- 2013(12580)
- 2012(11880)
- 2011(10903)
- 2010(11046)
- 2009(10523)
- 2008(10448)
- 2007(9778)
- 2006(8330)
- 2005(7497)
- 学科
- 济(45599)
- 经济(45555)
- 管理(29024)
- 业(27654)
- 方法(23943)
- 企(21743)
- 企业(21743)
- 数学(21225)
- 数学方法(21028)
- 农(12794)
- 财(11311)
- 中国(11200)
- 学(10939)
- 地方(8830)
- 贸(8612)
- 贸易(8610)
- 业经(8499)
- 农业(8449)
- 易(8342)
- 制(8048)
- 和(7501)
- 理论(7293)
- 务(7039)
- 财务(7017)
- 财务管理(6995)
- 银(6813)
- 银行(6790)
- 环境(6737)
- 企业财务(6559)
- 行(6417)
- 机构
- 大学(162296)
- 学院(159278)
- 济(63933)
- 经济(62451)
- 管理(60294)
- 研究(53694)
- 理学(51601)
- 理学院(50998)
- 管理学(49908)
- 管理学院(49611)
- 中国(40637)
- 科学(35241)
- 京(35033)
- 农(30627)
- 财(28753)
- 所(28208)
- 业大(26497)
- 中心(25936)
- 研究所(25782)
- 江(24592)
- 农业(24479)
- 财经(23117)
- 北京(22217)
- 范(21179)
- 经(20872)
- 师范(20806)
- 经济学(19816)
- 州(19398)
- 院(18769)
- 经济学院(18086)
- 基金
- 项目(104788)
- 科学(80578)
- 基金(74662)
- 研究(74409)
- 家(65621)
- 国家(65100)
- 科学基金(54624)
- 社会(44883)
- 社会科(42459)
- 社会科学(42442)
- 省(41319)
- 基金项目(39925)
- 自然(36217)
- 自然科(35319)
- 自然科学(35306)
- 教育(35126)
- 划(35007)
- 自然科学基金(34684)
- 资助(31065)
- 编号(30663)
- 成果(25453)
- 重点(23951)
- 部(23164)
- 发(22241)
- 创(21177)
- 课题(21058)
- 科研(20624)
- 大学(20456)
- 计划(20101)
- 创新(19870)
共检索到232194条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 情报理论与实践
[作者]
刘一宁 郑彦宁 化柏林
设计了一种定义抽取系统,通过混合使用模式规则、语法规则和词频统计以达到定义抽取的目的。详细介绍了系统中的各项关键技术,包括分词技术、抽取规则导入技术、句子抽取技术和加权词处理技术。并选取《情报学报》2007—2008年的235篇论文全文作为实验数据,通过与人工抽取结果进行对比分析,测试了抽取系统的抽全率与抽准率。
关键词:
学术定义 知识抽取 自然语言处理 分析
[期刊] 情报理论与实践
[作者]
化柏林 刘一宁 郑彦宁
学术定义是学术研究中一种基础性的知识。科技文献中蕴含着丰富的定义,对定义进行自动抽取是知识抽取的一种应用。这些定义具有一定的特征与规律,利用这些特征与规律形成规则对定义进行抽取是常见的方法。定义抽取中最重要的工作是规则构建。文章通过对定义语句的结构方式和分类进行研究,提出了一种基于多重规则的学术定义抽取规则构建方案。该方案通过构建模式规则、句法规则以及加权词规则,构建学术定义抽取所需要的多重规则。
关键词:
学术定义 知识抽取 规则构建
[期刊] 情报理论与实践
[作者]
洪娜 张智雄 刘建华
本文通过对国内外OBIE理论和OBIE系统的分析,比较了OBIE技术与传统信息抽取技术的主要区别,归纳了4种主要的技术方法,分别是基于实例的OBIE,基于规则的OBIE以及基于机器学习的OBIE和Ontology驱动的OBIE,并用案例对各种技术方法做了阐释,最后总结了OBIE研究和系统开发中存在的难点问题。
关键词:
本体 信息抽取 信息技术
[期刊] 情报理论与实践
[作者]
丁君军 郑彦宁 化柏林
学术文献作为科研成果的结晶,蕴含着丰富的知识,属性抽取作为知识抽取的一种应用,是把不同学术文献中对于某一学术概念的属性描述集中起来,用来构建属性描述知识库。本文通过人工构建规则的方法,形成了属性抽取的九大类描述规则,并对属性描述进行了数量关系和情感信息方面的分析,然后对学术概念属性抽取系统进行设计和实现,并对《情报学报》2007年和2008年的文章进行抽取实验,对系统抽取的结果和人工标记的结果进行了测评,并进行了实验结果的分析。
关键词:
知识抽取 规则构建 学术定义 概念
[期刊] 图书情报工作
[作者]
李纲 刘广兴 毛进 叶光辉
指出情感标签由评价对象和情感词组成,包含评论的关键要素,能清楚地表达评价者的观点意见。提出一种针对产品网络评论的情感标签抽取模型,利用依存句法分析设计情感标签抽取算法,通过情感极性计算对抽取出的情感标签进行过滤。通过放宽的抽取规则与情感极性过滤相结合,以提高情感标签的召回率,实现潜在评价对象的抽取。最后用网络抓取的产品评论语料作为测试数据集对模型进行测试,获得较高的抽取准确率和召回率,并对模型中存在的问题进行总结,作为模型改善的指导。
[期刊] 图书馆理论与实践
[作者]
阳广元
以国内2002年1月至2016年5月间发表的与基于本体的信息抽取有关的期刊文献为分析对象,运用内容分析法从领域本体的构建及基于本体的信息抽取方法、信息抽取模型、信息抽取算法、信息抽取系统、信息抽取的应用领域等6个方面对国内该领域的研究现状与热点进行分析,认为目前国内该研究领域具有研究内容从理论走向实践、研究主体多样性、尚未形成核心作者和核心团队等特点,指出本体构建的自动化及基于本体的信息抽取的评估机制、信息抽取的实践应用将成为未来的发展趋势。
[期刊] 图书情报工作
[作者]
屈鹏 王惠临
从信息分析的实际需求出发,对与电动汽车相关的5 405条专利数据进行术语抽取、生僻术语识别和字段比较研究。结果显示关键短语抽取的方法可行,互信息抽取的术语所在文档的平均文档长度更接近集合的平均文档长度;摘要和First Claim字段的术语存在一定差别,但对分类或聚类同等重要;生僻术语识别算法能够发现生僻词和高频词的对应关系。研究结论可以为专利文本挖掘和专利信息分析提供结果和方法,并为信息分析工作提供所需的参考术语。
关键词:
术语抽取 文本挖掘 专利 信息分析
[期刊] 情报理论与实践
[作者]
郑彦宁 邓擘
对海量信息进行有效收集与组织是情报学要解决的关键问题。分析了信息抽取技术的特点及其关键技术,讨论了信息抽取技术在情报学中的应用价值。通过信息抽取技术收集和组织信息,可提高信息相关性并为知识服务奠定基础。
关键词:
情报学 信息抽取 信息收集 信息组织
[期刊] 情报理论与实践
[作者]
杜思奇 李红莲 吕学强
[目的/意义]面向电子商务领域的在线评论,通过识别产品特征和评价词之间是否存在修饰关系,抽取出在线评论中的情感标签,从而帮助网购用户迅速了解某一产品的性能。[方法/过程]引入汉语组块分析对评论文本进行初始化处理,对名词性信息以及形容词性信息进行抽取。通过最大熵对初始化集合进行过滤,从而获得最终的情感标签集合。[结果/结论]该方法对评论文本的适应性较好,可以有效抽取出情感标签。[局限]需要对语料进行初始化抽取,经过过滤后才能获得最终的情感标签集合。
关键词:
情感标签 汉语组块分析 最大熵模型
[期刊] 情报理论与实践
[作者]
郑彦宁 化柏林
通过比较句子级知识抽取与词语级知识抽取的差异性,分析句子级知识抽取在情报学中的意义,表现在四类典型应用系统:学术抄袭检测系统、参考文献自动标注系统、文献自动综述系统、知识库构建系统。分析了知识抽取的难点与关键技术,针对难点与关键技术提出了知识抽取的3个转向:抽取对象转向以学术文献为主;抽取技术转向以内容结构分析为主;抽取目标转向以构建知识元数据库为主。
关键词:
知识抽取 情报学 应用研究
[期刊] 图书情报工作
[作者]
王东波 胡昊天 周鑫 朱丹浩
[目的/意义]数据科学作为一个融合诸多领域的新兴交叉学科正在快速形成。从数据科学招聘的公告信息中,抽取出相应的实体知识不仅有助于从市场的角度了解数据科学的发展动态,而且有助于改进数据科学教学的内容。[方法/过程]基于各大招聘网站职位招聘公告,结合情报学的数据获取、标注和组织方法,构建数据科学招聘语料库并从中抽取相应的实体进行分析与研究。[结果/结论]在搜集到的11 000篇经过标注的职位招聘公告语料的基础上,基于Bi-LSTM-CRF、CRF和Bi-LSTM模型,对数据科学招聘实体的抽取任务进行性能的对比,确定最终的数据科学招聘实体自动抽取模型,设计数据科学招聘实体自动抽取平台,并构建数据科学招聘实体网络。
[期刊] 图书情报工作
[作者]
关鹏 王曰芬 傅柱
[目的/意义]潜在狄利克雷分布(Latent DirichLet aLLocation,LDa)在科技情报分析中用来发现学科主题、挖掘研究热点以及预测研究趋势等。对常见的科学文献文本语料库(关键词、摘要、关键词+摘要)进行LDa主题抽取效果的评价,以揭示不同语料库的主题抽取效果,提高LDa在科技情报分析中的应用效果。[方法/过程]对上述3种语料库下的LDa主题模型进行对比研究,采用基于查全率、查准率、F值以及信息熵的定量分析和基于主题抽取的广度和主题粒度的定性分析相结合的方法对主题抽取效果进行评价。[结果/结论]通过国内风能领域的科学文献数据实证研究发现,无论是从定量分析还是从定性分析来看,摘...
[期刊] 情报理论与实践
[作者]
王娟 曹树金 谢建国
文章建立了一套不受领域约束、在各个领域中通用的情感评价单元抽取模式,实现自动且准确地抽取情感评价单元。首先,基于短语的内部结构和句法功能,深入地分析评价对象及其对应的评价短语在句中的句法位置;其次,结合情感句中词性和词对间的依存关系进行情感评价单元的抽取;最后,通过手工构建通用和领域情感词典进行情感评价单元抽取和情感倾向性计算的对比实验,进一步验证抽取模式的有效性。结合短语句法结构和依存句法进行情感评价单元抽取,准确地挖掘出评价对象及其对应的评价短语之间的句法关系。实验结果表明,在应用到后续情感倾向性计算
[期刊] 中国图书馆学报
[作者]
林泽斐 欧石燕
在线百科词条中蕴含着海量的人物间关系信息,基于这些信息可以抽取出大规模社会网络,为数字人文和社会计算研究提供数据支撑。本研究以百度百科为例,首次对面向中文在线百科的大规模社会网络抽取进行探索,提出一种新的人物社会网络抽取方法。该方法利用排序学习综合多种特征计算人物关系权重,通过估计人物生存时空来发现人物间的时空耦合关系。由此,从百度百科中抽取出一个带权重的跨时空人物社会网络和一个时空耦合的人物网络。这两个人物网络具有良好的小世界和无标度特性,并存在清晰的社区结构。最后,通过可视化分析展示了百科人物网络在数字人文研究中的应用模式和应用价值。图8。表6。参考文献39。
[期刊] 情报理论与实践
[作者]
王宇琪 周庆山
[目的/意义]互联网开源信息具有海量、多源异构等特点,如何从中及时发现有价值的信息,并对信息加以情报利用一直是情报研究和实践应用的重点领域之一。本文提出一套开源的学术会议领域信息抽取框架,解决信息抽取语义理解和关联融合的问题,并将其应用于情报研究中,为解决情报分析的智能应用提供工具和方法。[方法/过程]采集网络上新闻报道的内容,采用预训练语言模型方法挖掘学术会议事件信息,提出面向特定领域的信息抽取框架,实现会议名称及其举办时间、地点、出席人物、发言人物信息的抽取,并进行实际的情报利用研究案例分析。[结果/结论]相较于单一抽取实体的方法,抽取会议核心元素更具有情报关联性和准确性,可以更好地对开源热点事件发现和跟踪监测、目标人物轨迹动向分析等研究提供方法,为情报分析应用和情报研判奠定基础。
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除