- 年份
- 2024(7234)
- 2023(9749)
- 2022(8078)
- 2021(7237)
- 2020(6060)
- 2019(13465)
- 2018(13144)
- 2017(24698)
- 2016(13339)
- 2015(15025)
- 2014(15088)
- 2013(14369)
- 2012(13115)
- 2011(11798)
- 2010(12288)
- 2009(12040)
- 2008(10923)
- 2007(10086)
- 2006(8939)
- 2005(8434)
- 学科
- 济(45672)
- 经济(45583)
- 管理(43558)
- 业(40172)
- 企(35291)
- 企业(35291)
- 融(26656)
- 金融(26649)
- 银(24491)
- 银行(24472)
- 行(23731)
- 中国(21174)
- 制(19046)
- 财(18778)
- 方法(15918)
- 体(13310)
- 业经(13301)
- 农(13276)
- 数学(13074)
- 数学方法(12939)
- 务(12539)
- 财务(12499)
- 财务管理(12474)
- 企业财务(11879)
- 地方(11430)
- 中国金融(11099)
- 体制(10342)
- 理论(10050)
- 学(9586)
- 贸(9292)
- 机构
- 学院(182571)
- 大学(181269)
- 济(74993)
- 经济(73193)
- 管理(66717)
- 研究(61413)
- 理学(56188)
- 理学院(55599)
- 中国(55355)
- 管理学(54697)
- 管理学院(54368)
- 财(41178)
- 京(38010)
- 科学(34576)
- 财经(31171)
- 中心(30702)
- 所(30377)
- 江(29440)
- 农(28945)
- 经(28102)
- 研究所(26827)
- 业大(24547)
- 经济学(24024)
- 北京(23824)
- 州(23542)
- 财经大学(23187)
- 院(22598)
- 农业(22444)
- 范(22010)
- 师范(21718)
- 基金
- 项目(118333)
- 科学(93131)
- 研究(89812)
- 基金(85236)
- 家(73440)
- 国家(72791)
- 科学基金(62600)
- 社会(57668)
- 社会科(54748)
- 社会科学(54740)
- 省(47268)
- 基金项目(44425)
- 教育(40996)
- 划(38944)
- 自然(38141)
- 自然科(37282)
- 自然科学(37272)
- 编号(36870)
- 自然科学基金(36616)
- 资助(34192)
- 成果(31549)
- 制(28005)
- 重点(27006)
- 课题(26422)
- 部(26073)
- 创(25760)
- 发(25500)
- 国家社会(24229)
- 创新(24035)
- 性(23906)
共检索到295073条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 清华大学学报(自然科学版)
[作者]
李明扬 孔芳
相比规范新闻文本中命名实体识别(named entity recognition,NER),中文社交媒体中命名实体识别的性能偏低,这主要受限于文本的规范性和标注语料的规模。近年来中文社交媒体的命名实体识别研究主要针对标注语料规模小这一问题,倾向于使用外部知识或者借助联合训练来提升最终的识别性能,但对社交媒体文本不规范导致的对文本自身蕴含特征的挖掘不够这一问题的研究很少。该文着眼于文本自身,提出了一种结合双向长短时记忆和自注意力机制的命名实体识别方法。该方法通过在多个不同子空间捕获上下文相关信息来更好地理解和表示句子结构,充分挖掘文本自身蕴含的特征,并最终提升不规范文本的实体识别性能。在Weibo NER公开语料上进行了多组对比实验,实验结果验证了方法的有效性。结果表明:在不使用外部资源和联合训练的情况下,命名实体识别的F1值达到了58.76%。
关键词:
命名实体识别 中文社交媒体 自注意力机制
[期刊] 情报理论与实践
[作者]
邓胜利 夏苏迪 汪奋奋
[目的/意义]当前社交媒体中的虚假、劣质信息层出不穷,极大地干扰了正常的网络公共秩序。对发布异常信息、呈现异常行为的异常用户进行预测治理,能够有效实现网络公共空间的正本清源。[方法/过程]在既有研究的基础上,本文融合用户个体特征、行为、关系、文本主题和情感特征,构建社交媒体异常用户特征体系,并利用图注意力网络构建异常用户分类预测模型。[结果/结论]本文所构建的社交媒体异常用户特征体系具备完整性和普适性,且异常用户预测模型的分类准确率达到92.8%。相比其他分类模型,本文所构建的图注意力预测模型能够有效识别社交媒体中的异常用户。此外,关系特征、主题特征以及用户注册时间对预测异常用户的贡献度较高,在体征体系中具有较高的重要性。
[期刊] 图书馆论坛
[作者]
王娟 王志红 曹树金
命名实体分类和识别是自然语言处理中的关键任务,识别效果将会影响许多下游任务的性能。本文基于现有知识图谱,提出了图情领域9大类实体,并构建了适用于图情领域实体识别的LISERNIE模型。通过开展广泛的实验,结果表明,在预训练阶段注入了图情领域知识的LISERNIE模型能有效识别出命名实体,并且在小规模标注数据集上具有明显的性能优势,在应用到后续的开放域关系抽取实验中,其准确率远高于CORE系统,为进一步构建如知识图谱、问答系统、机器阅读等提供数据支撑。
[期刊] 财会月刊
[作者]
刘豪 胡艳
本文以2010~2014年间深市中小板的328家上市公司为研究样本,分析了投资者注意力与IPO抑价间的关系;同时用百度新闻搜索的媒体报道数量作为衡量媒体关注度的指标,实证研究了媒体报道与投资者注意力对IPO抑价的交互作用。实证结果表明,投资者注意力与IPO抑价呈正相关关系;在引入媒体关注度与投资者注意力的交互项后,媒体报道具有调节投资者注意力对IPO抑价影响的功能。据此,为完善IPO制度,本文提出建议:一方面,监管部门要重视新闻媒体对证券市场参与者和股票定价的影响,发挥其监督职能;另一方面,上市公司应利用新闻媒体择时向投资者披露利好信息,提升企业形象,增强融资能力。
[期刊] 运筹与管理
[作者]
曾宪聚 张雅慧 冯耕中
鉴于中国A股市场个人投资者比例相对较高但其理性程度相对较低的实际情况,在拓展Tetlock模型的基础上构建了一个两资产三阶段的理性期望模型。研究发现:首先,被报道股票的价格受到注意力效应的影响,存在正向注意力溢价;其次,注意力交易者对被报道股票的交易量在媒体报道后放大,且存在买卖不平衡性;最后,作为对有限理性的补偿,注意力受媒体报道的影响程度越高,其收益越低。论文在统一的分析框架之内考察了媒体报道对缓解信息不对称和引发投资者注意力效应两方面的影响,有助于在理论上为进一步探索媒体报道对股票市场的影响机理、在实践中为监管层更好地利用媒体力量促进股市健康发展提供理论启示。
关键词:
媒体报道 投资者注意力 股票价格
[期刊] 图书情报知识
[作者]
陆伟 鞠源 张晓娟 吴丹
随着互联网经济的飞速发展,信息抽取领域的产品命名实体识别在商务智能领域有着广泛的应用。本文采用条件随机场(CRF)模型,选取词汇、词法和词形上一系列的特征进行训练,通过交叉验证对识别效果进行评价,并通过识别效果指导特征的选取。实验中比较了两种标注方式(BRAND/TYPE和PROD),并取得了令人满意的识别效果。在与最大熵模型对比中,验证了CRF模型对于产品实体识别的优越性。
[期刊] 情报学报
[作者]
刘晓娟 刘群 余梦霞
命名实体识别是自然语言处理的基础性任务,其结果具有广泛的应用。关联数据由于具有丰富的语义知识,能够对现有命名实体识别进一步完善。本文实现了一个基于关联数据的可配置的中英文命名实体识别系统,在识别过程中对实体进行消歧并对识别结果进行扩展,为命名实体识别的进一步完善提供了新的思路。具体包括:基于DBpedia构造了跨领域的中英文命名实体词典;设计了一个基于Hive的分布式管理数据存储模型,基于该模型实现了对DBpedia数据集的组织、存储以及扩展;设计了一个基于图的命名实体识别算法,该算法能够充分利用关联数据的语义关系对命名实体进行消歧,并且基于DBpedia Spotlight NER Corpus对算法进行测试,并将算法结果与DBpedia Spotlight、NERSO以及Zwmanta三个系统进行对比评价,结果表明本文实现的算法在查全率、查准率、F值上具有更好的表现。
关键词:
命名实体识别 命名实体消歧 关联数据
[期刊] 情报理论与实践
[作者]
张军亮 方雪梅 雒曼 孙晶晶
中文电子病历中存在大量非结构化的文本信息,其中的医学命名实体识别是生物医学领域知识组织和服务的基础。文章首先分析了中文电子病历特征的词语、词性、语素和词的组成等语法特征,以及HowNet语义特征;然后,运用CRF模型,提出了基于CRF医学命名实体的识别方案;最后,实验表明融合HowNet的中文电子病历命名实体识别方法具有较好的效果。
[期刊] 中南林业科技大学学报
[作者]
崔晓晖 陈民 陈志泊 许福 王新阳
【目的】针对物候期识别传统方法特征提取不充分、未对关键特征进行区分,导致方法泛化能力较差、迁移应用识别精度低的问题,本研究将注意力机制引入残差神经网络,结合基于数字照相的物候观测方式,提出具有较强细粒度特征识别能力且实用性较强的林木物候期识别方法,从而为林木的长期实时物候监测提供技术支撑。【方法】以PhenoCam中的栎林及槭林像片为研究材料,选取2017—2018年的数据作为训练集,以2019年的数据评价模型的泛化能力。研究结合实地观测数据对研究区的林木物候期进行划分,设计数据裁剪公式,在增强数据的同时均衡各个物候期数据的数量。研究基于ResNet50残差神经网络设计了深度学习模型,针对林木物候期差异较小的特性引入了注意力机制,注意力模块在通道及空间维度对神经网络提取的特征进行再处理,提升了模型对细粒度图像差异的识别能力。【结果】注意力机制的引入有效提升了模型的泛化能力,增强了模型对易混淆物候期的识别能力,在未参与训练的19年数据集的栎林物候期识别取得了90.58%的准确率,槭林物候期识别准确率为89.27%,较引入前模型准确率在两个研究区分别提升21.86%与13.15%,优于传统AlexNet和HOG-SVM方法。【结论】基于残差注意力网络的林木物候期识别方法较好解决了原有方法泛化能力较差的问题,该方法具有准确度高、迁移应用能力强等优势,能对易混淆的林木物候期进行精准区分,适用于林木物候的长期观测。
[期刊] 情报理论与实践
[作者]
由丽萍 刘越 王世兴
[目的/意义]在社会危机事件发生后,及时、有效地对社交网络上的文本内容进行情绪分类,有助于准确掌握公众情绪状态、优化社会危机事件管控方案。[方法/过程]基于框架语义理论构建危机情绪分类词典和危机情绪类别体系,采用融合自注意力机制的LSTM神经网络分类模型,实现优化的、细粒度的危机情绪分类。[结果/结论]以微博危机事件评论数据为例,通过不同参数的组合以及模型对比实验,获得了较高的准确率,验证了模型的可行性和有效性。为社交网络文本危机情绪分类提供优化的理论模型和方法支持,同时为相关领域的研究提供语义资源。
[期刊] 情报理论与实践
[作者]
由丽萍 刘越 王世兴
[目的/意义]在社会危机事件发生后,及时、有效地对社交网络上的文本内容进行情绪分类,有助于准确掌握公众情绪状态、优化社会危机事件管控方案。[方法/过程]基于框架语义理论构建危机情绪分类词典和危机情绪类别体系,采用融合自注意力机制的LSTM神经网络分类模型,实现优化的、细粒度的危机情绪分类。[结果/结论]以微博危机事件评论数据为例,通过不同参数的组合以及模型对比实验,获得了较高的准确率,验证了模型的可行性和有效性。为社交网络文本危机情绪分类提供优化的理论模型和方法支持,同时为相关领域的研究提供语义资源。
[期刊] 情报学报
[作者]
朱茂然 王奕磊 高松 王洪伟 郑丽娟
商品在线评论中存在着大量的比较语句,其中蕴涵着用户对不同商品或服务的体验及评价。通过挖掘评论文本中的比较信息,能够帮助企业洞察产品的市场竞争力。本文关注中文评论中的比较句识别任务,摒弃了先前研究中经常采用的模式识别方法,提出基于深度学习方法的层次多注意力网络模型。该模型获得了较好的识别精度,优于传统的分类模型和常见的深度学习文本分类模型,F1分数达到81%。本文提出的层次多注意力网络模型是端到端的,缩减了大量人工干预,有效简化了比较评论识别的工作量。
关键词:
比较评论 文本分类 深度学习 注意力机制
[期刊] 清华大学学报(自然科学版)
[作者]
尹学振 赵慧 赵俊保 姚婉薇 黄泽林
互联网公开数据蕴含着大量高价值的军事情报,成为获取开源军事情报的重要数据源之一。军事领域命名实体识别是进行军事领域信息提取、问答系统、知识图谱等工作的基础性关键任务。相比较于其他领域的命名实体,军事领域命名实体边界模糊,界定困难;互联网媒体中军事术语表达不规范,随意性的简化表达现象较普遍;现阶段面向军事领域的公开语料鲜见。该文提出一种考虑实体模糊边界的标注策略,结合领域专家知识,构建了基于微博数据的军事语料集MilitaryCorpus;提出一种多神经网络协作的军事领域命名实体识别模型,该模型通过基于Transformer的双向编码器(bidirectional encoder representations from transformers, BERT)的字向量表达层获得字级别的特征,通过双向长短时记忆神经网络(bi-directional long short-term memory, BiLSTM)层抽取上下文特征形成特征矩阵,最后由条件随机场层(conditional random field, CRF)生成最优标签序列。实验结果表明:相较于基于CRF的实体识别模型,应用该文提出的BERT-BiLSTM-CRF模型召回率提高28.48%,F值提高18.65%;相较于基于BiLSTM-CRF的实体识别模型,该文模型召回率提高13.91%,F值提高8.69%;相较于基于CNN (convolutional neural networks)-BiLSTM-CRF的实体识别模型,该文模型召回率提高7.08%,F值提高5.15%。
[期刊] 华中师范大学学报(自然科学版)
[作者]
朱颢东 杨立志 丁温雪 冯嘉美
近年来,网络媒体微博的迅速发展,为命名实体的识别研究提供了一种全新的载体.针对中文微博文本短、表达不清、网络化严重等特点,论文提出了一种规则与统计相结合的中文微博命名实体识别方法.该方法首先利用中文微博的主题标签对处理后的数据进行筛选,然后再选取合适的特征模板,并利用条件随机场模型(Conditional random fields,CRF)进行实体识别.为了满足实验要求,该文将传统网页爬虫方法与API接口采集方法相结合进行微博数据采集.实验结果表明,该方法能够有效提高中文微博命名实体的识别效果.
关键词:
命名实体 中文微博 主题标签 条件随机场
[期刊] 图书馆论坛
[作者]
朱武信 夏翠娟
近年上海图书馆通过数字人文搭建多个知识服务平台,通过关联数据,以知识图谱、GIS等展示方式提供服务。基于关联数据的专业服务对基础数据提出新要求,如数据本体化须具体到人名、地名、时间等实体;数据保留关联性,以关联数据形式存储。在新的数据要求与数据量日益增加的背景下,传统通过人力来加工数据的方法,或提取简单的实体,无法满足需求。为此,研发命名实体识别工具,以上图关联数据为词典,结合HANLP技术,实现文本的实体挖掘。工具投入使用后,可对数据批量进行实体识别,改进了数据处理流程,缩短了数据加工周期。
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除