词汇分布语义的语言学基础探微
2019-12-15分类号:H0-0
【部门】浙江科技学院大数据科学系 绍兴文理学院 南京大学信息管理学院
【摘要】词汇分布表示是当前人工智能领域语义表示的主要方法。通过对大规模语料中词汇分布规律的学习,可以得到以数学向量形式表示的词汇,并具有语义可计算和可推导的重要性质。词汇分布语义表示的语言哲学基础是维特根斯坦的词义使用论,主张词的意义就在于使用。维特根斯坦和索绪尔的语言观有着某种联系,索绪尔认为,语言中一切要素都按照句段关系和联想关系运行,词汇分布语义模型的输入上下文事实上可以归为这两类关系。布龙菲尔德的结构语言学深受索绪尔的影响,最终发展成为海里斯的分布方法论,构成了词汇分布语义的语言学基础。当前以神经语言模型为代表的词汇分布语义,根植于词义使用论学说,并以描写语言学为理论支撑,其本质是对语料中词汇使用模式和偏好的反映,因此可以客观折射社会文化生活的某些特征,同时也不可避免地存在其固有的局限性。
【关键词】词义 分布语义 自然语言理解 结构主义 描写语言学
【基金】教育部人文社会科学研究青年基金项目“基于知识库和大规模文本的词汇语义表示研究”(18YJCZH137);; 浙江省自然科学基金重点项目(LZ18F020001)的研究成果之一
【所属期刊栏目】浙江社会科学
文献传递