直播导读
大家晚上好。大晚上的还来听学术报告,可以看到大家的学术热情还是很高的。感谢主持人的介绍以及罗跃嘉教授的邀请。非常高兴有这样一个机会,在脑客中国平台上跟大家一起讨论和交流。
近几年因为疫情的原因,大家参加学术会议的机会越来越少。我觉得学术会议包括我们今天的这种报告,更多的是交流想法和进展。所以我今天可能不去重点讲过去已经发表的一些工作(如果大家感兴趣可以去读paper),主要是跟大家交流一下我们的一些想法和未来的思路。通过交流讨论也希望看看大家有什么更好的建议。
我自己是做语言出身,但是我对语言的切入视角跟传统的心理语言学有一些差别。我更关注的是自然语言加工,特别是自然语言的交流。在自然语言加工与交流当中有一些非常重要的问题,我主要关心的是其中的预测问题。
我们都知道语言是人类特有的,这是我们引以为傲的一种能力。我们一般认为,至少从语言的结构性和语音、语义和语言的符号系统之间的任意映射关系,包括句法的结构性都是人类的语言特有的。所以我们一般认为这种复杂的交流系统是人类所特有的。过去我们对语言已经从多个角度进行了大量的研究,包括从语言学的角度,对语言的本体做研究。从心理学和认知科学的角度,对语言的使用和加工进行了心理语言学的研究。
进行了长时间的研究之后,虽然我们对语言有了很深的认识,但是语言的一些基本问题还没有解决,比如说语言的先天和后天问题,语言是怎样学习的问题。这就涉及到自然语言跟非自然语言之间的本质差异到底是什么。我简单的总结了以下几点:
1语境丰富,具有层级结构
首先自然语言的第一个特点就是所谓自然,它不是我们经过人为筛选操纵的东西。它一定是发生在非操纵的情境下,包含着丰富的语境的。语境就是我们所产出的某一个词不是孤立存在的,它总是有一定的前沿后果。在一定的语境下啊,同一个词的含义可能会发生变化。
特别是在汉语当中,很多词其实都是多义词。在不同的语境下出现,它所反映所表达的语义可能就不一样。所以这种丰富的语境使得我们的语言语义变得更加的丰富,更加的有层次性。
所以我们在加工自然语言的时候,就会表现出一种嵌套的结构。比如说现在大家在听我在讲话,那么大家听起来都是连续的一个声学刺激的刺激信息流。但其实可以把它切割成一个一个的发音单位。发音单位按照一定的规则组合成词、音节,音节又可以构成词汉语的这个双音节、短音节然后短语再到句子最后到篇章、段落及整个叙事。
它表现出从较小的语言单元到较高级的语言单元的一个嵌套式结构。在每一次嵌套上,它都是有一定的规则的。这是人类语言的一个非常重要特征,也是自然语言的一个重要特征。从这个角度来讲,自然语言能够体现语境的丰富性和它的层级结构性,这是它的第一个特点。
2前后内容相关
第二个特点,自然语言是一个连续的语言,也就是说每一个语音和词的前后面,总是同时有其他的语音和词出现,并且前后的语音和词之间是有一定关联的。正是因为有这样的关联性,那么我们可以基于前面的词对后面的词进行预测。同时我们可以在某一个词出现之后,根据后面的词跟前面词之间的关系来判断前面的词究竟表达的是什么含义,也就是对歧义词的一个解题。所以对于连续的自然语言来说,它的前后内容之间是有一个高度相关的。这种相关性也影响到我们在语言的听觉理解过程中怎么去进行加工。
3时间连续、快速
在时间上,自然语言是连续的,不是切割的。我们在说话的时候,词和词之间并没有明确的这种边界,特别是在连读的情况下,音和音之间的边界非常模糊。但是我们从感知来讲,还是能够把不同的词切割开,那是怎么实现的呢?这也是非常重要的问题,也是我们在自然语言理解当中要重点解决的问题。
自然语言当中语言呈现的速度非常快,而且是高度浓缩的,有一些词的音调甚至都会发生变调。像这样的问题,我们只有在自然语言的加工当中才能够去研究它。
4交互响应
最后一个就是自然语言很多时候是有交互性的。除了纯粹的理解和产出之外,我们所说的自然语言一定是发生在交互场景下的,也就是说它需要两个人进行会话。在会话的过程中,两个人之间就会有语句往返,这是因为他们在语义上会有一种上下承接关系。通过这种交互响应,能够保证两个人之间实现相互的理解,这也是语言的一个非常重要的功能,就是促进人与人之间的信息沟通,最终构建良好的社会关系,形成社会网络。
观看完整视频内容请扫描下方二维码观看。
扫描二维码
观看完整视频