• 首页   /  心理学   /  
  • 从原始时代到现代社会,从浩浩殿堂到街头巷尾,语言在我们的生活中扮演着非常重要的角色。语言是人类信息传递最重要的载体之一,是区分人类和其他动物的基本特征。没有语言,我们生活中几乎所有的创造都不可能存在。

    当我们学会了一门语言,甚至不用思考就能流畅地使用它。但是你知道学一门语言需要占我们大脑多少“内存”吗?我们交流的时候是否高效?近来就有研究者就对语言所包含的信息及其传递的速度进行探究。

    学语言,一本长篇小说相当的信息量就够了!

    当你听到一个单词,你的大脑会获取各种各样的信息来帮你理解它,包括单词的发音、含义、在句子中的语境、动词的时态等等。纽约罗彻斯特大学的Frank Mollica和同事们使用数学的分支信息理论,来研究在英语中编码这些信息需要多少位(bit)数据。在进一步了解他们的研究之前,让我们先回顾一下中小学信息课学习的知识。位/比特(Binary digit, bit),计算机专业术语,是二进制数系统中数据存储的最小单位,每个0或1就是一位(bit)。其中8位(bit)就称为一个字节(Byte, B),每个汉字占2字节(B),每个英文字符占1字节(B)[1]。1千字节(KB)=1024字节(B),1兆字节(MB)=1024千字节(KB),1千兆字节(GB)=1024兆字节(MB)。(相信大家对这些都是很熟悉的啦~)

    下面让我们回到这个研究本身。研究者们从音位,即能够区别意义的最小语音单位开始研究。举个例子,英文单词home包括三个音位/h/、/o/、/m/,改变其中任何一个都会改变词义,也就是说如果将/m/换为/p/,单词就由home变成了hope[2]。英语中大约有50个音位。经过对三种基本声学线索的分析,研究者发现存储每个音位需要大约15位(bit),所有音位需要大约750位(bit)。如果类比计算机对数据的存储,这差不多只有几十个汉字的大小。

    除此以外我们还需要学习单词。根据心理词典的相关模型,研究者发现学习平均40000个单词的英语词汇量需要400000位(bit),相当于计算机中存储两万多个汉字的硕士论文。而理解这些词汇的含义需要更多,因为词汇包含很多信息。比如提到turkey这个单词,你会想起关于火鸡的一些信息,比如它会不会飞、能不能说话。通过对语义空间进行分析,40000个词汇的所有语义信息需要12000000位(bit),相当于一本几十万汉字的长篇小说了。

    在语言学习中,知道一个单词出现的频率也很重要。研究者们对人们判断词频高低的准确性进行了考察,发现人们大概会将词频分为高、中高、中低、低四种,据此进行判断。这种词频信息需要大约80000位(bit),与计算机中存储几千个汉字的本科论文大小差不多,而存储造句原则也就是句法需要的最少。通过对不同句法结构的相似性和独特性进行分析,研究者发现句法信息只需要大约700位(bit),同样仅相当于几十个汉字的大小。把所有这些加起来会得到1.56兆字节(MB)。

    “我以为会更大”,Mollica说道,“这虽然是估计,但能给我们一个大致的概念,可以量化语言习得需要多少信息”。当你学英语的时候,你的大脑存储大约1.56兆字节(MB)的信息——差不多是计算机中存储一本几十万字长篇小说所需的信息量。虽然我们并不会去记住一本小说所有的内容,但这种类比有利于我们对英语的信息量形成一个直观的印象。Mollica说这个数字仅针对英语,但由于这是一个大致的估计,可能也适用于其他语言。

    所有语言传递信息的速率都是相同的

    存储一门语言只需要一本长篇小说这么大的信息量就够了,让人不由得感叹我们对语言存储的高效性。但学会一门语言不是最终目的,语言的重要性在于交流使用。那么在使用语言的时候,我们也能做到非常高效吗?法国里昂大学的Francois Pellegrino团队就分析了从英语到日语等17种语言信息传递的速率,这些语言在基础发音、音节数、音调等方面存在很大差异。例如,英语中有7000个不同的音节,而日语中仅有几百个。

    结合每种语言的语料库,该团队研究了其信息密度,也就是每个音节包含的信息量有多少位(bit)。信息密度从巴斯克语[3]的每音节5位(bit)到越南语的每音节8位(bit)不等。接下来,他们让每种语言的10个母语者,共170人读15段相同的文字。他们发现虽然每个人的说话速率,即每秒说出的音节数不同,但是使用信息密度更高的语言的人会说得更慢。例如,巴斯克语以平均每秒8音节的速率被表达,而越南语以每秒5音节的速率被表达,这使得二者信息传递的速率相同(8×5=5×8)。

    人类言语平均以每秒39位(bit)的速率传递信息,大致相当于计算机每秒传输2个汉字或4个英文字符。

    想象一下如果校园网的网速是每秒1MB,大约是我们语言信息传递速率的20万倍!在这个电子设备每秒交换百万位(bit)信息的时代,人类言语的信息传递速率虽然听起来很慢,但对我们的交流来说已经是较为高效的了。

    “我们都有相似的大脑、相似的发音器官,所以也有共同的限制”,团队成员Dan Dediu说道。但是什么造成了这种限制还不清楚。Dediu认为可能是人们进行表达和理解交互作用的结果,或者和脑电波的频率有关。该团队想扩展这一研究,纳入非洲、美洲、巴布亚新几内亚的语言进行分析。“这些语言种类很多,非常有趣”,Dediu说道,他认为在这些语言中也会发现相同的结果。

    看来学会一门语言后,大脑对它的存储是较为高效的,表达起来也很快。可能对我们来说只有存进去的这个过程,以及不熟的时候却要磕磕绊绊地使用这门语言才是真正的煎熬挑战。不管怎么样,了解语言的信息量及其传递速率对我们理解语言的特性、探究语言的起源都是很有意义的。


    ————————————————