的文化,使用各种简写,这里我们上一个对比视频,同样的弹幕内容,英文呈现出来的观感是不是明显差了点。”
陈博顺手截了个图,虽然英文弹幕的密集程度远不如中文,可字母间的遮挡严重影响了对弹幕内容的判断,反观中文弹幕这边,密密麻麻的字幕丝毫不影响陈博提取出弹幕内容。
汉字的倒序乱码在一定程度上不会影响读者的阅读体验,但丢失单个关键字符就波及整体,例如我去找他要钅,到底是要什么,要钱还是要铁要铜。
这点在英语方面恰恰相反,即便丢失了一部分后缀前缀,仍然不会影响对句子的整体理解,正是因为英文单个字符所提供的信息量较少。
“根据最新出版的各语言信息熵目录,汉字单个字体的平均信息熵在9.68左右,而英文的信息熵则在3.23徘徊,信息熵越高,代表越无序,关于信息熵的计算过程,有兴趣的同学可以看看下面的公式和延伸阅读。”
陈博顺着老师的指引点开链接,马上被一堆不知所云的公式下愣在原地,他借助看得懂的文字说明,试着对这些陌生的公式进行解读。
语言自身所拥有的符号越多,信息熵越大,英语字母看起来有26个,实际上能组合起来的单词不多,以大学英语6级为例,要求掌握的只有6000个,且句子间有特定的组合形式,前后彼此的关联度较高。
中文字符中最高关联度的是“的”,出现频率也仅在5%左右,而英文单词“is”则占了13%,较低的关联度使得汉字更难让人揣度前后文,换言之,学习者们能难猜到一个句子下一个出现的字会是什么。
数学公式拥有着比汉字更高的信息熵,这世界上没有什么比公式更简洁明了的揭示真理的东西了,一条简单的数学式子,几个特殊的字母符号便能让人画上两三页纸去解释其究竟是何含义。
“弹幕文化自古有之,我们古人不是经常喜欢做批注,前人写的文章著作,今人读完免不得在旁边加点自己的理解感悟,从某种程度上来说,这算是弹幕文化的雏形。”
刚刚被海量专业术语冲击的陈博总算能重新回到人类能听懂的语言频道,他撰笔的手微微发颤,字体也不如先前那般工整了。
注:弹幕文化这节课真不好上,又教语文又教数学,顺便来点历史增加厚重感,五星差评,分期付款。小说阅读_www.shuoshu8.com
『加入书签,方便阅读』