首页 玄幻 武侠 都市 历史 科幻 灵异 游戏 书库 排行 完本 用户中心 作者专区
小米阅读 > 恐怖 > 我靠打爆学霸兑换黑科技 > 第1868章 如何翻译外星文

因此需要调整图片特征,尽可能把图片和文字的吻合度拉到最高,用多张图片交叉说明一个词汇,类似于AI学习的过程,但为了沟通的便捷性,又不能让每个字词对应的图片太多,否则会严重拉长语言学习翻译的时间。

第二代星际语言翻译器,意识到外星生命可能并没有眼睛,压根看不见屏幕,因此增加了多种可见光之外的信息传达方式,整个翻译器的体积也急剧上升,从一块小屏幕,变成了冰箱大小。

但失去了图片,信息表述变得更加困难,神童们到这个版本开始研究,生命感知世界的方式总共可以有多少种?并尝试理解不同感官在脑海中形成的世界是什么样子,再进一步推导可能的语言形式。

研究结果比较乐观,大部分生物大概率会有视觉,因为光是感知世界最及时的媒介,用其他方式感知世界,在各类场景下往往会丢失大量信息,继而在生存进化中落入下风,很难成为星际文明。

第三代星际语言翻译器,添加了更多“达成共识”的初次接触信息。

譬如加入了中性氢原子的跃迁图像,氢原子在可观测宇宙中随处可见,无论在哪个星球诞生的文明都会熟悉氢原子,而跃迁长度21.106厘米以及跃迁时间0.704纳秒是固定的,就可以在长度单位和时间单位上取得一致。

各类物理化学知识都被加入初次接触信息中,毕竟整个世界是物理化学的世界,只要在物理化学层面达成一致,就可以一点点描述万事万物,虽然可能非常麻烦,但至少可以把翻译误解降到最低。

第四代星际语言翻译器,引入了更多信息论的成果。

譬如着名的齐普夫定律,也叫省力法则,拿足够长的一大段人类文字,将其中的高频字词统计出来,大概率会出现高频词次数和次序排序的反比关系,也就是说第二高频词出现的次数会是第一高频词的二分之一,第三高频词出现的次数会是第一高频词的三分之一,往后四分之一、五分之一等等。

最初齐普夫定律是从人类文本里总结出来的,但后来生物学家们发现,海豚座头鲸之类可以互相交流的生物,声音变化分布竟然也符合齐普夫定律。

此外这一版本的翻译器尝试额外引入了多种人类语言模型,用来应对不同信息熵的外星文明语言。

信息熵也叫香农熵,由信息论祖师爷香农提出了最初公式,历经一个多世纪的学术研究,结合马尔科夫链等理论,被反复升级优化。

简单来说,符号种类数量越小,信息熵越低,符号种类数量越大,信息熵越大。

信息熵越低的语言,文字理解学习起来更容易,但相同长度的文本能表达的信息量也越少,可以理解为更费口舌更费笔墨但不费脑子,沟通效率更低。

例如英文的一阶信息熵大约是4比特,汉字一阶信息熵大约是9.6比特,不同文本样本和不同建模得出的计算值会略有误差,但差距之大显而易见。

实际生活中最直观的例子,就是同样内容的文本,例如产品说明书或者联合国文件,就会出现汉字篇幅更短的情况。

第五代星际语言翻译器,在之前几代升级的模块上进行全面加强和改错。

传递信号的模块换上了最顶尖的,精度强度都上了一个台阶,造价上了十个台阶,好在这种和外星人沟通的东西也不用考虑量产成本,价格完全无所谓。

又加入了更多的初次接触信息种类,更灵敏的AI模型。

同时神童们在做第五代版本时,再度深入研究了语言信息熵,之前研究的语言只是现有使用的国际主流语言,这次神童们研究了历史上的古语言演变过程,并尝试自创信息熵更高或更低的新语言。

宋河看神童们的研究手册时,震惊于研究的细致深入程度。

有据可查的二百多种不同历史时期的语言,神童们分工合作都吃透了,得出大量数据详实的结论,这帮智商逼近二百的孩子,为了一个当时毫无实用价值的课堂小任务,业余时间自学成才变成了一堆古语言专家。

全球曾经出现过的主流语言里,信息熵的冠亚军分别是繁体汉语文言和东瀛候文,其中文言文不同历史时期的熵变化也做了排序,《尚书》时代的信息熵和《史记》时代的信息熵差别已经很大了。

最初神童们认为,很大概率外星文明的语言也会出现类似的变化,随着历史时期改变,出现信息熵减弱,从信息熵更高的《尚书》减小为《史记》,从信息熵更高的繁体减小为简体。

包括东瀛候文,是从汉语文言先演变成变体汉文,最后才演变成东瀛候文,整个演变过程也是信息熵不断减小的过程。

研究到这一步,神童们觉得外星文明的语言信息熵可能也会较低,毕竟星际文明的历史大概率会比人类历史更长。

但这一结论只存在了一个周末就被推翻了,神童们立马又得出了完全不一样的结论。

推翻老结论的原因主要有三点。

第一,为什么汉语演变时间比其他国际常用语言长的多,信息熵却是最高的,而不是随着时间降到所有语言的最低?

第二,经过多种算法做文本压缩实验,现代汉语几乎已经达到了信息熵界限。

为了验证压缩实验的成果,神童们特意在外星动物园挑选了一些智商接近普通人上限的、没怎么学过语言的小猩猩,教授人类各种语言,以及几种神童们自创发明的更高信息熵的新语言。

最后测试结果是,汉语几乎是普通人类智商上限能掌握的最高信息熵的语言,像一个守门员或者界限,一旦某种语言的信息熵高过了现代汉语,就对使用者的智商有极高要求,注定了人群中只有一小撮人能理解。

这也从侧面证明了为什么当初要废除文言文推广白话文,因为至少半数人的智力水平很难熟练掌握文言文,沿用文言文势必造成大规模人群的阅读困难,这一点从每年高考时学生们在文言文题目上瞎编乱写就看出来了,而白话文恰好够用,能有效减少文盲数量。

第三,神童群体们的内部黑话。

天才院神童们长期待在一起学习科研,几乎每一届都形成了固定的交流黑话,类似于将现代汉语精炼为文言文的过程,信息熵更高。

和普通人沟通,神童们需要说五分钟的内容,如果和其他神童沟通,可能两分钟不到就搞定了。

形成这种高信息熵的黑话之后,所有神童们一直很稳定的用,有时候需要和比较笨的外界同行合作,没法说内部黑话,所有神童都会感觉沟通麻烦费时。

综合以上三点,神童们得出的最终结论是:

【1.语言信息熵的大小,和使用语言群体的平均智商高度相关,平均智商越高越喜欢用高信息熵语言,因为沟通起来省时省力,寥寥几句话可以传达大量信息,平均智商越低越喜欢用低信息熵语言,因为更高的信息熵难以理解,会产生大量误会以及过度烧脑】

【2.语言信息熵的大小,和演变时间相关,会经历一个由最初偏离平均智商到最终回归平均智商的过程】

这两条结论相当重要,第二条结论先排除了误差,发展成星际文明的语言大概率已经经过时间足够漫长的演变,难度误差消除了,会高度贴合外星生命的平均智力。

第一条结论更重要,能够建立星际文明的生物,大概率平均智力会很高,因此外星生物的语言信息熵很可能也在超高水平,和之前初步结论得出的外星语言可能信息熵低截然相反!

于是神童们特意自创了三套新语言,信息熵分别为12、17和22,其中17信息熵的语言和神童们平时用的黑话差不多,22已完全达到神童们能够理解的上限,再往上就彻底变成天书了。

只能祈祷外星文明的语言,信息熵在22以下,或者他们能够主动将自己的语言信息熵先翻译扩充到22以下,否则双方交流将会极度困难,对牛弹琴。

第六代、第七代和第八代翻译器,改动幅度都不算太大,主要工作量是融合了大量密码学的翻译系统,以及反复调试AI自动翻译,确保翻译器能在第一时间理解外星语言。

毕竟追求准确的同时,时间也不能拖太久,说个“你吃了吗”花半个月才破译出来,麻烦就大了。

此刻,齐风小组正在测试检查多款不同型号的星际语言翻译器,目前部队装备的翻译器同时有第六代、第七代和第八代,之所以装备三代,主要是避免升级过猛反而带来一些意料之外的不可靠漏洞,最先进的要有,比较老式的也得有。

半夜一点钟,齐风终于长舒一口气,起身看向宋河相晓桐。

“院长,翻译器都没问题!”

“好!”宋河点头。

“然后我们干什么?”齐风又问。

“等!”宋河说。

目录
设置
设置
阅读主题
字体风格
雅黑 宋体 楷书 卡通
字体风格
适中 偏大 超大
保存设置
恢复默认
手机
手机阅读
扫码获取链接,使用浏览器打开
书架同步,随时随地,手机阅读
收藏
换源
听书
听书
发声
男声 女生 逍遥 软萌
语速
适中 超快
音量
适中
开始播放
推荐
反馈
章节报错
当前章节
报错内容
提交
加入收藏 < 上一章 章节列表 下一章 > 错误举报