在科幻電影《降臨》當(dāng)中,一群外星人乘著12艘飛船造訪地球。人類(lèi)無(wú)法準(zhǔn)確把握其意圖,而由語(yǔ)言學(xué)家班克斯領(lǐng)導(dǎo)的一支跨學(xué)科專(zhuān)家隊(duì)伍,被賦予了解碼“七肢桶”(Heptapod) 外星人語(yǔ)言,與其實(shí)現(xiàn)對(duì)話,理解其意圖的重要使命。
所幸的是,班克斯率領(lǐng)的美國(guó)團(tuán)隊(duì)掌握了外星人的符號(hào)語(yǔ)言,實(shí)現(xiàn)了和外星人的對(duì)話,并且成功通過(guò)避免了因?yàn)轭A(yù)料不全和翻譯誤差而導(dǎo)致人類(lèi)和外星人,甚至人類(lèi)不同國(guó)家之間的全面戰(zhàn)爭(zhēng)。
這部電影改編自美國(guó)作家姜峯楠的星云獎(jiǎng)獲獎(jiǎng)作品《你一生的故事》。雖然人類(lèi)希望交流的對(duì)象是外星生物,這部作品和一些古埃及、古羅馬傳說(shuō),以及安徒生童話、愛(ài)麗絲夢(mèng)游仙境等文學(xué)作品,仍然可以屬于同一個(gè)母題:跨物種交流。
而在真實(shí)世界當(dāng)中,一群來(lái)自世界各地知名院校的跨學(xué)科研究者,也在做著和電影當(dāng)中類(lèi)似的事情。他們的對(duì)象,不是外星人,而是我們地球的海洋中,一個(gè)十分令人著迷,極有可能具有智慧和情感的物種:抹香鯨。
這些研究者,希望翻譯鯨魚(yú)的語(yǔ)言,實(shí)現(xiàn)人鯨對(duì)話。
Project CETI:借助ML的力量,實(shí)現(xiàn)跨物種翻譯
哈佛大學(xué)拉德克里夫?qū)W院 (HRI)是該校專(zhuān)門(mén)為匯集來(lái)自全世界的優(yōu)秀專(zhuān)家進(jìn)行跨學(xué)科研究而運(yùn)作的機(jī)構(gòu)。2017年,一群海洋生物學(xué)家、信號(hào)學(xué)家和計(jì)算機(jī)科學(xué)家聚在這里,談天說(shuō)地。
來(lái)自加州大學(xué)伯克利分校的計(jì)算機(jī)和加密學(xué)教授Shafi Goldwasser走在樓道里,路過(guò)海洋生物學(xué)家David Gruber的辦公室時(shí),聽(tīng)到了一種奇怪但又熟悉的滴答聲(Clicks)。
其實(shí),Goldwasser聽(tīng)到的是抹香鯨發(fā)出的聲音。
抹香鯨是一種聽(tīng)覺(jué)極其敏感的海洋生物。其所有滴答聲中,大約有70%用于回聲定位和捕獵等。海洋生物學(xué)家經(jīng)過(guò)大量的研究,認(rèn)為其余大約20-25%的滴答聲,極有可能是用于鯨魚(yú)之間的交互溝通的。
——這部分的滴答聲,被稱(chēng)為“密碼曲” 。
而Goldwasser對(duì)這些聲音感到熟悉,是因?yàn)樗鼈兒茏约旱男盘?hào)學(xué)專(zhuān)業(yè)很接近,有點(diǎn)類(lèi)似摩爾斯電碼,也有點(diǎn)像故障的電路板元器件會(huì)發(fā)出的聲音。
這位2012年圖靈獎(jiǎng)得主發(fā)現(xiàn)自己的興趣被莫名調(diào)動(dòng)起來(lái)了。她當(dāng)時(shí)隨口一提,表示:“或許我們應(yīng)該搞一個(gè)項(xiàng)目,把這些聲音翻譯出來(lái)讓人能聽(tīng)懂。”
當(dāng)時(shí)她也沒(méi)想到,這個(gè)非常隨機(jī)的想法,居然在三年后,促成了一個(gè)雄心壯志的的跨學(xué)科前沿研究項(xiàng)目:Project CETI。
Project CETI 全稱(chēng)Cetacean Translation Initiative(鯨類(lèi)翻譯計(jì)劃),由來(lái)自紐約城市大學(xué)、UC伯克利、MIT、哈佛、谷歌研究院和《國(guó)家地理》等知名學(xué)府、研究和環(huán)保機(jī)構(gòu)的專(zhuān)家共同組成。
這些專(zhuān)家涵蓋了AI、機(jī)器人、信號(hào)學(xué)、語(yǔ)言學(xué)、水下聲學(xué)、海洋生物學(xué)等多個(gè)學(xué)科。鯨類(lèi)翻譯計(jì)劃脫胎于哈佛拉德克里夫?qū)W院,也繼承了該校的跨學(xué)科研究思路。成員們認(rèn)為,只靠一兩種技術(shù)是無(wú)法實(shí)現(xiàn)他們的目標(biāo)的。如果要對(duì)鯨類(lèi)語(yǔ)言獲得更加全面和深入的了解,必須采用這種跨學(xué)科研究的研究思路,讓不同專(zhuān)業(yè)的專(zhuān)業(yè)知識(shí)在項(xiàng)目里融會(huì)貫通。
這個(gè)計(jì)劃,獲得了知名科普機(jī)構(gòu) TED大會(huì)旗下The Audacious Project 的資助支持,并且按照501c3非營(yíng)利機(jī)構(gòu)的模式,在美國(guó)和多米尼加運(yùn)作。
在多米尼加海岸以外的一塊大約20平方公里的海域上,海洋生物學(xué)家已經(jīng)對(duì)當(dāng)?shù)氐哪ㄏ泠L群落進(jìn)行了十多年的觀察,記錄了大量的數(shù)據(jù)。而這些專(zhuān)家也帶著數(shù)據(jù)加盟了鯨類(lèi)翻譯計(jì)劃,讓團(tuán)隊(duì)實(shí)力顯著增強(qiáng)。今后,項(xiàng)目團(tuán)隊(duì)將進(jìn)一步擴(kuò)大抹香鯨的觀察研究,以及密碼曲數(shù)據(jù)的記錄。
整個(gè)項(xiàng)目的工作內(nèi)容和階段目標(biāo),主要如下:
1)從多米尼加海域開(kāi)始,對(duì)當(dāng)?shù)氐哪ㄏ泠L種群進(jìn)行大規(guī)模的長(zhǎng)期追蹤研究
2)大規(guī)模收集適合機(jī)器學(xué)習(xí)方式處理的聲音數(shù)據(jù)和其他元數(shù)據(jù)(如鯨魚(yú)的位置、動(dòng)作、姿態(tài)等)
3)了解鯨魚(yú)之間的互動(dòng)方式,特別是聲學(xué)溝通的方式
4)建立聲音表達(dá)和行為模式之間的關(guān)聯(lián)
5)更多了解幼鯨的溝通能力是如何發(fā)展的
6)初步目標(biāo):找到更多語(yǔ)言結(jié)構(gòu)存在的證據(jù),例如類(lèi)似于語(yǔ)法的高級(jí)別溝通方式
7)訓(xùn)練一個(gè)“鯨語(yǔ)聊天機(jī)器人”,嘗試對(duì)抹香鯨的表達(dá)做出回應(yīng),并進(jìn)一步觀察是否能夠發(fā)生有意義的交流
8)學(xué)習(xí)更多的對(duì)話數(shù)據(jù)中,增加對(duì)抹香鯨語(yǔ)言的句法、語(yǔ)義等要素的理解
8)超長(zhǎng)期的終極目標(biāo):實(shí)現(xiàn)人鯨對(duì)話,對(duì)族群和物種有更多的了解。
圖片來(lái)源:Project CETI
Michael Bronstein是鯨類(lèi)翻譯計(jì)劃的機(jī)器學(xué)習(xí)負(fù)責(zé)人。他自嘲這輩子到現(xiàn)在還沒(méi)見(jiàn)過(guò)真的鯨魚(yú)。盡管如此,當(dāng)Goldwasser 和 Gruber找他來(lái)聊想法的時(shí)候,他對(duì)數(shù)據(jù)的敏感程度,以及對(duì)用于NLP(自然語(yǔ)言處理)的無(wú)監(jiān)督深度學(xué)習(xí)模型的了解,還是令他立刻意識(shí)到這個(gè)項(xiàng)目是絕對(duì)可以做的。雖然注定很艱難,但如果真的做出來(lái)的話, 對(duì)于人類(lèi)文明的進(jìn)步、環(huán)境保護(hù)的推動(dòng),帶來(lái)的積極影響將會(huì)是難以估量的。
在一場(chǎng)硅星人參加的線上研討會(huì)中,Bronstein列舉了一組重要的數(shù)據(jù):
假設(shè)一片海域有50-400只抹香鯨(數(shù)量浮動(dòng)很大,因?yàn)樗鼈円矔?huì)遷徙),每年能夠錄得的Click數(shù)量可能在4到40億次之間——從數(shù)據(jù)量的規(guī)模來(lái)看,這個(gè)項(xiàng)目做下去的話,是完全可以和一些深度學(xué)習(xí)語(yǔ)言模型(比如 BERT)相提并論的。
Project CETI和一些主流語(yǔ)言模型的數(shù)據(jù)量對(duì)比 圖片來(lái)源:Michael Bronstein
Bronstein透露,自己到現(xiàn)在大體上對(duì)于鯨魚(yú)還是“一無(wú)所知”。但是,他和團(tuán)隊(duì)當(dāng)中負(fù)責(zé)機(jī)器學(xué)習(xí)部分的小伙伴們,已經(jīng)對(duì)之前錄下來(lái)的數(shù)十萬(wàn)個(gè)獨(dú)立的抹香鯨密碼曲數(shù)據(jù)單元進(jìn)行了分析。
不懂鯨魚(yú)的人也來(lái)做鯨魚(yú)研究?如果在一般的學(xué)術(shù)環(huán)境下,這種行為早就要被人笑掉大牙了。然而其實(shí)這樣完全沒(méi)問(wèn)題,因?yàn)檫@跟機(jī)器學(xué)習(xí)(準(zhǔn)確來(lái)說(shuō)是無(wú)監(jiān)督深度學(xué)習(xí))的邏輯是完全一樣的。
以面向文本生成的深度神經(jīng)網(wǎng)絡(luò)模型為例。其實(shí)神經(jīng)網(wǎng)絡(luò)根本不懂它說(shuō)的語(yǔ)言,也不知道自己輸出的句子到底什么意思。盡管如此,這些模型在語(yǔ)言生成上面仍然非常出色,其實(shí)是因?yàn)榻y(tǒng)計(jì)學(xué)做的好。它學(xué)習(xí)了大量的語(yǔ)料數(shù)據(jù)之后,其實(shí)已經(jīng)從統(tǒng)計(jì)的角度掌握了句子的構(gòu)成結(jié)構(gòu)、語(yǔ)法的規(guī)律等。
甚至在翻譯任務(wù)中,新的無(wú)監(jiān)督神經(jīng)網(wǎng)絡(luò),可以在不需要平行語(yǔ)料庫(kù)(也即同一內(nèi)容兩種語(yǔ)言對(duì)照的語(yǔ)料)的前提下,僅通過(guò)大量學(xué)習(xí)互聯(lián)網(wǎng)上的內(nèi)容,算法就能自己掌握翻譯的能力。
巨大的科學(xué)賭注
Bronstein坦誠(chéng)地表示,鯨類(lèi)翻譯計(jì)劃的基礎(chǔ),其實(shí)是一個(gè)特別大膽、高風(fēng)險(xiǎn)的科學(xué)假設(shè)。也即:抹香鯨的“密碼曲”是足以構(gòu)成一種語(yǔ)言,或者至少是一種接近于語(yǔ)言的聲學(xué)表意方式。
這里需要明確的是:不是所有的發(fā)聲都是語(yǔ)言。比如貓狗的叫聲就不構(gòu)成語(yǔ)言;學(xué)舌的鸚鵡就算模仿人類(lèi)說(shuō)出了一句話,它多半也只是想要獲取主人的注意,而不是真的理解學(xué)出來(lái)那句話的含義,同樣不屬于語(yǔ)言表達(dá)。
鯨類(lèi)翻譯計(jì)劃的假設(shè),基本就是:
1)抹香鯨發(fā)出的滴答聲組成的“密碼曲”當(dāng)中,是存在單詞或詞組的。一些特定結(jié)構(gòu)的滴答聲,在整個(gè)抹香鯨物種當(dāng)中(或者至少在一個(gè)族群當(dāng)中)是具有固定的含義的——也即語(yǔ)義的存在。
2)這些“密碼曲”當(dāng)中有語(yǔ)法的存在,哪怕是最簡(jiǎn)單的語(yǔ)法。比如山雀在特定威脅發(fā)生的時(shí)候會(huì)連續(xù)發(fā)出兩種聲音,作為對(duì)其它同類(lèi)的警告,或者抹香鯨在用密碼曲“自報(bào)家門(mén)”的時(shí)候可能會(huì)采用某種特定的報(bào)告順序,這都是簡(jiǎn)單語(yǔ)法可能存在的例證。
3)抹香鯨的密碼曲不是天生就會(huì),而是在社會(huì)化的族群生活中,通過(guò)不斷觀察學(xué)習(xí)其他同類(lèi)而獲得的。只有后天習(xí)得的語(yǔ)音表達(dá)能力,才有可能構(gòu)成語(yǔ)言。
以上這幾點(diǎn)假設(shè),目前都沒(méi)有足夠的、科學(xué)上絕對(duì)靠得住的證據(jù)和學(xué)術(shù)研究能夠證實(shí)。不過(guò),目前團(tuán)隊(duì)已經(jīng)積累了一些數(shù)據(jù)資料,似乎預(yù)示著他們的方向是正確的,假設(shè)是合理的。
其中一個(gè)證據(jù):抹香鯨的一段單獨(dú)的密碼曲一般由5個(gè)間隔各不相同的滴答聲組成。不同的鯨魚(yú)會(huì)使用不同的間隔方式。而通過(guò)大量的觀察和研究,目前海洋生物學(xué)家的共識(shí)是,抹香鯨的密碼曲當(dāng)中編碼了其所屬的族群、家庭,以及其個(gè)體身份的信息。甚至還有研究發(fā)現(xiàn),一些抹香鯨在不同的環(huán)境、處境下,發(fā)出的密碼曲的頻譜和振幅都不一樣,就好像在說(shuō)“方言”一樣。
抹香鯨的密碼曲 (codas) 示意 圖片來(lái)源:Michael Bronstein
”對(duì)于其它物種是否有類(lèi)似人類(lèi)的語(yǔ)言,以及我們是否可以理解它們的語(yǔ)言……如果這個(gè)方向有什么動(dòng)物值得研究,那肯定是抹香鯨了。”Bronstein 表示。
抹香鯨是哺乳動(dòng)物,人類(lèi)也是哺乳動(dòng)物
抹香鯨有發(fā)育良好的大腦——全宇宙最大的大腦,是人類(lèi)的6倍
抹香鯨以家庭為生活單位,可以說(shuō)有著和人類(lèi)類(lèi)似的家庭文化
抹香鯨有著復(fù)雜的溝通系統(tǒng),并且很有可能具有對(duì)話的能力。Gruber 有一次在多米尼加曾經(jīng)旁聽(tīng)了兩只位置靜止的抹香鯨之間,用密碼曲斷斷續(xù)續(xù)的“對(duì)話”,長(zhǎng)達(dá)40分鐘,幾乎每一句都不重樣,并且伴各種動(dòng)作
“既然我們知道抹香鯨有著濃厚的家庭意識(shí),萬(wàn)一這是兩只母鯨在拉家常、分享育兒心得呢?”
如果抹香鯨確實(shí)有語(yǔ)言的話,那么用 NLP 深度學(xué)習(xí)的思路,套用到翻譯密碼曲的任務(wù),就非常合適了。你可以這樣理解:深度學(xué)習(xí)不懂英語(yǔ)和中文,但是通過(guò)大量學(xué)習(xí)語(yǔ)料就可以獲得中英互譯的能力。
那么就算我們?nèi)祟?lèi)無(wú)法理解鯨語(yǔ),但深度學(xué)習(xí)或許能夠從大量鯨語(yǔ)語(yǔ)料中找到文本的構(gòu)成規(guī)律。如果這能實(shí)現(xiàn)的話,在人類(lèi)語(yǔ)言和鯨語(yǔ)之間實(shí)現(xiàn)互譯,甚至人鯨對(duì)話似乎并不是一件遙不可及的事。
Bronstein說(shuō),這是他學(xué)術(shù)生涯目前為止參與過(guò)的最瘋狂的一個(gè)項(xiàng)目,并且希望能夠說(shuō)服人們,他們的設(shè)想并不是一個(gè)夢(mèng),而是真的有可能實(shí)現(xiàn)海洋生物學(xué)和生態(tài)環(huán)境保護(hù)方面的一個(gè)重大突破。
“等我們能和鯨魚(yú)對(duì)話的那一天,萬(wàn)一它們想要告訴人類(lèi),‘不要再捕殺我們了,不要再破壞環(huán)境了’呢?”
Michael Bronstein在2015年國(guó)際圖像處理大會(huì)上演講
數(shù)據(jù)收集和項(xiàng)目進(jìn)展
這個(gè)項(xiàng)目聽(tīng)起來(lái)特別的宏大,但說(shuō)句實(shí)話,現(xiàn)在整個(gè)研究的進(jìn)度并沒(méi)有我們想象的那么深入,還沒(méi)有什么特別值得宣告的進(jìn)展。目前,團(tuán)隊(duì)仍處在數(shù)據(jù)獲取的階段。想要高效率地收集高質(zhì)量的抹香鯨聲音數(shù)據(jù),簡(jiǎn)直太難了。
在機(jī)器學(xué)習(xí)領(lǐng)域,為了訓(xùn)練神經(jīng)網(wǎng)絡(luò),需要大規(guī)模構(gòu)建標(biāo)注數(shù)據(jù)集,而缺乏優(yōu)質(zhì)標(biāo)注數(shù)據(jù)、標(biāo)注能力不足,一度制約了技術(shù)發(fā)展。
而在鯨類(lèi)翻譯計(jì)劃這里,團(tuán)隊(duì)面臨同樣的問(wèn)題:要獲取數(shù)據(jù),就得跟蹤抹香鯨的位置,而這又是一種聽(tīng)力極好,對(duì)聲音/噪音極其敏感的動(dòng)物,想要跟蹤他們并且“偷聽(tīng)”,非常費(fèi)時(shí)費(fèi)力。其次,因?yàn)槿祟?lèi)的航海活動(dòng),最適合抹香鯨生活的海域噪音也非常大,也會(huì)影響數(shù)據(jù)收集的質(zhì)量。
為了更好地收集數(shù)據(jù),鯨類(lèi)翻譯計(jì)劃專(zhuān)門(mén)吸納了機(jī)器人和信號(hào)學(xué)方面的專(zhuān)家。團(tuán)隊(duì)計(jì)劃開(kāi)發(fā)幾種不同的數(shù)據(jù)收集裝置,實(shí)現(xiàn)“全方位全天候覆蓋”:
第一種是常規(guī)的水下麥克風(fēng),通過(guò)浮標(biāo)的方式安放在海域固定位置和固定深度。
這種傳感器,和軍事場(chǎng)景偵測(cè)潛水艇的技術(shù)差不多,好處是成本較低,能夠全天候收集大量的背景聲音數(shù)據(jù)(如下圖所示)。
這種固定麥克風(fēng)的劣勢(shì)在于容易受到噪音的影響,且追蹤特定鯨魚(yú)的能力較差。所以就需要其他的傳感器來(lái)補(bǔ)充。
第二種傳感器叫做“Tag”(標(biāo)簽),也就是吸附在每一條抹香鯨身上,針對(duì)性地只收集這一只(以及附近和它交流的其他鯨魚(yú))的聲音數(shù)據(jù)。這些標(biāo)簽不僅收錄聲音,還可以同時(shí)記錄其更多類(lèi)型的行為數(shù)據(jù)位置、深度、速度、動(dòng)作、姿態(tài)等等:
第三種就是水下/空中無(wú)人機(jī),具有導(dǎo)航、追蹤、視頻音頻記錄功能用來(lái)覆蓋前集中數(shù)據(jù)收集方式的盲區(qū)。在未來(lái),一部分水下無(wú)人機(jī)還可以改造成“鯨語(yǔ)聊天機(jī)器人”。
至于鯨類(lèi)翻譯計(jì)劃目前的進(jìn)展:這個(gè)項(xiàng)目是去年正式組建的,今年前不久剛獲得更多外部機(jī)構(gòu)的資助和學(xué)術(shù)支持。Bronstein告訴硅星人,團(tuán)隊(duì)預(yù)計(jì)將在明年陸續(xù)完成各種數(shù)據(jù)收集裝置的開(kāi)發(fā),并開(kāi)始收集更多數(shù)據(jù)。
鯨類(lèi)翻譯計(jì)劃的團(tuán)隊(duì)成員們一廂情愿地認(rèn)為,自己的研究方向是正確的,一方面是考慮到之前有針對(duì)海豚等其他海洋生物的類(lèi)似項(xiàng)目取得了成果,另一方面也因?yàn)榍拔奶岬降模跈C(jī)器學(xué)習(xí)(也即統(tǒng)計(jì)學(xué))的研究方法,無(wú)論如何都是能用的。
在學(xué)術(shù)界中,支持和質(zhì)疑該項(xiàng)目的聲音此起彼伏。但不管怎么樣,由于研究對(duì)象和研究方式的限制,鯨類(lèi)翻譯計(jì)劃無(wú)法在短期(一兩年內(nèi))取得關(guān)鍵突破的。這注定是一個(gè)超長(zhǎng)期的項(xiàng)目——無(wú)論結(jié)果如何,團(tuán)隊(duì)成員的猜想最終是否應(yīng)驗(yàn),這個(gè)項(xiàng)目都將幫助人類(lèi),增進(jìn)對(duì)抹香鯨以及更多智慧生物溝通方式的了解。
跨物種溝通的“羅塞塔石碑”
兩個(gè)完全不同的物種想要進(jìn)行平等的溝通是非常困難的。幸運(yùn)的是,人類(lèi)對(duì)于語(yǔ)言這門(mén)巨大的學(xué)問(wèn)已經(jīng)掌握了非常多科學(xué)的方法。
文章一開(kāi)始提到的《降臨》電影,就是一個(gè)非常好的例子。片中,人類(lèi)一開(kāi)始錯(cuò)以為七肢桶發(fā)出的聲音是他們?cè)谡f(shuō)話,后來(lái)主角語(yǔ)言學(xué)家班克斯成功“激活”了外星人,讓他們用真正的文字語(yǔ)言(圓環(huán)狀的符號(hào))進(jìn)行溝通。有了文字,班克斯的團(tuán)隊(duì)進(jìn)一步構(gòu)建出了共享詞匯,進(jìn)而雙方之間的溝通效率極大提升。
在古埃及歷史文化中,“羅塞塔石碑”(Rosetta Stone) 是一個(gè)極其重要的存在。這是一塊刻有托勒密五世詔書(shū)的石碑,同一段內(nèi)容用了埃及草書(shū)、古希臘文,以及失傳了上千年的古埃及象形文,三語(yǔ)對(duì)照的寫(xiě)法。
毫無(wú)疑問(wèn),這塊石碑,就是這三種語(yǔ)言最古老的“詞典”,或者用今天機(jī)器學(xué)習(xí)的術(shù)語(yǔ)來(lái)說(shuō),這是最古老的平行語(yǔ)料庫(kù)。通過(guò)它,考古學(xué)家解讀出了失傳上千年的古埃及象形文的意義、結(jié)構(gòu),甚至還發(fā)現(xiàn)象形文字也具有表音的作用。羅塞塔石碑也被公認(rèn)為后世了解古埃及語(yǔ)言和文化的關(guān)鍵基礎(chǔ)。
而在今天機(jī)器學(xué)習(xí)方式,特別是無(wú)監(jiān)督深度學(xué)習(xí)的方法,為人類(lèi)處理語(yǔ)言任務(wù),甚至拓展語(yǔ)言研究的邊界,開(kāi)啟了一種全新的思路。
在翻譯這一經(jīng)典任務(wù)上,機(jī)器不需要理解語(yǔ)言,而是僅靠單一語(yǔ)言的語(yǔ)料,即可掌握該語(yǔ)言的句法、語(yǔ)法等關(guān)鍵要素。
Bronstein表示,在神經(jīng)網(wǎng)絡(luò)處理翻譯任務(wù)的時(shí)候,研究者有一個(gè)重要的發(fā)現(xiàn):英語(yǔ)和意大利語(yǔ),在詞、句、語(yǔ)法等各方面差異巨大的兩種語(yǔ)言,在表達(dá)同一句話時(shí),在神經(jīng)網(wǎng)絡(luò)內(nèi)部的Word Embedding模式驚人的近似。
這一情況的存在,讓鯨類(lèi)翻譯計(jì)劃的成員們對(duì)于未來(lái)非常期待。邏輯簡(jiǎn)單形容一下其實(shí)是這樣的:
這兩種語(yǔ)言都是人類(lèi)說(shuō)的↓
人類(lèi)是智力高度發(fā)達(dá)的哺乳動(dòng)物↓
抹香鯨也是智力高度發(fā)達(dá)的哺乳動(dòng)物↓
那么,人類(lèi)的語(yǔ)言和抹香鯨的“語(yǔ)言”,是否至少存在那么一點(diǎn)點(diǎn)相似之處,可以用機(jī)器學(xué)習(xí)/語(yǔ)言/統(tǒng)計(jì)學(xué)的思路,來(lái)打開(kāi)一個(gè)突破口?
這也是鯨類(lèi)翻譯項(xiàng)目的存在之外的另一個(gè)啟發(fā):在機(jī)器學(xué)習(xí)技術(shù)飛躍的時(shí)代,“羅塞塔石碑”或許不再是詞匯表,而是跨物種之間共通的,只有依靠先進(jìn)科學(xué)才能夠識(shí)別出的,隱性的規(guī)律。
也許經(jīng)過(guò)多年的研究,人鯨對(duì)話將成為現(xiàn)實(shí)。
關(guān)鍵詞: 密碼 語(yǔ)言 鯨魚(yú) 數(shù)據(jù) 鯨類(lèi) 物種 學(xué)科 海域 語(yǔ)法 外星人
網(wǎng)站首頁(yè) |網(wǎng)站簡(jiǎn)介 | 關(guān)于我們 | 廣告業(yè)務(wù) | 投稿信箱
Copyright © 2000-2020 www.xnbt.net All Rights Reserved.
中國(guó)網(wǎng)絡(luò)消費(fèi)網(wǎng) 版權(quán)所有 未經(jīng)書(shū)面授權(quán) 不得復(fù)制或建立鏡像
聯(lián)系郵箱:920 891 263@qq.com
主站蜘蛛池模板: 吃奶摸下激烈免费视频免费| 亚洲精品国产v片在线观看| 亚洲国产日韩欧美一区二区三区| 久久久久久久久久国产精品免费| 日韩欧国产精品一区综合无码 | 精品伊人久久大线蕉地址| 国产精品久久久久久一区二区三区| 中文字幕校园春色| 国产精品久久久久久福利| 爱情岛论坛亚洲永久入口口| 杨幂精品国产福利在线| 国产精品久久久天天影视香蕉| 欧美日韩色黄大片在线视频| 明星换脸高清一区二区| 国产成品精品午夜视频| lover视频无删减免费观看| 在线观看免费av网站| 国产高清中文字幕| 美女扒开尿口让男人捅爽| 美女隐私免费视频看| 高清不卡毛片免费观看| 色偷偷成人网免费视频男人的天堂| 91久久麻豆| 旧里番6080在线观看| 在厨房里挺进美妇雪臀| 国产区图片区小说区亚洲区| 成人精品一区二区三区中文字幕| 欧美日本免费| 波多野结衣在线女教师| 大学生情侣在线| 一个人看的hd免费视频| 亚洲国产精品一区二区第四页| 中国黄色一级大片| 2018av男人天堂| 精品国产污污免费网站入口 | 丰乳娇妻镇| 激情欧美日韩一区二区| 殴美黄色| 啊灬啊别停灬用力啊动视频| 女m羞辱调教视频网站| 日韩毛片高清在线看|