今天,DeepMind 的“Alpha”家族再添一名新成員:會刷編程競賽題的 AlphaCode 來了!
其實,AlphaCode 早在幾個月前就“悄悄進村”了,一直沒人察覺。它默默參加了著名網站 Codeforces 最近舉行的 10 場編程比賽,成績超過了一半人類。
直到今天 DeepMind 才公布最終成績:AlphaCode 在這 10 場比賽中排名前 54.3%,Elo 評分 1238。
更重要的是,在編程比賽這樣考察算法創造力的問題中,AI 終于不落下風,而這恰恰是 AI 過去所欠缺的。
如果把這個分數放到過去六個月總體來看,AlphaCode 的成績更為優秀,因為它只刷了 10 周的題目,就已經達到了前 28% 用戶的水平。
Codeforces 是一個由俄羅斯程序員 Mikhail Mirzayanov 創辦的編程競賽網站,大約每周舉行一次名為“Codeforces Rounds”的編程比賽。
通過 Codeforces 的 Elo 評分可以衡量一位程序員的編程水平。
△ Codeforces 創始人 Mikhail Mirzayanov
當看到 AlphaCode 的成績后,連創始人 Mirzayanov 都驚訝不已。
他原本對 AI 持懷疑態度,因為編程比賽考驗的是發明算法的能力,這是最困難的,沒想到 AlphaCode 的結果完全超出了他的預期。
DeepMind 發布這條消息僅半天,在 Twitter 上已經有 2000 多次轉發、5000 多點贊。
AlphaCode 如何編程
說了這么多,下面我們來看看 AlphaCode 是如何成為“編程做題家”的。
以下是 Codeforces 上的 1553D 問題:(鏈接:https://codeforces.com/ problemset / problem / 1553 / D)
有兩個字符串 s 和 t,都是由小寫字母組成。對于字符串 s,我們從前向后掃描整個字符串。
如果按下 Backspace 鍵,就刪除該光標前到上一個未刪除字符之間的所有字符。
例如字符串 s 是”abcbd”,你分別在第一個位置和第四個位置按下 Backspace,那么將得到字符串”bd”。
因為在第一個光標位置前沒有字符,所以第一次沒有動作。第四個光標位置前的字符是 c,上一個未刪除字符是 a,所以按下 Backspace 將刪除前三個字符”bd”。
好了,現在問題來了:
我們能否從前向后掃描一次 s 字符串, 讓 s 變為 t。如果可以輸出 YES,否則輸出 NO。
AlphaCode 給出的代碼是這樣的:
向以上程序輸入 4 組字符串:
得到的輸出是:
在這里,AlphaCode不再是黑箱。
它不僅成功解決了問題,還能將代碼和注意力高亮的對應位置顯示出來。
一位網友表示:既然 AI 能看得這么細,那么如果能在代碼后面加入注釋就更好了。
至于更多的案例,可以去 AlphaCode 網站觀摩。
原理
DeepMind 說,在 Codeforces 比賽中所需解決問題的能力,已經超出了現有 AI 系統的能力。
整個 AlphaCode 模型的流程如下:
用標準的語言建模目標在 GitHub 代碼上預訓練一個基于 Transformer 的語言模型。這個模型可以合理地代表人類編寫代碼的空間,大大減少了問題的搜索空間。
在競爭性編程數據集上微調模型,使用 GOLD 與 tempering 作為訓練目標,進一步減少了搜索空間,并利用預訓練彌補了少量的競爭性編程數據。
為每個問題從模型中生成非常多的樣本。
對樣本進行過濾,以獲得一小部分候選提交的樣本(最多 10 個),在隱藏的測試案例上進行評估,方法是利用實例測試和聚類,根據程序行為挑選樣本。
總而言之,通過將大規模 Transformer 模型與大規模采樣和過濾相結合,DeepMind 在可以解決的問題數量方面取得了重大進展,比之前的工作高出一個數量級。
刷題人士抵觸
正如 Codeforces 創始人所說,在編程問題中對算法的發明創造是最難的。
在全球編程比賽網站上常年排名前幾的谷歌工程師 Petr Mitrichev 說:解決編程比賽問題是一件非常困難的事情。它既需要良好的代碼技能,也需要人類解決問題的創造力。
AlphaCode 不是第一個編程工具,Codex 以及 GitHub Copilot 都給人留下了深刻的印象。
但 DeepMind 認為,AlphaCode 和前輩們大有不同:最近的大規模語言模型展示了生成代碼的驚人能力,現在能夠完成簡單的編程任務。然而,當對更復雜、看不見的問題進行評估時,這些模型的表現仍然很差,這些問題需要解決問題的技能,而不僅僅是將指令翻譯成代碼。
與 Twitter 上截然不同的是,Codeforces 高手們卻多有抵觸情緒。
一位程序員認為:“這個 AI 真是個菜鳥。”
因為 AlphaCode 只有1238分,只相當于一個學生水平,一個參加信息學奧賽的中學生也能刷到這個水平。
雖然 DeepMind 聲稱 AlphaCode 是為了輔助人類,但也有程序員開始擔心了:
現在連刷題的世界都被AI占領,本來這里是程序員們切磋的地方,AI應該適可而止,給程序員們留一片凈土吧!
網站首頁 |網站簡介 | 關于我們 | 廣告業務 | 投稿信箱
Copyright © 2000-2020 www.xnbt.net All Rights Reserved.
中國網絡消費網 版權所有 未經書面授權 不得復制或建立鏡像
聯系郵箱:920 891 263@qq.com
主站蜘蛛池模板: 性做久久久久免费观看| 人和与禽交| 蜜桃成熟时33d在线| www.四虎| 色多多在线观看视频| 在线网站你懂得| 波多野结衣在线看片| 高清破外女出血视频| 欧美一级大片在线观看| 麻豆约会| 福利一区二区在线| 国产欧美另类久久久精品免费| 美女跪下吃j8羞羞漫画| 欧美性生活视频免费| 黄色中文字幕在线观看| 欧美精品亚洲精品日韩专区| 国产亚洲情侣一区二区无| 草樱免费视频| 日本三级免费观看| 亚洲视频一二三| 你懂的电影在线| 国产视频一区二| 狠色狠色狠狠色综合久久| 蜜桃成熟时3之蜜桃仙子电影 | 国产123区在线视频观看| 你懂的电影在线| 日韩一级高清| 精品国产人成亚洲区| 成人免费福利电影| 日产2021乱码一区| 女人与公拘交酡过程高清视频| 欧美激情xxxx性bbbb| 女主调教贱女m视频| 韩国全部三级伦电影在线播放| 久久久99精品免费观看| 青青草97| 欧美日韩国产另类一区二区三区 | 在厨房里挺进美妇雪臀| 美国一级毛片在线| 香蕉久草视频| 男人的j插入女人的p|