新AI“阿爾法扣”勝過(guò)近五成“碼農(nóng)”

2022年12月12日 04:59　來(lái)源：科技日?qǐng)?bào)

大字體

小字體

分享到：

　　擁有或可媲美人類的編程創(chuàng)造力

　　新AI“阿爾法扣”勝過(guò)近五成“碼農(nóng)”

　　科技日?qǐng)?bào)訊 (實(shí)習(xí)記者張佳欣)在全球范圍內(nèi)，程序員短缺。如果人工智能(AI)會(huì)寫(xiě)代碼——只要人類告訴AI想通過(guò)程序做什么，將帶來(lái)許多便利。根據(jù)發(fā)表在最新一期《科學(xué)》雜志上的研究，一款名為“阿爾法扣”(AlphaCode)的新AI系統(tǒng)正在讓人類離這一愿景更近一步。該系統(tǒng)來(lái)自“深度思維”研究實(shí)驗(yàn)室，整體性能相當(dāng)于經(jīng)過(guò)幾個(gè)月到一年培訓(xùn)的新手程序員。

　　在測(cè)試中，“阿爾法扣”通過(guò)預(yù)測(cè)代碼段并創(chuàng)建數(shù)百萬(wàn)個(gè)潛在的解決方案，實(shí)現(xiàn)“接近人類水平的性能”，還能在競(jìng)爭(zhēng)中解決以往未發(fā)現(xiàn)的自然語(yǔ)言問(wèn)題。在生成了過(guò)多方案后，“阿爾法扣”會(huì)將它們篩選為最多10個(gè)方案，所有這些方案都是在“沒(méi)有任何關(guān)于計(jì)算機(jī)代碼結(jié)構(gòu)的內(nèi)置知識(shí)的情況下”生成的。

　　在Codeforce競(jìng)爭(zhēng)性編碼平臺(tái)最近的編碼模擬評(píng)估中，“阿爾法扣”在每個(gè)問(wèn)題的第10代解決方案中平均排名前54.3%，而其中66%的問(wèn)題第一次提交就得到了解決。

　　美國(guó)卡內(nèi)基·梅隆大學(xué)博世人工智能中心教授齊科·科爾特說(shuō)：“無(wú)論‘阿爾法扣’在多大程度上‘真正’理解了這項(xiàng)任務(wù)，它在前所未見(jiàn)的編碼挑戰(zhàn)中表現(xiàn)得非常出色。”

　　“阿爾法扣”并不是唯一會(huì)編碼的AI模型，但其性能超越了“前輩”Codex——OpenAI研究實(shí)驗(yàn)室于2021年發(fā)布的系統(tǒng)。GitHub也有自己的流行AI編程工具Copilot。然而，在解決復(fù)雜的競(jìng)爭(zhēng)性問(wèn)題方面，這兩款A(yù)I都未表現(xiàn)出與人類匹敵能力。

　　深度思維公司表示，經(jīng)過(guò)培訓(xùn)，“阿爾法扣”解決了約34%的指定問(wèn)題。為進(jìn)一步測(cè)試它的能力，公司讓它參加了在線編碼比賽。在至少有5000人參加的比賽中，“阿爾法扣”的表現(xiàn)超過(guò)了45.7%的程序員。研究人員還將其與訓(xùn)練數(shù)據(jù)庫(kù)中的程序進(jìn)行了比較，發(fā)現(xiàn)它沒(méi)有復(fù)制大段代碼或邏輯，這表明它有驚人的創(chuàng)造力。

　　除了提高總體生產(chǎn)率外，“阿爾法扣”還可讓新一代開(kāi)發(fā)人員更容易地進(jìn)行編程。其未來(lái)有一天可能會(huì)改變?nèi)藗兊木幊汤砟?，即人類主要是為了制定?wèn)題，然后由AI來(lái)解決問(wèn)題。

【編輯:程春雨】