首頁 > 科技

GitHub遭炮轟:Copilot「抄襲」已經失控,為訓練AI侵權整個社群

2021-07-11 03:03:07

博雯 發自 凹非寺量子位 報道 | 公眾號 QbitAI

「他們簡直是不知羞恥。」

7月7日,一位網友在推特上公開炮轟GitHub:

這位使用者貼出了一封GitHub的郵件回覆。

郵件中,GitHub官方確認了他們會使用所有GitHub公開程式碼來訓練Copilot,並且不區分License類別

而在之前,明明官方有過「Copilot是在GPL程式碼的基礎上訓練出來的」這種說法,但之後GitHub的CEO又表示:

每天都有數百名GitHub的開發者在使用Copilot,如果預覽版進展順利的話,我們將計劃在未來某個時候將其擴展為付費產品。

完全就是一副視General Public License如無物的樣子。

這位博主諷刺到,遵守版權的只有窮人和無產者,富人和大公司想怎麼做都可以。

這個訊息一出,網友們直接炸了。

「我們不區分License」

不區分License類別,這意味著什麼?

不管是使用了以下哪一份協議的程式碼,GitHub都有可能拿來訓練Copilot。

△圖源部落格《如何選擇開源許可證?》

如果未來Copilot真的變成付費商品,那麼對於很多並不允許被修改後拿去商用的原始碼來說,這毫無疑問是一種侵權行為。

更何況還包括了整個GitHub裡的所有程式碼!

在GitHub自己的服務協議(ToS)裡,他們可都表示「這份協議並沒有給GitHub出售您內容的權利」:

不過有人覺得事情沒那麼嚴重:

他們沒有真正出售程式碼,他們賣的是一種程式碼組合的模式。

確實,GitHub官方有說過Copilot「通常不會精確複製程式碼塊」。

但馬上就有人反駁:

可是大量的例子表明Copilot就是在逐字複製-貼上程式碼塊,實質上不就是在出售別人的程式碼嗎?

而且,要是Copilot自動生成的程式碼就是從別處一字不差的照搬來的呢?

又或者來自某個不允許被商用的原始碼,而使用者又拿著這些自動生成的程式碼去商用了呢?

不僅是GitHub自己違背版權,這種不顧License的商用也有可能讓使用者在無意識間面臨被起訴的風險。

而GitHub Copilot的下載頁面中,並沒有與此相關的法律風險的提示。

最開始曝出這一事件的博主表示:

GitHub以及微軟認為,個人和小型社群項目的版權是沒有價值的。這也就是為什麼他們會和自由軟體們打成一片;他們從來都沒打算尊重過我們的權利。

而目前,GitHub還沒有對這件事作出迴應。

抄襲可恥,AI無罪?

Copilot上週二由GitHub和OpenAI聯合釋出。

至此,釋出不到兩週,Copilot就深陷「版權侵犯」的質疑之中。

在釋出之初時,GitHub稱:

Copilot可以分析文件中的字元串、註釋、函數名稱以及程式碼本身,從而生成新的匹配程式碼,包括之前呼叫的特定函數。

簡單來說,這就是個「自動程式碼生成器」。

剛剛釋出時有人把Copilot拉去刷Leetcode的題庫,結果這位「AI程式設計師」每次都能通過Leetcode的測試,程式碼生成速度還近乎實時:

只要寫下一段註釋,Copilot就能補全剩下的程式碼,並提出改進的建議。

不僅能為真的程式設計師節省查詢時間,還能提高程式設計效率,看起來好像真的很美好。

但GitHub的CEO的那句要把Copilot商用的未來期望馬上就引來了滿城風雨。

馬上就有一位網友表示:

根據他們自己的說法,Github Copilot是在GPL程式碼的基礎上訓練出來的,這不就是把開原始碼洗成商業產品嗎。

而這位程式設計師也提到,Copilot並沒有做到它說的「不會精準複製某個程式碼塊」。

兩天後,另一位網友就驗證了這一說法。

在這段網友放出的視訊中,只打出Fast Inverse Square Root(平方根倒數速演算法)四個字,Copilot就「完美復刻」《雷神之錘3》裡的那段著名的演算法:

甚至連那句WTF的經典註釋都沒有放過。

隨後,矛盾進一步深化。

7月3日,有開發者站出來抵制GitHub Copilot,表示自己再也不會使用GitHub來託管程式碼:

這位抵制者認為:

我不同意GitHub在未經授權和未經許可的情況下,使用受版權保護的原始碼作為其Copilot產品的訓練資料。該產品將受版權保護的原始碼放入使用者的軟體中,而不告知他們原始碼的許可,這導致了對版權所有者作品的未經授權和未經許可的不當使用。

而現在,官方確認的「不顧開源許可證,以GitHub上所有開原始碼來訓練」這一事實,更是引爆了整個社群。

現在,已經有科技公司明確表示:禁止員工使用GitHub Copilot。

參考連結:[1]https://twitter.com/NoraDotCodes/status/1412741339771461635[2]https://www.reddit.com/r/programming/comments/og8gxv/github_support_just_straight_up_confirmed_in_an/[3]https://www.qbitai.com/2021/07/25969.html


IT145.com E-mail:sddin#qq.com