【資料圖】
新京報貝殼財經訊(記者羅亦丹)5月26日至5月30日,2023中關村論壇舉行期間,中科院院士、CCF開源發展委員會主任王懷民教授發表了關于“開源創新啟示”的演講。
王懷民表示,過去5年在人工智能領域大模型發展非常迅速,人們在大模型的研究中有過懷疑,也有過積極的探索。大模型的不確定性造就了開源模式和閉源模式同時推進的基本格局。當ChatGPT2發布之后,OpenAI也開始閉源。在這樣的背景下,有很多參與到開源大模型研究領域中的參與者懷疑OpenAI的開源主張,也由此產生了一系列更多的所謂能夠替代ChatGPT的開源的發展。去年年底ChatGPT發布之后,它所形成的潛力從學術界蔓延到全社會之后形成的影響力,一方面試圖在支撐著閉源的模式,同時也在激發著開源模型的發展,那么究竟是開源還是閉源,應該如何發展?
在他看來,閉源大模型的訓練成本極高,最近發布的谷歌的大模型訓練費用超過了千億美元,因此說閉源是保證商業投入的一個有效方式,也成為了閉源的理由。不過,開源創新已經成為軟件發展乃至于IT技術發展的一種主流技術形態,超級計算機的操作系統幾乎都是用Linux這樣的開源軟件操作系統進行構建,智能手機的操作系統80%以上都由開源的安卓系統支持,在云端,一些重要的軟件80%也是開源支持的。在大模型出現之前,深度神經網絡的學習框架也幾乎都是開源的。
王懷民認為,從整個市場形態看,國際IT產業從芯片到操作系統到數據庫到中間件,乃至于云邊端的軟件和設備發展模式,開源模式是一種非常有競爭力的形態。到了人工智能這個領域,最近ChatGPT是不開源,但是META把它的LLaMA模型開源,迅速地吸引了大量開發者,和在互聯網時代Linux開源狀態非常之相似。
“我們應該思考,今天我們的這個時代是一個不確定性的時代還是因為大模型已經確定了的人工智能時代,這實際上是開源和閉源能夠發揮有效作用的一個重要的態勢判斷。在這個過程中我們看到LLaMA模型,也看到整個人工智能大模型開發過程中,開源開放是以不同的形態表征的,過去我們開源軟件就是代碼要開源,而今天在人工智能當中數據的開源,訓練代碼的開源,推理代碼的開源,乃至于服務的開放,是不同層面的開放,都是被社會關注和接受的。比如說ChatGPT雖然它的數據訓練代碼、推理代碼都沒有開放,但是把API和服務開放之后,仍然可以吸引一大批在大模型驅動下的新型人工智能開發的探索。”王懷民說。
開源和閉源究竟哪一種模式更有效?王懷民表示,今天開源已經不簡單是目的了,是一種推動技術創新發展的手段,“在一個確定性的時代,微軟以它的企業組織模式封閉推進一個產品的開發,我們稱為單性繁殖,每個新的產品都由微軟定義。但是在互聯網時代到來的時候,在一個不確定性的互聯網時代,開源的競爭力更強,開源Linux社區發布一個核心版本,更多人在這個核心版本上根據他對需求和領域的理解進行不斷地修改,形成了雙性繁殖,能夠產生或者低成本產生更多的適應未來發展的新版本,由環境來評價,然后再迭代回來不斷地開發,這個新版本并不是由一家企業完成的,是由全社會參與的,開源在不確定性的時代更加有競爭力。”
(文章來源:新京報)
標簽:












