開源和閉源一直是大模型發展中的重要議題,DeepSeek掀起的大模型“旋風”更引起技術界對開閉源策略選擇的爭論。開源和閉源各有什么優劣?如何理解開源大模型對人工智能發展的意義?
所謂“開源”,指的是開放源代碼,意味著開源軟件的源代碼任何人都可以審查、修改和增強。DeepSeek便屬于開源大模型;而與之相對的閉源軟件,只有創建者才具備修改權限,像OpenAI旗下chatGPT的一系列模型就屬于閉源專有模型。
發展大模型,選擇開源還是閉源,本質上是由企業的不同定位決定的。選擇閉源的企業注重用專有技術換商業利潤,選擇開源的企業注重用技術擴散換生態影響。
短期看,閉源將大模型變成企業的一大盈利點,能夠保障企業在激烈的市場競爭中獲得利潤。相比來說,開源模式沒有明顯的盈利點,但也不意味著不能掙錢。
在大數據時代,信息和流量是最大的財富,相較專有閉源模型帶來直接的商業利潤,以DeepSeek為代表的開源模型通過卓越性能+免費開源的低部署成本,一躍成為人工智能時代的基礎設施,為未來發展帶來更多可能。
同時,開源大模型在凝聚全球開發者、建設智力共同體、快速優化模型能力、本地化部署適配各類場景等各個方面具有閉源模型無可比擬的優勢,更有潛力塑造行業標準,營造出一個能夠源源不斷培育頂級科技產品的開放生態,同時也能通過云服務和硬軟件等各種方式創造出不輸于閉源模型的商業價值。
我國擁有聯合國產業分類中所列全部工業門類,開源大模型賦能全產業鏈空間無限。通過標準化、模塊化的技術架構,大模型能夠打通產業鏈上下游,形成協同創新的生態系統。
在硬件層,算力廠商基于開源模型的通用需求優化芯片設計;在數據層,標注服務和語料庫建設因模型開源而標準化;在應用層,開發者可快速調用預訓練模型開發垂直場景產品,如智能客服、醫療影像分析等。這種全鏈條的貫通效應,使得技術創新能全方位轉化為經濟社會效益,為高質量發展注入持續動能。
傳統閉源模式下,算法、算力、數據的“三重壟斷”將中小企業排斥在AI競爭之外,一方面使得大模型賦能力度不足,另一方面也使得大模型缺少足夠的場景和用戶反饋,制約其繼續創新。
開源大模型通過“技術平權”重構經濟格局。低成本加卓越性能,塑造了開源模型的高性價比,直接使得大模型能夠全面賦能千行百業。這種開放生態形成了良性循環的“創新飛輪”:企業貢獻基礎模型,學術界優化算法,開發者創造應用,最終反哺模型迭代。
技術路線從來不會十全十美,開源模式也是如此。在發展開源大模型的過程中,應避免一些誤區。比如,開源并不等于忽視知識產權,應加緊開源許可協議標準建設,為開源生態確立規范。開源策略公開代碼,意味著安全風險的暴露和強傳播性,應充分調動開源社區維護者、開源軟件開發者、開源代碼使用者等受益于代碼開源的利益相關者的積極性,形成多元可靠的安全管控網絡,以去中心化的人人防控確保開源安全。
自2017年7月國務院印發《新一代人工智能發展規劃》至今,我國人工智能產業蓬勃發展。在其從大轉強的歷史發展進程中,我國的人工智能需要一個能充分激發技術創造力和生產力的新生態,而開源正是打造新生態的有力“武器”。
原標題:開源閉源孰優孰劣
文章來源:http://www.ce.cn/cysc/tech/gd2012/202504/16/t20250416_39344722.shtml
|