近兩年,大模型技術發展速度令人瞠目,從2020年OpenAI的GPT-3到2023年的GPT-4經歷了兩年多的時間,從2023年Google推出Imagen2文生圖大模型到2024年2月引爆媒體的文生視頻模型Sora僅間隔了2個月。而且,大模型技術的應用場景也更加廣泛,對人的工作和生活乃至產業的改變日趨加大,是一場真正的科技變革。運營商作為國家重要的科技力量,亦紛紛布局AI大模型。在全球矚目的巴塞羅那世界移動通信大會上,中國聯通重磅發布了“聯通元景”大模型體系及系列人工智能創新成果。
Scale AI主要從事的AI訓練數據標注,通俗理解,就是通過分類、畫框、標注、注釋等對圖片、語音、文本、視頻等原始的數據進行處理,標記對象的特征,以作為機器學習基礎素材。
人工智能大模型是指擁有超大規模參數(通常在十億個以上)、超強計算資源的機器學習模型,能夠處理海量數據,完成各種復雜任務,如自然語言處理、圖像識別等。
為確保人工智能大模型行業數據精準性以及內容的可參考價值,我們研究團隊通過上市公司年報、廠家調研、經銷商座談、專家驗證等多渠道開展數據采集工作,并對數據進行多維度分析,以求深度剖析行業各個領域,使從業者能夠從多種維度、多個側面綜合了解人工智能大模型行業的發展態勢,創新前沿熱點,進而賦能人工智能大模型從業者搶跑轉型賽道。
人工智能大模型行業是一個快速發展的領域,隨著大數據和云計算技術的不斷進步,該行業正在逐步成熟。人工智能大模型是實現人工智能應用的重要基礎,被廣泛應用于自然語言處理、計算機視覺、語音識別等領域。
根據評測結果,推理、數學、代碼、智能體是國內大模型的短板,但在主觀評測中,國內模型在中文場景下相比海外模型具有優勢,在中文語言理解、中文知識和中文創作上,國內商業模型相比GPT-4 Turbo具有極強的競爭力。
不過,在追趕過程中,GPT-4并非一成不變,“OpenAI的能力也在進步,后續會發布的GPT-5也一定會超越前一代,不會完全停下來等待大家追趕,國內和國外的模型都需要往前去拓展自己的能力。”林達華表示。
復旦大學計算機科學技術學院教授、上海市數據科學重點實驗室主任肖仰華同樣對第一財經表示,如果限定一下,如在兩三年做到 GPT-3.5的版本和GPT-4的版本,是早晚能追上的事,但問題是對方也在迭代。他表示,“我們總體上還是屬于跟隨OpenAI的階段,即便從谷歌發布的新的大模型來看,要追趕OpenAI也是很不容易的一件事,尤其是對于通用人工智能來說。”
“我們一直擔心的一個問題是,在通用人工智能這個賽道上只有第一沒有第二,因為它一旦突破了這個拐點,后面的增長是指數級的,而且有明顯的先發優勢,可以更快利用真實用戶的反饋,跑在一個快速迭代的道路上,且它已經形成了一定程度的商業閉環。”
工信部數據顯示,2023年1-10月,國內人工智能產業發展勢頭向好,核心產業規模達到5,000億元。從企業數量上看,截至2024年1月,國內人工智能相關企業為157.18萬家。2021年-2023年,國內人工智能企業數量分別增加36.36萬家、42.71萬家、52.92萬家,同比增長87.11%、17.47%、23.91%。
其中,以大模型為代表的生成式AI正加速與各行各業深度融合,關聯產業規模已突破10萬億,催生出規模可觀的數字經濟新業態、新場景和新模式。其中,尤以智能制造、能源、金融、醫療、教育等領域的人工智能商業化應用最為活躍。
過去幾年部署的AI應用,接下來幾年都有可能被基于大模型的AI所替代。升級迭代可能會從優先具備海量數據的場景開始。當大模型支撐的AI應用成為主流,不能利用大模型能力的廠商將失去競爭優勢。
《北京市人工智能行業大模型創新應用白皮書(2023年)》中顯示,截至2023年10月,我國10億參數規模以上的大模型廠商及高校院所共計254家,分布于20余個省市/地區。
人工智能大模型正掀起新一輪科技發展熱潮,重塑生產方式、優化產業結構、提升生產效率的賦能效應日益顯現。大模型是參數量龐大的機器學習模型,隨著AI硬件發展實現突破,大模型的快速訓練成為可能,全球大語言模型的行業發展進入加速期。2023年一季度以OpenAI為代表開發的ChatGPT等大語言模型成為現象級產品,標志著AI大模型落地有了明確進展。此后海外微軟、谷歌、Meta 等公司均發布自己的大模型產品,國內百度、阿里、科大訊飛等眾多公司也迅速推出了自己的大模型。根據賽迪顧問數據,截至2023年7月底,國外大模型發布數量累計達138個,國產大模型增長迅速,共發布64個。
在AI技術創新浪潮下,國內人工智能產業研發投入持續加碼,多模態大模型等技術迭代更新不斷加速。
9月初,科大訊飛宣布訊飛星火認知大模型面向全民開放服務,至此,首批包括訊飛星火、百度文心一言、商湯SenseChat等在內共十余款人工智能大模型全部面向公眾開放服務。另外包括騰訊在內的一些公司的大模型也通過備案,將擇機面向公眾開放。
顯然,2024年,大模型將繼續其火熱的現象,在2023年形成的百模大戰競爭將會進一步白熱化,進一步滲透到各行各業的數字化進程中。
人工智能大模型是實現人工智能應用的重要基礎,被廣泛應用于自然語言處理、計算機視覺、語音識別等領域。根據預測,到2024年年底我國將有5%—8%的企業大模型參數從千億級躍升至萬億級,算力需求增速會達到320%。
人工智能大模型行業市場深度分析
當下,我國專業性大模型AI的開發仍然面臨一些挑戰和限制。一方面,大模型的訓練需要龐大的計算資源和時間,這對于一些中小型企業和研究機構來說是一個難以逾越的壁壘。另一方面,大模型的訓練數據需要大量的人工標注和清洗,這對于一些領域專業性較高的任務來說是一個復雜而耗時的過程。此外,大模型的應用也面臨著數據隱私和安全性的挑戰,如何保護用戶數據和防止濫用成為了亟待解決的問題。
到2025年,我國AI芯片市場規模將達到1780億元,21-25年,我國AI芯片市場規模的復合年增長率(CAGR)預計為42.9%,高于同期全球市場規模增速(32.1%)。隨著我國AI下游需求的爆發和海外芯片流入日益收緊,國產AI芯片算力有望持續迭代,量價未來可期,是值得關注的長期大趨勢。
隨著各行各業大模型應用進程加快,智能制造生態和應用技術的成熟,2026-2029年,AI大模型應用領域有望呈現出裂變增長,市場總規模將達到5,000億元,年均增長率或超100%。
報告根據人工智能大模型行業的發展軌跡及多年的實踐經驗,對中國人工智能大模型行業的內外部環境、行業發展現狀、產業鏈發展狀況、市場供需、競爭格局、標桿企業、發展趨勢、機會風險、發展策略與投資建議等進行了分析,并重點分析了我國人工智能大模型行業將面臨的機遇與挑戰,對人工智能大模型行業未來的發展趨勢及前景作出審慎分析與預測。
想要了解更多人工智能大模型行業詳情分析,可以點擊查看中研普華研究報告《2024-2029年中國人工智能大模型行業發展分析及發展趨勢預測報告》。