華為加入大模型之戰
2023-07-08 20:20:18 來源:搜狐號-南財快訊
作者|于惠如 編輯|劉宇
國內大模型之戰,華為終于出手了。
(資料圖片)
7月7日,華為在開發者大會2023(Cloud)上發布盤古大模型3.0。但與此前諸多公司的大模型發布會不同,華為沒有在現場展示大模型寫詩、作畫的能力。
“盤古大模型3.0不寫詩,只做事?!比A為常務董事、華為云CEO張平安給盤古大模型3.0定調——盤古3.0完全面向行業,意在重塑各行各業,讓每個行業、每個企業、每個人都擁有自己的專家助手。
盤古3.0發布的前一天,華為輪值董事長胡厚崑在2023世界人工智能大會上稱,此輪人工智能浪潮中,華為的思路是推動人工智能“走深向實”,賦能產業升級。
據張平安介紹,“為B端而生”的盤古大模型目前已經覆蓋金融、金融、制造、醫藥研發、煤礦、鐵路等十余個行業,覆蓋400多個業務場景。
在“BATH”中,華為是最晚介紹大模型進展的公司。但華為對大模型的探索很早就已開啟。
2019年-2020年,盤古大模型投入AI大模型研發;2021年4月,華為云盤古大模型正式對外發布;2022年,盤古大模型落地行業應用。
從盤古1.0至盤古3.0,華為在大模型架構和訓練方法上進行了升級,盤古3.0包含“5+N+X”三層架構、多個模型。
在盤古3.0架構中,L0層包括自然語言、視覺、多模態、預測、科學計算五個基礎大模型,提供滿足行業場景中的多種技能需求。L1層是N個行業大模型,既包括用行業公開數據訓練的行業通用大模型,如政務,金融,制造,礦山,氣象等大模型;也包括基于行業客戶自有數據,在盤古大模型的L0和L1層上訓練而來的企業專有大模型。L2層是針對更多細化場景的模型,“開箱即用”。
在發布會后的媒體采訪中,張平安透露,對于盤古大模型的下一步計劃,華為內部制定非常激進的技術路線?!叭A為云現在是‘All in盤古大模型’,目標圖制定得密密麻麻。”在中國市場成功之后,盤古大模型將繼續在海外拓展。
據不完全統計,截至7月,全球已發布數百個大模型,中國有80多個?!鞍倌4髴稹敝?,華為為何選擇行業大模型作為突破口?
張平安給出的答案是:目前大模型大多數應用都集中在To C領域,在面向行業應用時,由于行業數據獲取難,技術與行業know-how結合難,大模型在行業的落地進展較慢。而政企業務的長期積累是華為做行業大模型的優勢。
華為云人工智能領域首席科學家田奇表示,目前全球基于大模型開發To B應用的企業不到三分之一,行業中的海量業務場景迫切需要更多專業的大模型和專業的AI應用來解決,彌補通用大模型落地行業的不足。
一位AI領域專家表達了類似的觀點:“英雄得有用武之地,科技成果要轉化成生產力,還是得有場景,有應用,有商業落地。”
與移動互聯網時代的C端客戶驅動不同,AI浪潮中大模型技術的變革,動力將由B端客戶驅動。不僅僅是華為,其它科技巨頭們也已經意識到了這一點,紛紛從最初豪言“打造中國的通用大模型”的狀態,將重點轉移至行業大模型上。
百度在發布文心大模型后又打造了文心千帆,為企業客戶服務;阿里的通義千問在發布之時便宣稱要為每一個企業打造專屬大模型;騰訊同樣發布了行業大模型解決方案。
“大模型發展到現在,‘BATH’的路線其實很相似,成為‘模型底座’,為B端客戶提供服務,同時售賣算力賺錢?!鄙鲜鯝I領域專家告訴全天候科技。
以華為為例,在這場大模型競賽中,華為扮演了“淘金者”和“軍火商”的雙重身份。
大模型所需要的各項根技術,從底層芯片、數據中心,到上層開發框架、開發平臺、工程平臺,華為自成一體,形成閉環生態。
同時,華為還升級算力設備、出租算力網絡,賺取“軍火錢”。盤古3.0發布的同時,華為云推出專門為AI行業建立的昇騰云服務,并在貴安、烏蘭察布上線兩個新的AI算力中心。
“華為具有典型的To B基因,擁有豐富的與B端客戶打交道的經驗,懂行業know-how,也積累了足夠多的行業數據。從這個角度講,華為的機會很大。”前述AI領域專家對全天候科技說。
激烈競爭已經開始,誰能在“百模大戰”中領先一步,還需要時間驗證。