從文心一言看百度在AI領(lǐng)域的布局及發(fā)展策略
數(shù)字經(jīng)濟時代,隨著數(shù)據(jù)、算力、算法的加速發(fā)展,讓人工智能技術(shù)落地千行百業(yè)從理論變成了現(xiàn)實。
“中國版ChatGPT”文心一言的發(fā)布,將加速國內(nèi)生成式AI模型的落地應(yīng)用
近日,百度發(fā)布新一代大語言模型、生成式AI產(chǎn)品文心一言(ERNIEbot)。
據(jù)李彥宏介紹,文心一言是基于百度2019年自研的通用大模型ERNIE及PLATO預(yù)訓(xùn)練對話生成模型而成,訓(xùn)練數(shù)據(jù)包括萬億級網(wǎng)頁數(shù)據(jù)、數(shù)十億的搜索數(shù)據(jù)和圖片數(shù)據(jù)、百億級的語音日均調(diào)用數(shù)據(jù),以及5500億事實的知識圖譜等。因此,文心一言具備文學(xué)創(chuàng)作、商業(yè)文案創(chuàng)作、數(shù)據(jù)邏輯推理、中文理解、多模態(tài)生成等眾多功能。
作為中國科技大廠發(fā)布的首個大模型產(chǎn)品,文心一言被譽為“中國版的ChatGPT”。
和GPT-3.5(ChatGPT的原模型)、GPT-4相比,在常識和創(chuàng)作類問題中,三大模型均能正確回答客觀常識類問題;在歸納和推理類問題中,文心一言在演繹推理、邏輯推理等領(lǐng)域表現(xiàn)略遜于GPT系列模型;在數(shù)學(xué)和代碼類問題中,GPT-3.5有更好的數(shù)學(xué)能力表現(xiàn),文心一言代碼問題識別能力有待加強;在應(yīng)用場景測試中,三大模型均能較好地完成AI生活助手、售后客服、產(chǎn)品推薦、辦公場景文本生成等任務(wù),但在在情感推理類問題中仍有提升空間。
資料來源:百度
在發(fā)布會上,李彥宏直言:“目前百度是全球大廠中第一個做出對標(biāo)ChatGPT產(chǎn)品的企業(yè),無論是哪家公司,都不可能靠突擊幾個月就能做出這樣的大語言模型。深度學(xué)習(xí)、自然語言處理等需要多年的堅持和積累,沒法速成。業(yè)界對文心一言的期望值是對標(biāo)ChatGPT,甚至要對標(biāo)GPT-4,這個門檻還是很高。”
值得一提的是,百度文心一言的發(fā)布不是通過現(xiàn)場演示而是通過事前錄屏的方式通過PPT來介紹的,并且發(fā)布會后該產(chǎn)品也并未對外直接開放,因此導(dǎo)致公眾的體驗和反饋效果不佳。
不過,文心一言作為國內(nèi)首個發(fā)布的“類ChatGPT”產(chǎn)品,這個表現(xiàn)總體而言已經(jīng)非常不錯了。從發(fā)布預(yù)熱到正式發(fā)布,短短一個多月的時間,已有超650家合作伙伴宣布加入文心一言生態(tài)。拿到先發(fā)優(yōu)勢后,隨著接入用戶數(shù)量的增加,文心一言模型會持續(xù)迭代,模型性能有望進(jìn)一步優(yōu)化完善。
未來,文心一言既可以向應(yīng)用開發(fā)者出售API接口,也可以放進(jìn)自有國民級應(yīng)用里獲取增值服務(wù)收入。作為中國AI歷史上標(biāo)志性的一款產(chǎn)品,毫無疑問文心一言的發(fā)布將極大加速國內(nèi)生成式AI模型的落地應(yīng)用節(jié)奏,并且?guī)椭鷳B(tài)伙伴實現(xiàn)用戶體驗提升和生產(chǎn)降本增效。
國內(nèi)唯一一家實現(xiàn)全棧布局的AI企業(yè),自研芯片昆侖芯已經(jīng)實現(xiàn)大規(guī)模出貨
事實上,百度能在ChatGPT發(fā)布后僅三個月左右的時間就發(fā)布類似的產(chǎn)品,憑的并不是“運氣”,而是十年如一如的在AI領(lǐng)域的深耕。
李彥宏表示,過去一年,無論是在技術(shù)層面還是在商業(yè)應(yīng)用層面,人工智能都有了巨大的進(jìn)展,有些甚至是方向性的改變。百度一直以來就把人工智能業(yè)務(wù)作為公司發(fā)展的重點,公司過去十年在人工智能累計研發(fā)投入已超過1000億元。
在持續(xù)高強度的投入下,公司終于迎來了收獲期。
在專利上,根據(jù)百度的數(shù)據(jù),百度專利申請量已達(dá)16754件,AI專利授權(quán)量5705件,AI專利申請和授予量連續(xù)五年全國第一,專利質(zhì)量(高價值專利及創(chuàng)新驅(qū)動力)評測得分92.21,再次位列全國第一。
而在布局上,經(jīng)過多年的發(fā)展,百度已經(jīng)成為全球為數(shù)不多的在“芯片-框架-模型-應(yīng)用”四層進(jìn)行全棧布局的人工智能公司。通過在技術(shù)棧的四層架構(gòu)中實現(xiàn)端到端的優(yōu)化,可以大幅提升AI的效率。
其中在框架層以飛槳為代表,這是百度產(chǎn)業(yè)級深度學(xué)習(xí)開源開放平臺,已經(jīng)凝聚了500多萬的開發(fā)者,20萬家企業(yè)以及60多萬個模型,目前國內(nèi)綜合市場份額第一;在模型層以文心大模型代表,包含對話模型(PLATO系列)、計算機視覺模型(VIMER系列)、跨模態(tài)模型(例如文圖生產(chǎn)模型文心一格)、生物計算大模型(Helix系列)、行業(yè)大模型等;而在應(yīng)用層則以百度APP(22年底MAU6.5億)等為代表。
值得重點強調(diào)的是,在芯片層方面,昆侖芯公司前身是百度智能芯片及架構(gòu)部,成立于2011年6月,于2021年4月完成獨立融資,首輪估值約130億元,截至目前已經(jīng)完成三輪融資,投資人包含IDG資本、元禾璞華、臨芯投資、比亞迪等眾多業(yè)內(nèi)知名金融資本及產(chǎn)業(yè)資本。
從具體的產(chǎn)品來看,昆侖芯科技于2018年推出云端AI芯片百度昆侖1,采用14nm工藝、16GB HBM先進(jìn)內(nèi)存和2.5D封裝解決方案,目前已經(jīng)在百度搜索引擎、小度和廣告業(yè)務(wù)中廣泛部署;經(jīng)過三年的更新迭代,百度于2021年公司推出昆侖芯2,采用7nm制程,搭載自研的第二代XPU架構(gòu),相比1代芯片性能提升2-3倍,成為業(yè)界最先進(jìn)的AI芯片之一。
此后不久,百度發(fā)布基于昆侖芯2代AI芯片的新一代AI加速卡R200,可以為數(shù)據(jù)中心高性能推理提供高達(dá)256 TOPS@INT8及128 TFLOPS@FP16算力,并且支持多種計算精度、硬件虛擬化、視頻編解碼等功能。目前該加速卡已經(jīng)落地重慶市高級人民法院服務(wù)器、北京市實驗室服務(wù)保障中心AI服務(wù)器等眾多項目,累計訂單已經(jīng)超過千萬級。
隨著整個社會數(shù)字化水平的不斷提升,算力也成為了數(shù)字經(jīng)濟的核心驅(qū)動力,對算力的需求也不斷加大。根據(jù)公司介紹,公司正計劃在未來推出昆侖芯3、昆侖芯4等更高算力與性能的產(chǎn)品,以實現(xiàn)無人駕駛等領(lǐng)域的大規(guī)模商業(yè)化落地,其中昆侖芯3代將于2024年初量產(chǎn)。
除了自研之外,百度近年來通過“BV百度風(fēng)投基金”也做了不少AI方面的產(chǎn)業(yè)投資。目前投資項目總計約151個,包括從芯片到傳感器,從人體數(shù)據(jù)采集到天基觀測網(wǎng),從智能工業(yè)到智能城市,不僅投資AI背后的底層技術(shù),也投資AI驅(qū)動的各種行業(yè)變革項目。
智能汽車業(yè)務(wù)加速發(fā)展,集度首款車型預(yù)計將于2023年交付
從智能汽車的布局來看,作為國內(nèi)最早一批進(jìn)入該行業(yè)的科技及AI公司,百度也已經(jīng)取得了一系列重大成績。
在高精地圖層面,AI是降本增效的核心驅(qū)動力。為了更好的助力智能汽車業(yè)務(wù)的發(fā)展,百度地圖業(yè)務(wù)已經(jīng)從百度CTO王海峰旗下剝離,調(diào)整至百度IDG(智能駕駛)事業(yè)群。
發(fā)展至今,百度高精地圖構(gòu)建自動化率已達(dá)到96%,領(lǐng)航輔助駕駛功能已覆蓋部分城市的高速公路和城市快速路,大幅解決了應(yīng)用成本高的問題。此外,百度已經(jīng)獲得城市高級輔助駕駛地圖許可,并且已經(jīng)與廣汽、蔚來、威馬、長安、本田、長城、吉利、北汽、江淮等眾多車企實現(xiàn)量產(chǎn)合作。預(yù)計到2023年,百度高級輔助駕駛地圖搭載量將超過100萬臺。
在自動駕駛層面,作為國內(nèi)最早布局自動駕駛的企業(yè),百度已成為全球四大自動駕駛領(lǐng)導(dǎo)者之一,并且擁有全球最多的3477件自動駕駛領(lǐng)域發(fā)明專利,在專利數(shù)量上遠(yuǎn)高于豐田、博世、本田、現(xiàn)代、華為、電裝、戴姆勒、福特等汽車整車廠及Tier1廠商。
具體產(chǎn)品上,目前百度主要有以ANP3.0智能駕駛軟硬一體產(chǎn)品方案及自動駕駛出行服務(wù)平臺蘿卜快跑兩大產(chǎn)品為代表。盡管目前兩大產(chǎn)品尚處于變現(xiàn)初期,對于公司的收入貢獻(xiàn)較小,但百度對行業(yè)前景依舊看好。
其中,ANP3.0是百度Apollo面向新一代智能汽車推出的L2+級智能駕駛軟硬一體產(chǎn)品方案,采用百度自研的自動駕駛控制器,兩顆500Top AI計算的NVIDIA Orin-X,800萬像素400米視野的攝像頭傳感器,SOTA半固態(tài)激光雷達(dá),目前正在中國的四個一級城市——北京、上海、廣州和深圳進(jìn)行路測。據(jù)百度預(yù)計,在未來3-5年內(nèi),ANP 3.0將搭載在超過100萬輛汽車上。
而蘿卜快跑是百度在2021年8月發(fā)布的自動駕駛出行服務(wù)平臺,目前已經(jīng)在北京、上海、廣州、深圳、重慶、長沙、滄州及陽泉等城市實現(xiàn)自動駕駛出行服務(wù),訂單量超100萬,穩(wěn)坐全球最大自動出行服務(wù)平臺。
百度蘿卜快跑與其他平臺比較情況
近年來,隨著國內(nèi)新能源汽車的不斷超預(yù)期發(fā)展,以“蔚小理”為代表的一批新能源汽車廠商順勢崛起,在這種情況下,僅做汽車軟硬件很顯然已經(jīng)不能夠滿足百度的胃口了。
經(jīng)過前期的充分調(diào)研后,百度于2021年1月宣布造車,并且于3月成立集度汽車公司并獲得超3億美元啟動資金。時隔僅僅10個月,集度汽車再次獲得新一輪融資近4億美元的A輪融資,由百度和戰(zhàn)略合作伙伴吉利共同增持。此后,吉利退出,由百度100%控股。
資料來源:百度
作為百度旗下新一代智能汽車品牌,集度將全棧應(yīng)用百度AI能力。在2022年6月8日,集度正式發(fā)布了首款汽車機器人概念車JIDU ROBO-01;2022年10月27日,集度發(fā)布首款汽車機器人ROBO-01探月限定版,售價39.98萬元。
集度汽車JIDU ROBO-01參數(shù)情況
在智能化配置上,集度ROBO-01將搭載高通 8295 旗艦智能座艙芯片,擁有30TOPS AI 算力;而自動駕駛芯片將采用英偉達(dá)最新的2顆Orin SoC芯片,合計擁有508TOPS的算力。據(jù)公司介紹,量產(chǎn)車型預(yù)計于2023年在國內(nèi)46個城市上市,以初步完成銷售網(wǎng)絡(luò)的全國布局。預(yù)計到2028年,集度將具備全年交付80萬臺汽車機器人的能力。
隨著當(dāng)前產(chǎn)業(yè)數(shù)字化轉(zhuǎn)型的不斷深入,AI相關(guān)技術(shù)正在家居、家電、工業(yè)、交通、能源、城市等千行百業(yè)“開花結(jié)果”,意味著人工智能發(fā)展的黃金期已經(jīng)到來。
作為國內(nèi)少有的“芯片-框架-模型-應(yīng)用”全棧布局的AI企業(yè),百度在數(shù)據(jù)、算力、算法等方面擁有領(lǐng)先于其他廠商的眾多優(yōu)勢。隨著公司后續(xù)產(chǎn)品端的持續(xù)落地與迭代完善,百度有望成為AI產(chǎn)業(yè)趨勢下,中國最為受益的公司之一。
編輯:zqy 最后修改時間:2023-03-22