大模型之爭(zhēng):從“通用”到“專屬”
“相信我們當(dāng)中的很多人都試用過了ChatGPT,也相信很多人試用過之后,已經(jīng)將它放置在一邊了,因?yàn)槟壳八臀覀兊墓ぷ骰旧线€是割裂的,所以用用就放下了。但我依然希望大家不要‘起了個(gè)大早,趕了個(gè)晚集’,因?yàn)檫@是一個(gè)會(huì)帶來顛覆性變革的范式革命?!蔽④洠ㄖ袊?guó))公司首席技術(shù)官(CTO)韋青在一場(chǎng)新書共讀會(huì)上講了這樣一段話。
最近,微軟研究院負(fù)責(zé)人彼得·李和哈佛大學(xué)醫(yī)學(xué)院生物醫(yī)學(xué)信息學(xué)系主任伊薩克·科粗恩以及醫(yī)學(xué)記者凱麗·戈德伯革寫了一本書《超越想象力的GPT醫(yī)療》,主要講GPT在醫(yī)療領(lǐng)域的落地和探索。
韋青的這段話里,包含了“人性”“流程”“關(guān)系重構(gòu)”等幾個(gè)關(guān)鍵詞。事實(shí)上,這三個(gè)關(guān)鍵詞揭示了席卷全球的大模型落地各個(gè)領(lǐng)域所面臨的挑戰(zhàn)。
大模型落地面臨三大挑戰(zhàn)
韋青的這段話里包含的第一個(gè)關(guān)鍵詞是“人性”。為什么大家對(duì)于包括GPT在內(nèi)的新生事物都躍躍欲試?因?yàn)槿舜蠖嘤泻闷嫘?。又為什么試完就擱置一邊了?因?yàn)槿耸菚?huì)養(yǎng)成一些習(xí)慣的,大多數(shù)人都不愿意走出舒適區(qū),所以通常是‘起了個(gè)大早,趕了個(gè)晚集’,這是人性使然。對(duì)新生事物,只有少數(shù)人不僅能夠勇于嘗試,而且能堅(jiān)持下去,并由此脫胎換骨。
第二個(gè)關(guān)鍵詞是“流程”。我們要改變?nèi)诵?,很不容易,如果我們想讓新工具、新技術(shù)、新思維對(duì)人或社會(huì)產(chǎn)生巨大的影響,就必須將之嵌入現(xiàn)有的生活、工作流程當(dāng)中。這樣的嵌入、植入,是一個(gè)分拆、打散、重構(gòu)的過程,需要很多次探索和迭代。“GPT要在行業(yè)里用起來,要讓每個(gè)人用起來,是非常難的事情,這涉及流程再造,而目前流程沒有準(zhǔn)備好?!表f青說道。
第三個(gè)關(guān)鍵詞是“新型的人—機(jī)關(guān)系范式”。GPT和過往的歷次工業(yè)革命、新浪潮都不一樣,過去工業(yè)革命帶來的是新工具,而這次帶來的是“新范式”,針對(duì)的是人的進(jìn)化。機(jī)器的各種能力表現(xiàn),會(huì)讓作為人類的我們開始認(rèn)真審視什么是人類真正擅長(zhǎng)的領(lǐng)域和人類與機(jī)器相區(qū)別的能力邊界,進(jìn)而思考何謂新型人—機(jī)關(guān)系的問題。比如在醫(yī)療領(lǐng)域,過去只有醫(yī)患關(guān)系,有了GPT,就變成了“你、我、它”三方模式。它猶如一面鏡子,對(duì)于醫(yī)生和病人,它都是一個(gè)新角色。
“人性”很難改變,但將GPT植入和嵌入現(xiàn)實(shí)社會(huì)的工作與生活“流程”當(dāng)中,卻是IT企業(yè)可以做也最應(yīng)該做的事情。事實(shí)上,在這一輪AIGC風(fēng)潮中,OpenAI雖然風(fēng)頭很猛,但依然虧損。然而,有兩家公司卻吃到了最大紅利:一個(gè)是英偉達(dá),因?yàn)镚PU是AIGC的算力支撐,所以英偉達(dá)市值飆升到萬(wàn)億美元;另一個(gè)是微軟,因?yàn)橥顿YOpenAI,微軟的市值已經(jīng)突破了2.6萬(wàn)億美元,目前微軟正將AI嵌入其各個(gè)產(chǎn)品線中。在今年5月的Build大會(huì)上,微軟宣布將把其基于通用大模型打造的智能助手Copilot融入到自己的各個(gè)To B、To C的產(chǎn)品當(dāng)中,包括Windows、GitHub、Bing搜索、Azure云等。作為一家提升生產(chǎn)力的公司,微軟產(chǎn)品分布在生產(chǎn)力的各個(gè)場(chǎng)景中,GPT-4模型嵌入其產(chǎn)品線中,與業(yè)務(wù)和需求場(chǎng)景的結(jié)合水到渠成。
目前,全球范圍內(nèi)的“大模型”競(jìng)賽正拉開序幕。在中國(guó),據(jù)不完全統(tǒng)計(jì),參數(shù)規(guī)模10億以上的通用大模型已經(jīng)超過80個(gè),如何將這些模型嵌入各行各業(yè)正在高速運(yùn)轉(zhuǎn)的流程當(dāng)中,重塑這些行業(yè)的“人—機(jī)”關(guān)系,是我們推動(dòng)大模型落地需要思考的維度。
北京麥伽智能科技有限公司創(chuàng)始人羅成表示,今天AI看起來很火,很多知名企業(yè)都下場(chǎng)做大模型,但現(xiàn)實(shí)卻是投資相對(duì)冷清,與幾年前投向線上打車、O2O、社區(qū)團(tuán)購(gòu)及共享單車等賽道的資金相比,目前投向這個(gè)領(lǐng)域的錢還非常少,這一輪AI領(lǐng)域的投資邏輯并沒有形成。
騰訊集團(tuán)高級(jí)執(zhí)行副總裁、云與智慧產(chǎn)業(yè)事業(yè)群CEO湯道生認(rèn)為,大模型只是起點(diǎn),未來,應(yīng)用落地的產(chǎn)業(yè)變革才是更大的愿景。在企業(yè)過去的研發(fā)、生產(chǎn)、銷售、服務(wù)等環(huán)節(jié)中,有很多依賴人來判斷、協(xié)調(diào)與溝通的地方,今天都值得去看看,哪些環(huán)節(jié)可以疊加AI的生產(chǎn)力,來提質(zhì)、降本與增效。
急需“行業(yè)AI驗(yàn)證者”
今天,各行各業(yè)都需要AI助力解決難題。以醫(yī)療行業(yè)為例,醫(yī)療資源匱乏仍是一大痛點(diǎn)。僅僅依靠專業(yè)醫(yī)生業(yè)余時(shí)間制作醫(yī)療科普短視頻,要解決醫(yī)療資源的匱乏是遠(yuǎn)遠(yuǎn)不夠的。據(jù)估計(jì),目前全球有近一半的人口——約40億人,缺乏足夠的醫(yī)療保健服務(wù)。
GPT-4及相關(guān)的大模型產(chǎn)品所展現(xiàn)出來的潛力,讓我們看到了用AI能夠在很大程度上填補(bǔ)醫(yī)療保健服務(wù)的空白,尤其是在邊遠(yuǎn)貧窮的村莊。目前,很多人獲得健康相關(guān)的信息是通過網(wǎng)絡(luò)搜索方式,如“百度醫(yī)生”“谷歌醫(yī)生”“醫(yī)療科普短視頻”,如果通過大語(yǔ)言模型,或許能夠獲得比醫(yī)生或醫(yī)學(xué)顧問更新、更全面的咨詢。
僅靠說人的語(yǔ)言,GPT就可以給人看病嗎?前段時(shí)間,美國(guó)加州大學(xué)圣地亞哥分校進(jìn)行了一項(xiàng)研究,研究人員在社交網(wǎng)站上找到了195個(gè)真實(shí)的醫(yī)患問答,然后將相同的問題發(fā)送給ChatGPT,再交給專家盲評(píng),用以比較人類醫(yī)生和AI的高下。結(jié)果是,ChatGPT在信息質(zhì)量和同理心這兩個(gè)方面都打敗了人類醫(yī)生。
微軟全球資深副總裁洪小文認(rèn)為,AI至少將在四個(gè)方面為醫(yī)療行業(yè)帶來改變:一是幫助醫(yī)護(hù)人員更高效地為更多患者提供實(shí)時(shí)和精準(zhǔn)的診療服務(wù);二是為患者提供更豐富、更準(zhǔn)確的醫(yī)學(xué)知識(shí)、醫(yī)療建議和保健指引;三是幫助醫(yī)療后臺(tái)支持體系的相關(guān)人員更快地處理醫(yī)療健康服務(wù)請(qǐng)求或是從各種診療數(shù)據(jù)中提煉洞察和結(jié)論;四是幫助研究者推進(jìn)醫(yī)學(xué)和生物科學(xué)的前沿探索,如新的靶向藥物的研制、測(cè)試、患者匹配及新的臨床試驗(yàn)等,加速醫(yī)療領(lǐng)域的新技術(shù)、新產(chǎn)品從創(chuàng)想到應(yīng)用的整個(gè)過程。
洪小文同時(shí)也表示:“截至目前,GPT-4自身還存在著一些局限性。例如,GPT-4偶爾會(huì)基于‘臆測(cè)’,對(duì)問題給出不適當(dāng)?shù)幕貞?yīng)。此類回應(yīng)不會(huì)被AI主動(dòng)標(biāo)注為‘臆測(cè)’,而且可能看起來很微妙、很接近用戶擬想的‘真實(shí)’,因而用戶很難識(shí)別?!边@些“臆測(cè)”對(duì)于隨意聊天或許無傷大雅,但是對(duì)于醫(yī)療行業(yè),它看似“真實(shí)”,如果用戶對(duì)它越來越信賴,其危害就有可能越來越大,甚至危及生命。因此,準(zhǔn)確性是醫(yī)療領(lǐng)域應(yīng)用大模型必須解決的痛點(diǎn)。
《超越想象的GPT醫(yī)療》的作者給出的改進(jìn)方法是將“醫(yī)生—患者—AI助手”的組合轉(zhuǎn)變?yōu)椤搬t(yī)生—患者—AI助手—AI驗(yàn)證者”的進(jìn)階版本,AI驗(yàn)證者的任務(wù)是檢查AI助手的結(jié)論及醫(yī)生、患者的表現(xiàn)——無論AI扮演何種角色,始終需要讓人類參與審查GPT-4生成的所有輸出。
大模型不僅是在醫(yī)療行業(yè),而且在幾乎每一個(gè)行業(yè)的落地應(yīng)用,都需要“行業(yè)AI驗(yàn)證者”,使AI成為真正的行業(yè)專家。
星環(huán)科技創(chuàng)始人、CEO孫元浩也表達(dá)了與《超越想象的GPT醫(yī)療》作者類似的觀點(diǎn),他認(rèn)為在行業(yè)企業(yè)級(jí)市場(chǎng),大語(yǔ)言模型要想規(guī)?;瘧?yīng)用依然面臨三重限制:“第一,訓(xùn)練需要半年或一年甚至更長(zhǎng)時(shí)間;第二,無論是通用還是行業(yè)大模型,輸入都有限制,這個(gè)限制取決于它的算力和工程化難度;第三,大模型有時(shí)精準(zhǔn)度不夠,會(huì)出現(xiàn)‘幻覺’,需要一個(gè)知識(shí)庫(kù)來校正結(jié)果,同時(shí)需要一個(gè)機(jī)制來補(bǔ)充大模型,讓它能夠給出準(zhǔn)確的答案和更實(shí)時(shí)的信息?!?/p>
大模型之爭(zhēng)從“通用”到“行業(yè)”落地
誰(shuí)來?yè)?dān)任“行業(yè)AI驗(yàn)證者”?誰(shuí)來校準(zhǔn)和修正大模型的“臆測(cè)”?誰(shuí)愿意提供行業(yè)數(shù)據(jù)?數(shù)據(jù)的安全誰(shuí)來保障?企業(yè)又該從哪個(gè)環(huán)節(jié)切入?
華中科技大學(xué)同濟(jì)醫(yī)學(xué)院附屬協(xié)和醫(yī)院智能醫(yī)學(xué)研究室主任葉哲偉表示,醫(yī)療行業(yè)一直在積極探索解決AI診療準(zhǔn)確性的問題。2017年,清華大學(xué)和iFlyTek合作創(chuàng)建了小醫(yī)生,在參考了200萬(wàn)個(gè)病例和40萬(wàn)篇論文后,其在中國(guó)執(zhí)業(yè)醫(yī)師資格考試中取得了456分的及格分?jǐn)?shù)。2022年12月,arxiv預(yù)印版發(fā)布了PaLM參加美國(guó)執(zhí)業(yè)醫(yī)師執(zhí)照考試(USMLE)的最新進(jìn)展,結(jié)果顯示PaLM的準(zhǔn)確率從50%躍升至67.6%。
今年5月,醫(yī)聯(lián)發(fā)布了醫(yī)療大語(yǔ)言模型——MedGPT,該公司稱,這是AI首次實(shí)現(xiàn)從有效問診到準(zhǔn)確診斷的標(biāo)志,實(shí)現(xiàn)了從疾病預(yù)防、診斷、治療、康復(fù)的全流程智能化診療能力。
據(jù)介紹,醫(yī)聯(lián)MedGPT目前的參數(shù)規(guī)模為1000億,預(yù)訓(xùn)練階段使用了超過20億的醫(yī)學(xué)文本數(shù)據(jù),微調(diào)訓(xùn)練階段使用了800萬(wàn)條的高質(zhì)量結(jié)構(gòu)化臨床診療數(shù)據(jù),并投入超過100名醫(yī)生參與人工反饋監(jiān)督微調(diào)訓(xùn)練。目前醫(yī)聯(lián)MedGPT已經(jīng)擁有3000種疾病的首診能力,覆蓋了80%以上的成年人疾病和90%以上的0~12歲的兒童疾病。
與通用大模型不同,MedGPT是一款基于Transformer架構(gòu)的醫(yī)療行業(yè)大模型。目前的AIGC大模型分為三層,底層為通用大模型,比如OpenAI的GPT、百度的文心一言、阿里的通義千問等。中層為行業(yè)大模型,如彭博的金融大模型Bloomberg GPT、醫(yī)聯(lián)的MedGPT,這類大模型或是與通用大模型廠商合作定制,或是調(diào)用API接口,或由大廠云廠商自研。上層為一系列應(yīng)用型服務(wù),基于通用大模型或行業(yè)大模型開發(fā)的AI工具。業(yè)內(nèi)人士表示,企業(yè)用戶其實(shí)并不關(guān)注所采用的是否為通用大模型,而是“數(shù)據(jù)是否安全”與“成本是否可控”,而行業(yè)大模型在這兩個(gè)維度上,能夠更好地滿足企業(yè)用戶需要。
今年前幾個(gè)月,通用大模型是各個(gè)公司角逐的焦點(diǎn),隨著時(shí)間的推移,行業(yè)大模型賽道開始變熱,不僅是在行業(yè)里有積累的公司相繼推出行業(yè)模型,而且有些已經(jīng)發(fā)布了通用大模型的企業(yè),也開始針對(duì)行業(yè)推出模型服務(wù)。
6月19日,騰訊云宣布面向B端客戶推出MaaS(Model-as-a-service,模型即服務(wù))解決方案。湯道生介紹,騰訊云MaaS是基于TI平臺(tái)打造的行業(yè)精選模型商店,覆蓋金融、文旅、政務(wù)、傳媒、教育等十大行業(yè),提供超過50個(gè)解決方案。在這些能力模型的基礎(chǔ)上,客戶只需要加入自己獨(dú)有的場(chǎng)景數(shù)據(jù),就可以快速生成自己的“專屬模型”。除了提供基礎(chǔ)的行業(yè)模型,在數(shù)據(jù)方面,騰訊云也推出了基于騰訊云TI平臺(tái)的行業(yè)大模型精調(diào)解決方案。
在騰訊云的MaaS服務(wù)里,解決了行業(yè)模型的精調(diào)以及用戶擔(dān)心的數(shù)據(jù)安全與掌控問題。有人認(rèn)為騰訊在通用大模型上相比較于百度與阿里巴巴慢了一步,但湯道生認(rèn)為,通用大模型不一定是滿足行業(yè)場(chǎng)景需求的最優(yōu)解,企業(yè)需要的是在實(shí)際場(chǎng)景中真正解決了某個(gè)問題,而不是在100個(gè)場(chǎng)景中解決了70%~80%的問題的模型。而通用大模型的訓(xùn)練數(shù)據(jù)主要來自公開數(shù)據(jù)集或網(wǎng)絡(luò)數(shù)據(jù),對(duì)于特定行業(yè)的專業(yè)領(lǐng)域知識(shí)了解有限。騰訊更關(guān)注落地,此前馬化騰在財(cái)報(bào)會(huì)上談及大模型時(shí)表示:“騰訊并不急于把半成品拿出來展示,關(guān)鍵還是要把底層的算法、算力和數(shù)據(jù)扎扎實(shí)實(shí)地做好,而且更關(guān)鍵的是場(chǎng)景落地?!?/p>
構(gòu)建龐大的大模型生態(tài),讓用戶開箱即用,正在成為AI科技企業(yè)的追逐目標(biāo)。就在騰訊云推出MaaS行業(yè)模型精選店的同時(shí),有媒體爆出OpenAI正考慮推出一個(gè)新的平臺(tái),針對(duì)定制化模型/軟件的交易市場(chǎng),類似應(yīng)用商店的“大模型商店”。經(jīng)由大模型商店,企業(yè)可以獲取到各種已經(jīng)過精調(diào)的AI軟件以及擁有最新數(shù)據(jù)、能回答特定市場(chǎng)信息的AI,這個(gè)商店還可以讓OpenAI的客戶,將自己定制的AI模型出售給其他企業(yè)。
除了OpenAI,包括微軟與Salesforce此前都推出了自己的模型應(yīng)用商店,外界分析,OpenAI此舉有可能與微軟形成AI生態(tài)競(jìng)爭(zhēng)。在今年5月舉行的Build大會(huì)上,微軟宣布采用與OpenAI相同的開放插件(Plugin)標(biāo)準(zhǔn),從而確保今后ChatGPT與微軟一系列“智能副駕”產(chǎn)品服務(wù)之間的互操作性。
大模型的時(shí)代正在到來,不斷降低企業(yè)用戶使用大模型的門檻,不斷以更低的成本、更方便的方式讓用戶獲得AI賦能,各類廠商在大模型落地之路上正“八仙過?!睂で笞顑?yōu)解。
而作為用戶,湯道生認(rèn)為,企業(yè)用戶擁抱AI帶來的變革需要關(guān)注四個(gè)維度。第一,聚焦企業(yè)自身業(yè)務(wù),挑選具體場(chǎng)景,讓AI成為服務(wù)的增量;第二,確保訓(xùn)練數(shù)據(jù)質(zhì)量,梳理出測(cè)試用例,建立上線評(píng)估流程;第三,確保服務(wù)合規(guī),同時(shí)關(guān)注數(shù)據(jù)的產(chǎn)權(quán)與隱私;第四,使用云廠商工具,搭建一體化的模型服務(wù),這樣效率比較高,而且還節(jié)約訓(xùn)練、運(yùn)維的成本和時(shí)間。
責(zé)任編輯:龔倩