新華通訊社主管

首頁(yè) >> 正文

超級(jí)大腦!AI大模型有望重塑信息產(chǎn)業(yè)格局
我國(guó)應(yīng)用市場(chǎng)巨大,亟待突破技術(shù)、人才、成本等瓶頸
2022-01-06 記者 烏夢(mèng)達(dá) 趙旭 北京報(bào)道 來(lái)源: 經(jīng)濟(jì)參考報(bào)

  《經(jīng)濟(jì)參考報(bào)》記者近日調(diào)研獲悉,AI(人工智能)大模型相當(dāng)于“超級(jí)大腦”,正成為人工智能“新高地”。AI大模型有望實(shí)現(xiàn)人工智能從感知到認(rèn)知的躍遷,重新定義人工智能產(chǎn)業(yè)模式和產(chǎn)業(yè)標(biāo)準(zhǔn),給部分產(chǎn)業(yè)帶來(lái)重大變革。我國(guó)有較大的AI大模型應(yīng)用市場(chǎng),但發(fā)展過(guò)程中面臨部分技術(shù)薄弱、人才稀缺、成本高昂等多重挑戰(zhàn),亟須對(duì)相關(guān)技術(shù)研發(fā)和產(chǎn)業(yè)布局加以引導(dǎo)和支持。

趙乃育 繪

  “學(xué)富五車(chē)”的“超級(jí)大腦”

  ——“不開(kāi)心的話可以聽(tīng)點(diǎn)開(kāi)心的歌,看看喜劇,也可以去運(yùn)動(dòng),或者好好休息一下。”

  ——“心情不好是一種很正常的情緒,所以不用太過(guò)自責(zé)?!?/p>

  針對(duì)“今天心情不好應(yīng)該怎么辦”這一問(wèn)題,一個(gè)人工智能平臺(tái)以不同的“人設(shè)”,給出了不同的回答。通過(guò)網(wǎng)址鏈接進(jìn)入該平臺(tái),在“人設(shè)問(wèn)答”區(qū)隨機(jī)輸入問(wèn)題,機(jī)器可支持和扮演不同“人設(shè)”,對(duì)問(wèn)題給出多角度答案。該平臺(tái)正是基于AI大模型打造而成。

  創(chuàng)新工場(chǎng)首席科學(xué)家、北京瀾舟科技創(chuàng)始人周明介紹,AI大模型也稱(chēng)人工智能預(yù)訓(xùn)練模型,將海量數(shù)據(jù)導(dǎo)入具有幾億量級(jí)甚至十萬(wàn)億量級(jí)參數(shù)的模型中,機(jī)器通過(guò)做類(lèi)似“完形填空”等任務(wù),深度學(xué)習(xí)數(shù)據(jù)中蘊(yùn)含的特征、結(jié)構(gòu),最終被訓(xùn)練成具有邏輯推理和分析能力的人工智能。

  通俗地說(shuō),AI大模型相當(dāng)于做了無(wú)數(shù)套關(guān)于各領(lǐng)域知識(shí)練習(xí)題、模擬題的“超級(jí)大腦”,深諳各領(lǐng)域知識(shí)內(nèi)在邏輯和解題思路,既能理解人類(lèi)世界的知識(shí)體系,也可能產(chǎn)出新的知識(shí)。

  2018年起,人工智能進(jìn)入“大模型時(shí)代”,由重復(fù)開(kāi)發(fā)、手工作坊式人工智能,即“一千個(gè)應(yīng)用場(chǎng)景就有一千個(gè)小模型”的零散、低效局面,走向工業(yè)化、集成化智能的全新路徑,以一個(gè)大模型“走天下”,為通用人工智能帶來(lái)曙光。比如,為生產(chǎn)智能音響,各個(gè)品牌競(jìng)相開(kāi)發(fā)各自的AI小模型,未來(lái)各品牌只需在同一個(gè)AI大模型基礎(chǔ)上開(kāi)發(fā)即可。

  “以前是‘碎片化’的人工智能,針對(duì)不同的應(yīng)用場(chǎng)景要開(kāi)發(fā)不同的模型。作坊式開(kāi)發(fā)對(duì)資源、成本造成較大消耗,且效率低下。未來(lái)在各垂直領(lǐng)域落地時(shí),只需基于一個(gè)大模型,對(duì)其參數(shù)進(jìn)行微調(diào)即可,這樣就打造出了具有通用性質(zhì)的人工智能?!比A為云人工智能領(lǐng)域首席科學(xué)家、國(guó)際歐亞科學(xué)院院士田奇介紹,AI大模型將重新定義人工智能產(chǎn)業(yè)模式、產(chǎn)業(yè)標(biāo)準(zhǔn),甚至產(chǎn)業(yè)倫理。

  受訪者舉例介紹,以前的小模型就像“偏科的機(jī)器”,只學(xué)習(xí)針對(duì)特定應(yīng)用場(chǎng)景的有限數(shù)據(jù),“舉一反三”能力不足,一些智能產(chǎn)品被用戶調(diào)侃為“人工智障”的情況時(shí)有發(fā)生。而AI大模型則學(xué)習(xí)了各行各業(yè)各類(lèi)數(shù)據(jù),成為具備良好的知識(shí)遷移能力的“通才”,適用領(lǐng)域更廣,產(chǎn)出內(nèi)容質(zhì)量更高,更加智能。

  同時(shí),周明指出,大模型的發(fā)展并非一味追求參數(shù)量大,而是聚焦模型的高性能,“在讓大模型學(xué)習(xí)和掌握更大量數(shù)據(jù)的同時(shí),盡可能讓大模型參數(shù)相對(duì)輕量化,在‘減負(fù)’的同時(shí)提高能效。”

  可分飾多角 應(yīng)用場(chǎng)景廣泛

  自動(dòng)問(wèn)診、產(chǎn)品營(yíng)銷(xiāo)、小說(shuō)續(xù)寫(xiě)……由于懂得人類(lèi)語(yǔ)言,且具備細(xì)分行業(yè)專(zhuān)業(yè)知識(shí),一個(gè)AI大模型可分飾多角,它做得了醫(yī)生,當(dāng)?shù)昧俗骷?,勝任得了情感博主,從事得了電商客服…?/p>

  AI大模型行業(yè)適用范圍廣,在醫(yī)療、金融、零售、氣象、新聞傳播、文學(xué)藝術(shù)等領(lǐng)域具有廣泛應(yīng)用場(chǎng)景。周明介紹,在大模型中輸入關(guān)鍵詞、主題、文本風(fēng)格等控制屬性后,即可生成滿足約束條件的文本內(nèi)容,可用于產(chǎn)品營(yíng)銷(xiāo)文案寫(xiě)作、電商智能客服等。在金融等領(lǐng)域,大模型通過(guò)抓取行業(yè)數(shù)據(jù),自主完成篩選、分析,并自主撰寫(xiě)生成行業(yè)報(bào)告,輔助從業(yè)人員做決策。

  田奇介紹,AI大模型已應(yīng)用于國(guó)網(wǎng)電力部門(mén)的日常線路檢測(cè)?!耙郧耙R(shí)別各種電力傳輸線上的缺陷,需要針對(duì)每一類(lèi)缺陷單獨(dú)做一個(gè)小模型,有幾百種缺陷就要做幾百種模型,現(xiàn)在利用一個(gè)大模型就可完成各類(lèi)缺陷的識(shí)別?!?/p>

  值得注意的是,AI大模型目前的技術(shù)進(jìn)步,是人工智能從感知向認(rèn)知演進(jìn)的關(guān)鍵環(huán)節(jié)。清華大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系副教授劉知遠(yuǎn)表示,古今中外一切文章、資料,都可作為訓(xùn)練大模型的數(shù)據(jù)。通過(guò)分析并“內(nèi)化”海量知識(shí),不僅讓智能產(chǎn)品擁有更高性能,如機(jī)器翻譯更加準(zhǔn)確、機(jī)器寫(xiě)作更加生動(dòng)有邏輯;還能品讀人類(lèi)情感,用于情感標(biāo)注。此外,“它可能識(shí)別到‘弦外之音’,甚至有希望發(fā)現(xiàn)人類(lèi)未曾掌握的知識(shí)?!?/p>

  這一技術(shù)的發(fā)展,也可能給部分產(chǎn)業(yè)帶來(lái)重大變革。周明說(shuō),未來(lái)將產(chǎn)生新一代搜索引擎?!澳壳按蟛糠炙阉饕媸腔陉P(guān)鍵詞識(shí)別,只將庫(kù)里已有的包含關(guān)鍵詞的結(jié)果‘搬運(yùn)’給用戶,而基于大模型的新一代搜索引擎,通過(guò)理解人類(lèi)語(yǔ)言,可以自主生成回答,且支持文字、圖片、音頻、視頻等多模態(tài)搜索?!?/p>

  田奇表示,新一代搜索引擎具備創(chuàng)作能力,比如搜索“長(zhǎng)翅膀的貓”“會(huì)飛的豬”等現(xiàn)實(shí)中不存在的事物,搜索引擎也可根據(jù)描述生成相應(yīng)照片。

  多重發(fā)展難題待解

  當(dāng)前,美國(guó)OpenAI、谷歌、微軟、臉書(shū)、英偉達(dá)等海外公司紛紛布局AI大模型產(chǎn)業(yè),國(guó)內(nèi)的華為、阿里巴巴、百度等大型企業(yè),以及高校、科研機(jī)構(gòu)也加入研發(fā)賽道。AI大模型正成為人工智能“新高地”。

  記者調(diào)研了解到,從技術(shù)上講,國(guó)內(nèi)AI大模型已初步成熟,下一步將聚焦行業(yè)推廣,并結(jié)合具體問(wèn)題對(duì)模型進(jìn)行迭代。田奇預(yù)測(cè),AI大模型的大規(guī)模應(yīng)用“可能還需要兩到三年時(shí)間”,且未來(lái)AI大模型還有望集納于芯片上,更方便落地應(yīng)用。

  專(zhuān)家指出,我國(guó)有較大的AI大模型應(yīng)用市場(chǎng),在應(yīng)用領(lǐng)域具有優(yōu)勢(shì),但發(fā)展過(guò)程中也面臨一些挑戰(zhàn)。

  劉知遠(yuǎn)介紹,很多核心技術(shù)目前仍然掌握在發(fā)達(dá)國(guó)家手中,訓(xùn)練AI大模型需大量GPU(圖形處理器)芯片,但當(dāng)前國(guó)產(chǎn)GPU芯片技術(shù)相對(duì)薄弱。同時(shí),我國(guó)在算法上的原始創(chuàng)新能力也有待提升。

  多位受訪者表示,目前從事AI大模型研發(fā)且能產(chǎn)出創(chuàng)新性成果的高校、科研機(jī)構(gòu)和企業(yè)屈指可數(shù),與國(guó)外相比,我國(guó)相關(guān)領(lǐng)域高水平基礎(chǔ)人才培養(yǎng)力度有待加強(qiáng)。

  此外,訓(xùn)練大模型需要較高的電力成本、設(shè)備成本等,很多中小企業(yè)、科研單位囿于高昂成本,無(wú)法搭建擁有充足算力的機(jī)房,面臨算力不足的問(wèn)題。

  多措并舉搶占“新高地”

  多位專(zhuān)家表示,AI大模型有望實(shí)現(xiàn)人工智能從感知到認(rèn)知的躍遷,將更高效地賦能AI產(chǎn)業(yè)化和產(chǎn)業(yè)AI化。相關(guān)技術(shù)研發(fā)和產(chǎn)業(yè)布局引導(dǎo)、配套支持政策、合理監(jiān)管等舉措能否有效落地至關(guān)重要。

  首先,推進(jìn)AI大模型標(biāo)準(zhǔn)化。受訪專(zhuān)家指出,大模型的訓(xùn)練過(guò)程具有高能耗的特點(diǎn),制定標(biāo)準(zhǔn)后,許多工作可基于已經(jīng)開(kāi)發(fā)的標(biāo)準(zhǔn)化大模型進(jìn)行適配和二次開(kāi)發(fā),無(wú)需每次從頭訓(xùn)練,以降低能耗。同時(shí),大模型發(fā)展的過(guò)程中,也可能衍生違法違規(guī)信息生成、隱私泄露、虛假信息傳播等風(fēng)險(xiǎn),對(duì)用于訓(xùn)練模型的源頭數(shù)據(jù)等做好規(guī)范,有利于規(guī)避相關(guān)風(fēng)險(xiǎn)。國(guó)家相關(guān)部門(mén)可牽頭或引導(dǎo)企業(yè)、研究所、高校等共同定義大模型的標(biāo)準(zhǔn)。

  其次,適當(dāng)開(kāi)放訓(xùn)練數(shù)據(jù)。受訪者表示,訓(xùn)練大模型需要海量數(shù)據(jù),出于對(duì)數(shù)據(jù)的隱私、安全等方面的擔(dān)憂,一些領(lǐng)域難以獲取數(shù)據(jù),形成數(shù)據(jù)孤島。建議在國(guó)家機(jī)構(gòu)監(jiān)管和宏觀把控的前提下,各方數(shù)據(jù)能夠?qū)Π酌麊纹髽I(yè)、機(jī)構(gòu)、高校適當(dāng)開(kāi)放,在確保數(shù)據(jù)安全使用的同時(shí),增強(qiáng)我國(guó)AI大模型實(shí)力。例如,醫(yī)院等機(jī)構(gòu)適當(dāng)開(kāi)放數(shù)據(jù),將有利于訓(xùn)練更懂醫(yī)療的大模型,賦能健康醫(yī)藥領(lǐng)域發(fā)展。

  再次,鼓勵(lì)算力共享。記者調(diào)研了解到,目前只有部分大企業(yè)能夠負(fù)擔(dān)超大模型訓(xùn)練所需的算力成本。受訪專(zhuān)家呼吁,可引導(dǎo)具有強(qiáng)算力的人工智能“國(guó)家隊(duì)”,為更多中小微企業(yè)、科研單位提供大模型訓(xùn)練所需的算力支撐,可探索合理付費(fèi)的算力共享機(jī)制,共同促進(jìn)技術(shù)的發(fā)展和資源的節(jié)約。

  最后,加大原始創(chuàng)新引導(dǎo)和支持。多位專(zhuān)家指出,我國(guó)應(yīng)加強(qiáng)研發(fā)力度,同時(shí)加強(qiáng)針對(duì)模型框架的基礎(chǔ)創(chuàng)新研究,引導(dǎo)更多科研單位、高校積極培養(yǎng)相關(guān)人才,鼓勵(lì)更多社會(huì)力量加入這場(chǎng)信息革命的浪潮。

?

凡標(biāo)注來(lái)源為“經(jīng)濟(jì)參考報(bào)”或“經(jīng)濟(jì)參考網(wǎng)”的所有文字、圖片、音視頻稿件,及電子雜志等數(shù)字媒體產(chǎn)品,版權(quán)均屬經(jīng)濟(jì)參考報(bào)社,未經(jīng)經(jīng)濟(jì)參考報(bào)社書(shū)面授權(quán),不得以任何形式刊載、播放。獲取授權(quán)
矩形廣告大

超級(jí)大腦!AI大模型有望重塑信息產(chǎn)業(yè)格局

超級(jí)大腦!AI大模型有望重塑信息產(chǎn)業(yè)格局

AI大模型有望實(shí)現(xiàn)人工智能從感知到認(rèn)知的躍遷,重新定義人工智能產(chǎn)業(yè)模式和產(chǎn)業(yè)標(biāo)準(zhǔn),給部分產(chǎn)業(yè)帶來(lái)重大變革。

·喚醒沉睡資產(chǎn) “農(nóng)地入市”助力鄉(xiāng)村振興

經(jīng)濟(jì)參考報(bào)社版權(quán)所有 本站所有新聞內(nèi)容未經(jīng)經(jīng)濟(jì)參考報(bào)協(xié)議授權(quán),禁止轉(zhuǎn)載使用

新聞線索提供熱線:010-63074375 63072334 報(bào)社地址:北京市宣武門(mén)西大街57號(hào)

JJCKB.CN 京ICP備18039543號(hào)