《經濟參考報》記者近日調研獲悉,AI(人工智能)大模型相當于“超級大腦”,正成為人工智能“新高地”。AI大模型有望實現人工智能從感知到認知的躍遷,重新定義人工智能產業模式和產業標準,
給部分產業帶來重大變革。我國有較大的AI大模型應用市場,但發展過程中面臨部分技術薄弱、人才稀缺、成本高昂等多重挑戰,亟須對相關技術研發和產業布局加以引導和支持。
“學富五車”的“超級大腦”
——“不開心的話可以聽點開心的歌,看看喜劇,也可以去運動,或者好好休息一下。”
——“心情不好是一種很正常的情緒,所以不用太過自責。”
針對“今天心情不好應該怎么辦”這一問題,一個人工智能平臺以不同的“人設”,給出了不同的回答。通過網址鏈接進入該平臺,在“人設問答”區隨機輸入問題,機器可支持和扮演不同“人設”,
對問題給出多角度答案。該平臺正是基于AI大模型打造而成。
創新工場首席科學家、北京瀾舟科技創始人周明介紹,AI大模型也稱人工智能預訓練模型,將海量數據導入具有幾億量級甚至十萬億量級參數的模型中,機器通過做類似“完形填空”等任務,
深度學習數據中蘊含的特征、結構,最終被訓練成具有邏輯推理和分析能力的人工智能。
通俗地說,AI大模型相當于做了無數套關于各領域知識練習題、模擬題的“超級大腦”,深諳各領域知識內在邏輯和解題思路,既能理解人類世界的知識體系,也可能產出新的知識。
2018年起,人工智能進入“大模型時代”,由重復開發、手工作坊式人工智能,即“一千個應用場景就有一千個小模型”的零散、低效局面,走向工業化、集成化智能的全新路徑,
以一個大模型“走天下”,為通用人工智能帶來曙光。比如,為生產智能音響,各個品牌競相開發各自的AI小模型,未來各品牌只需在同一個AI大模型基礎上開發即可。
“以前是‘碎片化’的人工智能,針對不同的應用場景要開發不同的模型。作坊式開發對資源、成本造成較大消耗,且效率低下。未來在各垂直領域落地時,只需基于一個大模型,對其參數進行微調即可,
這樣就打造出了具有通用性質的人工智能。”華為云人工智能領域首席科學家、國際歐亞科學院院士田奇介紹,AI大模型將重新定義人工智能產業模式、產業標準,甚至產業倫理。
受訪者舉例介紹,以前的小模型就像“偏科的機器”,只學習針對特定應用場景的有限數據,“舉一反三”能力不足,一些智能產品被用戶調侃為“人工智障”的情況時有發生。
而AI大模型則學習了各行各業各類數據,成為具備良好的知識遷移能力的“通才”,適用領域更廣,產出內容質量更高,更加智能。
同時,周明指出,大模型的發展并非一味追求參數量大,而是聚焦模型的高性能,“在讓大模型學習和掌握更大量數據的同時,盡可能讓大模型參數相對輕量化,在‘減負’的同時提高能效。”
可分飾多角 應用場景廣泛
自動問診、產品營銷、小說續寫……由于懂得人類語言,且具備細分行業專業知識,一個AI大模型可分飾多角,它做得了醫生,當得了作家,勝任得了情感博主,從事得了電商客服……
AI大模型行業適用范圍廣,在醫療、金融、零售、氣象、新聞傳播、文學藝術等領域具有廣泛應用場景。周明介紹,在大模型中輸入關鍵詞、主題、文本風格等控制屬性后,
即可生成滿足約束條件的文本內容,可用于產品營銷文案寫作、電商智能客服等。在金融等領域,大模型通過抓取行業數據,自主完成篩選、分析,并自主撰寫生成行業報告,輔助從業人員做決策。
田奇介紹,AI大模型已應用于國網電力部門的日常線路檢測。“以前要識別各種電力傳輸線上的缺陷,需要針對每一類缺陷單獨做一個小模型,有幾百種缺陷就要做幾百種模型,
現在利用一個大模型就可完成各類缺陷的識別。”
值得注意的是,AI大模型目前的技術進步,是人工智能從感知向認知演進的關鍵環節。清華大學計算機科學與技術系副教授劉知遠表示,古今中外一切文章、資料,都可作為訓練大模型的數據。
通過分析并“內化”海量知識,不僅讓智能產品擁有更高性能,如機器翻譯更加準確、機器寫作更加生動有邏輯;還能品讀人類情感,用于情感標注。此外,“它可能識別到‘弦外之音’,
甚至有希望發現人類未曾掌握的知識。”
這一技術的發展,也可能給部分產業帶來重大變革。周明說,未來將產生新一代搜索引擎。“目前大部分搜索引擎是基于關鍵詞識別,只將庫里已有的包含關鍵詞的結果‘搬運’給用戶,
而基于大模型的新一代搜索引擎,通過理解人類語言,可以自主生成回答,且支持文字、圖片、音頻、視頻等多模態搜索。”
田奇表示,新一代搜索引擎具備創作能力,比如搜索“長翅膀的貓”“會飛的豬”等現實中不存在的事物,搜索引擎也可根據描述生成相應照片。
多重發展難題待解
當前,美國OpenAI、谷歌、微軟、臉書、英偉達等海外公司紛紛布局AI大模型產業,國內的華為、阿里巴巴、百度等大型企業,以及高校、科研機構也加入研發賽道。AI大模型正成為人工智能“新高地”。
記者調研了解到,從技術上講,國內AI大模型已初步成熟,下一步將聚焦行業推廣,并結合具體問題對模型進行迭代。田奇預測,AI大模型的大規模應用“可能還需要兩到三年時間”,
且未來AI大模型還有望集納于芯片上,更方便落地應用。
專家指出,我國有較大的AI大模型應用市場,在應用領域具有優勢,但發展過程中也面臨一些挑戰。
劉知遠介紹,很多核心技術目前仍然掌握在發達國家手中,訓練AI大模型需大量GPU(圖形處理器)芯片,但當前國產GPU芯片技術相對薄弱。同時,我國在算法上的原始創新能力也有待提升。
多位受訪者表示,目前從事AI大模型研發且能產出創新性成果的高校、科研機構和企業屈指可數,與國外相比,我國相關領域高水平基礎人才培養力度有待加強。
此外,訓練大模型需要較高的電力成本、設備成本等,很多中小企業、科研單位囿于高昂成本,無法搭建擁有充足算力的機房,面臨算力不足的問題。
多措并舉搶占“新高地”
多位專家表示,AI大模型有望實現人工智能從感知到認知的躍遷,將更高效地賦能AI產業化和產業AI化。相關技術研發和產業布局引導、配套支持政策、合理監管等舉措能否有效落地至關重要。
首先,推進AI大模型標準化。受訪專家指出,大模型的訓練過程具有高能耗的特點,制定標準后,許多工作可基于已經開發的標準化大模型進行適配和二次開發,無需每次從頭訓練,
以降低能耗。同時,大模型發展的過程中,也可能衍生違法違規信息生成、隱私泄露、虛假信息傳播等風險,對用于訓練模型的源頭數據等做好規范,有利于規避相關風險。
國家相關部門可牽頭或引導企業、研究所、高校等共同定義大模型的標準。
其次,適當開放訓練數據。受訪者表示,訓練大模型需要海量數據,出于對數據的隱私、安全等方面的擔憂,一些領域難以獲取數據,形成數據孤島。建議在國家機構監管和宏觀把控的前提下,
各方數據能夠對白名單企業、機構、高校適當開放,在確保數據安全使用的同時,增強我國AI大模型實力。例如,醫院等機構適當開放數據,將有利于訓練更懂醫療的大模型,賦能健康醫藥領域發展。
再次,鼓勵算力共享。記者調研了解到,目前只有部分大企業能夠負擔超大模型訓練所需的算力成本。受訪專家呼吁,可引導具有強算力的人工智能“國家隊”,為更多中小微企業、
科研單位提供大模型訓練所需的算力支撐,可探索合理付費的算力共享機制,共同促進技術的發展和資源的節約。
最后,加大原始創新引導和支持。多位專家指出,我國應加強研發力度,同時加強針對模型框架的基礎創新研究,引導更多科研單位、高校積極培養相關人才,鼓勵更多社會力量加入這場信息革命的浪潮。