?
?——訪北京郵電大學人工智能學院教授鄧偉洪、中國信通院云大所內容科技部副主任石霖
??微軟發布“ChatGPT版必應”(人工智能增強型搜索引擎),市值飆漲超800億美元;谷歌緊急推出對話式AI服務Bard,演示“翻車”導致市
值蒸發千億美元;百度官宣將發布類ChatGPT項目“文心一言”(ERNIE Bot)……ChatGPT近期持續霸榜科技論壇熱搜,2023 開年的人工智能賽道
激戰正酣。
??ChatGPT何以成為AI圈“頂流”?人工智能領域有哪些突破性進展?從“曇花一現”到成為“得力助手”,人工智能技術發展面臨哪些挑戰?針
對上述問題,《人民郵電》報記者采訪了北京郵電大學人工智能學院教授鄧偉洪和中國信通院云大所內容科技部副主任(主持工作)石霖。
??更智能的服務體驗引領知識獲取方式變革
??記者:ChatGPT爆火的背后原因是什么?能夠激發哪些應用創新?
??鄧偉洪:技術上,GPT(Generative Pre-training Transformer)的全稱是生成式預訓練Transformer,是一個新型語言模型,ChatGPT是一個學
習了多領域知識(知識量比人類都大)和問答機制的智能系統,是一個高效的內容生產工具。
??2018年,GPT模型在NLP(自然語言處理)領域已經開始火起來了,最近ChatGPT在朋友圈和微博刷屏了,已經獲取了億級用戶。ChatGPT的交互
界面是一個聊天框。類似應用十多年前就有了,最近爆火的原因是它的回答內容非常準確、專業、全面,讓非專業的普通民眾近距離、實實在在地感受到
類似于人類的人工智能。
??ChatGPT未來的應用場景很多,基于大量語料和知識圖譜的學習,給出一系列的回答,它將推動基礎模型和通用智能的研究。
??最直接的影響就是改變我們獲取知識的方式。通過問答形式來獲得知識,同時得到經過歸納的答案,而不是搜索零散的網頁。這種搜索方式更加自然,
微軟已經率先整合進入必應搜索引擎,很多AI企業也在跟進。
??在內容生成方面,ChatGPT能夠根據給定主題和觀點生成論文、文案、詩歌、劇本等,它的觀點和知識都很全面。例如,對于市場營銷和文化教育行
業,它將大大提高內容產出效率。
??通過對開源代碼庫的學習,它已經有了寫代碼和改正代碼錯誤的能力。對于低端重復性的開發需求,只需要一行需求指令,就可以生成基礎代碼,將編
程效率提高數倍。不過,目前的需求分析還不能被取代。
??此外,像在智能客服、辦事攻略、行業咨詢等問答場景中,它能夠代替一些機械性、重復性的勞動,從而提高各行業信息獲取的效率。
??石霖:我覺得主要有三個方面的原因。一是人們對數字內容需求的不斷加大。近年來,隨著信息通信技術的不斷發展,人們對數字世界更加依賴,對內
容的質量、時效、數量、多樣性和個性化都提出了更高的要求。而傳統的內容生成方式受限于產能和質量,難于滿足迅速增長的內容需求。以ChatGPT為代
表的AIGC打破了這一局面,有望成為未來數字世界的基礎設施。
??二是智能生成技術應用的不斷成熟。人們對智能生成的研究一直在探索,早期的算法多基于預先定義的規則或模板,還算不上是“智能”。深度學習創
新發展加速了智能生成技術的發展,特別是大模型在工程上的優化改進,使得智能生成技術應用具備了強交互、強理解和強生成能力。
??三是智能生成類技術應用給用戶帶來了全新體驗。ChatGPT基于海量的互聯網公開數據訓練而成,支持多語種、多輪次交互對話,且具備一定的“通用”
智能,用戶幾乎可以向它問任何問題,這種全新的用戶體驗,使得全球用戶都成了它的宣傳員,這在很大程度上促進了它的火爆。
??以ChatGPT為代表的智能生成技術在應用場景上也不斷創新。除了ChatGPT所體現的智能對話、寫文章、寫代碼外,智能生成技術應用還可以作畫、作
曲、制作電影,且應用范圍還在進一步探索,有的甚至在工業設計、藥物生產等方面進行了實踐,幫助降低試驗成本和縮短研發周期,幫助提升社會生產力。
??
ChatGPT類應用火出圈兒,背后是生成式AI、大模型和預訓練技術的突破
??記者:近年來,人工智能領域有哪些突破性進展?
??石霖:近兩年,人工智能領域最具突破性的進展就是AIGC,也就是智能生成類的技術應用。特別是2022年,AIGC異軍突起,智能生成新范式已初步被市
場認可,迅速成為人工智能技術熱門方向。一方面是文本生成技術方向,2022年11月,OpenAI推出ChatGPT,背后的技術由GPT-3.5模型支持,其采用指令
微調(instruction tuning)并引入人類反饋中強化學習(RLHF)技術,較上一代GPT-3而言,能夠生成中立、客觀、安全和翔實的答案,因其文本交互能力
接近于人類水平,上線兩個月后月活躍用戶數已破億。另一方面是圖像生成方向,主要是擴散模型Diffusion的應用落地。國際上部分企業開始推出基于擴散模
型的產品服務。Open AI、谷歌等研究機構和企業從2021年開始就推出一系列視覺大模型,其中DALL.E 2、Imagen等都是基于擴散模型技術實現的。國內智
源研究院大模型研究團隊開源了擴散模型,可以實現中文直接生成圖像。值得一提的是,以Stable Diffusion模型聞名的新晉獨角獸Stability AI獲巨額融資,商
業化價值初步顯現,其推出的Stable Diffusion成為近期最火的擴散模型,在生成圖像的質量、速度和成本上都取得了巨大突破。Stable Diffusion于2022年8月
開源,在不到兩個月的時間內就突破了33K的點贊數量,成為攀升到Github 10K點贊最快的軟件之一。2022年10月,Stability AI獲得超過一億美元的融資,估
值突破十億美元,其面向消費者的產品DreamStudio注冊用戶數已經超過150萬,共同創建了超過1.7億張圖像。
??鄧偉洪:近兩年AI領域取得了很大進展,其中生成式AI、大模型和預訓練技術備受關注,這三項突破都與ChatGPT有關。
??生成式AI即借助AI生成內容,包括生成語言文字、語音、圖像、視頻、三維模型等,2015年出現了生成對抗網絡,前兩年提出的擴散模型進一步提升了AI
繪畫和圖像視頻的效果,甚至展現了藝術上的創造性,給了人們強人工智能的感覺。ChatGPT也是AI生成文本的里程碑式的工作。
??以Transformer為代表的模型,它的輸入特征維度和內部注意力模塊數量的倍增,達到了千億甚至萬億參數規模,對訓練數據的理解和生成能力都不斷提高,
通過多任務協同學習,識別和生成的性能不斷提高,至今為止人們依然沒有看到邊際效應。ChatGPT的核心技術就是Transformer結構,是一個非常成功的“大
語言模型”。
??自監督的預訓練技術利用數據內部的結構進行自我約束,可以在沒有人工標注的情況下學習。例如補全一句話或者一幅圖,通過過去的視頻來預測未來的視
頻等,能夠在沒有人工標注的情況下,對網絡模型的參數進行學習,從而降低目標任務的海量標注壓力。ChatGPT就是在自監督預訓練的基礎上,進一步引入了
人工標注反饋來進行強化學習,獲得了突破性的性能。
用戶訪問情況對比
??盈利模式、科技倫理治理體系仍需探索
??記者:從曇花一現到真正成為人類的得力助手,人工智能技術發展面臨哪些挑戰?
??鄧偉洪:ChatGPT已經可以輔助人類完成很多重復性的勞動,但它與人類的思維方式和能力還有明顯差距,在因果推理、多模態分析以及成本消耗等方面仍
有不少挑戰。
??GPT是典型的數據驅動模型,它理解知識的原則是“共生則關聯”。因此,GPT生成的文案可能會一本正經地胡說八道,存在術語的明顯錯誤、使用的數據不
可靠、語法正確但邏輯混亂等問題。目前看來,基于GPT的應用其推理分析能力還比較弱,例如無法解答小學生的“雞兔同籠”問題等。
??雖然ChatGPT的強化學習使其具備拒絕回答敏感問題的能力,但其生成的文本仍會帶有訓練語料中的偏見。GPT-3生成的文章可能存在性別、民族、種族或宗
教偏見。如果人們都使用ChatGPT來獲取知識,它的偏見就會影響人們的價值觀,帶來很大的社會問題。
??GPT目前擅長處理語言文字交流,而人類的理解是語音、視覺、觸覺、味覺等的多模態感知,后續GPT 需要重點突破多模態感知和對話的能力。
??此外,GPT模型很大,標注、訓練和應用的成本高昂,目前的盈利模式仍需探索。
??石霖:我個人認為,主要有兩方面的挑戰。第一方面是ChatGPT自身的問題,比如它的高昂的研發、運營成本。網上公開的資料顯示,OpenAI研發和運營投
入巨大,高度依賴于微軟算力支持。根據ChatGPT參數規模估計,OpenAI使用微軟Azure AI超級計算系統需耗費數月才能完成模型訓練,訓練一次成本約為460萬
美元,搭建類似系統的硬件投入約上億美元。
??ChatGPT運營成本高昂,按照百萬級別用戶量計算,每月運行成本約為300萬美元。整體上看,智能生成類應用目前仍處于打磨產品階段,從“能用”到“好用”
還有很長的路要走,比如它不能像搜索引擎一樣實時使用互聯網數據、回答的答案不準確等。在業務模式、商業模式上還有待時間的檢驗。
??第二方面是ChatGPT類的智能生成技術應用帶來的問題,主要集中在內容治理、版權制度、科技倫理方面。
??智能生成技術應用助長虛假信息的傳播,給網絡信息內容治理帶來新挑戰。隨著生成的內容愈發逼真,應用的門檻也在不斷降低,人人都能輕松實現“換臉”
“變聲”,制作虛假信息。
??智能生成技術應用還將提升“網絡水軍”的隱匿性,可能會被用于惡意炒作。網絡攻擊和電信網絡欺詐成本嚴重降低,普通網民可使用智能生成技術實現釣魚郵
件和惡意代碼的快速生成,信息安全的防范難度極大增加。美國研究機構CheckPoint已報告了利用ChatGPT進行網絡攻擊的可能性。
??智能生成技術應用將沖擊現有的版權制度。一方面,用戶輸入簡單指令生成的創作內容是否能夠享有版權仍然存在較大爭議。另一方面,用戶主動創作與引導機
器創作的內容交織雜糅,版權溯源難題進一步凸顯。當前,國外部分高校已將利用ChatGPT撰寫論文列為學術不端行為。
??智能生成技術應用還將帶來科技倫理治理難題。由于創作過程的不可解釋性,導致以ChatGPT為代表的智能生成產品輸出結果存在極大的不確定性和不穩定性,
對于當前科技倫理治理手段造成沖擊,影響了公眾對智能生成技術應用的信任。(記者 吳雙)