央廣網北京4月2日消息(記者 齊智穎)3月31日,在“2025中關村論壇年會”期間,中國科學院院士張鈸在智譜OpenDay活動上發(fā)表演講時提及,當前人工智能正在進入“智能體化”時代,應該把語言模型擴展到智能體。同時,張鈸認為構成智能體必須符合三個條件——很強的思考能力、很強的執(zhí)行能力、很強的感知能力。

張鈸認為,大模型的出現有兩個重要的意義。一方面,大模型使得人工智能的范式發(fā)生了根本性變化;同時,人工智能日新月異的發(fā)展必然會改變各行各業(yè)的面貌。

談及大模型之所以會產生巨大影響的原因,張鈸表示,大模型使機器像人類一樣思考,這一突破主要因為GPT(生成式預訓練變換器),通過巨大的人工神經網絡和龐大的數據量學習,催生出了一個大語言模型,這個大語言模型最大的成功就是擁有強大的語言生成能力。

張鈸強調,機器一旦理解和掌握了人類語言,必然會開辟一個充滿一切可能性的道路。

過去大模型的發(fā)展主要依靠規(guī)模定律,即依靠巨大的人工神經網絡和巨大的數量數據。張鈸認為,未來要超越規(guī)模定律首先要進一步提升大模型的性能,同時降低成本。

關于提升大模型性能的舉措,張鈸指出,其一是利用機器自身的能力——思考能力或者推理能力;其二是AI反饋的強化學習 (Reinforcement Learning from AI Feedback,簡稱 RLAIF) ,依靠AI對齊(AI Alignment),特別是人類反饋強化學習(Reinforcement Learning from Human Feedback,簡稱RLHF)。

張鈸強調,當前人工智能正在進入“智能體化”時代,應該把語言模型擴展到智能體。同時,張鈸提出構成智能體必須符合三個條件——很強的思考能力、很強的執(zhí)行能力、很強的感知能力。

盡管大模型帶來了巨大變革,但當前人工智能仍面臨諸多挑戰(zhàn),張鈸總結了三大難題,他認為這同時也是AI從業(yè)者的機會。

首先是多層次空間問題,沒有層次的空間很難進行復雜推理,目前在圖像領域這一問題已經使用擴散模型得到解決,一旦把擴散模型擴充到語言上去,那語言上的推理就會非常容易解決。

其次是過程與結果問題,推理都是以結果作為目標,這存在非常大的隱患,有時候結果是對的,但是過程不一定對,因為優(yōu)化的時候只優(yōu)化結果,并沒有優(yōu)化過程,這主要靠Reinforcement、AI Alignment解決。

此外,最重要的是可解釋性問題,這個問題的解決更多依靠校企合作,因為必須要解決理論上的問題。

張鈸建議,AI企業(yè)應不斷反思,不斷推動自己改進、進化,使自身更符合現代企業(yè)精神。

編輯:朱麗霓
更多精彩資訊請在應用市場下載“央廣網”客戶端。歡迎提供新聞線索,24小時報料熱線400-800-0088;消費者也可通過央廣網“啄木鳥消費者投訴平臺”線上投訴。版權聲明:本文章版權歸屬央廣網所有,未經授權不得轉載。轉載請聯系:cnrbanquan@cnr.cn,不尊重原創(chuàng)的行為我們將追究責任。
長按二維碼
關注精彩內容