人民網
人民網>>江蘇頻道>>社會

東大團隊原創理論獲“中國智能科學技術最高獎”一等獎

2026年03月10日07:18 |
訂閱已訂閱已收藏收藏小字號

讓AI“讀懂”復雜世界!東大團隊原創理論獲“中國智能科學技術最高獎”一等獎

長期以來,如何讓機器理解復雜語義,是人工智能領域的一塊“硬骨頭”。日前,東南大學計算機科學與工程學院、軟件學院、人工智能學院耿新教授團隊,憑借在“標記分布學習理論與方法”上的原創性突破,榮獲2025年度吳文俊人工智能科學技術獎自然科學獎一等獎。這個被譽為“中國智能科技最高獎”的榮譽,背后是團隊近二十年的深耕。

從“有什麼”到“有多少”

“機器學習,就是利用算法從數據中自動歸納規律,並利用這些規律對未知數據進行預測或決策。”談及獲獎項目,耿新舉例解釋,傳統監督學習在面對一個復雜對象時,往往只能給出簡單的“是或否”的判斷。“比如說,一幅圖像裡有貓、狗、大樹等多個元素,傳統的標注會告訴我們‘有貓、有狗、有樹’。但它不會告訴我們,不同元素在這一畫面裡佔了多少比重,‘顯著程度’分別有多高,這可能導致機器在面對真實世界的復雜場景時,理解出現偏差。”

面對這一痛點,耿新教授團隊在2016年正式提出了一種全新的學習范式——標記分布學習。這一范式不僅僅是給圖像打上標簽,而是要為每一個標簽賦予“描述度”。這相當於讓AI完成了一次認知升維:從判斷圖像裡“有什麼”,進階到理解每個元素“有多少”,從而對復雜對象進行更細膩、更精確的刻畫。

理論“無人區”裡的堅守

標記分布學習理論與方法的雛形最早可追溯到2007年,團隊經過近十年的積累與打磨,2016年作為完整范式被提出。但真正的攻堅,才剛剛開始。

“提出范式還不夠,想要讓它立得住,還得建立基礎理論、開發相應算法、推進應用落地……從理論到應用都得走通。”耿新回憶,最難的就是構建基礎理論這一塊。“比如一個核心點叫‘標記增強機制’。現實中,大家為了節省標注成本,往往隻標一個簡單的邏輯標記,並沒有給出描述度信息。我們要做的,就是通過數據分析,把這些缺失的描述度給恢復出來。”

為了保証恢復出來的效果是可靠的,團隊需要構建完整的理論框架。“光是這個難點,我們就打磨了三年多。”耿新感慨地說,針對另一個核心點“標記分布泛化理論”,團隊同樣打磨近三年時間。

從中國原創走向國際標准

標記分布學習因其在處理復雜、模糊語義上的獨特優勢,不僅成為了學術界的“寵兒”,更被應用在了諸多高精尖領域。目前,標記分布學習已形成機器學習領域的一個新興研究方向,吸引了大量國際同行跟研,包括哈佛、斯坦福、耶魯、牛津、劍橋等世界頂尖科研單位。

自2018年起,美國宇航局(NASA)在“好奇號”火星車的礦物分析任務中,就採用了標記分布學習作為核心算法。“火星礦物的化學成分非常復雜,以前的統計方法很難預測超過三種元素的化學成分。”團隊成員、東南大學計算機學院副教授徐寧介紹,該算法通過分析礦物晶體的X射線衍射數據,能精准預測多種化學元素及其豐度,幫助科學家還原火星地質歷史。此外,標記分布學習還被應用於集成電路領域,支撐構建了芯片設計大模型,已服務於諸多頭部企業,助力芯片設計自主化。

“我們發現在大模型研究中還有很多問題需要用標記分布學習去解決。”徐寧透露,團隊目前正在將這一技術應用於大模型的“安全對齊”研究。

“大模型生成的內容,有時候可能不安全,或者跟人類的價值觀有沖突。”徐寧表示,如何讓大模型與人類的價值觀對齊,使其更符合人類預期,這些核心問題恰好是標記分布學習未來可以發揮作用的方向。

鏈接:

“吳文俊人工智能科學技術獎”由中國人工智能學會發起主辦,得到了中國智能科學研究的開拓者和領軍人、首屆國家最高科學技術獎獲得者、中國科學院院士、中國人工智能學會名譽理事長吳文俊的支持,經中國科學技術部核准,於2011年1月6日正式設立,被譽為“中國智能科學技術最高獎”。(謝詩涵)

來源:交匯點新聞

(責編:張鑫、耿志超)

分享讓更多人看到

返回頂部