“探Sora真相,論AI未來”人工智能沙龍講座在深圳先進院成功舉辦
4月12日,由中國科學院深圳先進技術研究院計算與數(shù)字工程研究所與香港地區(qū)多媒體技術聯(lián)合實驗室共同主辦的“探Sora真相,論AI未來”人工智能沙龍講座在深圳先進院成功舉辦。本次活動邀請到人工智能領域的專家學者圍繞人工智能領域前沿技術進行了深入探討和分析,并討論Sora對AI基礎技術的推進作用。中國科學院院士、深圳先進院副院長鄭海榮,數(shù)字所所長李燁等近百位科研人員和學生參加此次活動。
鄭海榮在活動現(xiàn)場致辭
鄭海榮院士在致辭中提到,人工智能帶來科學研究范式的改變,正在深深影響材料、生命、信息和醫(yī)學等眾多領域發(fā)展。我們應以高度敏感性去思考如何與人工智能技術相融合帶動相關科技與產業(yè)領域的變革。希望通過今天的交流與合作,能夠促進非人工智能領域的研究學者擁有人工智能的意識和思維,助力開拓學科的新疆域。
香港中文大學副教授李鴻升在《圖像生成和視頻生成前沿技術探索》主題報告中,介紹了實驗室團隊在面對生成模型評估困難、生成圖像文本跟隨性差、生成視頻一致性差、生成模型推理速度慢等多重挑戰(zhàn)時開發(fā)的一系列工作,包括文生圖模型評估方法HPS(Human Preference Score)、增強生成圖像的文本依從性方法CoMat、增強生成視頻的一致性方法Motion-I2V、擴展圖像生成模型至視頻生成方法AnimateLCM等?!耙曨l生成模型的開發(fā)是一個龐大的系統(tǒng)工程,應對這一挑戰(zhàn),算力資源和人員組織架構都需要集中規(guī)劃,技術的開發(fā)需要有系統(tǒng)化的數(shù)據工程?!?/span>
騰訊科技高級研究員王鑫濤在《視頻生成探索及MINI-SORA的初步研究》的報告中提到,視頻生成正日益受到學術界和工業(yè)界的關注,隨著OpenAI??Sora的發(fā)布,視頻生成技術的潛力和挑戰(zhàn)越來越明晰。他回顧了視頻生成技術的發(fā)展路線,以及Sora的出現(xiàn)為視頻生成技術帶來的啟發(fā)與思考?!斑@是最好的時代也是最‘壞’的時代,我們見證了人工智能技術的不斷突破,同時也必須一次次突破認知才不至于‘望洋興嘆’?!?/span>
圖為圓桌對話現(xiàn)場
隨后,5位人工智能領域的科研工作者們在圓桌對話上探討了Sora對AI基礎技術的推進作用,以及人工智能技術發(fā)展背后的思考。
談及視頻生成模型的應用場景時,華為技術有限公司高級工程師蔡穎婕說道:“最直接的是在創(chuàng)作場景方面的應用,Sora表現(xiàn)出的良好一致性和一部分對物理世界的理解能力,讓其有希望成為數(shù)據仿真器,解決自動駕駛等任務中的部分數(shù)據問題,有利于提高安全性?!?/span>
那么,Sora是如何模擬和理解物理世界的?李鴻升:數(shù)據在Sora中起到了很大的作用,其中可能存在一部分使用了游戲物理引擎仿真的數(shù)據,再加上自然圖像大數(shù)據的訓練導致Sora能在一定程度上理解物理規(guī)律,產生符合人類認知的畫面。王鑫濤:數(shù)據在Sora中占據十分重要的地方,網絡模型本身的學習方式或許與人類學習的模式不一樣,模型從大量數(shù)據中學習可能也可以自適應地理解某種規(guī)律。香港中文大學助理教授薛天帆:物理規(guī)律是人類對于世界的某種‘壓縮’,將一系列的物理現(xiàn)象濃縮到幾個公式來統(tǒng)一表達,某種程度上說,‘壓縮’即智能。
深圳先進院數(shù)字所多媒體集成技術中心主任董超則從另一個角度提到,如果從Sora輸出的結果中,能推導出某種一致性規(guī)律,那么即使可能與真實世界規(guī)律有偏差,也算是Sora世界中自成一體的“物理定律”。
“無論什么樣的技術都是從人出發(fā),最終也是反饋到人類身上。我們應該更多關注人本身,創(chuàng)造出有利的科研環(huán)境,讓一線的從業(yè)者和科研工作者們保持創(chuàng)造力和好奇心。技術需要被人掌控并回歸人類本身,才能讓前沿技術帶來正向價值、有利于社會發(fā)展?!被顒拥淖詈?,董超說道。
附件下載: