2025-04-23
黃正傑
194
生成式AI促成了機器人的認知、規劃、行動的大腦融合。這一集AI想想,帶我們去看經典電影<<成人世界>>,並探討各種讓機器學習的方法。我們可以想一想新一代的機器手臂、人型機器人可以為我們帶來來甚麼樣的幫助?我們又期待哪樣的機器人可以協助我們的日常或通工作呢?
除了AI助理之外,最令人引頸期盼的就是實體AI(Physical AI)或者說是AI機器人、人型機器人的發展了!! Nvdia黃仁勳在2025年GTC展出Blue機器人,說明了新一代AI機器人對於語言、外界環境理解以及靈活的行動。黃仁勳賣的當然不是這一台機器人,而是所建立的開源機器人學習框架Newton,也進一步讓發展機器人的產品公司會購買Nvdia GPU晶片。
如同我們在本文提到的<<成人世界>>科幻電影,查皮機器人透過看電視、模仿人類行為、媽媽的教導等進行學習,Nvida的Newton學習框架可以透過其GPU平台,進行各種模擬學習,讓機器人在實體部署後,可以適應不斷改變的環境。這種模擬學習的平台,即是Nvida Ominverse的平台,可以說是一種數位孿生的模擬平台 (數位孿生概念請見「數位孿生,讓虛擬與實體融合與預測」一文)。Nvida機器人的學習,有幾種學習方法,包含強化學習、模仿學習、監督學習、擴散策略與自監督學習。後兩者是來自於生成式AI發展,可以讓演算法產生模擬數據,以彌補數據的不足。
圖、NVIDA的機器人訓練
(資料來源:Nvida)
我們可以說,生程式AI、大語言模型(LLM)的發展讓近期機器人技術快速地發展。我想,生成式AI,包含: 大語言模型(LLM)、影像大語言模型(VLM)以及程式的自動產生等,將持續地協助機器人在認知、規劃、行動上進行改進乃至於融合。或許,查皮機器人不會那麼快的到來,但一年半載後,讓你愛到不行的機器寵物將會問世!! 到時候,在公園裡看到遛機器狗,可不要驚嚇到!!
圖、生成式AI加速機器人的大腦融合
(參考資料: Vanhoucke(2024), Medium)
大家好,歡迎來到AI想想,想想AI、想想人文。我是黃正傑。
今天要跟各位聊一聊AI學習。
大家想想看,讀書的時代是怎麼學習的?是課堂老師上課? 回家寫功課練習? 期中考試? 還是去國外遊學? 哪一種你覺得最有最有效果?
那麼,人工智慧是怎麼學習的呢? 「成人世界」這部電影,就在跟我們講一個機器人學習成長的故事。
故事是這樣的。在一個充滿犯罪與危險的城市當中,警察常常在追捕罪犯的過程當中,因為槍戰而受傷、死亡。機器製造公司發明機器戰警,與人類警察一齊打擊犯罪,減少傷亡。
主角機器人22號就是一個機器警察。不過他的運氣不好,常常受傷,要進行修理。
有一次,22號參與警匪槍戰,被匪徒直接命中胸口,整個就這樣子倒下。於是,機器人公司決定將他報廢處理。
創造機器警察的工程師正好在作秘密實驗,想要創造更高階,有感知與思考的機器人。那一天,工程師的程式碼模擬成功,然後就將報廢在倉庫的22號機器人偷出來作測試。
在運送過程中,卻被持槍匪徒搶走。匪徒要求工程師把22號機器人修好。工程師把機器人裝上正在測試的高階程式碼,機器人22號就像嬰兒般活過來了,開始學習與成長。他們給他了個新的名字,叫作查皮。
就這樣,查皮在匪徒的家中學習、成長。工程師也定期來匪徒家中進行訓練,啟發他的創造力。所以在影片當中,我們可以看到查皮的成長學習過程中,匪徒爸爸教一些幹話、訓練武術、用刀、用槍等。創造者工程師教他看書、學畫畫等藝術的創造力訓練,而且會適時糾正他學到的不好的知識。另一個女匪徒則產生了憐憫之心,扮演媽媽角色,在床邊講故事。匪徒爸爸要他搶劫、工程師要他做善良的人、匪徒媽媽則要他做自己。
後來,查皮被匪徒爸爸帶去搶劫,被媒體曝光,展開了一場激烈的警匪追逐戰。就這樣查皮出社會了,他感受到親人的死亡以及社會的險惡。.
這部電影藉由AI機器人長大成人的故事,來反思人類要如何教育下一代及善良天性怎麼抵抗外界不良的影響?
幸好,現代的人工智慧或機器人還沒走到這樣的地步,否則真的會累死。照顧小孩還不夠,還要教育機器寶寶!!
那麼,以大數據為基礎的人工智慧是怎麼學習的?
現在人工智慧系統還是要靠人類協助來定義問題、給予特定數據、發展特定演算法,才能學習到不同問題的解決方法。例如:Google為了讓AI系統可以辨識圖片裡的狗或貓。科學家蒐集數千萬個照片,利用特定演算法、經過兩個星期訓練時間,讓AI系統學習到如何辨識狗、貓的特徵,如: 耳朵、鼻子、眼睛等。這些圖片必須由人為先指明哪個是貓、哪個是狗或汽車,最後訓練AI系統可以自動辨識特徵。像不像是讓AI透過選擇題的考試進行學習? 或者是像是電影中工程師即時糾正機器人哪些話是不對的?這種必須指明特定答案結果的AI學習方式,叫做監督式學習。
在商業界已經有許多成功案例可以參考。例如:一家生產輪軸公司發現,品質檢測人員不易判讀壓力檢測器的圖形。我們透過8,000張檢測圖形,其中36張已經被檢測人員標記為不合格,進行訓練;最後AI可以協助檢測人員判讀檢測圖形。另外一家隱形眼鏡公司想要找出影響產品良率因素為何?我們協助蒐集過去數萬筆影響品質良率的因素,如:設備參數、操作人員、機台及當批產品良率計算結果,讓AI系統學習。最後AI系統發現最大影響因子竟然跟操作人員有關。該公司進一步探查是否為教育訓練問題或是機台不易操作等問題。
就像人類學習的方法有很多,科學家也持續地在嘗試各種AI學習方法。例如: Google利用7個機器手臂,學習抓取不規則物品;在不斷的成功與失敗中學習,終於在4個月後學會抓取不規則物品。這種嘗試失敗與修正的學習方式叫作強化式學習。這就像是匪徒爸爸將機器人丟到壞人堆中,學習如何自我防衛與攻擊。
加州柏克萊大學則利用模仿學習方式,讓機器人透過電腦視覺,模仿人類將物品撿起來放到盤子中的動作。這像極了匪徒爸爸教機器人查皮如何用刀與用槍。
不過,不僅是模仿,匪徒爸爸還跟查皮對打。科學家也發明稱之為生成對抗網路的AI演算法,可以讓人工智慧與許多分身進行對戰,讓人工智慧更加精進。例如: AlphoGo AI圍棋在訓練過程中就創造不同的分身進行相互對奕;MakeGirl公司則利用生成對抗網路,來產生獨一無二的美少女樣貌。這個要幹嘛? 這可能要問一問宅男了~
大家想想看,要怎麼從問題中找到合適的AI學習方法呢?
由此可見,像查皮機器人能主動搜尋問題的人工智慧系統,仍在發展中。現代AI系統仍需要人類清楚的定義問題,進一步利用合適數據、學習演算法,讓AI系統學習。這也就是說,在商業人工智慧系統中,得仰賴會問問題的領域專家與具備數據蒐集、發展AI學習演算法能力數據科學家,緊密合作!!
此外,我們在設計AI系統時,也要注意運用甚麼樣的AI學習策略容易解決問題或是滿足數據需求? 是監督式學習、非監督式學習、強化式學習還是生成對抗學習?
有時候,或許我們也要記憶,如:背字典、背地名或年代。例如:我們在發展客戶新聞輿情系統時,就將客戶公司名稱利用字典檔來協助我們的AI系統記憶。AI系統就像人類一樣,需要各種學習策略,才可能將事情學好。更何況,現在AI系統還不像人類或電影中的查皮機器人一樣頭腦靈活呢!!
大家想想看,人類還有甚麼樣學習方法值得教給AI呢?
本次我們介紹AI學習電影反思、幾種常見的AI學習方法及AI系統實施、設計時候的反思。希望大家會喜歡!! 我是黃正傑,我們下一次再見~
科技轉角巷
301 Followers
科技轉角巷
301 Followers
我們使用本身的Cookie和第三方的Cookie進行分析,並根據您的瀏覽習慣和個人資料向您展示與您的偏好相關的廣告。如欲瞭解更多資訊,您可以查閱我們的隱私權政策。