為什麼 AI 沒選機率最高的答案?拆解 ChatGPT 的「換句話說」之謎(LLM有意識嗎Part2)
2026-06-13
58
前情提要:在上一篇文章中,我們提到大型語言模型(LLM)最核心的工作其實很單純:根據前面的內容,預測下一個 Token。 很多人看到這裡,第一個直覺反應都是: 「既然 AI 都已經算出每個字的機率了,那為什麼不直接選機率最高的那一個就好了?」 其實,這正是大型語言模型和傳統「辨識型 AI」最關鍵的分水嶺。
一分鐘對比:圖片辨識 vs 語言模型
(本篇為系列的第二篇,建議先讀第一篇)
為了搞懂這點,我們拿大家熟知的「圖片辨識」來對比。
案例 A:圖片辨識(目標:追求絕對的精準)
假設我們輸入一張八哥的照片,想知道牠到底是什麼品種。模型經過運算後,最後輸出的機率結果如下:
鳥類品種預測機率 >>
白尾八哥 92% 🔥
家八哥 5%
台灣冠八哥 3%
這時候答案是什麼?
很簡單,直接選機率最高的 白尾八哥(92%),收工回家!
因為圖片辨識的目標,就是幫人類「找出那一個最正確的標準答案」。
為什麼 LLM 不能照抄這個公式?
我們再看上一篇提過的語言模型例子。
當我們輸入:
🗣️ 「台灣最高的山是……」
模型經過大數據計算後,得到了一張下一個字的「機率分布表」:
預測 Token 出現機率:
玉山 85%
雪山 4%
阿里山 3%
中央山脈 2%
合歡山 / 大霸尖山 / 南湖大山各 1%
其他 Token 加總3%
單看這個結果,下一個 Token 最有可能是「玉山」。
既然玉山有高達 85% 的機率,直接選它不就好了嗎?
關鍵在於:LLM 不是「一發完工」的任務
圖片辨識只需要回答一次(給出一個標籤)就結束了。
但 LLM 不同,它必須持續不斷地產生下一個、再下一個、再下一個 Token,直到拼湊出完整的句子、段落,甚至一整篇文章。
如果每一步都死板板地只選機率第一名的選項,問題就來了:
⚠️ 「最安全,也最無聊。」
如果永遠只選第一名,模型就會極度傾向使用最常見、最不容易出錯的字詞。最後產生的內容雖然完全合理,卻會變得非常制式、枯燥,甚至每次問它,它吐出來的回答都一模一樣。
機率是指南針,而不是鐵律
為了讓 AI 說話更像人類、更有彈性,LLM 在決定下一個 Token 時,引入了「抽樣(Sampling)」的概念。
簡單來說:
- 機率高的 Token(如:玉山 85%),被抽中的機率極大。
- 機率低的 Token(如:雪山 4%),雖然機會渺茫,但依然有被抽中的可能。
這就是為什麼大部分情況下,AI 還是會回答「玉山」;但偶爾,它也會選擇其他合理的字詞來接續句子。這也完美解釋了:為什麼同樣的問題問兩次,ChatGPT 給你的答案每次都不太一樣。
🧠 延伸思考:如果 AI 成了「機率的奴隸」?
如果 LLM 不是永遠選第一名,那它到底是用什麼標準來決定「哪些字可以放進抽獎箱」?又是怎麼過濾掉那些機率極低、明顯不經大腦的笨答案?
下一篇文章,我們來聊聊大型語言模型裡非常重要的一個靈魂機制:Top-P Sampling(核抽樣)。
在看下一篇之前,不妨先留下你的想法:
💬 腦力激盪時間!
如果我們把設定鎖死,讓 ChatGPT 永遠只能選機率最高的那個 Token,你覺得它還會像現在這麼會聊天、甚至幫你寫小說和企劃案嗎?歡迎在下方留言分享你的看法!
本文為【LLM有意識嗎?】系列文章,歡迎訂閱追蹤最新 AI 科技科普分享!