哈佛實驗證明：AI 不會讓菜鳥變專家——為什麼你的專業知識才是 AI 時代真正的護城河

Asu
15 Apr, 2026
- 生產力

「AI 會讓所有人站在同一起跑線上。」

這句話你一定聽過。它暗示的意思是：當每個人都能用 ChatGPT 寫提案、做分析、產出內容，那些花了十年磨出來的專業，就不再是優勢了。

但如果告訴你，一個哈佛商學院的控制實驗剛剛證明了完全相反的結論呢？

Iavor Bojinov 的 IG Group 實驗：AI 真的能讓外行做出專家水準的工作嗎？

Iavor Bojinov 是哈佛商學院商業管理副教授，專攻 AI 與數據科學在企業中的實驗應用。他和共同研究者 Edward McFowland III——同時也是 2023 年那篇著名的 BCG「鋸齒前沿」（Jagged Frontier）研究的共同作者——在 2026 年 3 月的《Harvard Business Review》上發表了一篇讓許多 AI 樂觀主義者不太舒服的研究。

他們的問題很簡單：如果給不同專業背景的人同樣的 AI 工具，讓他們做同一件事，結果會一樣嗎？

實驗場景是英國金融科技公司 IG Group。研究團隊找來 78 名員工，分成三組：

12 名網站分析師（occupational insiders）——他們的日常工作就是為 IG 網站撰寫投資主題文章，這是他們的本行。
26 名行銷專員（adjacent outsiders）——他們做的事和寫文章相關，但不是直接在做這件事。
40 名技術人員（distant outsiders）——軟體工程師和資料科學家，寫投資文章對他們來說完全是另一個世界。

三組人都拿到同樣的生成式 AI 工具，任務也一樣：為 IG 的網站寫出一篇投資主題文章。

「GenAI 牆效應」：AI 在哪裡幫得上忙，又在哪裡撞牆？

研究團隊把寫文章拆成兩個階段：構思（conceptualization）和執行（execution）。構思就是列出文章的關鍵字、架構、標題；執行就是真正把文章寫出來。

結果出現了一個清晰的分水嶺。

構思階段：AI 幾乎消除了所有差距。 在滿分 5 分的評分中，技術人員拿到 4.05，行銷專員 4.18，網站分析師 4.12。三組人幾乎不分軒輊。這很合理——列大綱、想架構是相對結構化的工作，AI 非常擅長。

但執行階段，故事完全不同。 網站分析師平均 3.96 分，行銷專員 3.92 分——幾乎追平。然而技術人員只拿到 3.42 分，比專家低了 13%。

行銷專員能追平，因為他們的日常工作——寫行銷文案、組織素材、對受眾說話——和寫投資文章有足夠多的共通點。AI 幫他們補齊了不熟悉的部分。

但技術人員做的事和寫文章之間隔了太遠。他們缺乏判斷一篇投資文章「好不好」的直覺，AI 產出的內容他們無法有效地修改和提升。

Bojinov 把這個現象命名為「GenAI 牆效應」（GenAI Wall Effect）：

“If it’s an area that we do not understand and we don’t know much about, we are just performing at the baseline of the model.”

（如果是一個我們不理解、不熟悉的領域，我們就只是在 AI 模型的基準線上表現。）

這句話很殘酷，但很精準：當你不懂一個領域，你用 AI 產出的東西，就只是 AI 自己的水準。 你沒有能力讓它變得更好。

「AI 讓你覺得你什麼都能做」——但真的能做到嗎？

這裡有一個容易被忽略的細節：AI 確實讓所有人都變快了。構思階段從平均 63 分鐘壓縮到 23 分鐘（快了 65%），寫作階段從 87 分鐘縮短到 22 分鐘（快了 75%）。速度上，三組人都受益了。

但速度和品質是兩回事。

Bojinov 在接受採訪時說了一句值得反覆咀嚼的話：

“AI makes you feel like you can do anything. But can you do [a task] as well as people whose job it is?”

（AI 讓你覺得你什麼都能做。但你真的能做得跟那些以此為業的人一樣好嗎？）

這不是一個修辭問題。這個實驗給出了明確的答案：如果你和目標領域有足夠的交集，可以。如果你和目標領域隔了太遠，不行。

研究論文的結論用了一個很精準的比喻：

“GenAI can provide the map, but navigating the terrain is another matter.”

（GenAI 可以給你地圖，但真正走過那片地形是另一回事。）

地圖告訴你往哪走，但不會告訴你哪塊石頭會滑、哪條路雨天會斷、哪個彎道要減速。那些判斷來自你實際走過的經驗。

從「鋸齒前沿」到「GenAI 牆」：兩個發現的交叉對照

值得注意的是，這個研究和 2023 年那篇轟動的 BCG 研究是同一條脈絡。當時 McFowland 和 Wharton 教授 Ethan Mollick 等人讓 758 名 BCG 顧問用 GPT-4 做管理諮詢任務，發現 AI 讓所有人的表現都提升了——原本最弱的顧問進步幅度最大（43%），看起來像是 AI 在「拉平差距」。

但那個研究也發現了一個關鍵警告：當任務落在 AI 能力的「鋸齒前沿」之外——也就是 AI 不擅長的領域——盲目信任 AI 反而會讓表現更差。

Bojinov 的新研究把這條線索往前推了一步：就算 AI 本身擅長這個任務（寫文章是 AI 的強項），使用者的專業背景仍然決定了最終品質。AI 的能力是必要條件，但不是充分條件。你自己的專業才是那個乘數。

力量放大器，不是魔法棒：AI 放大的是你已經擁有的東西

把這些數據放在一起，一個清晰的框架浮現了：

AI 是力量放大器（force multiplier），不是魔法棒。

如果你在一個領域有十年經驗，AI 把你從 80 分推到 95 分。如果你在一個領域完全是外行，AI 把你從 20 分推到…大概 40 分。進步很大嗎？絕對是。但 40 分和 95 分之間的差距，才是真正的護城河。

MIT 經濟學家 David Autor 之前的研究指出，AI 能縮短新手達到「基本勝任」的時間。Bojinov 的實驗則補上了下半句：但從「基本勝任」到「專家水準」，AI 幫不了你。那段路，只有經驗能走。

這也解釋了一個很多人感受到卻說不清楚的現象：為什麼兩個人用同樣的 AI 工具、下同樣的 prompt，產出的東西品質天差地遠。不是工具不同，是操作工具的人不同。你的專業背景決定了你能問出什麼問題、能判斷 AI 給你的答案好不好、能在哪些地方加入 AI 做不到的洞察。

Bojinov 團隊在 HBS Working Knowledge 的報導中也提到，AI 在構思階段的「拉平效果」其實是一個好消息：它意味著 AI 可以大幅縮短跨領域協作的前期準備時間。一個技術人員用 AI 快速做出不錯的文章大綱，然後交給真正懂內容的人去執行——這比讓技術人員從頭到尾自己硬寫要好得多。

換句話說，AI 最大的價值不是讓你取代別人，而是讓你和別人的協作更有效率。它縮短的是溝通成本，不是專業門檻。

📎 這篇文章的核心數據來自 Bojinov 團隊發表在 HBR 2026 年 3/4 月號的文章，原文還深入探討了企業該如何重新設計培訓計畫、以及「GenAI 牆」對組織人才策略的影響——特別是什麼時候該用 AI 來加速跨部門輪調、什麼時候不該。如果你對 AI 怎麼改變組織內部的專業分工有興趣，同一期 HBR 還有另一篇值得對照閱讀的〈Don’t Let AI Destroy the Skills That Make Your Company Competitive〉，從反面論證了過度依賴 AI 可能侵蝕組織獨有的核心能力。