「AI 會讓所有人站在同一起跑線上。」
這句話你一定聽過。它暗示的意思是:當每個人都能用 ChatGPT 寫提案、做分析、產出內容,那些花了十年磨出來的專業,就不再是優勢了。
但如果告訴你,一個哈佛商學院的控制實驗剛剛證明了完全相反的結論呢?
Iavor Bojinov 的 IG Group 實驗:AI 真的能讓外行做出專家水準的工作嗎?
Iavor Bojinov 是哈佛商學院商業管理副教授,專攻 AI 與數據科學在企業中的實驗應用。他和共同研究者 Edward McFowland III——同時也是 2023 年那篇著名的 BCG「鋸齒前沿」(Jagged Frontier)研究的共同作者——在 2026 年 3 月的《Harvard Business Review》上發表了一篇讓許多 AI 樂觀主義者不太舒服的研究。
他們的問題很簡單:如果給不同專業背景的人同樣的 AI 工具,讓他們做同一件事,結果會一樣嗎?
實驗場景是英國金融科技公司 IG Group。研究團隊找來 78 名員工,分成三組:
- 12 名網站分析師(occupational insiders)——他們的日常工作就是為 IG 網站撰寫投資主題文章,這是他們的本行。
- 26 名行銷專員(adjacent outsiders)——他們做的事和寫文章相關,但不是直接在做這件事。
- 40 名技術人員(distant outsiders)——軟體工程師和資料科學家,寫投資文章對他們來說完全是另一個世界。
三組人都拿到同樣的生成式 AI 工具,任務也一樣:為 IG 的網站寫出一篇投資主題文章。
「GenAI 牆效應」:AI 在哪裡幫得上忙,又在哪裡撞牆?
研究團隊把寫文章拆成兩個階段:構思(conceptualization)和執行(execution)。構思就是列出文章的關鍵字、架構、標題;執行就是真正把文章寫出來。
結果出現了一個清晰的分水嶺。
構思階段:AI 幾乎消除了所有差距。 在滿分 5 分的評分中,技術人員拿到 4.05,行銷專員 4.18,網站分析師 4.12。三組人幾乎不分軒輊。這很合理——列大綱、想架構是相對結構化的工作,AI 非常擅長。
但執行階段,故事完全不同。 網站分析師平均 3.96 分,行銷專員 3.92 分——幾乎追平。然而技術人員只拿到 3.42 分,比專家低了 13%。
行銷專員能追平,因為他們的日常工作——寫行銷文案、組織素材、對受眾說話——和寫投資文章有足夠多的共通點。AI 幫他們補齊了不熟悉的部分。
但技術人員做的事和寫文章之間隔了太遠。他們缺乏判斷一篇投資文章「好不好」的直覺,AI 產出的內容他們無法有效地修改和提升。
Bojinov 把這個現象命名為「GenAI 牆效應」(GenAI Wall Effect):
“If it’s an area that we do not understand and we don’t know much about, we are just performing at the baseline of the model.”
(如果是一個我們不理解、不熟悉的領域,我們就只是在 AI 模型的基準線上表現。)
這句話很殘酷,但很精準:當你不懂一個領域,你用 AI 產出的東西,就只是 AI 自己的水準。 你沒有能力讓它變得更好。
「AI 讓你覺得你什麼都能做」——但真的能做到嗎?
這裡有一個容易被忽略的細節:AI 確實讓所有人都變快了。構思階段從平均 63 分鐘壓縮到 23 分鐘(快了 65%),寫作階段從 87 分鐘縮短到 22 分鐘(快了 75%)。速度上,三組人都受益了。
但速度和品質是兩回事。
Bojinov 在接受採訪時說了一句值得反覆咀嚼的話:
“AI makes you feel like you can do anything. But can you do [a task] as well as people whose job it is?”
(AI 讓你覺得你什麼都能做。但你真的能做得跟那些以此為業的人一樣好嗎?)
這不是一個修辭問題。這個實驗給出了明確的答案:如果你和目標領域有足夠的交集,可以。如果你和目標領域隔了太遠,不行。
研究論文的結論用了一個很精準的比喻:
“GenAI can provide the map, but navigating the terrain is another matter.”
(GenAI 可以給你地圖,但真正走過那片地形是另一回事。)
地圖告訴你往哪走,但不會告訴你哪塊石頭會滑、哪條路雨天會斷、哪個彎道要減速。那些判斷來自你實際走過的經驗。
從「鋸齒前沿」到「GenAI 牆」:兩個發現的交叉對照
值得注意的是,這個研究和 2023 年那篇轟動的 BCG 研究是同一條脈絡。當時 McFowland 和 Wharton 教授 Ethan Mollick 等人讓 758 名 BCG 顧問用 GPT-4 做管理諮詢任務,發現 AI 讓所有人的表現都提升了——原本最弱的顧問進步幅度最大(43%),看起來像是 AI 在「拉平差距」。
但那個研究也發現了一個關鍵警告:當任務落在 AI 能力的「鋸齒前沿」之外——也就是 AI 不擅長的領域——盲目信任 AI 反而會讓表現更差。
Bojinov 的新研究把這條線索往前推了一步:就算 AI 本身擅長這個任務(寫文章是 AI 的強項),使用者的專業背景仍然決定了最終品質。AI 的能力是必要條件,但不是充分條件。你自己的專業才是那個乘數。
力量放大器,不是魔法棒:AI 放大的是你已經擁有的東西
把這些數據放在一起,一個清晰的框架浮現了:
AI 是力量放大器(force multiplier),不是魔法棒。
如果你在一個領域有十年經驗,AI 把你從 80 分推到 95 分。如果你在一個領域完全是外行,AI 把你從 20 分推到…大概 40 分。進步很大嗎?絕對是。但 40 分和 95 分之間的差距,才是真正的護城河。
MIT 經濟學家 David Autor 之前的研究指出,AI 能縮短新手達到「基本勝任」的時間。Bojinov 的實驗則補上了下半句:但從「基本勝任」到「專家水準」,AI 幫不了你。那段路,只有經驗能走。
這也解釋了一個很多人感受到卻說不清楚的現象:為什麼兩個人用同樣的 AI 工具、下同樣的 prompt,產出的東西品質天差地遠。不是工具不同,是操作工具的人不同。你的專業背景決定了你能問出什麼問題、能判斷 AI 給你的答案好不好、能在哪些地方加入 AI 做不到的洞察。
Bojinov 團隊在 HBS Working Knowledge 的報導中也提到,AI 在構思階段的「拉平效果」其實是一個好消息:它意味著 AI 可以大幅縮短跨領域協作的前期準備時間。一個技術人員用 AI 快速做出不錯的文章大綱,然後交給真正懂內容的人去執行——這比讓技術人員從頭到尾自己硬寫要好得多。
換句話說,AI 最大的價值不是讓你取代別人,而是讓你和別人的協作更有效率。它縮短的是溝通成本,不是專業門檻。
📎 這篇文章的核心數據來自 Bojinov 團隊發表在 HBR 2026 年 3/4 月號的文章,原文還深入探討了企業該如何重新設計培訓計畫、以及「GenAI 牆」對組織人才策略的影響——特別是什麼時候該用 AI 來加速跨部門輪調、什麼時候不該。如果你對 AI 怎麼改變組織內部的專業分工有興趣,同一期 HBR 還有另一篇值得對照閱讀的 〈Don’t Let AI Destroy the Skills That Make Your Company Competitive〉,從反面論證了過度依賴 AI 可能侵蝕組織獨有的核心能力。