我在五年前開始幫我們公司搭建一個機器學習平台,幫助ML工程師快速開發和部署模型。這整套流程「搜集資料 -> 特徵工程 -> 訓練模型 -> 最佳化參數 -> 部署模型」和相關的基礎建設被稱為MLOps,基本上矽谷每個有用到ML的中大型公司都有團隊在開發和維護這類的系統和工具。 雖然我自己平日工作不開發ML模型,但為了開發好用的工具和平台給ML工程師用,我一直很關注他們的需求和日常開發流程。從去年(2022)開始,我發現整個ML開發流程默默地開始進行「典範轉移」。傳統的開發流程逐漸變得不再適用於新的AI時代。 這個改變來自於科技巨頭們和Hugging Face (ML界的Github)上公開的「預訓練模型 」(pre-trained models)。這些模型是用大量公開資料訓練出來的模型,可以很好地處理各種基礎任務,像是語音辨識、翻譯、自然語言、視覺辨識等。像GPT-3這樣的大型語言模型 (LLM),一個就可以做到以往需要十幾個專用模型才能做的事。有了這些已經訓練好的模型,要開發ML應用,ML工程師可以直接跳過MLOps前面所有步驟,直接進入最後一步的「部署模型」。如果用外部API,甚至連部署和ML工程師都省了,找個後端工程師接上API就可以運作了。