跳至主要内容

LLM 是 AI 的一個子集合

近年迅速竄起的 AI 產業風潮,精確來說是由使用大型語言模型(Large language model, LLM)技術的工具所引領,而 LLM 是人工智慧(Artificial Intelligence, AI)的一個子集。

相關技術名詞筆記:AI、ML、DL、GAI、LLM。

人工智慧 (AI)

AI 是指能模擬人類智慧完成各種 認知任務(Cognitive work) 的電腦程式,這些任務通常包括識別語言、圖像辨識、作出推理,甚至解釋一些複雜情境等。

在 AI 的領域裡,有兩種主要技術:

  • 基於規則的技術(Rule-based techniques):這種技術的 AI 是透過設計一組事先設定好的規則來工作。以垃圾信過濾系統為例,它如果是基於已定義好的特定關鍵字規則所設計,它會基於這些規則攔截所有包含這些關鍵字的信件。這種技術的缺點是它很死板,無法靈活應對新的情況。

  • 機器學習技術(Machine learning techniques):與基於規則的技術不同,機器學習讓 AI 可以從數據中自動學習,不需要事先設定每一條規則。例如,讓垃圾信過濾系統去分析已經標記為垃圾郵件的郵件特徵,並在未來攔截具有相似特徵的新郵件。隨著用戶對過濾結果的反饋,AI 可以調整自己的判斷,讓過濾結果越來越準確。

從上面的垃圾信過濾系統的例子可以理解到,其實原本 AI 就已經在許多過濾、推薦等機制中被應用,並不是在近年才崛起。

機器學習 (ML)

機器學習是 AI 的一個子集,可以說是一種教導電腦「學習」的方式,它可以從大量的數據中找到規律,並根據這些規律來預測或決策。

在機器學習中,有三種主要的訓練方法,根據數據的類型和解決問題的需求,AI 設計者會選擇適合的訓練方法來達到目標。

  • 無監督學習 (Unsupervised Learning):這種方法讓 AI 自己觀察大量的原始數據,從中找出模式或分組。例如,在一大批顧客資料中,AI 可以發現哪些顧客有相似的購物行為,從而建立顧客群組,方便之後的行銷推廣。

  • 監督學習 (Supervised Learning):這種方法需要提供已經標記好的數據,即數據不僅有內容,還有預期的結果,模型可以透過這些已知結果來學習如何預測未知情況。例如,為了讓 AI 辨識一張圖片是否是貓,設計者可以提供一組圖片和相對應的標籤 (如「貓」或「不是貓」),讓 AI 學會如何辨認特定的特徵。模型會透過不斷比對預測結果與標準答案,來優化自己的準確度。

  • 強化學習 (Reinforcement Learning):在這種方法裡 AI 透過試錯的方式來學習,每當 AI 做出正確的選擇,它會獲得「獎勵」,從而學會未來做出相同的行動。這種技術常用於對話式 AI 工具,例如當 AI 跟用戶互動時,透過用戶的回饋,AI 會逐步學會如何給出合適的回應。

深度學習 (DL)

深度學習是機器學習的一種特別形式,使用了人工神經網路(Artificial neural networks)技術來進行訓練,這種方法的靈活性較高,能處理比傳統機器學習更為複雜的模式。

神經網路模擬了人類大腦的運作方式,因此它特別適合用於處理圖像、語音或語言這類較難辨識的數據。它混合了前述提到的無監督與監督學習,使用半監督學習(Semi-supervised learning)的方式,用少量已標記數據和大量未標記數據進行訓練。例如,AI 可以從幾張標記為「貓」的圖片學到貓的特徵,然後自動分析其他沒有標記的圖片,找出具有相似特徵的圖片。

在深度學習技術的框架下有兩種主要的模型,可以依據任務目的單獨或結合使用:

  • 判別模型 (Discriminative model):這類模型適用於分類或預測數據點的標籤。簡單來說,它的目的是在給定的數據中找出某個特徵是否屬於特定類別,例如辨認一張圖片是否為貓。

  • 生成模型 (Generative model):生成模型可以根據現有數據的概率分佈生成新的數據。例如,AI 可以學習從人類繪畫中提取特徵,然後創造出新的畫作,模仿這些特徵。

生成式人工智慧 (GAI)

GAI 是來自深度學習使用生成模型的一種延伸,這類 AI 可以基於學習到的內容創造新的內容,它通常會結合監督學習、無監督學習和強化學習,以提高創作的精準度。這種技術現在廣泛應用於內容生成、圖片製作、影音創作等領域,幫助人們自動生成作品。

部分 GAI 使用多模態模型 (Multimodal model),不僅能理解文字,還能同時接收和學習多種類型的輸入,例如圖片、聲音、影片等。

大型語言模型 (LLM)

LLM 建立在 AI、ML、DL、GAI 的基礎上,它是 GAI 的一種,LLM 使用通常包含來自網路資料的大量文字數據來進行訓練,特別強調在文字生成與語言理解上的能力,能根據語境提供有邏輯性和流暢性的回應。

重點整理

為了區分什麼是 LLM,實在是需要了解非常多專有名詞,整體來說可以參考整理出的兩點關鍵,以及下方的技術名詞關係圖:

  • AI 是指能模擬人類智慧完成做決策或解決問題等複雜情境的電腦程式,已經在許多過濾、推薦等機制中被應用多年

  • LLM 是 GAI 的一個子集,特別強調在文字生成與語言理解上的能力

AI subsets