最後更新時間:2024 – 3 – 21 by ChuChu
相信大家最近都能感受到 AI 的熱門,尤其許多生成式 AI 的應用如雨後春筍般,不斷地推出各式各樣的服務,而到底什麼是生成式 AI 呢?本篇文章會帶你來了解生成式 AI 還有生成式 AI 會應用在哪裡。
人工智慧的發展
人工智慧( Artificial Intelligence, AI) 是一個非常廣泛的領域,主要在說計算機能夠透過大量資料的訓練,透過不同的處理方式,像是機器學習、深度學習、自然語言處理…等技術,執行人類智能的任務。
機器學習
機器學習( Machine Learning )就是 AI 延伸出來的領域,也是使用 AI 的轉捩點,主要從 80 年代推出,透過從電腦中大量的資料中,使用學習的模型,透過不斷學習、不斷地優化分析,根據這些訓練結果做分析,找出最佳決策及預測。
在機器學習下有不同的學習模式,一般可以分為監督式、非監督式、半監督式和強化式這四種學習模式,在學習時能套用一種或用多種演算模式組合,來達到最好的判斷結果。
深度學習
深度學習( Deep Learning )可以說是由機器學習的分支,之所以叫做「深度」,是因為這套學習模式使用了人工類神經網路來進行,而非統計的模型。
人工類神經網路可以想像成人類的神經元,輸入資料後,運作方式會很像人類的神經細胞,經由多個、多層神經元的架構進行運算,不過要使用深度學習,必須有大量的資料,經由強大的硬體去做運算。
從下圖可以看到人工智慧技術的發展經過:
什麼是生成式 AI
生成式人工智慧( Generative Artificial Intelligence ),又被大家稱作是生成式 AI,也是深度學習底下的分支,目的是讓計算機系統能生成新的數據、圖片、文字、影片、3D 模型等內容,並不是像以前的 AI 分析一樣,針對既有的數據做分析和預測。
生成式 AI 使用神經網路來分析、識別現有的資料,並依據原創的內容產生新的內容,創造出類似但又是全新的數據,因此常常看見我們能輸入文字產生圖片,或是輸入文字產生影相的相關應用。
如何去評估生成式 AI 模型是好的呢?取決於三大因素,分別是品質、多樣性、速度。
- 品質:是否有高品質的輸出是關鍵,譬如在文字轉圖像當中,如果想要「一隻咖啡色的貓」,但卻生成了一直黑色的貓,這就代表模型並沒有理解我們的意思。
- 多樣性:一個好的模型可以輸出多個結果,輸入「一隻咖啡色的貓」,可能會跳出在睡覺的咖啡色的貓、走路的咖啡色的貓,各式各樣的結果。
- 速度:輸入資料時,這些互動程式需要具備有快速生成的能力,才能將這些輸出資料應用在生活、工作當中。
常見的生成式 AI 模型
生成式 AI 有非常多種的類型,結合不同種類型做運算能創造出更強大的模型,主要有幾種生成式 AI 模型:
擴散模型( Diffusion Models )
透過多個步驟或多層架構逐漸擴散,生成新的數據資料,通常會包含一些反向操作,從生成的數據在反向會推到原始數據,將模型進行反向運算。而擴散模型應用蠻廣泛的,通常備用在圖像生成、文字生成。
變分自編碼器 ( VAEs )
VAEs 由兩個神經網路所組成,一個是編碼器,另一個是解碼器,當輸入資料時,編碼器會把這些資料轉成更小、更密集的資料,將這種壓縮視為重建原始的資料訊息,並把相關的資料刪除。
編碼器和解碼器會一同協作,來將潛在的變量映射到數據空間中,來產生數據樣本, VAEs 的模型能快速地產生影像,但是產出的影像卻沒有像擴散模型那麼詳細。
生成對抗網路( GANs )
GANs 由兩個獨立的神經網路所組成,分別是生成器( Generator )和判別器 ( Discriminator )。
生成器是用來生成與真實數據的像似假數據,而判別器則是用來分辨真實數據還是假數據,兩個神經網路進行對抗的訓練,不斷的改進生成的數據,這種模型被認為是三種模型最常用的。
生成式 AI 的應用場景
生成式 AI 是一個強大的工具,能幫助創意人員、工程師、研究人員…等工作人員,加速工作的流程,主要可以應用在語言、視覺、聲音三大區塊。
以下是最受歡迎的生成式 AI 應用:
文字生成
文本是很多生成式 AI 的應用基礎,也被視為是目前最廣泛、最先進的應用,基於語言的生成模型最受歡迎的是大型語言模型( LLM ),目前大家用文字生成 AI 功能在文章生成、程式開發、翻譯,甚至是可以應用在了解基因序列。
聲音生成
在音樂、音訊及語音是人工智慧的新興應用領域,像是能透過文字輸入想要的音樂片段,就能使用生成式 AI 創造出自己想要的音樂,或是自動判別影片中的物件,生成合適的配樂。
延伸閱讀:
Google MusicLM是什麼?用圖片和文字AI生成音樂
如何加入Google MusicLM等候名單,用AI創造音樂
圖片生成
視覺生成最受歡迎的應用是影像的領域,透過輸入一段文字,產出相對應的照片,包括 3D 圖像、頭像、圖表、插圖的應用,或是透過生成式 AI 來達到特殊的視覺效果,有些可以應用來去背、做特效,創造出新的視覺效果。
影像生成
生成式 AI 能用來創作影片,透過文字輸入轉換成動畫片段、特效、影片…等影音素材,能用在影音製作、電影製作、廣告製作…等領域
最近非常紅的 Sora ,就是 Open AI 推出的文字轉影音的一套工具。
合成資料
當參考資料不足或受到限制時,生成式 AI 能夠透過增強資料的訓練,來降低標記成本,合成更多資料,適用於較少標記的資料訓練 AI 模型。
未來可能的應用:
汽車產業
在未來開發汽車時,生成式 AI 能應用來創造汽車的 3D 模型,將所合成的資料應用來訓練車輛自動駕駛,模擬車子在 3D 世界中自動駕駛的能力,進行道路測試,提高自動駕駛的安全性,並降低風險。
自然科學
在醫療保健產業,生成式 AI 能開發新的藥物,並幫助醫療從業人員做醫學研究、醫學成像、醫學編碼…等任務,或是基因分析等研究。
在氣象產業中,可以用來預測天氣、預測災害,幫助大眾創造更安全的環境,預先做好準備。
娛樂產業
整個娛樂產業都能透過生成式 AI 來發想創意,從電玩遊戲、動畫、 AR 、 VR …等,創作者都能用生成式 AI 來一同協作,補足創造力和工作能力。
生成式 AI 的好處
文章裡提到了非常多生成式 AI 的運用,到底使用生成式 AI 有什麼好處呢?
創建多樣化的內容
透過生成式 AI 能基於原創的內容創建新的內容,像是圖片、影片、文字…等內容,對藝術創作、設計開發等相關領域有非常大的影響,能發想更多元的內容,提供了無限的可能性。
提高 AI 系統效率
生成式 AI 能用來提高現有人工智慧的效率,在生成式 AI 的合成資料這項功能裡,能用來訓練和評估這些人工智慧的模型,像是自然語言模型、電腦視覺…等模型。在數據缺乏的情況下,也能擴展既有的資料。
以新的方式探討數據
同樣的人去分析數據,可能會因為既有的偏見,造成沒辦法對數據做適當的分析,透過生成式 AI 能以不同的角度、不同的分析方法,來看出原始數據帶來的趨勢。
任務自動化
由於生成式 AI 能應用在圖片生成、文字生成、音樂生成…等任務,因此我們能透過 AI 來幫助攻做的自動化和加速各種任務流程,提高工作的效率,並節省時間和資源。
生成式 AI 的挑戰
當然,如果你要使用生成式 AI ,也會遇到一些挑戰,這些挑戰包括:
基礎設施的規模
生成式人工智慧具有將近十億的參數,如果要將這些參數進行訓練,就需要投入大量的資本、專業技術,還有必須配備基本的運算基礎設施。
如果你需要用擴散模型就會需要數百萬張、或數十億張圖像來做訓練,因此業者就要採購許多 GPU 來訓練他們的模型。
取樣的速度
會有越來越多資料輸入到系統裡面做運算,因此生成的規模會越來越大,所以生成的時間可能會越來越久,會存在著延遲的問題。
尤其像是聊天機器人、人工智慧語音助理、或是客服類的應用程式,這些回覆都需要精準的做回覆,因此為了優化回覆的內容,要創建高品質的樣本,採樣的速度也會變慢。
缺乏高品質數據
每天都會有大量的數據產生,但是這些數據不一定適合應用在人工智慧的訓練模型裡。
如果需要用在模型的訓練,需要有高品質、中立且沒有偏見的數據才能用來訓練模型,因此不只要大量的數據,還需要篩選這些數據,挑選精準的數據才行。
資料來源授權
當要收集這些數據時,需要經過授權取用來源數據,不過這也涉及到對方是否會願意讓我們收集數據,因此也會難以收集到高品質的數據,要避免侵犯到了智慧財產權。
機器學習、深度學習、生成式 AI 比較
在這裡為大家整理一下機器學習、深度學習、生成式 AI 的不同,希望能幫大家理解這三種的差異性。
項目 | 機器學習 | 深度學習 | 生成式 AI |
特徵 | 通常需要人工設計和選擇特徵 | 通常通過神經網絡自動學習和提取特徵 | 通常通過生成模型自動生成數據或內容 |
模型結構 | 基於統計方法或其他機器學習算法的模型 | 基於深度神經網絡的模型 | Diffusion Models 、GAN)、VAE 等 |
計算資源 | 對計算資源的要求通常較低 | 通常需要更多的計算資源,如大量的數據和計算能力 | 要求的計算資源視具體模型和任務而定 |
應用範圍 | 適用於各種機器學習任務,包括監督和非監督學習 | 在圖像識別、語音識別等方面取得了卓越的成就 | 主要用於生成圖像、文本、音訊等 |
知名算法 | 支持向量機、決策樹、隨機森林等 | 卷積神經網絡(CNN)、循環神經網絡(RNN)等 | 生成對抗網絡(GAN)、變分自編碼器(VAE)等 |
結論
不知道你是不是已經開始使用生成式 AI 的服務呢?這篇文章帶大家來了解什麼是生成式 AI,相信現在這項技術已經慢慢地滲透到你我的生活當中,我覺得不要害怕去使用 AI ,擔心 AI 會取代人類,我們應該把這項工具當成自己工作的利器,增加創意的多樣性。
延伸閱讀:
樂高汽車 AI 圖製作教學,客製化專屬自己的樂高汽車圖
Samsung S24 AI 手機,7 大 AI 功能開啟 AI 手機新世代
LINE AI Mini Me 功能,用 AI 一次創造出 50 張 Q 版的大頭貼