什麼是生成式 AI?你應該了解的生成式 AI 的可能性與魔力

什麼是生成式 AI?你應該要了解的生成式 AI 可能性與魔力

最後更新時間:2024 – 3 – 21 by ChuChu

相信大家最近都能感受到 AI 的熱門,尤其許多生成式 AI 的應用如雨後春筍般,不斷地推出各式各樣的服務,而到底什麼是生成式 AI 呢?本篇文章會帶你來了解生成式 AI 還有生成式 AI 會應用在哪裡。

人工智慧的發展

人工智慧( Artificial Intelligence, AI) 是一個非常廣泛的領域,主要在說計算機能夠透過大量資料的訓練,透過不同的處理方式,像是機器學習、深度學習、自然語言處理…等技術,執行人類智能的任務。

機器學習

機器學習( Machine Learning )就是 AI 延伸出來的領域,也是使用 AI 的轉捩點,主要從 80 年代推出,透過從電腦中大量的資料中,使用學習的模型,透過不斷學習、不斷地優化分析,根據這些訓練結果做分析,找出最佳決策及預測。

在機器學習下有不同的學習模式,一般可以分為監督式、非監督式、半監督式和強化式這四種學習模式,在學習時能套用一種或用多種演算模式組合,來達到最好的判斷結果。

深度學習

深度學習( Deep Learning )可以說是由機器學習的分支,之所以叫做「深度」,是因為這套學習模式使用了人工類神經網路來進行,而非統計的模型。

人工類神經網路可以想像成人類的神經元,輸入資料後,運作方式會很像人類的神經細胞,經由多個、多層神經元的架構進行運算,不過要使用深度學習,必須有大量的資料,經由強大的硬體去做運算。

從下圖可以看到人工智慧技術的發展經過:

什麼是生成式 AI - 人工智慧發展經過

什麼是生成式 AI

生成式人工智慧( Generative Artificial Intelligence ),又被大家稱作是生成式 AI,也是深度學習底下的分支,目的是讓計算機系統能生成新的數據、圖片、文字、影片、3D 模型等內容,並不是像以前的 AI 分析一樣,針對既有的數據做分析和預測。

生成式 AI 使用神經網路來分析、識別現有的資料,並依據原創的內容產生新的內容,創造出類似但又是全新的數據,因此常常看見我們能輸入文字產生圖片,或是輸入文字產生影相的相關應用。

如何去評估生成式 AI 模型是好的呢?取決於三大因素,分別是品質、多樣性、速度。

  • 品質:是否有高品質的輸出是關鍵,譬如在文字轉圖像當中,如果想要「一隻咖啡色的貓」,但卻生成了一直黑色的貓,這就代表模型並沒有理解我們的意思。
  • 多樣性:一個好的模型可以輸出多個結果,輸入「一隻咖啡色的貓」,可能會跳出在睡覺的咖啡色的貓、走路的咖啡色的貓,各式各樣的結果。
  • 速度:輸入資料時,這些互動程式需要具備有快速生成的能力,才能將這些輸出資料應用在生活、工作當中。

什麼是生成式 AI - 評估生成式 AI

常見的生成式 AI 模型

生成式 AI 有非常多種的類型,結合不同種類型做運算能創造出更強大的模型,主要有幾種生成式 AI 模型:

擴散模型( Diffusion Models )

透過多個步驟或多層架構逐漸擴散,生成新的數據資料,通常會包含一些反向操作,從生成的數據在反向會推到原始數據,將模型進行反向運算。而擴散模型應用蠻廣泛的,通常備用在圖像生成、文字生成。

變分自編碼器 ( VAEs )

VAEs 由兩個神經網路所組成,一個是編碼器,另一個是解碼器,當輸入資料時,編碼器會把這些資料轉成更小、更密集的資料,將這種壓縮視為重建原始的資料訊息,並把相關的資料刪除。

編碼器和解碼器會一同協作,來將潛在的變量映射到數據空間中,來產生數據樣本, VAEs 的模型能快速地產生影像,但是產出的影像卻沒有像擴散模型那麼詳細。

生成對抗網路( GANs )

GANs 由兩個獨立的神經網路所組成,分別是生成器( Generator )和判別器 ( Discriminator )。

生成器是用來生成與真實數據的像似假數據,而判別器則是用來分辨真實數據還是假數據,兩個神經網路進行對抗的訓練,不斷的改進生成的數據,這種模型被認為是三種模型最常用的。

生成式 AI 的應用場景

生成式 AI 是一個強大的工具,能幫助創意人員、工程師、研究人員…等工作人員,加速工作的流程,主要可以應用在語言、視覺、聲音三大區塊。

以下是最受歡迎的生成式 AI 應用:

文字生成

文本是很多生成式 AI 的應用基礎,也被視為是目前最廣泛、最先進的應用,基於語言的生成模型最受歡迎的是大型語言模型( LLM ),目前大家用文字生成 AI 功能在文章生成、程式開發、翻譯,甚至是可以應用在了解基因序列。

聲音生成

在音樂、音訊及語音是人工智慧的新興應用領域,像是能透過文字輸入想要的音樂片段,就能使用生成式 AI 創造出自己想要的音樂,或是自動判別影片中的物件,生成合適的配樂。

延伸閱讀:
Google MusicLM是什麼?用圖片和文字AI生成音樂
如何加入Google MusicLM等候名單,用AI創造音樂

圖片生成

視覺生成最受歡迎的應用是影像的領域,透過輸入一段文字,產出相對應的照片,包括 3D 圖像、頭像、圖表、插圖的應用,或是透過生成式 AI 來達到特殊的視覺效果,有些可以應用來去背、做特效,創造出新的視覺效果。

影像生成

生成式 AI 能用來創作影片,透過文字輸入轉換成動畫片段、特效、影片…等影音素材,能用在影音製作、電影製作、廣告製作…等領域

最近非常紅的 Sora ,就是 Open AI 推出的文字轉影音的一套工具。

合成資料

當參考資料不足或受到限制時,生成式 AI 能夠透過增強資料的訓練,來降低標記成本,合成更多資料,適用於較少標記的資料訓練 AI 模型。

未來可能的應用:

汽車產業

在未來開發汽車時,生成式 AI 能應用來創造汽車的 3D 模型,將所合成的資料應用來訓練車輛自動駕駛,模擬車子在 3D 世界中自動駕駛的能力,進行道路測試,提高自動駕駛的安全性,並降低風險。

自然科學

在醫療保健產業,生成式 AI 能開發新的藥物,並幫助醫療從業人員做醫學研究、醫學成像、醫學編碼…等任務,或是基因分析等研究。

在氣象產業中,可以用來預測天氣、預測災害,幫助大眾創造更安全的環境,預先做好準備。

娛樂產業

整個娛樂產業都能透過生成式 AI 來發想創意,從電玩遊戲、動畫、 AR 、 VR …等,創作者都能用生成式 AI 來一同協作,補足創造力和工作能力。

什麼是生成式 AI - 生成式 AI 應用場景

生成式 AI 的好處

文章裡提到了非常多生成式 AI 的運用,到底使用生成式 AI 有什麼好處呢?

創建多樣化的內容

透過生成式 AI 能基於原創的內容創建新的內容,像是圖片、影片、文字…等內容,對藝術創作、設計開發等相關領域有非常大的影響,能發想更多元的內容,提供了無限的可能性。

提高 AI 系統效率

生成式 AI 能用來提高現有人工智慧的效率,在生成式 AI 的合成資料這項功能裡,能用來訓練和評估這些人工智慧的模型,像是自然語言模型、電腦視覺…等模型。在數據缺乏的情況下,也能擴展既有的資料。

以新的方式探討數據

同樣的人去分析數據,可能會因為既有的偏見,造成沒辦法對數據做適當的分析,透過生成式 AI 能以不同的角度、不同的分析方法,來看出原始數據帶來的趨勢。

任務自動化

由於生成式 AI 能應用在圖片生成、文字生成、音樂生成…等任務,因此我們能透過 AI 來幫助攻做的自動化和加速各種任務流程,提高工作的效率,並節省時間和資源。

什麼是生成式 AI - 生成式 AI 好處
Photo by BoliviaInteligente on Unsplash

生成式 AI 的挑戰

當然,如果你要使用生成式 AI ,也會遇到一些挑戰,這些挑戰包括:

基礎設施的規模

生成式人工智慧具有將近十億的參數,如果要將這些參數進行訓練,就需要投入大量的資本、專業技術,還有必須配備基本的運算基礎設施。

如果你需要用擴散模型就會需要數百萬張、或數十億張圖像來做訓練,因此業者就要採購許多 GPU 來訓練他們的模型。

取樣的速度

會有越來越多資料輸入到系統裡面做運算,因此生成的規模會越來越大,所以生成的時間可能會越來越久,會存在著延遲的問題。

尤其像是聊天機器人、人工智慧語音助理、或是客服類的應用程式,這些回覆都需要精準的做回覆,因此為了優化回覆的內容,要創建高品質的樣本,採樣的速度也會變慢。

缺乏高品質數據

每天都會有大量的數據產生,但是這些數據不一定適合應用在人工智慧的訓練模型裡。

如果需要用在模型的訓練,需要有高品質、中立且沒有偏見的數據才能用來訓練模型,因此不只要大量的數據,還需要篩選這些數據,挑選精準的數據才行。

資料來源授權

當要收集這些數據時,需要經過授權取用來源數據,不過這也涉及到對方是否會願意讓我們收集數據,因此也會難以收集到高品質的數據,要避免侵犯到了智慧財產權。

什麼是生成式 AI - 生成式 AI 的挑戰
Photo by Emiliano Vittoriosi on Unsplash

機器學習、深度學習、生成式 AI 比較

在這裡為大家整理一下機器學習、深度學習、生成式 AI 的不同,希望能幫大家理解這三種的差異性。

項目

機器學習

深度學習

生成式 AI

特徵

通常需要人工設計和選擇特徵

通常通過神經網絡自動學習和提取特徵

通常通過生成模型自動生成數據或內容

模型結構

基於統計方法或其他機器學習算法的模型

基於深度神經網絡的模型

Diffusion Models 、GAN)、VAE 等

計算資源

對計算資源的要求通常較低

通常需要更多的計算資源,如大量的數據和計算能力

要求的計算資源視具體模型和任務而定

應用範圍

適用於各種機器學習任務,包括監督和非監督學習

在圖像識別、語音識別等方面取得了卓越的成就

主要用於生成圖像、文本、音訊等

知名算法

支持向量機、決策樹、隨機森林等

卷積神經網絡(CNN)、循環神經網絡(RNN)等

生成對抗網絡(GAN)、變分自編碼器(VAE)等

結論

不知道你是不是已經開始使用生成式 AI 的服務呢?這篇文章帶大家來了解什麼是生成式 AI,相信現在這項技術已經慢慢地滲透到你我的生活當中,我覺得不要害怕去使用 AI ,擔心 AI 會取代人類,我們應該把這項工具當成自己工作的利器,增加創意的多樣性。

延伸閱讀:
樂高汽車 AI 圖製作教學,客製化專屬自己的樂高汽車圖
Samsung S24 AI 手機,7 大 AI 功能開啟 AI 手機新世代
LINE AI Mini Me 功能,用 AI 一次創造出 50 張 Q 版的大頭貼

Leave a Comment

Your email address will not be published. Required fields are marked *

Scroll to Top