下一篇文章
生成式AI勢改變世界 怎把握新機遇?
每次有新技術冒起之際,最常聽到的猜疑聲音,總是有關該技術的應用層面,例如元宇宙(即虛擬實境VR/擴增實境AR/混合實境MR)概念幾年前大行其道,但最終未能立即改變世界,主要在於硬軟件配套經歷多年發展,仍有致命缺陷(例如因光學難題,令長時間使用頭套十分不舒適),應用場景有限;最近風行的生成式AI(generative AI),是否又是被過分誇大影響力的技術?筆者認為絕非如此,原因在於AI生成內容(AI generated content,AIGC)產品十分成熟,已經切實帶來巨變。
綜觀不同AIGC產品,筆者認為「文生圖」軟件或是最快取替大量工作的產品,此類以Stable Diffusion或Midjourney為首的軟件,可以讓用戶輸入對一幅圖片的文字描述,再由AI生成配合該描述的圖片。以兩個月前發布的Midjourney v5為例,幾分鐘內已可以生成4幅圖片,用戶可調整生成的隨機程度,令4幅圖片變得十分不一樣,而且可以任意調整其風格及比例等細節,再透過微調篩選出的圖片,得出更貼合需求的效果。
「文生圖」可亂真 料取替大量工作
此外,軟件更可把兩幅圖片合成,並生成一幅新圖片(即「圖生圖」),或是把局部細節提交給AI,由AI完成完整的圖片,例如只提供人物的草圖,由AI完成上色等其他細節,十分多元化。最近有報道指,一名藝術家透過微調AI生成的圖片,奪得著名相機品牌舉辦的相片比賽獎項,可見AI的功力已達幾可亂真的境界。
至於受惠的企業,理論上大量企業都可用AI開源節流,改善營運效率。精準地描述的話,每生成一幅圖片,都需要用到AI晶片的強大運算能力,目前而言主要是Nvidia或AMD生產的顯示卡,而由於購買這些晶片十分昂貴,大部分用戶只會租用雲端供應商提供的顯示卡伺服器,例如Amazon的AWS、Microsoft的Azure、Google Cloud等;有能力製造這些晶片的企業亦十分有限,現時不外乎是台積電及三星,若干年後或會包括現正開展先進晶片代工服務的Intel。
「恰巧合格」技術 更易普及應用
當然,目前的「文生圖」AI仍有許多缺陷,例如由於缺乏邏輯能力及世界知識(world knowledge),有時生成的圖片會有細節問題,典型例子如生成人物的手部時,人物會多了或少了幾根手指(目前已很少有此問題);同時,輸入成語或諺語時,生成的圖片與輸入的文字不符等。在這些領域,仍需要設計師運用其美術能力及經驗解決問題,不能依仗AI,有些從業員便因此認為,AI的威脅仍然很小,不足為懼。
然而,改變世界的技術往往並不接近完美,因為領先技術通常成本過高,難以投入商用;通常「恰巧合格」的技術,才會改變世界,重點在於有缺陷,但沒有致命缺陷。早期的個人電腦便是一個好例子,早期的電腦功能有限,主要處理文書工作,但照樣暢銷,原因在於比其要替代的技術利多於弊,而非只有利沒有弊。
助中小企開源節流 增推廣能力
同樣地,雖然專業設計師可以原創出臻至完美的圖片,但很多用戶只要求質量剛好合格的標準化成品,較着重產量及價格,因此完全可以只僱用幾個設計師,在AI的設計上小修小補,而不用招聘大量人手,用更少成本維持同等水準的設計能力;至於對數量龐大的中小企而言,本來就沒有特定人手作美術設計,有「文生圖」AI則如同多了一個外判設計團隊,反而令可調用的美術能力提升,改善這些企業的宣傳推廣能力,因此「文生圖」AI正在快速顛覆設計行業,絕非只是商家自吹自擂的行銷噱頭。
除了可用通用軟件(「文生圖」軟件可以生成不同類型的圖片)加上人工後期調整的方法應用AI,另一方向便是令通用AI得以調用不同的專業工具,解決複雜問題。傳統的大型語言模型(如ChatGPT)將會成為平台工具,以插件(plugin)的形式增強其自身能力。
OpenAI最近已宣布,ChatGPT的付費用戶即將可以體驗插件服務,或會令新一代的「超級App」出現。插件是指容許ChatGPT調用其他程式的API,用戶可以自行選擇ChatGPT可存取的插件,當ChatGPT解決問題時,便可以自行決定使用哪些「被允許可以存取的插件」,例如由於語言模型的數理能力較差,在解決數學問題時,便可以調用Wolfram Alpha(常用於解決數學問題的軟件)此一插件,以得出更準確的答案。
運用插件拓超級App 增用戶黏性
微信一直以來是最接近「超級App」的軟件,原因是在中國要解決的各種問題(例如訂機票),很多時候都可在微信上找到相應的解決方案,令用戶可以一直停留在微信上,形成極高的客戶黏性;ChatGPT插件或會令ChatGPT成為新一代「超級App」,而且是國際版,再依靠向個人用戶收付費訂閱的月費牟利(如目前每月20美金的ChatGPT Plus)。
此外,更可以仿效蘋果App Store或Google Play Store的分成模式,向插件開發商收取分成。具體可行做法之一,是向在ChatGPT上產生的收入,收取固定的分成比例,例如用戶透過ChatGPT訂閱了某些付費軟件,則該軟件開發商分出一部分月費收入予ChatGPT平台。Microsoft作為OpenAI的最大合作夥伴之一,亦將因此獲得大量用戶的流量數據,令其交叉銷售其他產品或推送廣告的能力大增,為Microsoft提供新的增長動能。
「多生多」AI 勢成未來突破關鍵
目前的AI主要還是「一生一」的設計,例如「文生圖」,但人類就是典型的「多生多」設計--人類依靠多種感官輸入理解世界,輸出多種類型的作品,例如文字、圖片、聲音等;運算能力及邏輯能力是限制「多生多」形式AI的關鍵難題之一,但我樂觀認為很快會有解決方案。
當然,「多生多」AI亦將有新類型的缺陷,但就正如人類助手同樣有不同問題(如情緒不好的助手或許會常犯錯),AI亦將在人類協助下逐步成為主角,淘汰更多的人,以及興許會產生其他有限的新機遇(我更傾向認為AI是一種「毀滅性創新」)。不論如何,持續發展應會是不可避免的趨勢,不適應者只能自求多福。
撰文 : 王逸研 易方資本助理基金經理
欄名 : 評論