「AI助手」競爭 成AI商業化最大戰場

評論 2023/09/16

分享:

分享:

隨着ChatGPT等大型語言模型(LLM,Large Language Model)面世近1周年,不少人開始質疑AI如何與傳統的商業流程相結合,為公司開源節流。因此,不同公司正在加速推出一系列基於LLM的「AI助手」(AI Agent/AI Copilot),以及相對應的AI助手開發工具。

所謂AI助手,實際上就如同一個專業的人類員工。假設一個手機公司老闆要舉行一場手機發布會,他可能會把這句指令傳達給CEO,然後CEO再將這個複雜的大任務分解成不同的小任務(例:安排場地、設計PPT),再指示各部門繼續將這些任務分解及執行。對老闆而言,理想情況下,應該是下達一個指示,然後幾個月後就得到一場好的發布會。

現AI助手半自動 性能漸提升

在AI助手的語境下,人類同樣是以自然語言(例:英文)下達類似的指令,然後由AI逐步拆解成要執行的步驟。而在以往,則是需要人類軟件工程師以編程語言(例:Python)手把手指導電腦完成不同指令。因此,若然通用型AI助手真的成功面世,不只會大幅減少人類的工作時數(AI完成以前要一大堆人類員工才做得完的事),也能讓更多人以極低學習成本把AI融入到日常工作流程。

現階段最接近商業化的例子,當屬微軟365 Copilot這類為辦公軟件而設的AI助手。其中外的對手,例如谷歌的Duet AI及金山的WPS AI,都可以讓用戶在幾輪對話中,就可以完成Word/Excel/PowerPoint文件的製作。當然,現階段的這些半自動助手不能與真正的AI助手相提並論。

以做PowerPoint為例,人類員工當然可以指示AI寫出投影片的大綱(例:讓ChatGPT以「介紹AI助手」為題,生成20頁PowerPoint的大綱),再讓AI按每頁的題目擴充成一整頁的內容。但在實際操作下,仍需要人類的監督及微調,例如指導AI調整每頁的文字細節(例:第3頁第2個重點需要以更專業的語氣重寫)、或美術設計細節(例:主題風格要更強調科技感)。但總括而言,半自動助手已經足以令完成一份PowerPoint,變成10分鐘解決的小任務。

正如去年11月推出的ChatGPT與現今9月的ChatGPT,在性能上已有重大改善(即使只討論基於GPT-3.5的基礎版ChatGPT),當這些AI助手逐步進入公測流程,自然會優於現時的內部測試版性能。

更懂用戶個人偏好 減「AI幻覺」

一般而言,AI助手包括3個主要部件。第一,當然就是LLM本身,例如ChatGPT。LLM就如同人類大腦,經由Chain of Thought(CoT)甚至Tree of Thought(ToT)等方式,把大問題分解成小工序。

第二個較少人聽聞的重要部件,就是向量數據庫。通常,AI助手的數據庫不是傳統基於完全吻合(exact match)思路設計的關係數據庫(relational database),而是基於相似度思路設計的向量數據庫(vector database)。簡而言之,向量數據庫是真正明白不同文件/圖片/錄音檔案等資料的含意的數據庫。使用傳統數據庫進行資料搜尋時,在輸入一個關鍵字後(例:蘋果),數據庫只會展示所有含有「蘋果」這個字的文件供你參考,即只有和關鍵字「完全吻合」的文件才會被找到。這種找東西的方法有兩個問題。首先,一份文件可以完全不包含關鍵字,但卻可能是你希望找到的文件(例:一份討論十大最有營養水果的文件可以完全不提及蘋果這個字,但卻是你想參考的文件)。

除此之外,也有可能找到一堆關鍵字完全吻合,卻並非你想找到的文件(例:一堆有關「蘋果手機」的文件,但跟作為水果的蘋果不太相關)。

向量數據庫則可以解決這兩個問題。透過用向量模型(embedding model)把不同段落的內容轉化成多維度的向量(multi-dimensional vector),就可以令AI明白不同段落的內容的意思含意,從而找到跟你希望找的東西最相似的文件。對於AI助手而言,向量數據庫亦有兩大好處。

首先,可以減少AI的幻覺(hallucination),即AI會更少回答出似是而非的答案。在沒有向量數據庫加持的情況下,一般的LLM只會根據被用於訓練的資料回答問題,因此對有時效性的問題往往表現較差(例:問哪一代的蘋果手機是最新款,可能會回答出2021年款的手機型號)。而在向量數據庫的加持下,便可以使用RAG(Retrieval Augmented Generation)的技巧,讓LLM在回答問題前,先把問題同步輸入進數據庫,以找出相關的資料(例:數據庫可能有最新2022年款手機的資料),再把找到的最新最準確資料融入到最終的答案中。

其次,AI亦會更懂用戶的個人偏好。假設用戶要求AI訂前往歐洲的機票,AI可以在10間航空公司中任意選一間就正確地完成任務。然而,在有數據庫的長期記憶下,AI會記得過去3次這名用戶都是坐同一間公司的飛機去歐洲,因此在這次訂機票時,更應該繼續訂這間航空公司的機票,令AI提供的結果更貼心。

AI助手的第三個部件,自然是不同可以調用的工具,通常是不同的API(Application Programming Interface)。API是AI助手與不同其他工具用於溝通的通道。

舉例而言,AI助手可以調取用戶的行事曆API來查看用戶的日程安排,或是調用郵件API來閱讀用戶未閱讀的郵件。

在未來,當AI助手有可以在現實中行動的物理軀體,AI可以使用的工具就不僅限於軟件中虛擬的API,而是會包含現實中的工具,例如螺絲刀。在各家軟件巨頭爭相研發自己的AI助手下,或會出現限制對手的AI助手訪問自家軟件API的情況。而相制衡的政府力量亦會出手干預這種反競爭行為,例如歐盟最近開始實施的數碼市場法案(Digital Markets Act),就明令科技巨頭要讓不同公司自由使用軟件,不能針對對手設置不合理的限制。

人機共處模式 顛覆職場生態

總括而言,我認為AI助手將會是一眾AI公司證明AI技術商業化實力的最大戰場。除了上文提到的預製好的AI助手(如:365 Copilot),亦會有供不同公司自行開發AI助手的低/無代碼(low/no code)平台,如谷歌的Vertex AI。此類平台會提供讓公司導入自己的內部資料微調LLM,以及用自然語言編寫AI助手的行為準則等一站式的服務。

屆時,不同公司就可以訓練和部署自家製的AI助手,如在網頁端啟用一個AI銷售助手,用以向初次接觸公司的新潛在客戶介紹不同的商品,並把有較高潛力轉化成付費用戶的客人轉介給人類銷售人員進一步解答問題。這種人機共處的AI Copilot模式將會顛覆現有以人類為主的職場生態,令環球的商業模式迎來巨變。

撰文 : 王逸研 易方資本助理基金經理

欄名 : 評論