語音 AI 從聊天走向企業服務,關鍵在流程與責任設計

| |

最近 OpenAI 在 API 中推出三款即時語音模型,分別能做到即時語音推理、把 70 多種輸入語言翻譯成 13 種輸出語言,以及能夠即時語音轉文字。從表面上看,這次更新像是 OpenAI 讓 AI 更會「聽」也更會「說」。但這會帶給我們的影響不只是聲音變得更自然,還有語音 AI 開始有機會從「回答問題」走向「協助完成任務」。
換句話說,未來的語音 AI 不只是接電話、回答 FAQ、幫顧客轉接人員。它還可能在對話過程中理解顧客需求、查詢後台資料、翻譯語言、留下紀錄,甚至在授權範圍內協助處理訂單、預約、工單或服務變更。
不過,這不代表客服中心很快就會被 AI 接管,也不代表語音 Agent 已經能處理所有高風險服務情境。我們應該要這樣看待:語音 AI 正開始具備進入企業服務流程的條件。但是,對於企業來說,真正考驗的不是 AI 聲音像不像真人,而是企業能不能清楚設計流程、權限、資料、人工覆核與責任邊界。這是一個值得企業與新創關注的訊號。

語音 AI 不只是更會說話,還會開始接近真實服務現場
過去幾年,生成式 AI 多半從文字開始。使用者打字提問,AI 用文字回答。企業也常把 AI 接進客服問答、文件摘要、內部搜尋與知識庫查詢。
文字界面有很多優點。它可以保存、可以修改,也比較容易事後查核。對企業來說,文字紀錄也比較容易管理。
但很多真實的服務場景,就是透過「說話」發生的。
顧客打電話問訂單,旅客想修改行程,病患家屬想確認掛號時間,門市人員需要馬上查庫存,業務剛拜訪完客戶想快速更新 CRM。這些情境如果都要打字,反而不自然,效率也不高。

而語音的價值,就在於它更接近人們原本的溝通方式。
OpenAI 這次推出的三款模型,正好把語音服務拆成幾個不同能力:一個負責即時語音對話與推理,一個負責即時翻譯,一個負責即時轉錄。這代表語音 AI 不再只是「把聊天機器人加上聲音」,而是開始可以被設計成一組被放進工作流程裡的工具。
企業可以依照自己的需求選擇不同起點。客服中心可以先從通話摘要與即時轉錄開始;跨境服務可以先從即時翻譯開始;低風險、高重複的問題,可以讓語音 Agent 先協助查詢與初步處理;若涉及付款、合約、醫療、金融或重大客訴情境者,仍需真人確認。
所以,這三個模型帶給客服中心的變化是,語音開始可以被放進服務流程裡。

從回答問題,升級到協助把事情辦完
過去很多企業雖然有導入語音機器人,但是顧客體驗並不一定理想。常見的情況是:系統聽不懂、一直要求重複、只能照固定選單走,最後還是要轉接真人客服。所以很多人一聽到 AI 客服,第一個反應不是期待而是擔心。而 GPT-Realtime-2 這類即時語音模型想要改善的,就是過去這種「看起來有 AI,但其實只有語音選單」的問題。
根據 OpenAI 文件顯示,GPT-Realtime-2 支援工具呼叫、打斷處理與較長的對話紀錄。路透社的報導也指出,這次 API 發佈讓 OpenAI 的語音能力,從轉錄與聊天,朝向能在即時對話中聆聽、翻譯與採取行動的 AI Agent 方向前進。
這聽起來有點偏技術,但是把它放到日常服務的場景裡,我們就很容易理解。例如,一位旅客打電話說:「我班機延誤了,幫我看今晚住宿能不能改,還有明天接駁車要不要調整。」
傳統語音系統可能只能聽出「改住宿」或「接駁車」幾個關鍵字,然後把電話轉給真人客服。而更進步的語音 AI Agent,則能夠同時理解班機狀態、訂房規則、接駁時間、費用變更、顧客身分與授權範圍。
因此,它要做的不是回答一句話,而是協助處理一整段的客服流程。此外,OpenAI 的官方資料與路透社的報導也都提到,Zillow、Priceline、Deutsche Telekom 等公司已經參與相關測試。其中 Zillow 與 Priceline 比較偏向語音 Agent 與旅遊服務情境,Deutsche Telekom 則測試多語語音互動。不過,這些案例目前比較算是早期測試訊號,而不是代表企業已經大規模部署語音 AI Agent 。
這對企業來說,這個訊號可以反應出一個很實際的問題:在我們的現有服務流程裡,有哪些工作,是依賴人用電話、系統和經驗串接起來,但實際上這些服務是有明確的規則與流程步驟的。因此,客服需求如果需要透過查資料、查看規則、進行跨系統確認,再用口語回覆顧客,那它就可能是語音 AI Agent 開始切入的場景。

客服中心不只是導入 AI,還需要重新分工
語音 AI 最容易被誤解的就是「取代真人客服」。對此,我們建議看待態度是:客服中心會先針對真人與 AI 的分工,進行重新設計。麥肯錫在分析客服中心的人機協作時曾指出,企業要真正改善客服效率與顧客體驗,不能只靠導入 AI,還需要先處理好資料、系統整合、流程破碎與風險管理問題。
外媒有另一篇關於 Agentic AI 與客服體驗的文章也提到,AI 導入客服中心的重點,不光是自動化而已,還有要讓 AI 在合適的流程中協助完成任務。
這個觀點很適合拿回來用在台灣的企業現場。例如,第一線客服人員每天花很多時間處理的,未必都是最複雜的客訴。有時候,最耗力的反而是大量重複性問題、身份確認、資料查詢、紀錄整理、系統切換與通話後做摘要記錄。
雖然這些工作很重要,但卻也很消耗人員的精力。當客服人員被大量例行工作占滿時,就比較難把更多的時間留給真正需要服務的顧客。如果語音 AI 能穩定處理這些低風險、高重複、規則明確的任務,那真人客服的角色就會改變。
此時,客服主管的管理方式,也同樣地會需要跟著改變。過去客服中心常看接通率、平均通話時間、顧客滿意度。未來還可能需要看 AI 處理率、轉人工原因、錯誤類型、知識庫更新速度、人工覆核品質,以及哪些流程根本不適合讓 AI 自動處理。
也就是說,客服人員未來不只是「會用 AI 系統」就好,而是要知道 AI 可能會聽錯、判斷錯誤、漏掉上下文。客服人員也要知道什麼時候該介入、什麼時候要再次確認、什麼時候不能讓 AI 繼續往下處理。

重點不是讓 AI 開口,而是讓它接上流程
語音 AI 最吸睛之處,是它能自然對話。但企業在導入時,最困難的往往不是「AI 能不能說話」,而是「AI 能不能接進後台流程」。如果一個語音 Agent 只會回答 FAQ,它的價值有限。但如果要讓它真正幫顧客把事情辦好,那就必須接進訂單系統、會員資料、庫存、排程、付款、工單、客服紀錄、內部知識庫,有時甚至可能需要連結到第三方服務。
而每多接一個系統,就有可能多出一個問題:誰有權限查資料?哪些資料不能讓 AI 看?AI 可以代替人執行哪些動作?錯誤發生時如何追查?哪些對話必須保存?哪些決定一定要真人確認?
在 OpenAI 的 Voice Agents 文件也有提到,語音 Agent 可以有不同架構。一種是較自然、低延遲的即時語音對語音架構;另一種則是把語音轉文字、進行文字推理、再轉回語音的流程。後者比較適合可預期流程,或需要清楚紀錄與控管的企業場景。
這說明了一件事:企業導入語音 AI,不能只看模型有多強,還要看它能不能被管理、被追蹤、被覆核。這些如果沒有先想清楚,語音 AI 很容易會變成新的風險來源。它可能讓服務看起來更快,但也可能讓錯誤擴散得更快。
尤其是在金融、保險、醫療、電信與公共服務場景,語音對話經常涉及身份、權益、費用、個資與責任歸屬。一旦 AI 誤解顧客意思,或做出超過授權範圍的回應,後果就是不好的服務體驗。
而這也是台灣新創可以切入的機會,這不是說要去做一個通用語音模型,而是去幫特定產業設計語音工作流、建立知識庫、串接內部系統、設計人工覆核機制、做語音紀錄分析,或協助客服中心調整管理指標。這對中小企業來說,可能會是更容易負擔,且能直接套用在特定產業的解決方案。

跨語言服務,可能是台灣更容易先落地的場景
最後,GPT-Realtime-Translate 的出現,也讓跨語言服務,成為另一個值得關注之處。
根據 OpenAI 官方資料,GPT-Realtime-Translate 支援 70 多種輸入語言與 13 種輸出語言,而這類模型最適合用於客服、教育等即時溝通情境。
這代表即時語音翻譯可能不只是會議輔助工具,還有可能逐漸進入前線服務。對企業來說,這會比「打造全自動 AI 客服」更容易先落地。例如,旅遊服務人員可以用即時翻譯協助外國旅客理解行程變更;醫療行政人員可以協助非診斷性的掛號、繳費與流程說明;製造業現場可以在跨國技術支援時降低溝通成本;跨境電商客服也可以更快理解海外顧客的問題。
但這裡仍然有個邊界要注意,只要涉及醫療判斷、法律責任、金融交易或正式承諾,AI 翻譯就不能被當成最後依據。企業還是需要清楚標示 AI 參與,也要在重要節點保留人工確認。否則,語音 AI 帶來的方便,可能會被誤解、誤譯與責任不清而抵消。

不必神話語音 AI,但也不能低估它的價值
這裡有個事實我們要認清,GPT-Realtime-2 的推出,不會讓所有客服中心一夕改變。因為,實際的企業場景仍有很多問題需要處理。對新創而言,這個語言模型推出,帶給我們的啟發是,市場未必是需要一個看起來很炫的語音聊天機器人,而這其中的商機可能是藏在找出哪個產業、哪段流程,最適合優先由語音 AI 協助處理。
對台灣企業而言,導入語音 AI 的第一步,也不是急著把真人客服撤下來,而是先重新理解自己的服務流程。當顧客不再只是打字,而是直接開口要求 AI 幫他處理事情,企業面對的就不只是技術選擇,還有服務責任的重新安排。
對台灣新創與企業來說,語音 AI Agent 的重點,不是聲音像不像真人,而是它能不能在客服流程中做到,把資訊查對、把任務接好、把風險留住,並且在該交給真人處理時,順利返還到客服人員手上。


.

Cover image created with AI
本文依 CC 創用姓名標示 - 非商業性 - 相同方式分享 4.0 國際釋出
Previous

科技創業週報 #531:零售競爭正在從導流,走向「被 AI 正確推薦與完成交易」

發佈留言

Share via
Copy link
Powered by Social Snap