不同於B2C零售,C2C平臺賣家從專業二手商,到偶爾清倉的家庭都有。這意味著相同類型商品,名稱、描述、圖片的內容與品質可能完全不同。當C2C平臺巨頭eBay想用站上20億件商品SKU資料,來強化搜尋、推薦、行銷以及整體購物體驗,就得面臨資料品質參差不齊的挑戰。
多年來,他們持續使用不同技術,例如NLP、分類、圖像辨識等各種AI,來改善圖文資料品質和完整性。同時,打造各式各樣輔助C2C商家上架商品的科技,從源頭來提升品質。生成式AI崛起後,他們更把握機會,用於進一步強化商品上架技術。
用生成式AI降低業餘商家上架商品的門檻,從資料來源完善品質
賣家在eBay上架商品時,需要填寫不少欄位。尤其是高稀有度收藏品等,需要附上大量詳細資料的商品,會花費大量填寫時間,經驗較少的商家可能於此階段卡住。2023年年中,eBay就推出二代商品輔助上架功能,背後運用多模態生成式AI技術。
商家上傳商品圖片後,由AI分析圖片細節,結合eBay站上的分類邏輯及後臺商品資料庫,自動生成商品標題、描述、生產日期、分類、建議售價、建議運費等資訊。商家一個字都不用打,即可完成上架,eBay則可以獲得詳細、高品質的商品資料。
2024年,他們陸續推出更多商家用生成式AI功能,包括行動版上架輔助功能、批量上架功能、從自然語言描述來生成商品背景圖片的功能、商品圖片去背功能、社群媒體貼文生成功能等。時至今日,美國、英國、德國超過1,000萬名賣家,使用這些GenAI功能上架數億件商品,帶來數十億美元GMV(平臺交易額)。賣家對這些工具滿意度,更超過90%。
這些商家輔助工具還大幅提升新商家與重新活躍商家的數量。同時,上架流程完成率、平臺商品數量與每次商品上架的平均GMV,都有顯著成長。平均上架費時則顯著下降。不只如此,從源頭提升資料品質,使eBay更容易開發其他大數據應用。
發揮圖像類AI優勢打造多模態GenAI購物體驗,更擁抱AI代理購物潮流
eBay在顧客體驗領域應用生成式AI時,同樣發揮出自身長期耕耘圖像類AI的技術優勢。例如,他們用GenAI強化搜尋功能時,會同時運用圖片及文字資料。他們的生成式AI購物功能,更充分展現出圖像類AI技術長處。
eBay上的互動式服飾購物體驗「Shop the Look」,是一個全新的商品探索模式。系統利用生成式AI從顧客購物歷史分析可能喜好,再生成一系列穿搭範例圖。顧客可以點擊圖片上的不同元件,在eBay站上尋找相似商品。
今年,他們進一步擁抱AI代理購物潮流。年初,eBay宣布與OpenAI合作,開放後者的AI代理Operator能推薦eBay商品,甚至直接代為購買商品。
年中,eBay將代理式AI技術融入自家電商網站中。在顧客購買旅程不同階段,例如搜尋或瀏覽,電商介面會預測可能想知道的訊息,並跳出提示問句。顧客點選後,即能跳轉到聊天介面,與生成式AI購物助手透過自然語言,進行比價、詢問、推薦等對話。
用GenAI強化數位行銷及RMN經營
2024年報中,eBay寫到2025年一大目標是提升自家RMN廣告營收,降低站內站外第三方廣告占比。他們也用GenAI來為支援此策略。
eBay打造出賣家用RMN廣告儀表板,呈現廣告相關表現數據,並用生成式AI與AI來呈現相關分析、建議策略、趨勢洞察等資訊。
每周,他們還用AI生成數以百萬計的個人化電子郵件標題和預覽文字,用於商品推銷、購物車未結帳、商家近況更新等情境,使網站訪問轉換率增加40%以上。
不過,他們也沒放過用GenAI優化外部廣告的機會。投放Google商品列表廣告(Product Listing Ads)時,eBay利用GenAI優化商品標題,還用來檢測低品質商品圖片,替換為高品質的AI生成商品圖。eBay CEO Jamie Iannone表示,這些做法顯著提升廣告品質分數、排名和整體行銷表現,進而帶來更多GMV。
自建3兆Token的專屬LLM,下一步是從超大模型蒸餾出專用小模型以降低成本
除了前述應用,eBay還靠生成式AI強化客戶服務、資訊工程、支付等更多場景。為支援eBay超大規模資料處理及AI應用,他們於2024年大幅升級內部AI開發平臺Kyrlov,更用3兆個Token訓練出專屬的多模態、多語言LLM。
eBay自家AI平臺Kyrlov底層有4個小平臺,特徵平臺(Feature Store)、實驗平臺、訓練平臺及推論平臺。他們鎖定數個訓練平臺及推論平臺的痛點,導入新技術與做法來解決。
首先是專案硬體資源配給問題。過往在訓練平臺與推論平臺開啟新專案時,工程師須先設定固定的專案所需算力及記憶體。專案無法在資源不足時增加硬體,更無法釋出沒用到的資源,導致硬體利用率低。開始大規模發展硬體需求高的生成式AI專案後,此問題尤其顯著。
eBay解法是,改用系統自動配給硬體資源的模式。同時,規定一個GPU可以使用的記憶體上限、強化GPU多工能力、導入傳輸效率更高的資料串流技術,並採用優先級調度(Preemption)做法,讓更高優先度的推論作業,可以搶占低優先度開發作業的硬體資源。這一系列解法,提升2至4倍GPU數據吞吐量。
第二個痛點是CPU與GPU調度彈性。過往,eBay使用GPU節點,只會配置固定數量CPU。當eBay訓練或推論作業中,所需CPU數量大於節點上的GPU,就會降低作業效能,或需要啟用更多節點,但浪費GPU資源。
為增加彈性,他們導入分散式計算框架Ray的Remote CPU功能,得以調度更多外部CPU資源來支援,進而避免啟用更多節點,而導致GPU閒置。導入後,相關作業的GPU利用率提升4倍、單位時間數據吞吐量更提升7倍。
第三個痛點是訓練與推論作業所使用的開發語言不同,模型開發工程師使用Python,推論作業的工程師使用Java。這使他們需要花費高達一半開發時間,進行來回溝通、語言間轉換、邏輯改寫等作業。這次升級,他們將兩種開發流程使用的語言統一為Python,省去前述作業時間,更簡化了運算資源調度及整體作業流程管理。
今年,他們計畫再訓練更大、更成熟的模型。接著,從中蒸餾出多個小模型,根據專門用途微調,再投入實際應用。目前,他們已經在5個核心電商功能實驗,投入規模僅有原本模型1/8的小型模型,卻提升30%精準度,且延遲時間只剩1/10。
