
10月19日晚,阿里巴巴西溪園區(qū),一場面向全球的實時翻譯直播在東八區(qū)的深夜22點開始了。在西班牙、俄羅斯以及美國等地的消費者如果打開速賣通的直播,可能會驚異地看到自己最熟悉的語言浮現(xiàn)在屏幕上,而將產(chǎn)品賣向全球的中國賣家,在屏幕這端用各自獨具特色的中文順暢地做著介紹。
作為阿里經(jīng)濟體內(nèi)面向全球的跨境電商平臺,速賣通的商品已銷往全球200多個國家和地區(qū),依托達摩院的AI翻譯技術(shù),平臺支持18個語種的文本翻譯。但要具體到直播這個新場景中,語言問題又橫亙在了商家面前。數(shù)據(jù)顯示,速賣通上近九成商家來自中國,而82%的中國商家因為語言困難而放棄跨境直播。
要通過直播一鍵賣全球,必須打破語言障礙。速賣通直播實時翻譯產(chǎn)品負責(zé)人趙文倩介紹,這款技術(shù)產(chǎn)品最初從中譯英實時翻譯直播起步,耗時7個月,于今年5月上線。在8月速賣通的大促中,有九成商家直播間都使用了實時翻譯功能,服務(wù)器做了3次擴容才承載住旺盛的需求熱情。但新的問題出現(xiàn)了:只有約30%的用戶聽得懂英語。于是,60多人的跨國團隊從中譯英起步、耗時兩個月,又攻克了中文到西班牙語、俄羅斯語的直播實時翻譯。

10月19日速賣通全球首場實時翻譯直播,摩托車商家用中文直播,被實時翻譯成英語
俄羅斯、西班牙也是速賣通平臺在全球擁有最多“忠粉”的區(qū)域。而在海外,直播也正在興起。數(shù)據(jù)顯示,過去一年,社交策略助推速賣通用戶增長超過50%。而從中譯英到中譯多,峰值期間,翻譯直播間的購買轉(zhuǎn)化率比無翻譯直播間高300%,更進一步降低了中國商家自播的語言門檻。
“今年黑五前,我們還將上線英文到俄、西、法三種語向的實時翻譯,并實現(xiàn)直播評論區(qū)18種語言的實時翻譯,讓全球用戶越過語言障礙,深度參與直播互動?!壁w文倩透露,未來,全球直播間里所有用戶的語言都將通過中間層翻譯,向主播和用戶進行語向選擇性展示。
在全球化生意中,同傳并不是新鮮事,速賣通為什么不直接調(diào)用服務(wù),而是選擇和達摩院聯(lián)手自研翻譯引擎?這與速賣通平臺上的產(chǎn)品以及直播場景的特性都有關(guān)系。
速賣通上有上億件商品、數(shù)百億個商品相關(guān)的專業(yè)名詞,對品牌、型號、屬性等關(guān)鍵信息,標準模型并沒有特殊處理,新產(chǎn)品上架就會產(chǎn)生新的詞匯翻譯需求;商家、消費者的用語也不一定會遵循語法規(guī)律,有的語言跨越多個國家區(qū)域、同一個詞在不同區(qū)域有多種語義,如zapatillas在西班牙本土、美洲等地表示不同的鞋,在翻譯時需要融入國家、地區(qū)差異特征;直播現(xiàn)場環(huán)境也比較復(fù)雜,通常不會有專門的收音設(shè)備,很難達到同傳的要求。

把這些難題拋給AI,就要用到達摩院的技術(shù)了。速賣通直播實時翻譯技術(shù)負責(zé)人樊楷介紹,通過達摩院自研的語音算法模型,AI可以從嘈雜的環(huán)境中“聽清”直播內(nèi)容,就連口音問題也能解決。
“通過將多領(lǐng)域的知識融入翻譯模型,達摩院自研的AI還能舉一反三,無需重新訓(xùn)練便能快速學(xué)習(xí)不同場景里不斷更迭的專業(yè)名詞?!狈浴拔蚁矚g打籃球”為例,針對這句話,AI需要隨意學(xué)習(xí)訓(xùn)練I like to play basketball、我喜歡打籃球、I like to play 籃球等多種表述,在這個過程中,AI不光能夠高效地掌握簡單的語法規(guī)則,還具備復(fù)制能力,當新詞匯替代“籃球”出現(xiàn)時,能夠很快理解句子的意思。
針對一詞多義的情況,達摩院在算法模型層面對表示法進行迭代,AI可以根據(jù)整個句子,更好地理解和判斷最終應(yīng)該采用哪個翻譯。“我們對目前上線功能的標準是‘可懂’?!壁w文倩介紹,功能上線前,團隊參考了語言學(xué)家以及當?shù)叵M者兩端的意見,拿出一個句子的翻譯,當?shù)厝耸欠衲芸炊?、哪個詞有問題,是判別這項功能的關(guān)鍵。
速賣通和達摩院研發(fā)的AI實時翻譯直播功能也成為阿里面向全球化布局的重要基礎(chǔ)設(shè)施。據(jù)介紹,未來阿里巴巴國際站、Lazada等國際化業(yè)務(wù)可直接調(diào)用國際化直播翻譯中臺支持全球消費場景。依托阿里生態(tài),不少跨境商家也主動提供AI訓(xùn)練學(xué)習(xí)所需的物料,加速了技術(shù)向商業(yè)的進化。
阿里巴巴達摩院翻譯平臺負責(zé)人駱衛(wèi)華舉例,速賣通上一億件商品就有600億個單詞,1人一天大約可以翻譯3000個單詞,全年無休是100萬個單詞,根據(jù)目前中國最大的翻譯公司規(guī)模不超過1000人來計算,一年可翻譯單詞10億個,如果速賣通上的商品信息由人工全部翻譯完,至少需要60年。
“由達摩院新研發(fā)的統(tǒng)一多語言多領(lǐng)域融合模型,可以把上百個語言,以及每個語言的多個領(lǐng)域壓縮到一個神經(jīng)網(wǎng)絡(luò)模型中進行翻譯,且翻譯質(zhì)量不變?!瘪樞l(wèi)華說,目前,達摩院AI翻譯技術(shù)已創(chuàng)下多項業(yè)界第一,日均調(diào)用量超過13億次,累計3000億單詞,可提供214種語言的高質(zhì)量翻譯。
來源:浙江新聞客戶端