
自 2016 年立項(xiàng)至今,時(shí)空壺的翻譯產(chǎn)品已經(jīng)銷往全球 170 多個(gè)國家,幾乎以一己之力定義了「翻譯耳機(jī)」這個(gè)品類。在 AI 翻譯行業(yè)因行業(yè)巨頭到來而「風(fēng)云突變」的 2025 年下半年,雷科技也帶著問題拜訪了時(shí)空壺 CTO 石偉,聊了聊他眼中這場(chǎng)新的翻譯革命。

說起翻譯耳機(jī),其實(shí)很多人對(duì)這個(gè)品類都有誤解。在不少消費(fèi)者眼里,所謂的「翻譯耳機(jī)」不過是一個(gè)可以調(diào)用手機(jī)翻譯 App 的普通藍(lán)牙耳機(jī)。畢竟翻譯的步驟都在手機(jī) App 里處理,只要 App 翻譯夠快就行。
不過在時(shí)空壺看來翻譯耳機(jī)其實(shí)是一個(gè)非常淺層的品類;他們真正想解決的,是人與人交流、理解之間的障礙。簡單來說,翻譯只是信息的轉(zhuǎn)移,交流是情感和語境的傳遞,而理解則是人與人真正建立連接的過程。時(shí)空壺希望用技術(shù)跨越前兩者的界限,讓機(jī)器翻譯最終服務(wù)于人類的理解與共感。
也正因如此,時(shí)空壺選擇了一個(gè)過去大家都未曾留意到的地方,作為重構(gòu)翻譯耳機(jī)品類的落腳點(diǎn)——「聽」,具體來說是讓「翻譯耳機(jī)聽清人說的話」。
戳視頻看
一般來說,只有近距離面對(duì)面翻譯才會(huì)用到翻譯耳機(jī)。而在近距離、面對(duì)面的雙向交流下,讓翻譯耳機(jī)能搞清楚「誰在說什么」,并不是一件簡單的事情:
首先,一般的耳機(jī)只有一路麥克風(fēng)上行信號(hào)、開啟同傳模式需要更新藍(lán)牙耳機(jī)的底層固件;其次,普通的藍(lán)牙耳機(jī)在近距離場(chǎng)景下很難區(qū)分每只耳機(jī)對(duì)應(yīng)的講話人—— A 說話的聲音除了會(huì)被 A 佩戴的耳機(jī)捕捉,同時(shí)也會(huì)被 B 佩戴的耳機(jī)捕捉,并導(dǎo)致翻譯混亂。
在 2021 年發(fā)布的 W3 同傳耳機(jī)中,時(shí)空壺設(shè)計(jì)了一套「矢量降噪技術(shù)」,可以區(qū)分不同的講話人。而在今年 9 月推出的時(shí)空壺 W4 上,時(shí)空壺更進(jìn)一步,拿出了 TWS 中首創(chuàng)的「骨聲紋技術(shù)」。

當(dāng)然,為了保證 W4 收音的質(zhì)量,W4 利用骨聲紋技術(shù)識(shí)別講話人的同時(shí),也會(huì)用氣傳導(dǎo)麥克風(fēng)聯(lián)動(dòng)捕捉說話的聲音。骨聲紋技術(shù)分辨講話人,氣傳導(dǎo)麥克風(fēng)技術(shù)采集說話聲,W4 這套業(yè)內(nèi)首創(chuàng)的翻譯耳機(jī)聲學(xué)方案,讓翻譯耳機(jī)可以「無懼」環(huán)境噪聲,即使在 IFA、CES 那種人聲洶涌的國際展會(huì)中,也能準(zhǔn)確分辨、識(shí)別佩戴者的聲音。
而這樣技術(shù)創(chuàng)新的背后,自然也離不開時(shí)空壺研發(fā)團(tuán)隊(duì)的努力。由于時(shí)空壺 W4 是 TWS 耳機(jī)領(lǐng)域首個(gè)落地骨傳導(dǎo)麥克風(fēng)技術(shù)的產(chǎn)品,時(shí)空壺必須從零開始研發(fā),在這個(gè)沒有前人可以借鑒的「技術(shù)無人區(qū)」,時(shí)空壺結(jié)合骨導(dǎo)與氣導(dǎo)信號(hào),經(jīng)過上萬次測(cè)試、數(shù)十輪樣品驗(yàn)證,才在 W4 上實(shí)現(xiàn)穩(wěn)定量產(chǎn)。
翻譯應(yīng)該像母語一樣自然
解決了「聽」這個(gè)前置條件,我們來談?wù)劮g耳機(jī)的「根」。毫無疑問,翻譯耳機(jī)的核心功能就是「翻譯」——把 A 說的話翻譯成另一種語言,播放給 B 聽,反之亦然。但在時(shí)空壺看來,「翻譯」只不過是翻譯耳機(jī)的表象。
「我們做產(chǎn)品的出發(fā)點(diǎn),并不僅僅是要做一個(gè)翻譯耳機(jī)」,石偉解釋道,「我們實(shí)際上更希望的它是一個(gè)人與人交流的工具」。
有了「交流工具」這個(gè)終極目標(biāo),時(shí)空壺開始對(duì)傳統(tǒng)翻譯設(shè)備的工作模式進(jìn)行了大刀闊斧的改進(jìn):
首先是翻譯的流暢性。傳統(tǒng)的翻譯耳機(jī)受技術(shù)限制,高度依賴云端的翻譯模型。這種云端翻譯模型雖然可以帶來較好的翻譯效果,但高度依賴網(wǎng)絡(luò)傳輸,一旦網(wǎng)絡(luò)信號(hào)波動(dòng),就會(huì)出現(xiàn)斷句。
石偉舉例到:「打電話卡時(shí)候,人們自然就會(huì)知道這是網(wǎng)絡(luò)延遲問題,而在翻譯方面,大部分用戶不會(huì)往網(wǎng)絡(luò)延遲上想,而是會(huì)直接認(rèn)為這就是產(chǎn)品有問題。從品牌角度,我們肯定不會(huì)要求用戶理解我們。」
但這也意味著,時(shí)空壺必須從翻譯的原理入手,用更強(qiáng)的短策大模型來處理翻譯延遲的問題。

但端側(cè)模型并不是時(shí)空壺在「交流」這個(gè)大命題下的唯一解決方案。為了讓跨語言交流能像「母語交流」一樣自然,時(shí)空壺還構(gòu)建了「超能翻譯引擎」系統(tǒng)。
簡單來說,「超能翻譯引擎」集成了行業(yè)內(nèi)最好的翻譯模型,并建立專有評(píng)測(cè)體系,通過真人錄音測(cè)試以確保輸出品質(zhì)。石偉介紹道:「我們會(huì)邀請(qǐng)專業(yè)的真人譯員,由他們和時(shí)空壺一起評(píng)測(cè)翻譯的質(zhì)量。積累出一個(gè)公平、全面的評(píng)測(cè)機(jī)制,再基于這個(gè)機(jī)制去測(cè)試市面上的翻譯模型。」
我們知道,不同翻譯服務(wù)對(duì)不同的翻譯語種有不同的效果,可能某個(gè)公司的模型擅長 AB 語言的翻譯,另一個(gè)公司的模型擅長 CD 語言之間的翻譯。而時(shí)空壺采用的「超能翻譯引擎」,能在不同的翻譯模型之間各取所長,從而打造真正的「母語級(jí)」翻譯。
當(dāng)然了,這并不意味著時(shí)空壺沒有自己的翻譯模型能力。石偉補(bǔ)充道「如果(外界翻譯引擎)沒有我們自己的好,我們集成自己的引擎,自己動(dòng)手優(yōu)化和提升翻譯質(zhì)量。」

比如在實(shí)驗(yàn)室中,時(shí)空壺還打造了「音色跨語種克隆」技術(shù),讓翻譯后的譯文也擁有講話人原始語音中的音色、語氣,讓跨語言交流不再是「機(jī)器替用戶說話」。
在「技術(shù)無人區(qū)」里,
用戶就是唯一的前進(jìn)方向
盡管在訪談中,石偉介紹「骨聲紋」「超能翻譯引擎」「雙向翻譯」等技術(shù)時(shí)有些「輕描淡寫」,但代入到時(shí)空壺的角色后,我們也能看到時(shí)空壺從零開始打造翻譯耳機(jī)品類的艱辛。
2016 年,時(shí)空壺成立。當(dāng)時(shí)整個(gè)翻譯耳機(jī)行業(yè)尚無可參考的成熟模板,技術(shù)、形態(tài)、交互方式都要時(shí)空壺親自去摸索。「時(shí)空壺作為行業(yè)先行者,一直都是在『無人區(qū)』里探索」,石偉說。
在這樣的「技術(shù)無人區(qū)」里,時(shí)空壺沒有數(shù)據(jù)可抄、也沒有競(jìng)品可比,唯一能指引時(shí)空壺不斷前行的,就是時(shí)空壺的用戶。
在此次交流之前,雷科技曾參觀過時(shí)空壺的辦公室。在其研發(fā)區(qū)域,掛著一臺(tái)所有人看見的電視。但電視里放的并不是企業(yè)文化宣傳片,而是「實(shí)時(shí)評(píng)價(jià)」——時(shí)空壺會(huì)在電視上實(shí)時(shí)滾動(dòng)播放全球電商平臺(tái)上關(guān)于自己產(chǎn)品的評(píng)價(jià)。

除了專注線上用戶反饋,時(shí)空壺還會(huì)把團(tuán)隊(duì)帶到真實(shí)的使用現(xiàn)場(chǎng)。「我們會(huì)給研發(fā)同事補(bǔ)助、獎(jiǎng)金,讓他們帶家人去日本、泰國、越南等小語種國家旅游。唯一的要求就是必須親自用自己的產(chǎn)品,去感受時(shí)空壺在真實(shí)的場(chǎng)景里的體驗(yàn)」。
在交流中,石偉也向雷科技分享了一個(gè)受用戶啟發(fā)的案例:
時(shí)空壺原本是一個(gè)純 C 端(面向消費(fèi)者)的產(chǎn)品,但有段時(shí)間,時(shí)空壺發(fā)現(xiàn)很多學(xué)校的老師都會(huì)自費(fèi)購買他們的產(chǎn)品。「同時(shí)到了現(xiàn)場(chǎng),觀察到海外很多 K12 教育機(jī)構(gòu)(幼兒園到 12 年級(jí)的教育階段),除了正常的課堂,還有很多手工課、木工課之類的課程,課堂里面的收音環(huán)境特別的差。正是這些真實(shí)的用戶和場(chǎng)景需求,才讓我們找到了如 W4 這樣的骨傳導(dǎo)抗噪方向。」

可以說,正是來自海量用戶的信任和反饋,讓時(shí)空壺能從 2016 年一路走到今天。也正是這種「洞察用戶、傾聽用戶」的方法論,讓時(shí)空壺能從翻譯耳機(jī)品類中脫穎而出,從「翻譯耳機(jī)品類探索者」成長為「有溫度的科技品牌」。
不做「沒有意義」的競(jìng)爭
當(dāng)然了,時(shí)空壺開辟翻譯耳機(jī)這個(gè)賽道已經(jīng)將近十年了,翻譯耳機(jī)這個(gè)賽道也迎來了不少「新玩家」。但談到不同品牌之間的競(jìng)爭時(shí),石偉的看法卻讓雷科技有些出乎意料。
「競(jìng)爭是一定會(huì)有的,這沒什么意外。」他頓了頓,「但關(guān)鍵是,我們不能讓競(jìng)爭變得無意義。」
石偉認(rèn)為,翻譯耳機(jī)這個(gè)品類還遠(yuǎn)沒到「成熟」的階段。它不像手機(jī)、汽車那樣可以比參數(shù)、拼配置;現(xiàn)在所有玩家都還在摸索體驗(yàn)邊界。「有的品牌想靠價(jià)格戰(zhàn)搶市場(chǎng),但我們更清楚,這個(gè)行業(yè)跑的是馬拉松,不是百米賽。」石偉喜歡用跑步做比喻:「你跑了三公里就開始回頭看別人追上來沒,這種狀態(tài)是跑不遠(yuǎn)的。」
結(jié)合時(shí)空壺在「無人區(qū)」探索的經(jīng)歷,石偉這樣的觀點(diǎn)其實(shí)也很好理解。就當(dāng)前的翻譯設(shè)備市場(chǎng)來說,企業(yè)發(fā)展的難題并不是「競(jìng)爭對(duì)手太多」,而是「行業(yè)、技術(shù)對(duì)交流的覆蓋還不夠深」。
舉個(gè)例子,人與人的交流除了語義,還包括聲調(diào)、眼神、手勢(shì)等多種維度。比如意大利人在說話時(shí),手部動(dòng)作就特別豐富;亞洲人在表達(dá)情緒時(shí),也更常用眼部動(dòng)作。
如果我們將時(shí)空壺看作一個(gè)「翻譯耳機(jī)品牌」,那這個(gè)賽道里不同品牌的競(jìng)爭點(diǎn)無非就是翻譯準(zhǔn)確度、速度。但在時(shí)空壺看來,「翻譯耳機(jī)」只不過是時(shí)空壺基于當(dāng)前消費(fèi)電子技術(shù)現(xiàn)況,選定的最「最佳形態(tài)」而已。如果從「交流工具」的角度看,時(shí)空壺依舊是那個(gè)「沒有對(duì)手、探索未知」的品牌。
讓技術(shù)更有溫度
在石偉看來,時(shí)空壺真正想做的,是讓機(jī)器的語言逐漸「長出人味」,而不僅僅是做一個(gè)快速且沒有感情的翻譯機(jī)器。
「技術(shù)再先進(jìn),也得讓人感受到溫度。」石偉解釋道,「翻譯不是字對(duì)字,而是要把說話的感覺傳過去。」

為了實(shí)現(xiàn)這一目標(biāo),時(shí)空壺作出了大量的努力。得益于大模型的加入,時(shí)空壺的雙向翻譯擁有了對(duì)上下文的理解能力,可以理解對(duì)話場(chǎng)景,并根據(jù)歷史對(duì)話,排除不符合語境的多音字、多義詞分支,獲得更準(zhǔn)確的翻譯效果。
而之前提到的「音色跨語種克隆」技術(shù),也能在翻譯原話的同時(shí),盡可能保留原聲的特點(diǎn)。用石偉的話來說:「我們希望用戶在使用時(shí)不會(huì)覺得這是機(jī)器在幫你,而是有人在理解你。 」
不只是翻譯耳機(jī),還是溝通的橋梁
在 AI 迅猛發(fā)展的時(shí)代,大多數(shù)公司都在追逐更高的模型參數(shù)、更快的響應(yīng)速度。但時(shí)空壺選擇了一條不那么顯眼的路徑——去研究「交流的質(zhì)感」。

End
