梅賽德斯-賓士 Linguatronic 系統說明
車載語音辨識和語音操作命令控制系統旨在讓駕駛員通過正常說話來訪問常見的導航功能,如今許多汽車都配備了車載語音辨識和語音操作命令與控制系統。然而,梅賽德斯-賓士是第一個在市場上引入這種系統的汽車品牌,早在 1996 年的 S-Klasse 中,即 Linguatronic。
從那時起,該產品經歷了幾次變化,並已擴展到其他品牌,反映了梅賽德斯-賓士的理念,即每個人都應該部署安全增強技術。這種系統對道路安全做出了重大貢獻,因為駕駛員不再被迫將手從方向盤上移開來操作汽車電話或設備,並且可以更好地專注於交通。
簡短的歷史
第一代語音對話 Linguatronic 系統僅用於汽車手機的語音操作,包括號碼撥號和存儲、使用者定義的電話簿條目名稱、姓名撥號和目錄編輯。那是因為它只有 30 個與說話者無關的單詞的詞彙表。該系統的第二個版本於 2000 年推出,詞彙量約為 300 個單詞,進一步促進了空調、收音機和 CD 播放器和換尿布機等功能的使用。
目前,最新一代的 Linguatronic 可用於許多其他語言,它集成了導航系統,並且已被程式設計為識別僅在德國就大約 80,000 個城鎮和 470,000 個街道名稱。因此,如果第一代系統只需要記憶體為512 KB的處理器,那麼當前的系統需要超過10 MB。
發展
負責使 Linguatronic 運行的基本演算法的是位於德國烏爾姆的戴姆勒-克萊斯勒研究和技術中心的語音理解小組。它們由戴姆勒-克萊斯勒 TEMIC 部門的語音處理部門進一步投入到產品中。這些產品僅由梅賽德斯-賓士品牌銷售,並且只有在一段時間后才能提供給其他品牌和製造商。例如,BMW 和 Audi 也採用了 TEMIC 的語音技術。
科技
在駕駛員與 Linguatronic 之間的簡短對話中,聲音信號被數位化,轉換為頻率範圍,最後進行分析。在幾毫秒內,計算機從語音信號中提取各種特徵,即語言的最小聲音成分。基於這些元件,控制系統能夠檢測到發音中最細微的差別並識別單詞。此外,德國工程師還插入了一項特殊的背景雜訊抑制功能,即使在更高的速度下也能很好地識別語音命令。這意味著 Linguatronic 甚至可以在 Cabriolet 或 Roadster 車型的車頂打開時工作。當然,它在更高的速度方面確實存在一些問題。
特性
對於最新版本的 Linguatronic,梅賽德斯-賓士試圖讓它理解駕駛員說的每一個字,無論性別如何,因為每個人都有自己的發音、語氣和個人說話節奏。由於該系統旨在發起互動對話並與駕駛員交流,因此該系統還配備了“培訓后”功能,允許駕駛員根據他/她的聲音和語調單獨調整語音識別。
為了達到這一點,梅賽德斯-賓士與專業的男女揚聲器簽訂了合同。對於每種語言,我們花了 3 天時間將寫在大約 100 頁手稿上的單詞、短語、數位序列和名稱記錄下來,作為路線引導和語音操作對話的基礎。所有 take 都已單獨保存和編碼。在此過程中,揚聲器必須始終使用相同的語調,以便在系統制定回應時獲得自然的聲音。
根據梅賽德斯-賓士專家的說法,汽車服從駕駛員的命令與用於路線引導的語言信息之間存在差異。在與司機互動和給他們指路時,他們主要使用女性聲音,唯一的例外是土耳其,據報導,土耳其的司機更喜歡從男性聲音接收路線。
Linguatronic 不僅在輸入目的地時能理解所有城鎮和街道名稱,而且在選擇廣播電臺或從手機議程中選擇名稱時也能理解整個單詞。當駕駛員說出目的地時,系統會在其電子記憶體中搜索相關結果。如果有類似的結果可用,則顯示幕將顯示一個選擇。