下班后嘈雜的辦公室,當月底‘窮困潦倒’的你還在糾結外賣是吃套餐A還是套餐B的時候,突然十米開外的同事大喊一聲“發工資啦”。你果斷地在原本就已經選好的套餐上又加了一個雞腿。
同樣的,在嘈雜的餐廳,我們總能清晰地聽到有人叫自己的名字,并根據聲音判斷發聲的方位。而相比目前市面上的智能語音系統,除了識別精度之外,甚至常常無法收音,其核心原因是什么呢?

為什么人的聽覺會有選擇性?
相信大家都會有這樣的經歷。睡著后,一夜的暴風閃電、大雨傾盆,并不能影響到我們。反而吵醒我們的可能只是輕微的手機鈴聲。而我們常把這種情況稱為“雞尾酒會效應”。“雞尾酒會效應”在聲學中是指人耳的掩蔽效應。在雞尾酒會嘈雜的人群中盡管周圍噪聲很大,兩人依舊可以順利交談,仿佛聽不到談話內容以外的各種噪音,因為自身已經把各自的關注重點(這就是注意的選擇性)放在談話主題上了。
因為當人的注意力集中于某一事物時,意識會將一些無關的聲音刺激排除在外,而無意識卻在始終監察著外界的刺激,一旦有一些與自己有關的特殊刺激,就能立即引起注意。該效應實際上是聽覺系統的一種適應能力。
簡單來說,在聽任何聲音時,大腦都會提前進行某種程度的判斷,然后再決定聽或者不聽。

智能語音設備如何精準收音?
而說到智能語音識別技術,最早還要追溯到上世紀50年代。彼時的AT&T貝爾實驗室開發的Audrey語音識別系統已經能夠識別10個英文數字,但實際使用效果并不好。
隨著時代的發展,直到近些年,在引入深度學習之后語音識別準確率才得以快速提升。如今,語音識別的正確率已經接近甚至部分超過了人類。比如,2017年,IBM、微軟相繼宣稱自家產品的語音識別錯誤率接近了人類,人類的語音識別錯誤率大約為5.1%,而百度更是通過像百度大腦中語音語義一體化這樣的技術,把語音識別錯誤率控制在了3%左右。
此時現代汽車找上了行業大佬“百度”,強強聯合打造了智能網聯平臺,便于提升用戶的用車體驗。而當下,第十代索納塔雙12.3英寸超大智慧連體雙屏顯示系統中搭載的第三代智能網聯平臺就是現代汽車與百度兩大技術公司深度合作后的最新產物。

這款全新的第三代智能網聯平臺將根據使用場景將語音識別分為“封閉域識別”和“開放域識別”兩大類。
封閉域識別,特定情況下的固定語境。顧名思義,系統將識別范圍圈定為預先確定的詞/句??梢岳斫鉃閺娀娴穆犛X敏感。當乘客說到“你好,北京現代”或“小度小度”時,系統將及時捕捉,并同步開啟系統與乘客語言對話。除了系統開啟語言外,系統中還加入了“我困了”、“抽根煙”等常用詞匯。當收到特定詞匯時,系統將根據指令智能進行天窗、車窗及音樂系統的相關操作,更好的幫助乘客解決當下問題。
開放域識別,乘客放開了說,啥都接得住。得益于百度的智能加持,第十代索納塔搭載的第三代智能網聯平臺,擁有了更加平順的智能語言交互系統。無論是讓系統幫助操作車內、家里的智能設備,還是聊天段子日常交流,系統全都不在話下。同時智能AI的加入,也讓系統不僅能聽懂話,更能聽懂你。

無處不在的小心機 隱藏在車內12.6°的哲學
除了高智能的系統加持外,第十代索納塔也將物理領域中人機工程學原理發揮到了極致。相較于行業內漂亮的“大直屏”,第十代索納塔引以為傲的雙12.3英寸超大智慧連體雙屏顯示系統竟然是“彎”的。

所以,是因為廠家做工失誤導致的屏幕折疊?又或是技術限制,車內空間利用率不夠?當然不是,這12.6°的折疊屏里折疊著北京現代不少的小心思。
一定的偏折角,讓語音對話更好“聽”。雖說是有了百度智能語音的加持,但為了進一步提高系統的收聲率,一定角度的折角將發揮出它的最大功效。通過多次實際場景的實驗,12.6°的折角將使收聲效率和使用舒適度達到極佳的平衡狀態。
一定的偏折角,讓智慧雙屏更好用??赡苡行┹^真的讀者會糾結,是不是再將偏折率提高一些,效果會更加明顯呢。答案是肯定的。但是更大的折角意味著將會犧牲副駕駛者的使用好感度,使整體評分下降。同時大屏偏向駕駛者一定的角度,將在減少右側陽光直射大屏帶來的反光的同時,讓駕駛者更好地使用。

看似稀松平常的設計,卻飽含著北京現代不尋常的“小心機”。這些極力貼合人機工程學的設計,正是北京現代“以客戶為中心”的品牌理念落地。而這款“有溫度”的第十代索納塔,也將帶著全村人的希望,在本就競爭激烈的B級車市場上開辟出新的天地。