但實際上,人類之間的語音交互都會拉開一定距離。所以,現(xiàn)在我們開始需要機器適應人類的遠場語音交互。
機器適應人類,這可以說是計算機技術(shù)的一個巨大進步,也是人工智能得以實現(xiàn)的核心要素之一。
這并非聲學領(lǐng)域特有的問題,當汽車安裝攝像頭和雷達,以及自行車安裝 GPS 時,場景變化帶來的技術(shù)挑戰(zhàn)才會凸顯出來,因為真實場景所需要的技術(shù)并非是簡單升級而是顛覆性創(chuàng)新。這也是當前技術(shù)型創(chuàng)業(yè)公司被青睞的主要原因。
然而,單一傳感方式所帶來的影響總是有限,不足以推動整個技術(shù)和社會的變革。例如,麥克風陣列可以采集人類自然對話的語音信息,從而逐漸演化、理解人類語言。這意味著將來機器可以讀懂我們的思想,十分可怕。但這種理解其實還比較片面,缺乏圖像、位置等其他傳感信息的支持。
從這個層面來說,人工智能必須融合多種傳感方式,而非局限于聲、光、電、熱、力、磁,再加上強大的計算和存儲能力,才能在某些領(lǐng)域超越人類,從而看懂世界,推動更多新商業(yè)模式的誕生。
當機器獲取的融合數(shù)據(jù)足以覆蓋人類產(chǎn)生的數(shù)據(jù)的十分之一時,大多時候,人類只需要說一說、看一看或者想一想,機器就能捕捉到背后的思想。
未來到底會產(chǎn)生哪些新的商業(yè)模式,我們尚不可知。但有一點可以肯定,廣告模式肯定不是人工智能時代的商業(yè)模式