FESTO技術熱點人工智能識別
“Siri,今天天氣怎么樣?”“好的,Google,把音樂調小點!”“Alexa,再幫我訂一雙那款藍色運動鞋!”這些聽從于語言的技術化身為語音助手,早已成為我們日常生活的一部分。語音控制之所以能順暢工作,要得益于其背后運行著的復雜的軟件程序。若要正確解讀所發出的指令,眾多準備工作、高性能計算機、以及人工智能均*。
人腦可以不費吹灰之力地解讀一個簡單的要求、一條短句。也就是說,人腦可以建立起邏輯關聯,并相應地作出反應。但這對機器而言要復雜百倍。若想通過語音去控制技術設備,必須經歷若干步驟。
識別與解讀語音
“給我一支鉛筆!”這樣一句簡單的指令,背后的計算機處理流程卻十分復雜。首先,要將發出的語音指令轉換為文本。只有借助頻率模板,語言識別軟件才能確定指令中包含哪些詞語,并克服諸多挑戰:譬如模糊的發音,同音異義詞,不同的音調或方言。浩瀚的數據庫中儲存了大量的雙關語及其頻率模板,通過與數據庫進行比對,軟件能夠判斷當前出現的是哪些詞。
下一步是推斷句義。為此,軟件要將文本發送至語言界面,界面會根據特定關鍵詞來審核文本。在準備階段,程序員必須確定并定義所有重要的概念與指令——即所謂的目的——以及它們的近義詞,以應對每一次不確定的任務。例如發出“給”這個指令時,對應的是將一個物體傳送至某個具體的位置。
“我”一詞則被理解為某個人、或某個行為的目的。
人工智能可以找到*解
當語言界面識別出句義時,將會出現一個所謂的環境對象:借助一個軟件代碼可以實現對設備的操控。為了給機器下達一個無歧義的命令,需要使用另一個軟件所配備的“人工智能”技術。人工智能可以分析語境對象的內容,并同時通過不同的傳感器收集關于設備位置與環境的信息。軟件中包含許多針對不同解決途徑所設置的模塊,它們分別對應某種的行為。綜合所有信息,程序將建立一個指令,例如抓臂該如何運動以及往哪個方向運動,然后將指令發送給設備操控系統。傳感技術能夠識別鉛筆在書桌的哪個位置,以及機器要采取何種路線才能拿起它,并將之遞給某個人。此外,軟件還能逐漸學習哪條解決路徑對當前行為而言是*解,并在下一次處理這一行為時運用這個知識。
以上所有復雜的流程必須在轉瞬間進行,因為人希望機器能夠作出迅速且必須正確的反應。經過三十余年的應用,語音識別在一定程度上能夠運行得當。但在我們能與機器像與鄰居一般自如流暢地交流之前,還需要對機器的語音控制展開眾多研究與發展。
至于費斯托公司如何在仿生學習網絡的一項全新設計中運用語音控制技術,這一謎底將在2018年的漢諾威博覽會上揭曉。敬請期待!
FESTO氣缸、 費斯托電磁閥、 FESTO減壓閥 、 FESTO傳感器