【速報:世界首創】NTT成功透過高速攝影機和AI使「聲音可視化」,透過深度學習及光探測邁向「聲音的數位孿生」

日本電信電話株式会社(NTT)開發了一種利用高速攝影機、雷射光和AI的聲音可視化技術。利用獨特的深度學習模型對噪音進行消除,從而能高精度地捕捉音場,進一步理解音響設備的設計和對聲音相關的現象,有望實現「聲音的數位孿生」。可應用於噪音評估、新型音響裝置開發及傳統技術的高效化。

聲音是空氣壓力變動形成的波,由於聲音不像水面上的波紋能直接觀察,還會伴隨反射和繞射現象,所以要掌握聲音是如何產生及傳播是很困難的。而NTT這套「光學音場成像」技術,光學音場成像是一種技術,通過使用將不可見的聲音轉換為光亮度的特殊成像裝置,可以像拍攝照片一樣記錄某一瞬間聲波的形狀。與一般用於測量聲音空間特性的麥克風陣列相比,光學音場成像具有約100倍的空間解析度,使音波的傳播可視化。然而,此光學音場成像技術容易受光學噪音影響,因此NTT將之搭配新開發的獨特深度學習模型來從動態影像中去除不必要的噪音。

在NTT近年致力於無限光通訊的IOWN構想中,NTT希望未來能將空間中的聲音數位化加以活用,為所有人創造更加舒適的聲音環境。

 

資料來源:RobotStart新聞(2024-06-17)

來源/出處

0 回復

發表評論

Want to join the discussion?
Feel free to contribute!

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *