3c資訊: Google讓電腦更「了解」照片內容

2014年11月19日星期三

Google讓電腦更「了解」照片內容

【聯合新聞網／記者楊又肇／報導】

Google計畫應用圖像識別技術，配合人工智慧識別等技術，讓電腦系統能自動識別照片影像內容，並且透過認知系統為照片加上相關文字描述，進一步應用將可配合文字轉語音等技術，協助視障者了解影像內容，或應用在人工智慧與機械學習。而相關技術應用，史丹佛大學也已經投入研發內容。

根據

目前此項技術仍處於前期測試階段，暫時還無法完全正確做出精準描述內容，史丹佛大學方面也已經投入相關研發內容，預期未來將能進一步協助視障者使用電腦操作服務等應用，甚至也能進一步應用在人工智慧記憶或機械學習等範圍，或是協助更精準的圖像搜尋比對。

相關技術主要建立在影像內容分析，並且讓系統清楚識別影像中主要物件、相對位置、互動關連，以及可能代表含意等，同時目前分析影像來源包含Pascal、Flickr8k、Flickr30k與SBU等開放影像資料庫內容，讓系統能藉由大量影像數據學習如何正確識別物件，並且配合在地語言轉換成最佳文字描述內容。

※相關連結》

‧A picture is worth a thousand (coherent) words: building a natural description of images (Google研究官方部落格)

via UDN數位資訊

沒有留言:

張貼留言

訂閱：張貼留言 (Atom)