2014年11月19日 星期三

Google讓電腦更「了解」照片內容

聯合新聞網/記者楊又肇/報導

Google計畫應用圖像識別技術,配合人工智慧識別等技術,讓電腦系統能自動識別照片影像內容,並且透過認知系統為照片加上相關文字描述,進一步應用將可配合文字轉語音等技術,協助視障者了解影像內容,或應用在人工智慧與機械學習。而相關技術應用,史丹佛大學也已經投入研發內容。


Screen Shot 2014-11-17 at 2.11.11 PM_resize


根據


目前此項技術仍處於前期測試階段,暫時還無法完全正確做出精準描述內容,史丹佛大學方面也已經投入相關研發內容,預期未來將能進一步協助視障者使用電腦操作服務等應用,甚至也能進一步應用在人工智慧記憶或機械學習等範圍,或是協助更精準的圖像搜尋比對。


相關技術主要建立在影像內容分析,並且讓系統清楚識別影像中主要物件、相對位置、互動關連,以及可能代表含意等,同時目前分析影像來源包含Pascal、Flickr8k、Flickr30k與SBU等開放影像資料庫內容,讓系統能藉由大量影像數據學習如何正確識別物件,並且配合在地語言轉換成最佳文字描述內容。


image01


螢幕快照 2014-11-19 下午12.00.05_resize


※相關連結》


‧A picture is worth a thousand (coherent) words: building a natural description of images (Google研究官方部落格)







via UDN數位資訊

沒有留言:

張貼留言