在智能手機時代,圖像識別、人臉識別一直是人工智能和機器學習領域的熱點技術,這些技術也給手機用戶帶來了非常實用的功能。據外媒最新消息,在日前的一個云計算技術大會上,谷歌對外展示了一個新技術:可以識別視頻中的物體和內容,這也是機器學習研究的重大新成果。
過去,諸多公司已經能夠利用人工智能技術,對于圖片文件中的人臉或物體進行識別,比如Facebook公司就推出了人臉識別,從而搜尋出含有自己面孔的好友照片,或是對手機拍攝的海量照片進行分類管理。據美國科技新聞網站TheVerge報道,日前谷歌舉行了云計算相關的一個大會,在大會上,谷歌負責人工智能和機器學習研究的負責人李飛飛女士,介紹了谷歌人工智能研究的新成果,以及可以供外部開發者利用的新接口等。
李飛飛在大會上展示了“視頻智能API”。通過這一技術,谷歌能夠識別視頻當中的各種動物、物體、風景等內容。比如在一個演示中,谷歌很快識別出視頻中出現了一條達克斯狗。
在另外一個視頻搜索演示中,用戶搜索“沙灘”,則谷歌列出了所有含有沙灘風景的視頻內容。
從功能上,這些識別技術和過去的圖像識別、人臉識別存在相似之處,不過谷歌已經把識別提升到了視頻的新領域。
據報道,視頻識別依然是一個新技術。目前許多互聯網公司無法識別視頻內容,要求用戶在上傳時提供諸多的標簽,從而利用標簽作為搜索依據。未來,和圖片文件的標簽一樣,視頻的標簽將成為一種落后技術。
過去,谷歌已經把許多機器學習的技術及時變成了軟件開發接口,讓開發者應用到自己的軟件產品中。據悉,谷歌也正在把上述的視頻內容識別變成接口,對外開放。
視頻識別將具有重大的應用場景,比如在安全、打擊恐怖主義等領域,政府或者警方可以對視頻畫面進行實時的監控和分析,快速抓捕恐怖分子。
另外,寬帶的發展已經讓互聯網進入了網絡視頻時代,短視頻、視頻直播等新應用不斷出現,但是與此同時,視頻搜索的長期落后,成為行業的一個短板。不少消費者已經發現,在一些搜索引擎的視頻搜索服務中,出現了準確率太低的現象,主要原因是搜索企業對于視頻內容完全無法識別,他們只能根據視頻周邊的文字內容、視頻標題等附加信息進行搜索,這導致差錯率大大提高,也影響了用戶發現更多精彩的視頻內容。
值得一提的是,在人工智能、機器學習和圖像識別方面,谷歌和Facebook展開了一場軍備競賽。在去年的一次開發大會上,Facebook相關團隊負責人也曾經表示,Facebook已經具備了成熟的圖像識別技術,目前正在進行視頻識別的研究,希望能夠盡早識別出視頻中的人臉,方便搜索好友之間發送的大量視頻。