谷歌開始反擊 推出AI助手ProjectAstra 正面硬剛GPT-4o

2024-05-15     手機中國

【CNMO科技消息】在備受矚目的谷歌I/O大會上,谷歌揭幕了一款名為Project Astra的通用人工智慧系統,旨在與OpenAI的GPT-4o展開競爭。Project Astra不僅支持實時對話,還能通過視頻聊天的方式與用戶進行交互。大會上,谷歌官方演示了這款系統與AR眼鏡的結合使用,預示著它在日常生活場景中的廣泛應用潛力。儘管目前仍處於原型階段,但谷歌表示計劃在今年晚些時候正式推出。

谷歌DeepMind的執行長兼聯合創始人Demis Hassabis親自展示了Astra模型。這款模型通過智慧型手機的攝像頭捕捉並分析周圍環境,同時與用戶進行流暢的對話。Hassabis強調,他的團隊一直致力於開發能夠融入日常生活的通用人工智慧助手,而Project Astra正是這一努力的成果。

Project Astra的操作介面類似於一款取景器應用程式。在演示中,用戶手持手機,將攝像頭對準辦公室的不同角落,並通過語言與系統進行交互。例如,當用戶發出指令:「當你看到有東西發出聲音時,請告訴我。」Astra能夠迅速識別各種物體、甚至代碼,並與用戶進行實時的語音交流。

Astra之所以能夠實現如此快速的反應,是因為其背後的「Agent」技術。這些Agent能夠連續編碼視頻幀,將視頻和語音輸入整合到事件時間線中,並通過緩存這些信息以實現高效回憶,從而加速信息處理過程。

此外,Demis Hassabis還宣布了另一項創新——AI媒體創作模型Veo。據他介紹,Veo能夠生成高質量的1080p視頻,並且依託於Imagen 3這一最新的文本到圖像框架。儘管這些技術在目前看來或許並非革命性突破,但它們無疑是谷歌在應對OpenAI的Sora視頻模型和Dall-E 3圖像生成器方面的重要策略。

谷歌聲稱,Veo具備對自然語言和視覺語義的深刻理解能力,能夠按照用戶的意願創建任何所需的視頻內容。這些AI生成的視頻可以持續超過一分鐘,並且Veo還能夠理解電影製作和視覺技術的專業概念,如延時拍攝等。隨著Project Astra和Veo等創新技術的推出,谷歌無疑在人工智慧領域邁出了重要的一步。

文章來源: https://twgreatdaily.com/zh-sg/25af2122f7cf266432b7bbd3e1bf2ff6.html