一方面,他們與耶魯大學合作基于 Gemma 研發的 Cell2Sentence-Scale 27B (C2S-Scale) 首次預測了一種新的潛在癌癥療法,引發世界廣泛關注。另一方面,他們又更新上線了 Veo 3.1,為用戶帶來了大幅提升的視頻生成能力,參閱報道《剛剛,谷歌 Veo 3.1 迎來重大更新,硬剛 Sora 2》。
再一方面,他們又推出了Coral NPU,可用于構建在低功率設備上持續運行的 AI。具體來說,其可在可穿戴設備上運行小型 Transformer 模型和 LLM,并可通過 IREE 和 TFLM 編譯器支持 TensorFlow、JAX 和 PyTorch。

和前兩個新聞一樣,這也同樣引起了開發者的廣泛熱議。


Coral NPU:一個為邊緣設備打造的全棧開源 AI 平臺
谷歌給 Coral NPU 的定位是「一個全棧、開源的平臺,旨在解決性能、碎片化和隱私這三大核心挑戰,而這些挑戰限制了功能強大、始終在線的 AI 技術在低功耗邊緣設備和可穿戴設備上的應用。」
也就是說,使用 Coral NPU,未來我們有望打造出能在智能手表等設備上本地持續運行的好用 AI,讓智能直接嵌入到用戶的個人環境中。
然而,要做到這一點卻并非易事。谷歌總結了三大方面的挑戰:
- 性能差距:復雜且先進的機器學習模型需要更多的計算資源,這遠超邊緣設備有限的功率、散熱和內存預算。
- 碎片化成本:為多樣化的專有處理器編譯和優化機器學習模型既困難又昂貴,這阻礙了跨設備實現一致的性能。
- 用戶信任缺失:要想真正發揮作用,個人 AI 必須優先保障個人數據和情境的隱私與安全。
而谷歌今天推出的 Coral NPU 基于其最初的 Coral 項目,「可為硬件設計者和機器學習開發者提供了構建下一代私密、高效邊緣 AI 設備所需的工具。」
具體來說,Coral NPU 是與 Google Research 和 Google DeepMind 合作設計的成果,乃是一個 AI 優先的硬件架構,可用于支持下一代超低功耗、始終在線的邊緣 AI。
它提供了統一的開發者體驗,使部署環境感知等應用變得更加容易。它專為在可穿戴設備上實現全天候 AI 而設計,同時能最大限度地減少電池消耗,并且可通過適當配置來適應更高性能的應用場景。
谷歌已經發布了相關文檔和工具,以便開發者和設計者可以立即開始構建。
