- Makersuite(更名為Google AI Studio):設(shè)計、輕鬆遊玩AI模型的線上IDE平臺,已從原本的PaLM 2模型改成最新的Gemini Pro、Pro Vision模型,其中的Pro Vision模型為支援圖片交流的,大家快來此平臺玩出新火花吧。
- Google Cloud上的Vertex AI平臺:可更完整的控管使用Gemini模型,須付費,但有試用金。
- Vertex AI平臺上的Gemini API使用範例 (Github)
- Gemini API文檔:可使用Python、Node.js、Web、Swift(iOS)、Kotlin(Android)、REST API等方式建構(gòu)開發(fā),使用前記得先在Makersuite(Google AI Studio)平臺取得API Key。
- 價格:
- Gemini Pro、Pro Vision API每分鐘限制60次的呼叫。
- Google AI Studio (免費) vs Google Cloud上的Vertex AI (須建立帳單):
- 由Google於12/06號推出的最強多模態(tài)模型,可處理文字、圖像、視訊、音訊和程式碼等內(nèi)容進行理解並推理。
- Gemini是第一個在MMLU(大規(guī)模多任務(wù)語言理解)方面超越人類專家的模型。
- 明年初將會部署至Google Bard。
- 支援32K的文字脈絡(luò)長度,具備函式呼叫、嵌入、語義檢索、客製化知識基礎(chǔ)及聊天功能。
- 12/07號已部署至Google Bard中,目前僅限英語版。(查看支持的地區(qū))
- 12/08號已部署至新增10多項新功能的新版的AI筆記管理平臺NotebookLM,目前僅支援美國地區(qū)。
- 分為2個版本,分別為 Nano-1(1.8B,18億參數(shù),針對低記憶體裝置)、Nano-2(3.25B,32.5億參數(shù),針對高記憶體裝置)。
- 採用4-bit量化技術(shù)進行部署,改善效能。
- 已向 Google 自家的旗艦 Pixel 8 Pro 開放,以進一步釋放其所用 Tensor G3 晶片的 AI 潛力。
- Gemini Nano在Android行動裝置上。
- Hands-on with Gemini: Interacting with multimodal AI (Youtube)
- 後續(xù)爭議:
- Google坦承影片非真實呈現(xiàn),實際操作時間比影片來得更長,並且操作的過程也不是即時或語音進行,而是靠靜態(tài)圖像與提示操作。
- DeepMind首席副總裁Oriol Vinyals針對影片造假嫌疑的後續(xù)回應(yīng),稱影片中的所有使用者提示和輸出都是真實的,為簡潔起見而進行了縮短,該影片展示了使用 Gemini 構(gòu)建的多模態(tài)用戶體驗是什麼樣子。我們這樣做是為了激勵開發(fā)人員。
- The potential of Gemini (Youtube): 展示科學(xué)、推理、音頻、程式、數(shù)學(xué)與物理方面的能力。
- X(Twitter)
- X(Twitter)
- X(Twitter)
- Gemini相關(guān)公告:
- Blog:
- Introducing Gemini: our largest and most capable AI model
- Learn more about Gemini, our most capable AI model
- It’s time for developers and enterprises to build with Gemini Pro
- Gemini API and more new AI tools for developers and enterprises
- Gemini, Google’s most capable model, is now available on Vertex AI
- Bringing Gemini to organizations everywhere
- X(Twitter):