ETH官方钱包

^{<blockquote id="0clgf"></blockquote>}<ruby id="0clgf"><blockquote id="0clgf"><source id="0clgf"></source></blockquote></ruby>

<style id="0clgf"></style>

<blockquote id="0clgf"></blockquote>

<nav id="0clgf"><strong id="0clgf"></strong></nav>

<bdo id="0clgf"><source id="0clgf"></source></bdo>

前往
大廳

主題

Gemini: 由Google所推出的多模態(tài)AI大模型

這可不是鬧著玩的 | 2023-12-10 13:43:18 | 巴幣 2 | 人氣 530

~~官方開源預(yù)計要等到12/13號(三)~~

(已開放使用！！)

官方API、使用平臺：

Makersuite(更名為Google AI Studio)：設(shè)計、輕鬆遊玩AI模型的線上IDE平臺，已從原本的PaLM 2模型改成最新的Gemini Pro、Pro Vision模型，其中的Pro Vision模型為支援圖片交流的，大家快來此平臺玩出新火花吧。
Google Cloud上的Vertex AI平臺：可更完整的控管使用Gemini模型，須付費，但有試用金。

Vertex AI平臺上的Gemini API使用範例 (Github)

Gemini API 文檔：可使用Python、Node.js、Web、Swift(iOS)、Kotlin(Android)、REST API等方式建構(gòu)開發(fā)，使用前記得先在Makersuite(Google AI Studio)平臺取得API Key。

Gemini API SDK (Github)：

Docs (文檔)
Python
JavaScript
Go
Swift (iOS)
Kotlin (Android)

價格：
Gemini Pro、Pro Vision API每分鐘限制60次的呼叫。
Google AI Studio (免費) vs Google Cloud上的Vertex AI (須建立帳單)：

?? 介紹：

由Google於12/06號推出的最強多模態(tài)模型，可處理文字、圖像、視訊、音訊和程式碼等內(nèi)容進行理解並推理。
Gemini是第一個在MMLU(大規(guī)模多任務(wù)語言理解）方面超越人類專家的模型。

Gemini 官網(wǎng)
Gemini Blog
Gemini Paper

?? Gemini的三種規(guī)模:

1??. Gemini Ultra（最大）: 適用高度複雜任務(wù)，在2024年初會推出給企業(yè)和開發(fā)者使用。

明年初將會部署至Google Bard。

2??. Gemini Pro（中等）: 最靈活通用的模型，12/13會讓開發(fā)者和企業(yè)客戶在Vertex AI和AI Studio等平臺中使用。

支援32K的文字脈絡(luò)長度，具備函式呼叫、嵌入、語義檢索、客製化知識基礎(chǔ)及聊天功能。
12/07號已部署至Google Bard中，目前僅限英語版。（查看支持的地區(qū)）
12/08號已部署至新增10多項新功能的新版的AI筆記管理平臺NotebookLM，目前僅支援美國地區(qū)。

3??. Gemini Nano（最小）: 最有效率且可以部署在手機等終端裝置的模型，12/6起提供給安卓開發(fā)者申請使用，可透過Android AICore建立Gemini為基礎(chǔ)的裝置用應(yīng)用程式。

分為2個版本，分別為 Nano-1（1.8B，18億參數(shù)，針對低記憶體裝置）、Nano-2（3.25B，32.5億參數(shù)，針對高記憶體裝置）。
採用4-bit量化技術(shù)進行部署，改善效能。
已向 Google 自家的旗艦 Pixel 8 Pro 開放，以進一步釋放其所用 Tensor G3 晶片的 AI 潛力。
Gemini Nano在Android行動裝置上。

?? 各基準測試：

? 文字、數(shù)學(xué)、推理、程式碼等方面...

? 圖像、影像、音頻等方面...

? 與其他模型的比較

? Gemini的三種規(guī)模(Nano、Pro、Ultra)互相比較

?? 已部署至Google Bard中(12/07號，目前僅限英語版)：

?? 官方展示Gemini強大的多模態(tài)功能：

Hands-on with Gemini: Interacting with multimodal AI (Youtube)

後續(xù)爭議：

Google坦承影片非真實呈現(xiàn)，實際操作時間比影片來得更長，並且操作的過程也不是即時或語音進行，而是靠靜態(tài)圖像與提示操作。
DeepMind首席副總裁Oriol Vinyals針對影片造假嫌疑的後續(xù)回應(yīng)，稱影片中的所有使用者提示和輸出都是真實的，為簡潔起見而進行了縮短，該影片展示了使用 Gemini 構(gòu)建的多模態(tài)用戶體驗是什麼樣子。我們這樣做是為了激勵開發(fā)人員。

The potential of Gemini (Youtube): 展示科學(xué)、推理、音頻、程式、數(shù)學(xué)與物理方面的能力。

? 與知名科技型Youtuber馬克·羅伯(Mark Rober)合作展示整合至Google Bard的Gemini Pro能力：

Mark Rober takes Bard with Gemini Pro for a test flight (Youtube)

?? 相關(guān)消息：

X(Twitter)
X(Twitter)
X(Twitter)
Gemini相關(guān)公告：

Blog：

Introducing Gemini: our largest and most capable AI model
Learn more about Gemini, our most capable AI model
It’s time for developers and enterprises to build with Gemini Pro
Gemini API and more new AI tools for developers and enterprises
Gemini, Google’s most capable model, is now available on Vertex AI
Bringing Gemini to organizations everywhere

Ｘ(Twitter)：

https://vxtwitter.com/Google/status/1734953733836976466
https://vxtwitter.com/sundarpichai/status/1734952757722001626

不斷更新中...

#Gemini Nano #Gemini Ultra #Gemini Pro #Gemini #AI #Google

1

送禮物贊助創(chuàng)作者 !

0

創(chuàng)作回應(yīng)

這可不是鬧著玩的 a35963596

追蹤創(chuàng)作集

作者相關(guān)創(chuàng)作

作品資料夾

Gemini: 由Google所推出的多模態(tài)AI大模型

Google推出Gemini Pro 1.5版，OpenAI推出影片生成模型Sora，以及...

Google Bard改名為Gemini，並釋出搭載Gemini Ultra 1.0模型的付費版Gemini Advanced服務(wù)以及專屬App

Magika: Google開源基於AI的檔案辨識工具，擁有99%以上的辨識率、毫秒級的速度...

Meta推出LLaMA 3模型，分別有80億、700億參數(shù)，以及7/23推出的4050億Llama 3.1模型

國科會推出TAIDE-LX-7B模型(已推出基於Llama 3的新版本)

3D Gaussian Splatting的JS庫gsplat.js現(xiàn)在支援動態(tài)3D場景渲染

Claude 3：繼Claude 2後的下一代新模型，碾壓GPT-4、Gemini Ultra等模型

FunSearch：DeepMind所推出，能在數(shù)學(xué)、科學(xué)等新舊問題上找到更好最佳解的新技術(shù)

OpenAI DevDay首屆開發(fā)者大會: 釋出GPT-4 Turbo新模型、多種AI應(yīng)用

DragGAN: AI圖像編輯器，可隨意拖動改變對象的姿勢、形狀、表情、佈局等

大型語言模型LLM演化樹及實踐指南

全球資訊網(wǎng)(WWW)今年35歲了

聖誕樹星團NGC2264

A Place In My Heart feat. moumoon - 聽了會讓人十分溫暖又振奮人心的歌

The Crane Wives — Curses

兩個交集的世界...

相關(guān)創(chuàng)作

ChatGPT-4o與Google Gemini 1.5 Flash模型的複雜任務(wù)比較

2

365

ChatGPT-4o vs Google Gemini Pro v1.0：發(fā)車班次異動實測 + 19種職場情境應(yīng)用

2

229

AI如何搶走人類的工作？又有什麼工作是AI無法搶走的？

0

490

職場Ai浪潮來襲，員工如何自救？

2

192

棋類遊戲與上下文推理的關(guān)係

3

771

認識AI工具的三種等級

2

271

[速報]Google Gemini app繁體中文版正式上線啦！

2

836

OpenAi付費的ChatGPT-4 Turbo與Copilo上的ChatGPT-4 Turbo模型有一樣嗎？

0

454

[實測] Claude 3、Google Gemini Pro v1.0、ChatGPT-4 Turbo - 詐騙對話紀錄文本分析測試

2

2479

人工智慧模型的前因後果理解挑戰(zhàn)：以ChatGPT與律師需求為例

3

1336

CES 2024：生成式AI成為主流，領(lǐng)先技術(shù)走向明確方向

0

259

[動眼看] Gemini Pro模型實測：圖片推理分析 + 生成YT影片摘要 + 文件讀取(2024/02/02更新)

1

959

教你如何免費使用GPT4、Claude

0

7

「Ai推理」的標準定義是什麼？

1

242

來聊聊一個很有趣的問題：何謂跨領(lǐng)域?qū)W習？

2

386

Claude 3模型與Google Gemini Pro v1.0模型的視覺推理對決

1

619

Foxford Comics漫畫翻譯-歷史的顏色

19

399

掌握未來工作趨勢：生成式Ai的革命性自動化技術(shù)探析

0

1075

ChatGPT在實際應(yīng)用中的限制：加航ChatBot事件的啟示

0

629

[有雷]以「愛、纏、殺：誰是恐怖情人？」進行ai模型推理測試

0

1040

更多創(chuàng)作

這可不是鬧著玩的 a35963596

追蹤創(chuàng)作集

其他創(chuàng)作

作品資料夾

<var id="bo3ro"></var>

<bdo id="bo3ro"></bdo>

<p id="bo3ro"><strike id="bo3ro"></strike></p>