開始使用 Google AI Studio
Google AI Studio 是 Google 所推出的整合式 AI 平台,讓使用者不用寫程式就能自己玩 AI,快速體驗 Gemini 模型的強大功能,Google AI Studio 適合新手、設計師和內容創作者,這篇教學會介紹 Google AI Studio 的操作介面和使用基本功能,協助大家掌握 Google AI Studio。
快速導覽:
認識 Google AI Studio
Google AI Studio 是一個 Google AI 工具的大集合,可以讓使用者在同一個平台中,充分運用 Google Gemini AI 模型的各種功能,一氣呵成的完成建立、管理到部署 AI 專案的所有流程。
前往 Google AI Studio:https://aistudio.google.com/
Google AI Studio 具有下列的核心能力:
與 Google Drive 整合:
在 Google AI Studio 所上傳、產生或編輯的內容,都會儲存在自己的雲端硬碟 ( Google Drive ) 中。
多模態互動與分析:
Google AI Studio 是一個聊天型 AI 操作台,能夠處理文字輸入、圖片、音訊、影片,以及 PDF 或 CSV 等文件檔案,並透過 Gemini 模型分析上傳的內容。
即時互動與指導 ( Stream ):
這是 Google AI Studio 最強大的功能之一,AI 可以和使用者的文字、語音、視訊鏡頭或螢幕共享進行「即時互動」,即時觀看您的電腦操作畫面或攝影鏡頭內容,提供語音或文字指導,例如教學如何使用 Photoshop 移除背景物件。
應用程式開發與程式碼生成 ( Build ):
透過 Build 功能快速開發應用程式或遊戲,只需輸入簡要描述,AI 就能直接產生前端或後端程式碼,使用者還可以將滿意的提示結果轉換成 Python、JS、Kotlin、Swift 等程式碼範例,加速專案整合。
多媒體內容生成 ( Generate Media ):
透過 Nano Banana Imagen、Veo 等模型生成圖像、語音和影片。
Google AI Studio 費用
Google AI Studio 只要有 Google 的帳號就能免費使用,免費方案通常支援 分鐘 60 次請求,對於日常對話和多輪測試非常足夠,除非需要建構非常大規模的應用程式才需要服費,如果是一般使用者,可以使用每個月 650 台幣的基本付費方案 ( 同時也會具有 Google One 2T 的權限 ),如果是開發者也可以根據呼叫 API 的請求數量進行付費。
Google AI Studio 介面與功能介紹
Google AI Studio 的介面主要分為下列幾個核心區域:
左側主要功能選單
- Chat:標準對話模式,用於一般的問答互動。
- Stream:即時互動模式,用於語音、視訊或螢幕共享指導。
- Generate Media:進入多媒體生成(圖像、影片、語音)的入口。
- Build:建立和測試 AI 應用程式,串接 API 或 SDK。
- History:回顧與儲存過去的實驗和對話,可連接到您的 Google Drive。
- API keys:申請金鑰,將 Gemini 的 AI 能力整合到自己的網站或應用程式中。
- Projects:管理產生的應用程式與金鑰。
- Usage & Billing:API 用量和費用資訊。
- Changelog:改版資訊。
- Documentation:API 說明文件。
上方快捷功能列
- Edit Title:編輯對話名稱。
- Temporary chat:開啟臨時對話,不會保存歷史紀錄。
- Show conversation with markdown formatting:使用 markdown 原始格式呈現內容。
- Share:分享目前的對話內容與設定。
- Compare mode:比較不同模型或不同設定下的輸出結果。
- Already in a new chat:新增一個對話。
- Saved to Drive:手動儲存到 Google 雲端硬碟 ( 基本上都是自動存 )。
- Make a copy:複製目前的對話為新的對話。
- Delete:刪除目前的對話。
中央主畫面
- 對話輸入框:輸入提示詞訊息。
- Insert Assets:從 Google Drive、本機、相機或預設圖庫上傳檔案。
- Run:輸入內容後,點擊按鈕開始生成回應。
右側進階設定面板
- Get code:將滿意的提示結果或設定轉換成程式碼片段 ( 如 Python、JS 等 )。
- Model:選擇要使用的 Gemini 模型。
- System Instructions:替 AI 設定整體角色、個性、能力和限制。
- Temperature:控制模型的創意度或隨機性。數值越高,回應越有創意,數值越低,回應越穩定、死板和可重現。
- Top P:取樣參數,用於控制輸出結果的隨機性和多樣性。
- Stop sequence:指定一串字元,當模型生成到該序列時,會立即終止內容的產生。
- Output length:控制模型回覆的最大長度。
範例:Google AI Studio 變成皮卡丘
這個範例會使用 Google AI Studio 右側面板的 System Instructions 功能,創造一個只會「皮卡皮卡」叫的 AI 機器人。開啟右側 System Instructions,輸入下方提示詞:
你是一隻皮卡丘,只會皮卡皮卡的叫!
完成後就可以透過 Chat 功能和 Google AI Studio 聊天,過程中 AI 就只會皮卡皮卡的叫,聊天過程中如果對於回應不滿意,可以點擊 Rerun 按鈕重新產生。
範例:Google AI Studio Stream 即時查看畫面協作
Google AI Studio 的 Stream 功能可以讓 AI 透過攝影鏡頭或螢幕畫面,搭配麥克風與使用者互動,點擊左側 Stream,就可以選擇想要使用哪種互動模式。
如果點擊「Webcam」,就會開啟電腦攝影鏡頭以及麥克風,這時 AI 會即時辨識鏡頭內的景物,下方範例拿了一個史奴比的玩具,搭配語音詢問「這是什麼東西」,AI 就即時辨識出畫面中的東西 ( 好厲害也好恐怖 )。
如果點擊「Share Screen」,就會透過 Chrome 分享螢幕畫面,分享的方式和 Google Meeting 類似,選擇螢幕之後,就可以開始透過語音詢問 AI 這個畫面的問題,例如下方範例搜尋寶可夢的圖片,詢問 AI 是否有單一張皮卡丘的圖片,AI 就即時辨識並告訴我單一張皮卡丘的圖片在哪裡。
範例:Google AI Studio 畫圖
Google AI Studio 的 Generate Media 功能可以讓 AI 透過產生影像、影片或語音,點擊「Try Nano Banana」就可以使用 Nano Banana 的模型開始產生影像。
更多 Google AI Studio 產圖或改圖教學參考:Nano Banana 影像生成、影像合成、影像編輯
輸入下方的提示詞後,點擊「Run」按鈕就可以開始產生圖片。
請按照下方指令幫我產生一張圖:
幾個大人小孩在畫面中間,大家開心的抬頭看著上方的3D 發光發光文字「Google AI Studio」,背景在都市和田野的交界處,鳥瞰視角,3D 精細風格
小結
Google AI Studio 提供了強大的 Gemini AI 核心能力,並以極低的技術門檻呈現在使用者面前。Google AI Studio 不僅僅是一個聊天工具,更像是一個多功能的原型設計和實驗室,可以讓使用者快速的將創意轉化為實際成果,並利用 AI 助理加速工作效率。
意見回饋
如果有任何建議或問題,可傳送「意見表單」給我,謝謝~