搜尋

GTP-4o 或 GPT-4o-mini 分析圖片

這篇教學會運用 Poe AI 裡的 OpenAI GPT-4o 和 GPT-4o-mini 機器人,讀取本機圖片或網路上的圖片,進行圖片的分析,進一步撰寫產生類似圖片的提示詞,甚至可以讀取具有圖表的圖片,分析圖表內容轉換成表格呈現。

快速導覽:

Poe 教學 - GTP-4o 或 GPT-4o-mini 分析圖片

認識 GPT-4o 和 GPT-4o-mini

GPT-4o 是 OpenAI 在 2024 年中所推出最強大的語言模型,不僅資料庫更新至 2023 年 10 月,更能讀取網頁和圖片進行分析,而 GPT-4o-mini 雖然屬於 GPT-4o 的小型模型,卻也同樣具備讀取網頁和分析圖片的功能,還具有速度快、費用低、跨平台等優勢,就算參數量不如 GPT-4o,卻更適合一般人使用。

注意,GPT-4o-mini 有時沒辦法順利讀取網頁或圖片,可改換成 Gemini-1.5-Flash。

GPT-4o GPT-4o-mini
每則訊息費用 300 15
讀取網頁 可以 可以
讀取圖片 可以 可以
速度 普通
語意理解與回覆能力 極佳

Official bot 官方機器人裡可以看見 GPT-4o 和 GPT-4o-mini 機器人,由於 GPT-4o 每則訊息費用高達 300,通常直接使用 GPT-4o-mini 就能處理所有問題 ( 如果有進階需求就另當別論 ),點擊機器人就可以開始和機器人聊天。

Poe 教學 - GTP-4o 或 GPT-4o-mini 分析圖片 - GPT-4o 和 GPT-4o-mini 機器人

從機器人資訊中可以看到兩者的消耗的 Poe 代幣差了 20 倍。

Poe 教學 - GTP-4o 或 GPT-4o-mini 分析圖片 - 消耗的 Poe 代幣差了 20 倍

讀取圖片內容

對於一般使用者來說,各種大型語言模型機器人都大同小異,但 GPT-4o 和 GPT-4o-mini 卻能讀取上傳的圖片內容或網路圖片內容,下方範例使用 GPT-4o-mini 機器人,上傳一張「我就讚」的經典迷因圖片,並詢問機器人這張圖片是什麼內容 ( 使用 GPT-4o 也是相同的做法,但因為消耗的 Poe 代幣太高,所以使用 GPT-4o-mini )。

Poe 教學 - GTP-4o 或 GPT-4o-mini 分析圖片 - 上傳一張「我就讚」的經典迷因圖片

初次使用時,有可能會遇到類似下圖,機器人回應「不知道是什麼」的狀況,通常只要改變問句方式就能解決

Poe 教學 - GTP-4o 或 GPT-4o-mini 分析圖片 - 機器人回應「不知道是什麼」

嘗試修改問句的結構,將問題改成「幫我描述這張圖片的主題或場景」,GPT-4o-mini 機器人就會分析圖片並回答,結果也相當準確。

Poe 教學 - GTP-4o 或 GPT-4o-mini 分析圖片 - 修改問句結構

換成寶可夢的動漫角色,GPT-4o-mini 竟然也能精準的描述出正確的名字和構圖。

Poe 教學 - GTP-4o 或 GPT-4o-mini 分析圖片 - 精準的描述出正確的名字和構圖

使用網址讀取圖片

除了使用上傳的功能上傳圖片,由於 GPT-4o-mini 具有讀取網址的功能,也可以直接提供圖片網址,搭配「幫我描述這張圖片的主題或場景」提示詞,讀取圖片內容,範例使用 STEAM 教育學習網的一張圖片,GPT-4O-mini 機器人可以精準讀取內容。

Poe 教學 - GTP-4o 或 GPT-4o-mini 分析圖片 - 直接提供圖片網址

撰寫產生類似圖片的提示詞

既然能夠讀取圖片內容,就能運用 GPT-4o-mini 協助撰寫「產生圖片的提示詞」,下方範例上傳了「我就讚」的迷因圖片,並使用「根據這張圖片的主題和場景,撰寫一段要透過 AI 產生類似圖片的中英文提示詞」作為提示,機器人就會撰寫產生類似圖片的提示詞。

Poe 教學 - GTP-4o 或 GPT-4o-mini 分析圖片 - 產生圖片的提示詞

運用 Poe AI 的 Playground v2.5 機器人 ( 參考 Poe 生成圖片機器人 ),貼上剛剛產生的提示詞,就會產生一張類似的圖片。

Poe 教學 - GTP-4o 或 GPT-4o-mini 分析圖片 - 貼上剛剛產生的提示詞,就會產生一張類似的圖片

快速重點整理圖片內容

運用 CPT-4o-mini 強大的圖取圖片能力,如果遇到「看不懂」的說明文字,也可以拍照上傳請機器人進行分析和重點整理,舉例來說,下圖是一張日本神戶動物世界的說明標語。

Poe 教學 - GTP-4o 或 GPT-4o-mini 分析圖片 - 遇到「看不懂」的說明文字

上傳圖片後,使用「請協助分析這張圖片所描述的內容,並用中文進行重點整理描述」提示詞,機器人就會分析圖片內容,並進行中文的重點整理。

Poe 教學 - GTP-4o 或 GPT-4o-mini 分析圖片 - 分析圖片內容,並進行中文的重點整理

除了辨識文字,GPT-4o-mini 機器人甚至可以讀取圖表,將圖表轉換成表格呈現,下圖是 2024 台灣總統大選最後的票圖表。

Poe 教學 - GTP-4o 或 GPT-4o-mini 分析圖片 - 讀取圖表,將圖表轉換成表格呈現

上傳圖片後,使用「請協助解析這張圖表,並用表格方式呈現」提示詞,機器人就會分析圖片內容,擷取出圖表的部分進行整理。

Poe 教學 - GTP-4o 或 GPT-4o-mini 分析圖片 - 讀取圖表,將圖表轉換成表格呈現

小結

GPT-4o 和 GPT-4o-mini 讀取和分析圖片的能力非常好用,除了產生產生類似圖片的提示詞,更能真正分析圖片內容,協助使用者快速處理圖片裡的資訊,這也是未來應用 AI 的一大重點!

意見回饋

如果有任何建議或問題,可傳送「意見表單」給我,謝謝~

生成式 AI 教學

基本介紹

關於生成式 AI 關於 AI 繪圖 AI 繪圖的提示技巧 AI 繪圖軟體比較 ( 2023 ) AI 繪圖軟體推薦 ( 2024 ) 2025 生成式 AI 工具推薦

Vibe Coding 專區

Vibe Coding 教學導讀 認識 Vibe Coding Vibe Coding 新手入門 Vibe Coding 規劃架構流程 Vibe Coding 網頁知識 Vibe Coding Python 知識 Vibe Coding 下載網頁程式碼 Vibe Coding Google App Script 部署網頁 Vibe Coding Github 部署網頁 Vibe Coding 固定網頁樣式 Vibe Coding 使用外部圖片 Vibe Coding 使用 SVG 圖示 Vibe Coding 使用外部字體 Vibe Coding + Spreadsheet 資料庫 Vibe Coding + Firebase 即時資料庫 Vibe Coding + Firestore 資料庫 Vibe Coding 資料庫安全防護 Vibe Coding 串接帳號驗證機制 Vibe Coding 串接 Google 雲端硬碟 Vibe Coding 串接 Gemini API Vibe Coding 打造 LINE Bot Vibe Coding 範例 - 英文單字卡

2025 AI 影音工具

ChatGPT - 圖片提示詞技巧 ChatGPT - 客製化機器人 ChatGPT - 使用畫布功能 Gemini - 開始使用 Gemini - 客製化機器人 Gemini - 串接 Google 服務 Gemini - 使用畫布功能 NotebookLM - 開始使用 NotebookLM - 建構知識庫 Google AI Studio - 介面功能 Nano Banana - 影像生成與編輯 Gemini Educator 線上認證 圖片 - AI 圖片快速去背 圖片 - AI 黑白照片上色 聲音 - AI 影片語音轉字幕 影片 - Pika 生成創意影片 影片 - KlingAI 生成影片 影片 - AI 影片趣味特效 影片 - AI 擁抱 ( AI Hug ) 影片 - AI 老照片動起來 圖片 - Dreamina 生成圖片 音樂 - SUNO 創作音樂 音樂 - 免費 AI 音樂素材

ChatGPT

ChatGPT 教學導讀 認識 ChatGPT 開始使用 ChatGPT 優良的提示技巧 基本提示 實用組合提示 角色扮演&對話主題 閱讀並模仿風格 對話中顯示圖片 創作長篇故事與小說 使用 Bing Chat 相關工具或服務

Poe ( Poe AI )

開始使用 Poe 聊天機器人 生成圖片機器人 建立自己的機器人 Youtube 影片重點整理 PDF 重點整理 GPT-4o-mini 分析圖片 讀取網頁進行重點整理 讓 AI 美化提示詞

Ideogram

開始使用 Ideogram 文字產生圖片 圖片 Retry 與 Remix

dzine

開始使用 dzine 提示詞產生圖片 圖片產生圖片 運用圖層功能 運用文字和畫筆 ( 範例 ) 室內設計透視圖實體化 ( 範例 ) 名畫轉真人照片 ( 範例 ) 真人照片轉卡通 ( 範例 ) 真人卡通貼圖

Image Creator

開始使用 Image Creator 提示原則與技巧 搭配 Bing Copilot 產生圖片 ( 範例 ) 產生分享文章縮圖 ( 範例 ) 漫畫書風格

Leonardo.Ai

Leonardo.Ai 教學導讀 Leonardo.Ai vs Midjourney 認識 Leonardo.Ai 註冊與登入 Leonardo.Ai 使用圖片產生器 文字提示語法和準則 Elements 風格元素 使用圖片產生圖片 AI 圖片編輯器 ( Canvas Editor ) 即時 AI 畫布 ( Realtime Canvas ) 即時圖片產生器 ( Realtime Gen ) 圖片升級器 ( Universal Upscaler ) 產生圖片的後續步驟 Prompt Magic 魔法提示 PhotoReal&Alchemy 特色模型 訓練自己的模型 ( 範例 ) 填補缺少的披薩 ( 範例 ) 組合兩片披薩 ( 範例 ) 虛擬陳雷 ( 範例 ) 修改人物年齡 ( 範例 ) 換臉特效 ( 範例 ) 隱藏的人臉或文字 ( 範例 ) 全部填滿皮卡丘 ( 範例 ) 名畫轉真人照片

Recraft

開始使用 Recraft 點陣圖 Raster image 向量圖 Vector image 圖示 Icon 與 Logo 系列影像 Image Set 原型示意圖 Mockup 畫框 Frame、文字 Text 放大 Upscale、改色 Recolor 圖片去背、替換圖片背景 添加、修改、移除景物 圖片產生圖片 點陣圖轉向量圖 自定義圖片風格 合併不同圖片 ( 範例 ) 名畫轉真人照片 ( 範例 ) 照片轉卡通插畫 ( 範例 ) 自製表情貼圖 ( 範例 ) 多格漫畫風格 ( 範例 ) 圖片中加入文字 ( 範例 ) 延伸圖片範圍

Midjourney

Midjourney 教學導讀 認識 Midjourney 使用 Midjourney 使用 niji.journey 設定指令 功能參數 使用文字提示產生圖片 使用圖片產生圖片 優良的提示技巧 多重提示的權重與順序 style tuner 樣式調校 remix 放大、修改與重繪 blend 混合多張圖片 刪除圖片&傳送資訊 ( 範例 ) 修改人物年齡 ( 範例 ) 阿爾欽博托風格 ( 範例 ) 照片轉卡通人物 ( 範例 ) 變胖、變瘦

Vidnoz AI

開始使用 Vidnoz AI ( 影片 ) 照片講話 ( 圖片 ) 人物換臉 ( 圖片 ) 圖片去背

Canva AI 魔法功能

魔法媒體工具 ( 新視窗 ) 魔法工作室 ( 新視窗 ) 魔法變形工具 ( 新視窗 ) 魔法文案工具 ( 新視窗 )

Clipdrop

開始使用 Clipdrop 修改圖片選取區域 延展圖片並生成內容 人物換臉 圖片去背 移除特定物件 放大與增強影像 影像打光 替換天空

Playground AI

開始使用 Playground AI Board 文字產生圖片 Canvas 繪製與修改圖片 Remix 與 Edit 圖片 延展和放大增強圖片 圖片去背、移除物件 搭配 Poe AI 產生圖片

Replicate 模型

認識 Replicate ( 修圖 ) 黑白照片上色 ( 修圖 ) 修復老照片 ( 修圖 ) 增強與放大照片 ( 修圖 ) 更換髮型和表情 ( 繪圖 ) 似顏繪貼圖 ( 繪圖 ) 真人照片轉公仔 ( 繪圖 ) 隱藏的圖案或文字 ( 提示 ) 圖片轉提示詞 ( 提示 ) 改善提示詞

AI 繪圖效果&範例

著色本效果 2D 卡通人物 物品開箱照 像素藝術 百科全書風格 卡通貼紙

AI 繪圖風格大全

風格大全 ( 總覽 ) 風格大全 ( 攝影、照片 ) 風格大全 ( 畫面角度效果 ) 風格大全 ( 媒材、材質 ) 風格大全 ( 卡通、漫畫 ) 風格大全 ( 藝術流派風格 ) 風格大全 ( 藝術家、畫家 ) 風格大全 ( 插畫風格 1 ) 風格大全 ( 插畫風格 2 ) 風格大全 ( 特色風格 )