搜尋

GTP-4o 或 GPT-4o-mini 分析圖片

這篇教學會運用 Poe AI 裡的 OpenAI GPT-4o 和 GPT-4o-mini 機器人,讀取本機圖片或網路上的圖片,進行圖片的分析,進一步撰寫產生類似圖片的提示詞,甚至可以讀取具有圖表的圖片,分析圖表內容轉換成表格呈現。

快速導覽:

Poe 教學 - GTP-4o 或 GPT-4o-mini 分析圖片

認識 GPT-4o 和 GPT-4o-mini

GPT-4o 是 OpenAI 在 2024 年中所推出最強大的語言模型,不僅資料庫更新至 2023 年 10 月,更能讀取網頁和圖片進行分析,而 GPT-4o-mini 雖然屬於 GPT-4o 的小型模型,卻也同樣具備讀取網頁和分析圖片的功能,還具有速度快、費用低、跨平台等優勢,就算參數量不如 GPT-4o,卻更適合一般人使用。

GPT-4o GPT-4o-mini
每則訊息費用 300 15
讀取網頁 可以 可以
讀取圖片 可以 可以
速度 普通
語意理解與回覆能力 極佳

Official bot 官方機器人裡可以看見 GPT-4o 和 GPT-4o-mini 機器人,由於 GPT-4o 每則訊息費用高達 300,通常直接使用 GPT-4o-mini 就能處理所有問題 ( 如果有進階需求就另當別論 ),點擊機器人就可以開始和機器人聊天。

Poe 教學 - GTP-4o 或 GPT-4o-mini 分析圖片 - GPT-4o 和 GPT-4o-mini 機器人

從機器人資訊中可以看到兩者的消耗的 Poe 代幣差了 20 倍。

Poe 教學 - GTP-4o 或 GPT-4o-mini 分析圖片 - 消耗的 Poe 代幣差了 20 倍

讀取圖片內容

對於一般使用者來說,各種大型語言模型機器人都大同小異,但 GPT-4o 和 GPT-4o-mini 卻能讀取上傳的圖片內容或網路圖片內容,下方範例使用 GPT-4o-mini 機器人,上傳一張「我就讚」的經典迷因圖片,並詢問機器人這張圖片是什麼內容 ( 使用 GPT-4o 也是相同的做法,但因為消耗的 Poe 代幣太高,所以使用 GPT-4o-mini )。

Poe 教學 - GTP-4o 或 GPT-4o-mini 分析圖片 - 上傳一張「我就讚」的經典迷因圖片

初次使用時,有可能會遇到類似下圖,機器人回應「不知道是什麼」的狀況,通常只要改變問句方式就能解決

Poe 教學 - GTP-4o 或 GPT-4o-mini 分析圖片 - 機器人回應「不知道是什麼」

嘗試修改問句的結構,將問題改成「幫我描述這張圖片的主題或場景」,GPT-4o-mini 機器人就會分析圖片並回答,結果也相當準確。

Poe 教學 - GTP-4o 或 GPT-4o-mini 分析圖片 - 修改問句結構

換成寶可夢的動漫角色,GPT-4o-mini 竟然也能精準的描述出正確的名字和構圖。

Poe 教學 - GTP-4o 或 GPT-4o-mini 分析圖片 - 精準的描述出正確的名字和構圖

使用網址讀取圖片

除了使用上傳的功能上傳圖片,由於 GPT-4o-mini 具有讀取網址的功能,也可以直接提供圖片網址,搭配「幫我描述這張圖片的主題或場景」提示詞,讀取圖片內容,範例使用 STEAM 教育學習網的一張圖片,GPT-4O-mini 機器人可以精準讀取內容。

Poe 教學 - GTP-4o 或 GPT-4o-mini 分析圖片 - 直接提供圖片網址

撰寫產生類似圖片的提示詞

既然能夠讀取圖片內容,就能運用 GPT-4o-mini 協助撰寫「產生圖片的提示詞」,下方範例上傳了「我就讚」的迷因圖片,並使用「根據這張圖片的主題和場景,撰寫一段要透過 AI 產生類似圖片的中英文提示詞」作為提示,機器人就會撰寫產生類似圖片的提示詞。

Poe 教學 - GTP-4o 或 GPT-4o-mini 分析圖片 - 產生圖片的提示詞

運用 Poe AI 的 Playground v2.5 機器人 ( 參考 Poe 生成圖片機器人 ),貼上剛剛產生的提示詞,就會產生一張類似的圖片。

Poe 教學 - GTP-4o 或 GPT-4o-mini 分析圖片 - 貼上剛剛產生的提示詞,就會產生一張類似的圖片

快速重點整理圖片內容

運用 CPT-4o-mini 強大的圖取圖片能力,如果遇到「看不懂」的說明文字,也可以拍照上傳請機器人進行分析和重點整理,舉例來說,下圖是一張日本神戶動物世界的說明標語。

Poe 教學 - GTP-4o 或 GPT-4o-mini 分析圖片 - 遇到「看不懂」的說明文字

上傳圖片後,使用「請協助分析這張圖片所描述的內容,並用中文進行重點整理描述」提示詞,機器人就會分析圖片內容,並進行中文的重點整理。

Poe 教學 - GTP-4o 或 GPT-4o-mini 分析圖片 - 分析圖片內容,並進行中文的重點整理

除了辨識文字,GPT-4o-mini 機器人甚至可以讀取圖表,將圖表轉換成表格呈現,下圖是 2024 台灣總統大選最後的票圖表。

Poe 教學 - GTP-4o 或 GPT-4o-mini 分析圖片 - 讀取圖表,將圖表轉換成表格呈現

上傳圖片後,使用「請協助解析這張圖表,並用表格方式呈現」提示詞,機器人就會分析圖片內容,擷取出圖表的部分進行整理。

Poe 教學 - GTP-4o 或 GPT-4o-mini 分析圖片 - 讀取圖表,將圖表轉換成表格呈現

小結

GPT-4o 和 GPT-4o-mini 讀取和分析圖片的能力非常好用,除了產生產生類似圖片的提示詞,更能真正分析圖片內容,協助使用者快速處理圖片裡的資訊,這也是未來應用 AI 的一大重點!

意見回饋

如果有任何建議或問題,可傳送「意見表單」給我,謝謝~

生成式 AI 教學

基本介紹

關於生成式 AI 關於 AI 繪圖 AI 繪圖軟體比較 ( 2023 ) AI 繪圖軟體推薦 ( 2024 )

ChatGPT

ChatGPT 教學導讀 認識 ChatGPT 開始使用 ChatGPT 優良的提示技巧 基本提示 實用組合提示 角色扮演&對話主題 閱讀並模仿風格 對話中顯示圖片 創作長篇故事與小說 使用 Bing Chat 相關工具或服務

Poe ( Poe AI )

開始使用 Poe 聊天機器人 生成圖片機器人 建立自己的機器人 Youtube 影片重點整理 PDF 重點整理 GPT-4o-mini 分析圖片 讀取網頁進行重點整理

Midjourney

Midjourney 教學導讀 認識 Midjourney 使用 Midjourney 使用 niji.journey 設定指令 功能參數 使用文字提示產生圖片 使用圖片產生圖片 優良的提示技巧 多重提示的權重與順序 style tuner 樣式調校 remix 放大、修改與重繪 blend 混合多張圖片 刪除圖片&傳送資訊 ( 範例 ) 修改人物年齡 ( 範例 ) 阿爾欽博托風格 ( 範例 ) 照片轉卡通人物 ( 範例 ) 變胖、變瘦

Leonardo.Ai

Leonardo.Ai 教學導讀 Leonardo.Ai vs Midjourney 認識 Leonardo.Ai 註冊與登入 Leonardo.Ai 使用圖片產生器 文字提示語法和準則 Elements 風格元素 使用圖片產生圖片 AI 圖片編輯器 ( Canvas Editor ) 即時 AI 畫布 ( Realtime Canvas ) 即時圖片產生器 ( Realtime Gen ) 圖片升級器 ( Universal Upscaler ) 產生圖片的後續步驟 Prompt Magic 魔法提示 PhotoReal&Alchemy 特色模型 訓練自己的模型 ( 範例 ) 填補缺少的披薩 ( 範例 ) 組合兩片披薩 ( 範例 ) 虛擬陳雷 ( 範例 ) 修改人物年齡 ( 範例 ) 換臉特效 ( 範例 ) 隱藏的人臉或文字 ( 範例 ) 全部填滿皮卡丘 ( 範例 ) 名畫轉真人照片

Recraft

開始使用 Recraft 點陣圖 Raster image 向量圖 Vector image 圖示 Icon 與 Logo 系列影像 Image Set 原型示意圖 Mockup 畫框 Frame、文字 Text 放大 Upscale、改色 Recolor 圖片去背、替換圖片背景 添加、修改、移除景物 圖片產生圖片 點陣圖轉向量圖 自定義圖片風格 合併不同圖片 ( 範例 ) 名畫轉真人照片 ( 範例 ) 照片轉卡通插畫 ( 範例 ) 自製表情貼圖 ( 範例 ) 多格漫畫風格 ( 範例 ) 圖片中加入文字 ( 範例 ) 延伸圖片範圍

Ideogram

開始使用 Ideogram 文字產生圖片 圖片 Retry 與 Remix

Image Creator

開始使用 Image Creator 提示原則與技巧 搭配 Bing Copilot 產生圖片 ( 範例 ) 產生分享文章縮圖 ( 範例 ) 漫畫書風格

Playground AI

開始使用 Playground AI Board 文字產生圖片 Canvas 繪製與修改圖片 Remix 與 Edit 圖片 延展和放大增強圖片 圖片去背、移除物件 搭配 Poe AI 產生圖片

Clipdrop

開始使用 Clipdrop 修改圖片選取區域 延展圖片並生成內容 人物換臉 圖片去背 移除特定物件 放大與增強影像 影像打光 替換天空

Vidnoz AI

開始使用 Vidnoz AI ( 影片 ) 照片講話 ( 圖片 ) 人物換臉 ( 圖片 ) 圖片去背

Canva AI 魔法功能

魔法媒體工具 ( 新視窗 ) 魔法工作室 ( 新視窗 ) 魔法變形工具 ( 新視窗 ) 魔法文案工具 ( 新視窗 )

Replicate 模型

認識 Replicate ( 修圖 ) 黑白照片上色 ( 修圖 ) 修復老照片 ( 修圖 ) 增強與放大照片 ( 修圖 ) 更換髮型和表情 ( 繪圖 ) 似顏繪貼圖 ( 繪圖 ) 真人照片轉公仔 ( 繪圖 ) 隱藏的圖案或文字 ( 提示 ) 圖片轉提示詞 ( 提示 ) 改善提示詞

AI 繪圖效果&範例

著色本效果 2D 卡通人物 物品開箱照 像素藝術 百科全書風格 卡通貼紙

AI 繪圖風格大全

風格大全 ( 總覽 ) 風格大全 ( 攝影、照片 ) 風格大全 ( 畫面角度效果 ) 風格大全 ( 媒材、材質 ) 風格大全 ( 卡通、漫畫 ) 風格大全 ( 藝術流派風格 ) 風格大全 ( 藝術家、畫家 ) 風格大全 ( 插畫風格 1 ) 風格大全 ( 插畫風格 2 ) 風格大全 ( 特色風格 )