搜尋

AI 影片轉字幕 ( 語音逐字稿、MP3 轉字幕 )

隨著線上影片需求的增加,出現了越來越多「AI 轉字幕」的工具,但很可惜目前幾乎所有的線上 AI 轉字幕工具都是要付費的,最多也都只有幾分鐘的免費額度,因此這篇教學會介紹一些免費額度較多的線上轉字幕工具,以及如何在本機環境安裝線上轉字幕工具。

快速導覽:

AI 影片轉字幕 ( 語音逐字稿、MP3 轉字幕 )

cSubtitle

cSubtitlea 是一款可以「不用註冊」,且能「免費」將語音轉換文字至少 3 分鐘的線上工具,只需要開啟網站,上傳語音音檔或影片,就可以將語音音檔或影片的語音,轉換成純文字 ( txt ) 或是字幕 ( srt )。

前往:cSubtitle 語音轉字幕

AI 影片轉字幕 ( 語音逐字稿、MP3 轉字幕 ) - cSubtitle 語音轉字幕

上傳檔案後,cSubtitlea 就會開始透過 AI 分析音檔內容,完成後就可以下載字幕檔案或純文字檔案。

AI 影片轉字幕 ( 語音逐字稿、MP3 轉字幕 ) - cSubtitle 語音轉字幕

下方是轉換後的字幕:

1
00:00:00,470 --> 00:00:02,770
測試語音轉文字

2
00:00:03,390 --> 00:00:07,290
不知道轉出來的效果準不準確

3
00:00:08,480 --> 00:00:13,900
五秒鐘不知道會不會太少十秒十一秒十二秒

4
00:00:15,080 --> 00:00:15,560
測試一下

5
00:00:16,160 --> 00:00:18,420
那就傳個二十秒

6
00:00:19,390 --> 00:00:19,910
完成

turboscribe

turboscribe 是一款可以「需要註冊」,但可以「免費」將語音轉換文字至少 30 分鐘的線上工具,只需要開啟網站並註冊登入,就能上傳語音音檔或影片,將語音音檔或影片的語音,轉換成純文字 ( txt ) 或是字幕 ( srt )。

前往:turboscribe 語音轉字幕

AI 影片轉字幕 ( 語音逐字稿、MP3 轉字幕 ) - turboscribe 語音轉字幕

上傳檔案後,可以選擇語系、轉錄模式或一些進階設定。

AI 影片轉字幕 ( 語音逐字稿、MP3 轉字幕 ) - turboscribe 語音轉字幕

轉換完成後,可以在網站上看見轉換後的文字和時間戳記,從右側也可以將其下載為 txt 或 srt 檔案,不過下載時因為還要手動設定「每句的字詞數量」,常導致字幕段落和預期不同,因此不建議使用它的下載功能,為了避免這種狀況,可以先「手動複製」網站上轉換後的文字

AI 影片轉字幕 ( 語音逐字稿、MP3 轉字幕 ) - turboscribe 語音轉字幕

接著使用任何一套 AI 工具 ( ChatGPT、Gemini、Poe AI 皆可 ),將剛剛複製的文字轉換成字幕檔案 ( ChatGPT 還會直接提供 .srt 檔案下載 )。

幫我將下面這段字幕變成字幕檔 .srt
`
(0:00) 測試語音轉文字 (0:04) 不知道轉出來的效果準不準確 (0:08) 5秒鐘不知道會不會太少 (0:11) 10秒、11秒、12秒 (0:14) 測試一下 (0:16) 那就傳個20秒 (0:19) 完成
` 

下方是轉換後的字幕:

1
00:00:00,000 --> 00:00:04,000
測試語音轉文字

2
00:00:04,000 --> 00:00:08,000
不知道轉出來的效果準不準確

3
00:00:08,000 --> 00:00:11,000
5秒鐘不知道會不會太少

4
00:00:11,000 --> 00:00:14,000
10秒、11秒、12秒

5
00:00:14,000 --> 00:00:16,000
測試一下

6
00:00:16,000 --> 00:00:19,000
那就傳個20秒

7
00:00:19,000 --> 00:00:19,800
完成

本機安裝 OpenAI Whisper 轉字幕工具

由於現在幾乎所有線上語音轉字幕工具都「要收費」,就算有提供免費額度往往也不太夠,所以如果不排斥「本機環境」,也可以安裝 OpenAI 所開發的 Whisper,在本機環境轉換字幕,就可以完全不受額度限制。Whisper 是由 OpenAI 所開發的一個開源自動語音辨識模型,能夠將語音轉換成文字,支援多種語言辨識與翻譯,具備高度準確性和靈活性,Whisper 提供下列幾種模型:

模型名稱 精確度 執行速度 備注
tiny 最快 使用 CPU
base 較低 使用 CPU
small 中等 中等 使用 CPU,推薦
medium 建議使用 GPU
large 最高 最慢 GPU,支援最多語言

Mac 環境安裝

在 Mac 環境下安裝,需要先安裝 Homebrew ( 如果尚未安裝 ),打開「終端機 ( Terminal )」輸入下方指令:

/bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)"

接著安裝 ffmpeg ( 讓 Whisper 可以處理聲音音訊 )

brew install ffmpeg

在 Python 環境中安裝 Whisper ( 參考:使用 Python 虛擬環境 )

pip install -U openai-whisper

安裝後就能在 Python 開發環境中,在終端機輸入下列指令轉換,轉換後會在同一個目錄下,產生一個同樣檔名的 srt 檔案。

whisper sample.mp3 --language Chinese --output_format srt --task transcribe --model small 

下方列出相關指令說明:

部分 功能
whisper 啟動 Whisper 命令列工具 ( 需安裝 openai-whisper )。
sample.mp3 欲轉換的音訊檔案 ( 支援 .mp3, .wav, .m4a, .mp4 等格式 )。
--language 指定語音的語言 ( 支援語言:English、Chinese、Japanese、French 等 )。
--task 任務類型,選項為 transcribe 和 translate ( 會翻譯為英文 )。
--model 指定使用的模型。

下方是轉換後的字幕檔案:

1
00:00:00,000 --> 00:00:03,000
測試語音轉文字

2
00:00:03,000 --> 00:00:07,000
不知道轉出來的效果準不準確

3
00:00:08,000 --> 00:00:11,000
5秒鐘不知道會不會太少

4
00:00:11,000 --> 00:00:14,000
10秒、11秒、12秒

5
00:00:14,000 --> 00:00:16,000
測試一下

6
00:00:16,000 --> 00:00:19,000
那就轉個20秒

7
00:00:19,000 --> 00:00:21,000
完成

Windows 環境安裝

在 Windows 中安裝 Whisper 的步驟如下:

下方列出相關指令說明:

部分 功能
whisper 啟動 Whisper 命令列工具 ( 需安裝 openai-whisper )。
sample.mp3 欲轉換的音訊檔案 ( 支援 .mp3, .wav, .m4a, .mp4 等格式 )。
--language 指定語音的語言 ( 支援語言:English、Chinese、Japanese、French 等 )。
--task 任務類型,選項為 transcribe 和 translate ( 會翻譯為英文 )。
--model 指定使用的模型。

下方是轉換後的字幕檔案:

1
00:00:00,000 --> 00:00:03,000
測試語音轉文字

2
00:00:03,000 --> 00:00:07,000
不知道轉出來的效果準不準確

3
00:00:08,000 --> 00:00:11,000
5秒鐘不知道會不會太少

4
00:00:11,000 --> 00:00:14,000
10秒、11秒、12秒

5
00:00:14,000 --> 00:00:16,000
測試一下

6
00:00:16,000 --> 00:00:19,000
那就轉個20秒

7
00:00:19,000 --> 00:00:21,000
完成

小結

對於製作影片而言,字幕往往是最難處理的,如果可以透過一些 AI 工具輔助轉換字幕,就能省下非常多「上字幕」的時間,趕快運用這篇教學所介紹的方法,加速自己的創作時間吧。

意見回饋

如果有任何建議或問題,可傳送「意見表單」給我,謝謝~

生成式 AI 教學

基本介紹

關於生成式 AI 關於 AI 繪圖 AI 繪圖的提示技巧 AI 繪圖軟體比較 ( 2023 ) AI 繪圖軟體推薦 ( 2024 ) 2025 生成式 AI 工具推薦

Vibe Coding 專區

認識 Vibe Coding Vibe Coding 新手入門 Vibe Coding 網頁知識 Vibe Coding Python 知識 Vibe Coding 規劃架構流程 Vibe Coding 下載網頁程式碼 Vibe Coding 固定網頁樣式 Vibe Coding 使用外部圖片 Vibe Coding 使用 SVG 圖示 Vibe Coding 使用外部字體 Vibe Coding + Firebase 即時資料庫 Vibe Coding 資料庫安全防護 Vibe Coding Google App Script 部署網頁 Vibe Coding Github 部署網頁

2025 AI 影音工具

ChatGPT - 圖片提示詞技巧 ChatGPT - 客製化機器人 ChatGPT - 使用畫布功能 Gemini - 開始使用 Gemini - 客製化機器人 Gemini - 串接 Google 服務 Gemini - 使用畫布功能 NotebookLM - 開始使用 NotebookLM - 建構知識庫 Google AI Studio - 介面功能 Nano Banana - 影像生成與編輯 Gemini Educator 線上認證 圖片 - AI 圖片快速去背 圖片 - AI 黑白照片上色 聲音 - AI 影片語音轉字幕 影片 - Pika 生成創意影片 影片 - KlingAI 生成影片 影片 - AI 影片趣味特效 影片 - AI 擁抱 ( AI Hug ) 影片 - AI 老照片動起來 圖片 - Dreamina 生成圖片 音樂 - SUNO 創作音樂 音樂 - 免費 AI 音樂素材

ChatGPT

ChatGPT 教學導讀 認識 ChatGPT 開始使用 ChatGPT 優良的提示技巧 基本提示 實用組合提示 角色扮演&對話主題 閱讀並模仿風格 對話中顯示圖片 創作長篇故事與小說 使用 Bing Chat 相關工具或服務

Poe ( Poe AI )

開始使用 Poe 聊天機器人 生成圖片機器人 建立自己的機器人 Youtube 影片重點整理 PDF 重點整理 GPT-4o-mini 分析圖片 讀取網頁進行重點整理 讓 AI 美化提示詞

Ideogram

開始使用 Ideogram 文字產生圖片 圖片 Retry 與 Remix

dzine

開始使用 dzine 提示詞產生圖片 圖片產生圖片 運用圖層功能 運用文字和畫筆 ( 範例 ) 室內設計透視圖實體化 ( 範例 ) 名畫轉真人照片 ( 範例 ) 真人照片轉卡通 ( 範例 ) 真人卡通貼圖

Image Creator

開始使用 Image Creator 提示原則與技巧 搭配 Bing Copilot 產生圖片 ( 範例 ) 產生分享文章縮圖 ( 範例 ) 漫畫書風格

Leonardo.Ai

Leonardo.Ai 教學導讀 Leonardo.Ai vs Midjourney 認識 Leonardo.Ai 註冊與登入 Leonardo.Ai 使用圖片產生器 文字提示語法和準則 Elements 風格元素 使用圖片產生圖片 AI 圖片編輯器 ( Canvas Editor ) 即時 AI 畫布 ( Realtime Canvas ) 即時圖片產生器 ( Realtime Gen ) 圖片升級器 ( Universal Upscaler ) 產生圖片的後續步驟 Prompt Magic 魔法提示 PhotoReal&Alchemy 特色模型 訓練自己的模型 ( 範例 ) 填補缺少的披薩 ( 範例 ) 組合兩片披薩 ( 範例 ) 虛擬陳雷 ( 範例 ) 修改人物年齡 ( 範例 ) 換臉特效 ( 範例 ) 隱藏的人臉或文字 ( 範例 ) 全部填滿皮卡丘 ( 範例 ) 名畫轉真人照片

Recraft

開始使用 Recraft 點陣圖 Raster image 向量圖 Vector image 圖示 Icon 與 Logo 系列影像 Image Set 原型示意圖 Mockup 畫框 Frame、文字 Text 放大 Upscale、改色 Recolor 圖片去背、替換圖片背景 添加、修改、移除景物 圖片產生圖片 點陣圖轉向量圖 自定義圖片風格 合併不同圖片 ( 範例 ) 名畫轉真人照片 ( 範例 ) 照片轉卡通插畫 ( 範例 ) 自製表情貼圖 ( 範例 ) 多格漫畫風格 ( 範例 ) 圖片中加入文字 ( 範例 ) 延伸圖片範圍

Midjourney

Midjourney 教學導讀 認識 Midjourney 使用 Midjourney 使用 niji.journey 設定指令 功能參數 使用文字提示產生圖片 使用圖片產生圖片 優良的提示技巧 多重提示的權重與順序 style tuner 樣式調校 remix 放大、修改與重繪 blend 混合多張圖片 刪除圖片&傳送資訊 ( 範例 ) 修改人物年齡 ( 範例 ) 阿爾欽博托風格 ( 範例 ) 照片轉卡通人物 ( 範例 ) 變胖、變瘦

Vidnoz AI

開始使用 Vidnoz AI ( 影片 ) 照片講話 ( 圖片 ) 人物換臉 ( 圖片 ) 圖片去背

Canva AI 魔法功能

魔法媒體工具 ( 新視窗 ) 魔法工作室 ( 新視窗 ) 魔法變形工具 ( 新視窗 ) 魔法文案工具 ( 新視窗 )

Clipdrop

開始使用 Clipdrop 修改圖片選取區域 延展圖片並生成內容 人物換臉 圖片去背 移除特定物件 放大與增強影像 影像打光 替換天空

Playground AI

開始使用 Playground AI Board 文字產生圖片 Canvas 繪製與修改圖片 Remix 與 Edit 圖片 延展和放大增強圖片 圖片去背、移除物件 搭配 Poe AI 產生圖片

Replicate 模型

認識 Replicate ( 修圖 ) 黑白照片上色 ( 修圖 ) 修復老照片 ( 修圖 ) 增強與放大照片 ( 修圖 ) 更換髮型和表情 ( 繪圖 ) 似顏繪貼圖 ( 繪圖 ) 真人照片轉公仔 ( 繪圖 ) 隱藏的圖案或文字 ( 提示 ) 圖片轉提示詞 ( 提示 ) 改善提示詞

AI 繪圖效果&範例

著色本效果 2D 卡通人物 物品開箱照 像素藝術 百科全書風格 卡通貼紙

AI 繪圖風格大全

風格大全 ( 總覽 ) 風格大全 ( 攝影、照片 ) 風格大全 ( 畫面角度效果 ) 風格大全 ( 媒材、材質 ) 風格大全 ( 卡通、漫畫 ) 風格大全 ( 藝術流派風格 ) 風格大全 ( 藝術家、畫家 ) 風格大全 ( 插畫風格 1 ) 風格大全 ( 插畫風格 2 ) 風格大全 ( 特色風格 )