搜尋

AI 影片轉字幕 ( 語音逐字稿、MP3 轉字幕 )

隨著線上影片需求的增加,出現了越來越多「AI 轉字幕」的工具,但很可惜目前幾乎所有的線上 AI 轉字幕工具都是要付費的,最多也都只有幾分鐘的免費額度,因此這篇教學會介紹一些免費額度較多的線上轉字幕工具,以及如何在本機環境安裝線上轉字幕工具。

快速導覽:

AI 影片轉字幕 ( 語音逐字稿、MP3 轉字幕 )

cSubtitle

cSubtitlea 是一款可以「不用註冊」,且能「免費」將語音轉換文字至少 3 分鐘的線上工具,只需要開啟網站,上傳語音音檔或影片,就可以將語音音檔或影片的語音,轉換成純文字 ( txt ) 或是字幕 ( srt )。

前往:cSubtitle 語音轉字幕

AI 影片轉字幕 ( 語音逐字稿、MP3 轉字幕 ) - cSubtitle 語音轉字幕

上傳檔案後,cSubtitlea 就會開始透過 AI 分析音檔內容,完成後就可以下載字幕檔案或純文字檔案。

AI 影片轉字幕 ( 語音逐字稿、MP3 轉字幕 ) - cSubtitle 語音轉字幕

下方是轉換後的字幕:

1
00:00:00,470 --> 00:00:02,770
測試語音轉文字

2
00:00:03,390 --> 00:00:07,290
不知道轉出來的效果準不準確

3
00:00:08,480 --> 00:00:13,900
五秒鐘不知道會不會太少十秒十一秒十二秒

4
00:00:15,080 --> 00:00:15,560
測試一下

5
00:00:16,160 --> 00:00:18,420
那就傳個二十秒

6
00:00:19,390 --> 00:00:19,910
完成

turboscribe

turboscribe 是一款可以「需要註冊」,但可以「免費」將語音轉換文字至少 30 分鐘的線上工具,只需要開啟網站並註冊登入,就能上傳語音音檔或影片,將語音音檔或影片的語音,轉換成純文字 ( txt ) 或是字幕 ( srt )。

前往:turboscribe 語音轉字幕

AI 影片轉字幕 ( 語音逐字稿、MP3 轉字幕 ) - turboscribe 語音轉字幕

上傳檔案後,可以選擇語系、轉錄模式或一些進階設定。

AI 影片轉字幕 ( 語音逐字稿、MP3 轉字幕 ) - turboscribe 語音轉字幕

轉換完成後,可以在網站上看見轉換後的文字和時間戳記,從右側也可以將其下載為 txt 或 srt 檔案,不過下載時因為還要手動設定「每句的字詞數量」,常導致字幕段落和預期不同,因此不建議使用它的下載功能,為了避免這種狀況,可以先「手動複製」網站上轉換後的文字

AI 影片轉字幕 ( 語音逐字稿、MP3 轉字幕 ) - turboscribe 語音轉字幕

接著使用任何一套 AI 工具 ( ChatGPT、Gemini、Poe AI 皆可 ),將剛剛複製的文字轉換成字幕檔案 ( ChatGPT 還會直接提供 .srt 檔案下載 )。

幫我將下面這段字幕變成字幕檔 .srt
`
(0:00) 測試語音轉文字 (0:04) 不知道轉出來的效果準不準確 (0:08) 5秒鐘不知道會不會太少 (0:11) 10秒、11秒、12秒 (0:14) 測試一下 (0:16) 那就傳個20秒 (0:19) 完成
` 

下方是轉換後的字幕:

1
00:00:00,000 --> 00:00:04,000
測試語音轉文字

2
00:00:04,000 --> 00:00:08,000
不知道轉出來的效果準不準確

3
00:00:08,000 --> 00:00:11,000
5秒鐘不知道會不會太少

4
00:00:11,000 --> 00:00:14,000
10秒、11秒、12秒

5
00:00:14,000 --> 00:00:16,000
測試一下

6
00:00:16,000 --> 00:00:19,000
那就傳個20秒

7
00:00:19,000 --> 00:00:19,800
完成

本機安裝 OpenAI Whisper 轉字幕工具

由於現在幾乎所有線上語音轉字幕工具都「要收費」,就算有提供免費額度往往也不太夠,所以如果不排斥「本機環境」,也可以安裝 OpenAI 所開發的 Whisper,在本機環境轉換字幕,就可以完全不受額度限制。Whisper 是由 OpenAI 所開發的一個開源自動語音辨識模型,能夠將語音轉換成文字,支援多種語言辨識與翻譯,具備高度準確性和靈活性,Whisper 提供下列幾種模型:

模型名稱 精確度 執行速度 備注
tiny 最快 使用 CPU
base 較低 使用 CPU
small 中等 中等 使用 CPU,推薦
medium 建議使用 GPU
large 最高 最慢 GPU,支援最多語言

Mac 環境安裝

在 Mac 環境下安裝,需要先安裝 Homebrew ( 如果尚未安裝 ),打開「終端機 ( Terminal )」輸入下方指令:

/bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)"

接著安裝 ffmpeg ( 讓 Whisper 可以處理聲音音訊 )

brew install ffmpeg

在 Python 環境中安裝 Whisper ( 參考:使用 Python 虛擬環境 )

pip install -U openai-whisper

安裝後就能在 Python 開發環境中,在終端機輸入下列指令轉換,轉換後會在同一個目錄下,產生一個同樣檔名的 srt 檔案。

whisper sample.mp3 --language Chinese --output_format srt --task transcribe --model small 

下方列出相關指令說明:

部分 功能
whisper 啟動 Whisper 命令列工具 ( 需安裝 openai-whisper )。
sample.mp3 欲轉換的音訊檔案 ( 支援 .mp3, .wav, .m4a, .mp4 等格式 )。
--language 指定語音的語言 ( 支援語言:English、Chinese、Japanese、French 等 )。
--task 任務類型,選項為 transcribe 和 translate ( 會翻譯為英文 )。
--model 指定使用的模型。

下方是轉換後的字幕檔案:

1
00:00:00,000 --> 00:00:03,000
測試語音轉文字

2
00:00:03,000 --> 00:00:07,000
不知道轉出來的效果準不準確

3
00:00:08,000 --> 00:00:11,000
5秒鐘不知道會不會太少

4
00:00:11,000 --> 00:00:14,000
10秒、11秒、12秒

5
00:00:14,000 --> 00:00:16,000
測試一下

6
00:00:16,000 --> 00:00:19,000
那就轉個20秒

7
00:00:19,000 --> 00:00:21,000
完成

Windows 環境安裝

在 Windows 中安裝 Whisper 的步驟如下:

下方列出相關指令說明:

部分 功能
whisper 啟動 Whisper 命令列工具 ( 需安裝 openai-whisper )。
sample.mp3 欲轉換的音訊檔案 ( 支援 .mp3, .wav, .m4a, .mp4 等格式 )。
--language 指定語音的語言 ( 支援語言:English、Chinese、Japanese、French 等 )。
--task 任務類型,選項為 transcribe 和 translate ( 會翻譯為英文 )。
--model 指定使用的模型。

下方是轉換後的字幕檔案:

1
00:00:00,000 --> 00:00:03,000
測試語音轉文字

2
00:00:03,000 --> 00:00:07,000
不知道轉出來的效果準不準確

3
00:00:08,000 --> 00:00:11,000
5秒鐘不知道會不會太少

4
00:00:11,000 --> 00:00:14,000
10秒、11秒、12秒

5
00:00:14,000 --> 00:00:16,000
測試一下

6
00:00:16,000 --> 00:00:19,000
那就轉個20秒

7
00:00:19,000 --> 00:00:21,000
完成

小結

對於製作影片而言,字幕往往是最難處理的,如果可以透過一些 AI 工具輔助轉換字幕,就能省下非常多「上字幕」的時間,趕快運用這篇教學所介紹的方法,加速自己的創作時間吧。

意見回饋

如果有任何建議或問題,可傳送「意見表單」給我,謝謝~

生成式 AI 教學

基本介紹

關於生成式 AI 關於 AI 繪圖 AI 繪圖的提示技巧 AI 繪圖軟體比較 ( 2023 ) AI 繪圖軟體推薦 ( 2024 )

2025 AI 工具彙整

音樂 - SUNO 創作音樂 音樂 - 免費 AI 音樂素材 影片 - AI 語音轉字幕 影片 - Pika 生成創意影片 影片 - KlingAI 生成影片

ChatGPT

ChatGPT 教學導讀 認識 ChatGPT 開始使用 ChatGPT 優良的提示技巧 基本提示 實用組合提示 角色扮演&對話主題 閱讀並模仿風格 對話中顯示圖片 創作長篇故事與小說 使用 Bing Chat 相關工具或服務

Poe ( Poe AI )

開始使用 Poe 聊天機器人 生成圖片機器人 建立自己的機器人 Youtube 影片重點整理 PDF 重點整理 GPT-4o-mini 分析圖片 讀取網頁進行重點整理 讓 AI 美化提示詞

Ideogram

開始使用 Ideogram 文字產生圖片 圖片 Retry 與 Remix

dzine

開始使用 dzine 提示詞產生圖片 圖片產生圖片 運用圖層功能 運用文字和畫筆 ( 範例 ) 室內設計透視圖實體化 ( 範例 ) 名畫轉真人照片 ( 範例 ) 真人照片轉卡通 ( 範例 ) 真人卡通貼圖

Image Creator

開始使用 Image Creator 提示原則與技巧 搭配 Bing Copilot 產生圖片 ( 範例 ) 產生分享文章縮圖 ( 範例 ) 漫畫書風格

Leonardo.Ai

Leonardo.Ai 教學導讀 Leonardo.Ai vs Midjourney 認識 Leonardo.Ai 註冊與登入 Leonardo.Ai 使用圖片產生器 文字提示語法和準則 Elements 風格元素 使用圖片產生圖片 AI 圖片編輯器 ( Canvas Editor ) 即時 AI 畫布 ( Realtime Canvas ) 即時圖片產生器 ( Realtime Gen ) 圖片升級器 ( Universal Upscaler ) 產生圖片的後續步驟 Prompt Magic 魔法提示 PhotoReal&Alchemy 特色模型 訓練自己的模型 ( 範例 ) 填補缺少的披薩 ( 範例 ) 組合兩片披薩 ( 範例 ) 虛擬陳雷 ( 範例 ) 修改人物年齡 ( 範例 ) 換臉特效 ( 範例 ) 隱藏的人臉或文字 ( 範例 ) 全部填滿皮卡丘 ( 範例 ) 名畫轉真人照片

Recraft

開始使用 Recraft 點陣圖 Raster image 向量圖 Vector image 圖示 Icon 與 Logo 系列影像 Image Set 原型示意圖 Mockup 畫框 Frame、文字 Text 放大 Upscale、改色 Recolor 圖片去背、替換圖片背景 添加、修改、移除景物 圖片產生圖片 點陣圖轉向量圖 自定義圖片風格 合併不同圖片 ( 範例 ) 名畫轉真人照片 ( 範例 ) 照片轉卡通插畫 ( 範例 ) 自製表情貼圖 ( 範例 ) 多格漫畫風格 ( 範例 ) 圖片中加入文字 ( 範例 ) 延伸圖片範圍

Midjourney

Midjourney 教學導讀 認識 Midjourney 使用 Midjourney 使用 niji.journey 設定指令 功能參數 使用文字提示產生圖片 使用圖片產生圖片 優良的提示技巧 多重提示的權重與順序 style tuner 樣式調校 remix 放大、修改與重繪 blend 混合多張圖片 刪除圖片&傳送資訊 ( 範例 ) 修改人物年齡 ( 範例 ) 阿爾欽博托風格 ( 範例 ) 照片轉卡通人物 ( 範例 ) 變胖、變瘦

Vidnoz AI

開始使用 Vidnoz AI ( 影片 ) 照片講話 ( 圖片 ) 人物換臉 ( 圖片 ) 圖片去背

Canva AI 魔法功能

魔法媒體工具 ( 新視窗 ) 魔法工作室 ( 新視窗 ) 魔法變形工具 ( 新視窗 ) 魔法文案工具 ( 新視窗 )

Clipdrop

開始使用 Clipdrop 修改圖片選取區域 延展圖片並生成內容 人物換臉 圖片去背 移除特定物件 放大與增強影像 影像打光 替換天空

Playground AI

開始使用 Playground AI Board 文字產生圖片 Canvas 繪製與修改圖片 Remix 與 Edit 圖片 延展和放大增強圖片 圖片去背、移除物件 搭配 Poe AI 產生圖片

Replicate 模型

認識 Replicate ( 修圖 ) 黑白照片上色 ( 修圖 ) 修復老照片 ( 修圖 ) 增強與放大照片 ( 修圖 ) 更換髮型和表情 ( 繪圖 ) 似顏繪貼圖 ( 繪圖 ) 真人照片轉公仔 ( 繪圖 ) 隱藏的圖案或文字 ( 提示 ) 圖片轉提示詞 ( 提示 ) 改善提示詞

AI 繪圖效果&範例

著色本效果 2D 卡通人物 物品開箱照 像素藝術 百科全書風格 卡通貼紙

AI 繪圖風格大全

風格大全 ( 總覽 ) 風格大全 ( 攝影、照片 ) 風格大全 ( 畫面角度效果 ) 風格大全 ( 媒材、材質 ) 風格大全 ( 卡通、漫畫 ) 風格大全 ( 藝術流派風格 ) 風格大全 ( 藝術家、畫家 ) 風格大全 ( 插畫風格 1 ) 風格大全 ( 插畫風格 2 ) 風格大全 ( 特色風格 )