Home ShuenKei Blog

2023年11月17日星期五

讀字上稿

在非常年青的時候,買過一部迷你磁帶錄音機,在較後的時期,也擁有過一支 MP3錄音筆,隨身携帶著,預備隨時想到好的點子時,就立即掏出來口述錄下;然後進入 PDA 電子手帳的年代,經歷過 Visor, Palm, WinCE 等,也是一心隨想即寫。現在想來,才發覺自己在很早之前,已經是一個想記錄想法的人。

大概與「測不準原理」相似吧,靈感這東西,只會在不經意的時候浮現,而且一瞬即逝。偏偏,當你萬事俱備,帶著錄音機、小手帳預備好要捕捉想法的時候,腦海會立即空白一片,按下 "Rec+Play" 雙按鈕也是徒然,所以當年也沒有錄下多少東西。

手機的出現,集合了多項功能於一身,帶來的便利是以往不能比擬的。例如我這 Blog 裡的每天創作,最徍的方式是對著電腦邊打邊想,像這一篇的產生,是先有個簡單概念(「寫一點文字生成的過程」),就可以打開 blogger 網頁,開始寫第一段。在大多數情況下不可能一口氣把文章寫完,但好在 Blogger 會把文字上傳雲端,手機可以接力,在流動的情況下續寫。

想「多功作業」的話,我會邊駕車邊錄音,但不像手打那樣隨意,需要先想好了起承轉合的進路,才可連起有線耳機,開啟「雅婷逐字稿」這個 APP,就可以一邊錄音,同步立即產生文本。概念上是是一講完就入即有文字可編輯了,該是相當便利。可惜的是這能用的辨識率不高,要修正文字還得花一點功夫,所以我會把音檔匯出,傳送到電腦,再以免費的 AI 軟件 Whisper  Desktop 來轉文字,辨識準確率可達九成以上,是一個相常有用的神器。

不過這 Whisper 的 AI 模型很依賴 GPU 的運算能力,若電腦沒有獨立顯示咭的話,單以文書機的算力,十分鐘的聲音檔,隨時需要十小時以上才能辨識成功。幸好,妹妹剛升級了其電腦,把舊有的 1080 顯卡送了給我,讓電腦只用十分鐘就能交出準確的文字,大大增加了我追趕寫稿的效率呢!


沒有留言:

發佈留言