AI文字辨識不要用Gemini,要改用騰訊元寶!

昨天試著用AI幫我處理一項簡單的任務,
將圖檔裡的文字完整呈現與導出。

這其實用手機拍照的辨識功能也可做得到,
但手機時常會無法完整地列出標點符號,
文字還會看錯…
整體使用的體驗不是很好!

這看起來是一件很簡單的任務,用了兩個不同的AI,結果卻有細微的差異。

騰訊元寶採用的是DeepSeek大模型,
以A4圖檔的方式上傳測試,
內容是我昨天要發佈的文章,
很順利就辨識完成、文字沒有任何的錯字,
所有的標點符號也都沒錯。

另外,
我再下另一個指令用於我平常寫作的排版,
不知道是我的指令不夠清晰,
還是AI沒辦法理解,
多次排版沒成功我就放棄了!

說到Gemini就火大,
同樣的一份圖檔,
辨識出來的成果和只比手機好一點,
而且我還多次提醒有錯字,
但AI仍然找不到!

其中最扯的是“折腰”這2個字,
一直辨識成→“拆建”?!
接著又變成“拆書”?
又有一版是“拆閱”?

罵了AI很多次還是辨識錯誤,
它還直接要投降輸一半?!
請我直接告訴它答案,
真是有夠廢~

除此之外,
還是有點用處的,
排版的指令就有照著我所說想的模式產出。

剛剛又用了這篇文章再試一次,
結果也是一樣…

試用了美、中的AI,
我猜可能是語系不同所影響的產出,
畢竟中國的AI對於華語內容還是佔了些優勢,成果上也比較不會有錯字!

下次我來試試表格行不行?

發表留言

這個網站採用 Akismet 服務減少垃圾留言。進一步了解 Akismet 如何處理網站訪客的留言資料