AI文字辨識不要用Gemini，要改用騰訊元寶！

本文之圖文內容版權皆為作者所有，
未經授權，禁止複製轉貼文章內容！

昨天試著用AI幫我處理一項簡單的任務，
將圖檔裡的文字完整呈現與導出。

這其實用手機拍照的辨識功能也可做得到，
但手機時常會無法完整地列出標點符號，
文字還會看錯…
整體使用的體驗不是很好！

這看起來是一件很簡單的任務，用了兩個不同的AI，結果卻有細微的差異。

騰訊元寶：
文字一次就辦識成功，
但排版的指令不太行！

騰訊元寶採用的是DeepSeek大模型，
以A4圖檔的方式上傳測試，
內容是我昨天要發佈的文章，
很順利就辨識完成、文字沒有任何的錯字，
所有的標點符號也都沒錯。

另外，
我再下另一個指令用於我平常寫作的排版，
不知道是我的指令不夠清晰，
還是AI沒辦法理解，
多次排版沒成功我就放棄了！

說到Gemini就火大，
同樣的一份圖檔，
辨識出來的成果和只比手機好一點，
而且我還多次提醒有錯字，
但AI仍然找不到！

其中最扯的是“折腰”這2個字，
一直辨識成→“拆建”？！
接著又變成“拆書”？
又有一版是“拆閱”？

罵了AI很多次還是辨識錯誤，
它還直接要投降輸一半？！
請我直接告訴它答案，
真是有夠廢~

除此之外，
還是有點用處的，
排版的指令就有照著我所說想的模式產出。

剛剛又用了這篇文章再試一次，
結果也是一樣…

試用了美、中的AI，
我猜可能是語系不同所影響的產出，
畢竟中國的AI對於華語內容還是佔了些優勢，成果上也比較不會有錯字！

下次我來試試表格行不行？