opinionsreddit2026年4月23日上午05:40

花大錢買最新 AI 根本浪費？我們測試 18 個 LLM 做 OCR，結果便宜舊模型反而贏了，完整測試資料全部免費公開

We benchmarked 18 LLMs on OCR (7k+ calls) — cheaper/old models oftentimes win. Full dataset + framework open-sourced.

TLDR; We were overpaying for OCR, so we compared flagship models with cheaper and older models. New mini-bench + leaderboard. Free tool to test your own documents. Open Source. We’ve been looking at OCR / document extraction workflows and kept seeing the same pattern: Too many teams are either stuck in legacy OCR pipelines, or are overpaying badly for LLM calls by defaulting to the newest/ biggest model. We put together a curated set of 42 standard documents and ran every model 10 times under

看原文 →

你可能也想看

觀點看過了86d

OpenAI 要開直播了，會不會又推出什麼新東西？

欸你知道嗎，OpenAI 最近要辦一場直播活動。雖然現在還不知道會講什麼，但根據他們過去的習慣，通常直播就代表有新東西要發表。可能是 ChatGPT 的新功能、新模型，或者什麼其他猛的東西。反正 OpenAI 的直播從來不會無聊，有興趣的話可以追蹤一下，說不定又會有什麼改變遊戲規則的公告。

The last time OpenAI did an unannounced livestream, they dropped GPT-4 Turbo and changed pricing overnight

Hacker News

觀點看過了86d

ChatGPT 畫圖功能大升級！2.0 版本現在直播發表

欸你知道嗎，ChatGPT 的畫圖功能出新版本了！OpenAI 推出 ChatGPT Images 2.0，聽說生成圖片的品質和功能都有大幅進步。如果你有在用 AI 畫圖，或是一直想試試看的話，現在正好可以看直播了解新功能是什麼。簡單來說就是 AI 畫圖又更強了，說真的有點扯。想看現場演示的話，直接上 https://openai.com/live/ 就能看直播。

OpenAI is positioning this as a direct competitor to established image generation tools, suggesting they're confident enough to challenge the current market leaders

Hacker News

109

觀點看過了87d

去年那句「再等6個月就會變好」的話，現在看起來超尷尬

欸你知道嗎，整個2025年，只要有人說AI有問題，大家就會說「別急，再等3到6個月，下一版本就會完美解決」。這套說詞真的到處都是——什麼功能不夠、什麼做不到，通通都說「這只是暫時的，馬上就會改進」。那些自主AI助手的展示影片更是被吹得天花亂墜，好像明天就要改變世界一樣。結果現在已經2026年4月了，該檢驗一下去年那些承諾有沒有兌現。Reddit上ClaudeAI社群這週炸裂了，一堆人在討論最新的Opus 4.7版本，結論是：「這根本是退步啦」。說真的，去年那套「再等等」的論調現在看起來有點傻。

觀點看過了74d

Mistral Medium 3.5 在 AMD Strix Halo 上跑超慢，你的筆電可能不適合

欸你知道嗎，有人在 AMD 最新的 Strix Halo 筆電晶片上試著跑 Mistral Medium 3.5 這個大型 AI 模型，結果超慘。一個簡單的程式碼問題，光是讓 AI 思考和回答就花了 2 小時。沒騙你，真的 2 小時。這就像是你問 ChatGPT 一個問題，結果要等到隔天早上才有答案，只不過這次是在你自己的筆電上發生。雖然他們已經用了各種優化技巧（什麼量化啦、GPU 加速啦），但還是快不起來。簡單來說就是，如果你想在筆電上跑這麼大的 AI 模型，現在還不是時候。除非你不介意每次都要等個幾小時。