你们对OCR有巨大误解,知识库该更新了。 像GPT-5这种vision language model,做识别文字的任务,成功率其实比人类手工精雕的OCR model要高得多, 用上了GPT-5,...
你们对OCR有巨大误解,知识库该更新了。像GPT-5这种vision language model,做识别文字的任务,成功率其实比人类手工精雕的OCR model要高得多,用上了GPT-5,除了贵和不可解释,其他一切都是好处,都是优点;传统OCR除了便宜和模型可控可解释,其他一切都是缺点。gemini就是直接vlm读的。Ordinary Kitty: @lidangzzz 是不是他们转了jpg再OCR了?


X (formerly Twitter)
lidang 立党 (全网劝人卖房、劝人学CS、劝人买SP500和NASDAQ100第一人) (@lidangzzz) on X
你们对OCR有巨大误解,知识库该更新了。
像GPT-5这种vision language model,做识别文字的任务,成功率其实比人类...





