-
多模态大模型应用完全指南:从一次"把高清照片直接发给模型、账单和错字一起爆了"看懂视觉理解
2024 年我做一个功能让用户拍一张照片模型帮他认出照片里是什么读出照片上的信息。第一版我做得很省事把用户的原图和一句话 prompt 一起塞进多模态 API 等模型回答。本地一测真神模型真的看懂了照片描述得头头是道。我心里很踏实多模态嘛不就是把图片和文字一起发给模型它就什么都能看懂。可等它真正上线跑在真实用户的照片上一串问题冒了出来。第一种最先吓到我一张普通的手机高清照片光是发给模型就烧掉了惊人…- 0
- 0
OCR
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!

