豆包App視覺推理升級 支持圖片思考
據悉,豆包App視覺推理能力已于近期升級,支持在思維鏈中運用圖像思考。
現在,當用戶在豆包App中上傳圖片并提出問題時,豆包不再是簡單地“看”圖,而是能主動“思考”如何更好地分析這張圖片。例如,如果圖片中包含需要仔細辨認的文字或細小物品,豆包會智能地對圖片進行局部放大,確保不遺漏任何關鍵信息。同時,對于那些畫面復雜、信息量大的圖片,豆包也能夠在思考過程中智能裁剪,并調用搜索進行文搜圖、圖搜圖等,為用戶提供更準確的結果。
據介紹,升級后豆包能更智能地調用多種工具對圖片進行輔助分析。無論是日常生活中遇到的花草樹木識別、商品信息查詢,還是工作學習中對圖表數據、專業圖片的分析,豆包都能給出更精準、更實用的答案。
今年初,ChatGPT發布最新的o3模型時,首次實現將圖像融入思維鏈中,將高級推理與網頁搜索和圖像處理(自動縮放、裁剪、翻轉或增強圖像)等工具無縫結合。據了解,豆包為國內首個實現這一能力的產品,用戶可免費體驗。