近日,,字節(jié)跳動在火山引擎原動力大會上發(fā)布豆包視覺理解模型,,為企業(yè)提供多模態(tài)大模型能力。豆包視覺理解模型千詞元(tokens)輸入價格僅為3厘,1元錢就可處理284張720P的圖片,比行業(yè)平均價格便宜85%,以更低成本推動AI技術(shù)普惠和應(yīng)用發(fā)展,。
火山引擎總裁譚待介紹,豆包視覺理解模型通過算法,、工程等技術(shù)創(chuàng)新,,大幅優(yōu)化使用成本。該模型不僅能精準識別視覺內(nèi)容,,還具備出色的理解和推理能力,,可根據(jù)圖像信息進行復(fù)雜的邏輯計算,完成分析圖表,、處理代碼,、解答學(xué)科問題等任務(wù)。
此前,,豆包視覺理解模型已經(jīng)接入豆包App和PC端產(chǎn)品,。豆包戰(zhàn)略研究負責人周昊表示,為了讓用戶的輸入更快更方便,,豆包非常注重多模態(tài)的輸入和打磨,,包括語音、視覺等能力,,這些模型都已通過火山引擎開放給企業(yè)客戶,。
數(shù)據(jù)顯示,截至12月中旬,,豆包通用模型的日均tokens使用量已超過4萬億,,較7個月前首次發(fā)布時增長了33倍。大模型應(yīng)用正在向各行各業(yè)加速滲透,。
據(jù)悉,,豆包大模型已經(jīng)與八成主流汽車品牌合作,并接入多家手機,、PC等智能終端,覆蓋終端設(shè)備約3億臺,,來自智能終端的豆包大模型調(diào)用量在半年時間內(nèi)增長達100倍,。
“豆包大模型調(diào)用量的高速增長,是市場快速發(fā)展的一個縮影,。大模型在各種場景中都在全面開花,,尤其是和企業(yè)生產(chǎn)力相關(guān)的場景。”譚待介紹,,最近3個月,,豆包大模型在信息處理場景的調(diào)用量增長了39倍,客服與銷售場景增長16倍,,硬件終端場景增長13倍,,AI工具場景增長9倍,學(xué)習(xí)教育等場景也有大幅增長,。(記者 楊雪)
編輯:周大為