近日,,字節(jié)跳動在火山引擎原動力大會上發(fā)布豆包視覺理解模型,,為企業(yè)提供多模態(tài)大模型能力,。豆包視覺理解模型千詞元(tokens)輸入價格僅為3厘,,1元錢就可處理284張720P的圖片,比行業(yè)平均價格便宜85%,,以更低成本推動AI技術(shù)普惠和應用發(fā)展,。
火山引擎總裁譚待介紹,豆包視覺理解模型通過算法,、工程等技術(shù)創(chuàng)新,,大幅優(yōu)化使用成本。該模型不僅能精準識別視覺內(nèi)容,,還具備出色的理解和推理能力,,可根據(jù)圖像信息進行復雜的邏輯計算,完成分析圖表,、處理代碼,、解答學科問題等任務。
此前,,豆包視覺理解模型已經(jīng)接入豆包App和PC端產(chǎn)品,。豆包戰(zhàn)略研究負責人周昊表示,為了讓用戶的輸入更快更方便,,豆包非常注重多模態(tài)的輸入和打磨,,包括語音、視覺等能力,,這些模型都已通過火山引擎開放給企業(yè)客戶,。
數(shù)據(jù)顯示,截至12月中旬,,豆包通用模型的日均tokens使用量已超過4萬億,,較7個月前首次發(fā)布時增長了33倍。大模型應用正在向各行各業(yè)加速滲透,。
據(jù)悉,,豆包大模型已經(jīng)與八成主流汽車品牌合作,并接入多家手機,、PC等智能終端,,覆蓋終端設(shè)備約3億臺,來自智能終端的豆包大模型調(diào)用量在半年時間內(nèi)增長達100倍,。
“豆包大模型調(diào)用量的高速增長,,是市場快速發(fā)展的一個縮影。大模型在各種場景中都在全面開花,,尤其是和企業(yè)生產(chǎn)力相關(guān)的場景,。”譚待介紹,最近3個月,,豆包大模型在信息處理場景的調(diào)用量增長了39倍,,客服與銷售場景增長16倍,硬件終端場景增長13倍,,AI工具場景增長9倍,,學習教育等場景也有大幅增長。(記者 楊雪)
編輯:周大為