1月26日消息,美國時間周四, OpenAI宣布了一系列重大更新。這些更新不僅關(guān)乎它們備受歡迎的大模型,還包括API訪問價格的調(diào)整、性能優(yōu)化以及全新嵌入性模型的發(fā)布。這些動作旨在吸引更多開發(fā)者的注意,也有望為未來的消費者市場設(shè)立新的標桿。
OpenAI這次更新中,特別提到了它們的GPT-4 Turbo和GPT-3.5 Turbo兩大模型。它們都是大型多模式模型,可以理解和生成自然語言或代碼。在新版本中,它們迎來了諸多增強功能,包括更精準的指令跟隨、支持JSON模式、更多可復(fù)現(xiàn)的輸出,以及并行函數(shù)調(diào)用的優(yōu)化。
此外,該公司還推出了全新的16k版本GPT-3.5 Turbo,這一版本在處理超長輸入和輸出時,相比標準的4k版本展現(xiàn)出了更為出色的性能。
對于眾多用戶而言,GPT-3.5 Turbo并不陌生。作為大多數(shù)人通過ChatGPT進行互動的背后支持模型,它幾乎已經(jīng)成為了行業(yè)內(nèi)的金標準。面對其他聊天機器人,如果用戶發(fā)現(xiàn)其回答質(zhì)量不及ChatGPT,那么繼續(xù)使用后者無疑成為了最佳選擇。
在API領(lǐng)域,GPT-3.5 Turbo同樣表現(xiàn)不俗。在執(zhí)行各類任務(wù)時,它不僅能夠提供比GPT-4更低的成本,還能保證更快的執(zhí)行速度。因此,對于那些付費用戶來說,此次輸入價格下調(diào)50%、輸出價格下調(diào)25%無疑是一大利好。具體來說,新的輸入價格定格在每千個代幣0.0005美元,而輸出價格則為每千個代幣0.0015美元。
在處理文本密集型應(yīng)用(如整篇論文或書籍的分析)時,這些代幣的累積費用往往相當可觀。而且隨著開源大模型開始發(fā)力,OpenAI需要確保其客戶不會離開。因此,這一價格調(diào)整無疑將為用戶帶來真正的實惠。當然,這也是模型精簡和基礎(chǔ)設(shè)施改進的結(jié)果。
在GPT-3.5 Turbo上,OpenAI還悄然推出了代號為GPT-3.5 Turbo 0125的新模型版本。雖然該公司并未大肆宣揚,但這一版本顯然包含了一系列“各種改進”。不過,相較于最新版本GPT-3.5 Turbo 0613,這一更新似乎并未帶來公司認為值得特別提及的重大突破。
在GPT-4 Turbo上,OpenAI同樣有所動作。一個新的API使用預(yù)覽模型——GPT-4 Turbo 0125應(yīng)運而生。這個模型成功解決了GPT-4 Turbo過去存在的一個老問題,即模型在面對某些任務(wù)時可能出現(xiàn)的“懶惰”情況。此外,GPT-4 Turbo 0125在代碼生成等任務(wù)方面的表現(xiàn)也較之前的預(yù)覽模型有了顯著提升。
目前,GPT-4 Turbo 0125仍處于預(yù)覽模式階段。不過,具有視覺效果的GPT-4 Turbo(即GPT-4 V)有望在“未來幾個月內(nèi)”與廣大用戶正式見面。
在嵌入模型方面,OpenAI同樣帶來了令人振奮的消息。該公司推出了全新的text-embeddings-3-small和text-embeddings-3-large模型,它們相較于上一代的text-embeddings-ada-002展現(xiàn)出了更為強大的性能和更為親民的價格。
這些新模型能夠創(chuàng)建多達3072維度的嵌入空間,從而捕獲更多的語義信息并提高下游任務(wù)的準確性。在性能測試中,新模型將多語言檢索(MIRACL)常用基準的平均分數(shù)從31.4%提升至54.9%,而在英語任務(wù)(MTEB)常用基準上的平均分數(shù)也從61.0%提升至64.6%。
更值得一提的是,與text-embeddings-ada-002相比,text-embeddings-3-small的價格降到1/5,這無疑為開發(fā)人員帶來了更為經(jīng)濟實惠的選擇。
此外,OpenAI還發(fā)布了一個全新版本的免費文本審核API。這一API能夠檢測文本是否包含敏感或不安全的內(nèi)容,并且新版本還擴展了支持的語言和領(lǐng)域范圍,同時為其預(yù)測提供了更為詳盡的解釋。(小。