<samp id="tgzrj"><video id="tgzrj"><nav id="tgzrj"></nav></video></samp>

<samp id="tgzrj"></samp>

<legend id="tgzrj"><font id="tgzrj"><tr id="tgzrj"></tr></font></legend>

您現在的位置：首頁 >
要聞 >
正文

大模型開發者必備手冊：這些數字值得記住

來源：量子位時間：2023-05-19 14:23:21

本文經AI新媒體量子位（公眾號ID:QbitAI）授權轉載，轉載請聯系出處。

GPT-4的使用成本，竟然是GPT-3.5的50倍之多；

(資料圖)

而讓大語言模型同時處理25個請求的時間，僅是處理單個請求的2倍……

這些數據聽上去可能有些出乎意料，但都是真實的。

它們出自一篇名為《大語言模型（LLM）開發者必須知道的數字》的GitHub文章。

文章發布之后僅1天，便獲得了1200次星標。

文章基于真實的開發經驗，介紹了提示工程、硬件資源、價格等方面的數據。

就算沒有成為開發者的打算，拿來擴充一下知識儲備也是極好的。

都有哪些數字值得關注

我們不妨先來看一下文章作者制作的速覽圖表：

接下來，我們就來詳細介紹一下這些數據。

提示工程

40-90%：在提示詞中加入“Be Concise”節約的成本

使用LLM是按照回復的token數量付費的，因此讓LLM的回答簡明扼要可以節約成本。

在提示詞中加入“Be Concise”（答案簡明些），可以節約40-90%的成本。

1.3：每個單詞的平均token數

LLM是對token進行操作的，token可能包含完整單詞或其中的一部分。

如“eating”是由“eat”和后綴“ing”兩個token組成。

一篇750詞的英文文章中大約含有1000個token。

而對于其他語言，每個詞所含的token數量可能更多。

價格

價格數據會存在波動，本節的價格數據主要參考OpenAI，但其他公司數據也相似。

約50倍：GPT-4與GPT-3.5花費的比值

效果上，GPT-4的表現明顯好于GPT-3.5，但其成本約為后者的50倍之多。

因此，對于諸如總結這類GPT-3.5也能出色完成的任務，可以考慮不使用更昂貴的GPT-4。

5倍：GPT-3.5-Turbo生成與使用OpenAI embedding的成本比

諸如“美國的首都是哪里”這類可以通過檢索得到答案的問題，讓LLM生成答案的成本是檢索的5倍。

而如果使用GPT-4，成本差異將高達250倍。

10倍：OpenAI embedding與自建embedding的成本比

這一數字為大約數值，實際情況可能隨著embedding的規模而變化。

6倍：微調版與基本版OpenAI模型的成本比值

盡管成本較為昂貴，但對基本OpenAI模型的微調是有意義的。

對基本模型進行微調的效益明顯高于定制模型。

1倍：自建模型是否進行微調的成本比

由于參數量相同，是否進行微調對自建模型的成本幾乎沒有影響。

訓練與微調

約100萬美元：在1.4萬億token上訓練130億參數模型的成本

這一數字是建立在一切工作都十分順利、沒有發生崩潰的前提下計算出的。

Meta的大語言模型LLaMA的論文當中顯示，用2048塊80GB A100 GPU進行訓練LLaMA一共花費了21天。

<0.001：微調與從頭開始訓練的成本比

這一數據有一些籠統，但微調的成本幾乎可以忽略不計。

對一個60億參數模型進行微調的成本大約是7美元。

即使是最貴的OpenAI模型Davinci，1000個token的微調成本也只有3美分。

相對于對一部莎士比亞全集進行微調也只需要40美元。

GPU消耗

如果你要自建模型，了解其GPU消耗十分重要。

本節所列數據僅是推理過程所消耗的資源量，訓練和微調過程還需要更多資源。

V100: 16GB, A10G: 24GB, A100: 40/80GB：GPU內存大小

GPU內存大小決定了LLM的參數量上限。

24GB的A10G在亞馬遜云服務中的價格為1.5-2美元每小時。

參數量的2倍：LLM的典型GPU內存需求

例如，7B參數量的LLM需要消耗14GB的GPU內存。

這是因為大多數時候，每個參數需要16bit浮點空間。

通常情況下不需要使用超過16bit的精度，8bit則會顯著降低結果精準度。

約1GB：嵌入式模型的典型GPU內存需求

嵌入式模型消耗的本地GPU資源是很小的。

甚至可以在一塊GPU上同時運行多個嵌入式模型。

超過10倍：批量處理LLM請求帶來的吞吐量改善

在GPU上運行LLM時往往會有較大延遲。

一次請求消耗的時間可能長達5秒，相對于每秒僅能處理0.2個。

但如果同時發送兩個請求，消耗的時間約為5.2秒。

而將25個請求捆綁發出的耗時約為10秒，相對于每秒可處理2.5個請求。

約1MB：130億參數模型輸出1個token所需的GPU內存

內存消耗量與生成token數成正比。

512個token（約380個英文單詞）需要消耗512MB的空間。

作者簡介

這篇文章的作者來自開源人工智能框架Ray的開發公司Anyscale。

主要貢獻者是Google前首席工程師Waleed Kadous。

他也曾擔任Uber CTO辦公室工程戰略負責人。

其中一位華人合作者是Google前員工Huaiwei Sun。

他來自江蘇昆山，本科畢業于上海交通大學工業設計專業。

期間，他參加了耶魯大學summer school并取得了滿績。

此后他取得了佐治亞理工學院碩士學位，研究方向為人機交互。

此外還有其他作者也參與了這篇文章的工作，未來也可能有更多人加入。

參考鏈接：[1]https://github.com/ray-project/llm-numbers[2]https://www.linkedin.com/in/scottsun94/

標簽：

責任編輯：FD31

上一篇：行政合同糾紛應通過什么途徑解決？哪些合同屬于行政合同？

下一篇：最后一頁

精彩圖集(熱圖)

熱點圖集

實踐中對收養人能否收養成年子女有幾種意見？收養人能否收養成年子女？

點擊詳細
女子舉重是從什么時候開始的？舉重減肥的優勢是什么？

點擊詳細
股票期權如何開通？股票期權開通要具備什么條件？

點擊詳細
2023年中秋國慶假期如何放假調休？中秋國慶假期高速免費嗎?

點擊詳細
勞動合同到期辭職了可以領失業金嗎？領取失業金要滿足什么條件？

點擊詳細
聚焦高分劇《漫長的季節》專家：走出類型局限環球動態

點擊詳細
iqoo產品經理宋紫薇個人資料宋紫薇高清寫真

點擊詳細
行政合同糾紛應通過什么途徑解決？哪些合同屬于行政合同？

點擊詳細
中國旅游日，跟著李白、杜甫、徐霞客去旅行

點擊詳細
焦點消息！88只股中線走穩站上半年線

點擊詳細
會計初級職稱好考嗎？會計初級職稱報名條件和要求？

點擊詳細
大模型開發者必備手冊：這些數字值得記住

點擊詳細
金線蓮的功效與作用是什么？金線蓮怎么栽培？

點擊詳細
指揮家邵恩執棒40載：指揮的成功緊緊地拴在樂隊身上

點擊詳細
什么是保理合同糾紛？保理合同糾紛如何解決？

點擊詳細
化妝棉怎么清洗才干凈？常用的化妝工具怎么清洗？

點擊詳細
匯正財經為什么拉人?匯正老學員來聊聊自身所學

點擊詳細
乳液和面霜的區別是什么？補水乳液的主要功效是什么？

點擊詳細

最近更新

大模型開發者必備手冊：這些數字值得記住

點擊詳細
實踐中對收養人能否收養成年子女有幾種意見？收養人能否收養成年子女？

點擊詳細
股票期權如何開通？股票期權開通要具備什么條件？

點擊詳細
辦理收養登記的事實收養情況有幾種？關于收養孩子入戶條件有哪些規定？

點擊詳細
女子舉重是從什么時候開始的？舉重減肥的優勢是什么？

點擊詳細
化妝棉怎么清洗才干凈？常用的化妝工具怎么清洗？

點擊詳細
收養孩子有哪些要求？如何收養孩子？

點擊詳細
打新基金四步驟是什么?基金暫停贖回風險大嗎？

點擊詳細
勞動合同到期辭職了可以領失業金嗎？領取失業金要滿足什么條件？

點擊詳細
蘑菇發霉了還能不能吃？蘑菇放的時間長了長白毛能吃嗎？

點擊詳細
夏季如何調養脾胃？調理脾胃的養生粥有哪些？

點擊詳細
中國旅游日，跟著李白、杜甫、徐霞客去旅行

點擊詳細
當前快報:作家莫言為書法“拋磚引玉” 愿更多年輕人“重拾”毛筆

點擊詳細
聚焦高分劇《漫長的季節》專家：走出類型局限環球動態

點擊詳細
【盤中播報】45只個股跨越牛熊分界線

點擊詳細
指揮家邵恩執棒40載：指揮的成功緊緊地拴在樂隊身上

點擊詳細
焦點消息！88只股中線走穩站上半年線

點擊詳細
今日盤中突破五日均線個股一覽

點擊詳細
福建上杭首次發現恐龍蛋已進行搶救性保護

點擊詳細
【熱聞】【盤中播報】滬指跌0.36% 石油石化行業跌幅最大

點擊詳細
基金5月18日參與7家公司的調研活動

點擊詳細
超過60歲還能協商網貸延期嗎？網貸延期怎么協商效果好？

點擊詳細
2023年中秋國慶假期如何放假調休？中秋國慶假期高速免費嗎?

點擊詳細
乳液和面霜的區別是什么？補水乳液的主要功效是什么？

點擊詳細
金線蓮的功效與作用是什么？金線蓮怎么栽培？

點擊詳細
iqoo產品經理宋紫薇個人資料宋紫薇高清寫真

點擊詳細
房貸延期辦理有年齡限制嗎？房貸延期哪些人可以申請？

點擊詳細
一側臉疼是三叉神經痛嗎？半邊臉刺痛是怎么回事？

點擊詳細
西安銀行信用卡額度一般多少？西安信用卡還款日寬限期

點擊詳細
沒學位證能考公務員考試嗎？國家承認的五種學歷提升方式

點擊詳細

熱詞榜

編輯推薦

精彩圖集

專題策劃

美團“取關”支付寶外賣付款方式要變了？

信用中國

信用信息
行政許可和行政處罰
網站文章

瀏覽排行

久爱免费观看在线精品_亚洲综合一区二区三区_最新国产国模无码视频在线_中文字幕无码精品亚洲资源网久久

<samp id="tgzrj"><video id="tgzrj"><nav id="tgzrj"></nav></video></samp>

<samp id="tgzrj"></samp>

<legend id="tgzrj"><font id="tgzrj"><tr id="tgzrj"></tr></font></legend>