<ul id="mwmk6"><sup id="mwmk6"></sup></ul>
<ul id="mwmk6"></ul>
    <abbr id="mwmk6"></abbr>
  • <ul id="mwmk6"></ul>
  • <ul id="mwmk6"><sup id="mwmk6"></sup></ul>
    資訊在沃

    谷歌Gemini 2.5 API新推隱式緩存功能,開發者成本有望大幅削減

       發布時間:2025-05-10 12:10 作者:柳晴雪

    近期,科技界傳來一則新動態,谷歌在其Gemini 2.5 API中引入了名為“隱式緩存”的新功能,旨在通過智能化手段降低開發者的成本。據科技媒體WinBuzzer于5月9日報道,這一創新技術能自動識別并重用API請求中的常見前綴,從而幫助開發者實現成本的大幅縮減,最高可達75%。

    具體而言,“隱式緩存”功能適用于Gemini 2.5系列中的Pro和Flash模型。該功能無需開發者進行任何手動配置,系統默認啟用,大大簡化了操作流程。它通過自動檢測并重用API請求中的重復前綴,有效提升了效率,降低了成本。

    值得注意的是,“隱式緩存”與谷歌早前在2024年5月推出的“顯式緩存”有所不同。后者需要開發者自行配置,而前者則完全由系統自動處理,不僅節省了成本,還顯著提升了用戶體驗。為了最大化隱式緩存的效果,谷歌建議開發者在構建提示詞時,將穩定且常見的內容置于開頭,隨后再添加用戶特定的變量內容。

    谷歌還指出,如果開發者在短時間內發送具有相似前綴的請求,將有助于提高緩存的命中率,進一步提升效率。不過,為了享受這一功能,開發者需要滿足一定的Token數量要求:Gemini 2.5 Flash模型需至少1024個Token,而Gemini 2.5 Pro模型則需至少2048個Token。

    為了幫助開發者更好地了解緩存的使用情況,谷歌在API響應中新增了“cached_content_token_count”字段。這一字段將顯示緩存Token的使用詳情以及優惠計費信息,讓開發者能夠清晰掌握成本節約的具體情況。

    盡管谷歌宣稱“隱式緩存”功能能夠帶來高達75%的成本節省,但實際效果仍需第三方進行驗證。同時,由于不同開發者的使用模式可能存在差異,因此具體節省的幅度也可能有所不同。

    谷歌并未完全放棄“顯式緩存”方案。作為可選方案,顯式緩存仍然支持Gemini 2.5及2.0模型,并允許開發者自定義緩存內容和生存時間(TTL,默認1小時)。這一靈活性使得開發者能夠根據自身需求選擇最適合的緩存方案。

     
     
    更多>同類內容
    全站最新
    熱門內容
    本欄最新
     
    99在线观看精品视频| 国产成人精品久久亚洲高清不卡 | 国产精品视频久久久| 无码精品久久久久久人妻中字| 视频一区精品自拍| 国产精品女人呻吟在线观看| 国产日韩综合一区二区性色AV| 国产精品免费视频一区| 精品国产高清久久久久久小说 | 国产精品视频福利| 亚洲综合久久精品无码色欲 | 国产精品一区二区久久乐下载| 精品日产a一卡2卡三卡4卡乱| 色噜噜精品视频在线观看| 精品国产一二三产品价格| 久久er99热精品一区二区| 无码精品人妻一区二区三区人妻斩| 欧洲精品视频在线观看| 亚洲精品无码永久在线观看你懂的| 91精品国产福利在线导航| 中文字幕日韩专区精品系列| 国产精品无码专区在线观看| 国产2021久久精品| 精品久久久久久久久久久久久久久 | 中日韩精品无码一区二区三区| 国产日韩一区二区三免费高清 | 久久精品亚洲中文字幕无码网站| 亚洲精品乱码久久久久久蜜桃不卡| 日韩A∨精品日韩在线观看 | 青青草原精品99久久精品66| 亚洲αv在线精品糸列| 久久成人精品视频| 亚洲国产精品无码久久久不卡| 亚洲AV无码成人网站久久精品大| 久久亚洲国产欧洲精品一| 久久99精品福利久久久| 亚洲精品国产成人专区| 91精品国产免费久久国语麻豆| 1204国产成人精品视频| 国产精品bbwbbwbbw| 午夜麻豆国产精品无码|