<ul id="mwmk6"><sup id="mwmk6"></sup></ul>
<ul id="mwmk6"></ul>
    <abbr id="mwmk6"></abbr>
  • <ul id="mwmk6"></ul>
  • <ul id="mwmk6"><sup id="mwmk6"></sup></ul>
    資訊在沃

    微軟開源OmniParser,GPT-4V秒解析屏幕截圖,智能新突破!

       發布時間:2024-10-29 10:39 作者:楊凌霄

    微軟近日宣布了一項重大開源項目——OmniParser,這是一款專為解析和識別屏幕上可交互圖標設計的AI工具。傳統自動化方法受限于HTML或視圖層次結構,而現有的視覺語言模型在處理復雜GUI元素時又顯得力不從心。為此,微軟推出了這款純視覺基礎的工具,旨在解決當前屏幕解析技術的局限性。

    OmniParser結合了可交互區域檢測模型、圖標描述模型和OCR模塊,無需依賴HTML標簽或視圖層次結構等顯式基礎數據。這一特性使得它能夠在桌面、移動設備和網頁等多種平臺上跨平臺工作,顯著提高了用戶界面的解析準確性。OmniParser還能將識別出的屏幕元素轉換成結構化的數據。

    在實際測試中,OmniParser展現出了卓越的性能。在ScreenSpot數據集中,它的準確率提高了73%,遠超依賴HTML解析的模型。同時,當GPT-4V使用OmniParser的輸出后,圖標的正確標記率從70.5%提升至93.8%。這些改進充分證明了OmniParser在解決當前GUI交互模型根本缺陷方面的有效性。

    微軟已在Hugging Face上發布了OmniParser,這一舉措將有助于普及這一前沿技術,進一步推動多模態AI的發展,特別是在無障礙、自動化和智能用戶輔助等領域。

     
     
    更多>同類內容
    全站最新
    熱門內容
    本欄最新
     
    国产精品va久久久久久久| 日韩AV在线不卡一区二区三区| 亚洲av永久无码精品漫画| 国产精品热久久毛片| 精品日韩亚洲AV无码一区二区三区| 国产精品午夜无码AV天美传媒| fulidown国产精品合集| 99re热久久精品这里都是精品| 久久精品国产亚洲| 日本精品一区二区三区在线观看| 97精品国产福利一区二区三区 | 国语自产少妇精品视频蜜桃| 黑人无码精品又粗又大又长 | 久久精品亚洲一区二区三区浴池| 亚洲精品无码不卡在线播HE | 日本一区精品久久久久影院| 正在播放国产精品每日更新| 中文国产成人精品久久水| 精品视频在线观看你懂的一区| 一区二区国产精品| 精品不卡一区中文字幕 | 91精品久久久久久久久中文字幕| 久久久久久久99精品国产片| 久久99精品久久久| 久久99精品波多结衣一区| 亚洲国产精品成人精品无码区| 精品久久一区二区三区| 精品一区二区三区在线视频| 九九热这里只有在线精品视| 亚洲伊人久久精品影院| 狠狠色丁香婷婷综合精品视频| 久久国产成人精品麻豆| 亚洲国产精品无码久久一区二区| 国产成人精品一区二区三区免费| 国产99视频精品免视看7| 久久国产视频精品| 无码aⅴ精品一区二区三区浪潮| 亚洲综合国产精品| 精品亚洲成a人片在线观看| **毛片免费观看久久精品| 国产精品乳摇在线播放|