應用分析能力是什么_chatgpt應用分析_應用分析能力題庫單招

一. 關于

據報道,GPT-3.5系列模型自2021年四季度就開始混合使用文本和代碼進行訓練[1]。而在今年11月30日,推出了一款新的自然語言對話模型,該模型是對GPT-3.5中一個2022年初完成訓練的模型的微調實現[2]。

在發布至今的一周時間里,模型便受到全球范圍的廣泛關注,并獲得了普遍正面的評價[3]。不僅能夠以非常自然的詞句與人類用戶交流,還能保持聊天過程的上下文狀態。不僅如此,在信息行業中的應用也非常令人驚艷,它可以在短短幾秒內按照用戶的要求編寫簡單的代碼實現。

目前,開放了的WEB交互面板,本文案例如無特殊標注均通過該接口運行得到。關于信息安全領域之外的應用,已有大量文章進行探討,本文不再深入。

二. 在安全行業的應用

2.1

安全工具開發

首先,既然能夠按照用戶的要求編寫代碼,那自然就可以用來制作安全工具(不論是用于進攻還是防御)。目前已經有人指出通過可以生成實際可用的漏洞利用工具[4]:

應用分析能力題庫單招_應用分析能力是什么_chatgpt應用分析

圖1通過生成漏洞利用代碼

我們粗略地測試了一些用例,大部分情況下都能得到質量上乘的結果。但可能由于測試方法尚不完善,也可能是安全領域的訓練樣本相對較少,的發揮似乎并不是非常穩定:

chatgpt應用分析_應用分析能力是什么_應用分析能力題庫單招

圖2非常不錯的功能實現

應用分析能力題庫單招_應用分析能力是什么_chatgpt應用分析

圖3雖然有待優化,但姑且實現了功能

chatgpt應用分析_應用分析能力題庫單招_應用分析能力是什么

圖4看上去有模有樣,但并沒有正確實現功能

結果看來,確實能夠幫助用戶完成相當一部分的代碼編寫工作,而且代碼注釋、變量命名等都非常完善。但由于輸出質量的不穩定性,這種方法仍然對用戶自身的技術水平有一定的要求,至少需要能夠驗證AI模型輸出的代碼是否正確。

只要運用得當,將會大大提高安全工具的開發效率,但要想完全依賴該模型完成復雜系統的實現,目前看來還有一段距離。

2.2

逆向分析

還在逆向分析領域大放異彩。例如,可以用它來分析機器語言的功能:

應用分析能力是什么_chatgpt應用分析_應用分析能力題庫單招

圖解析。

圖片擴散廣泛而原始出處不詳,有知情者還請留言告知

甚至還有人為知名逆向分析工具IDA制作了一個插件,可以通過的API(-003,為GPT-3.5系列中的一個[1])為反編譯代碼生成注釋描述和修復變量名[5]:

應用分析能力題庫單招_chatgpt應用分析_應用分析能力是什么

圖6IDA插件

我們也進行了一些相關測試,要求對給定的反編譯代碼進行解釋:

chatgpt應用分析_應用分析能力是什么_應用分析能力題庫單招

圖 中的一個函數,效果還可以

應用分析能力是什么_應用分析能力題庫單招_chatgpt應用分析

圖中的一個函數,效果一般

應用分析能力是什么_chatgpt應用分析_應用分析能力題庫單招

圖9來自一個加有VMP殼的惡意樣本,效果不太好

從測試情況看來,如果代碼中包含有對標準庫或API函數(如上面的等)的顯式調用,就能夠從更抽象的、注重目的而非實現的角度去解釋。但除此之外的情況,往往就只會按代碼字面意思進行翻譯:數據從哪里拷貝到哪里、做了什么加減乘除比較操作等,諸如此類。此外chatgpt應用分析,由于目前開放的接口有輸入長度的限制,每次只能輸入少量代碼,這導致現階段實際使用起來還是不太方便。

2.3

安全檢查和漏洞挖掘

目前已有很多利用在現有代碼中尋找潛在BUG或漏洞的成功案例。對此我們也進行了一些嘗試:

應用分析能力題庫單招_chatgpt應用分析_應用分析能力是什么

圖靶場中SQL注入漏洞頁面high.php,正確識別并修復了漏洞

應用分析能力題庫單招_應用分析能力是什么_chatgpt應用分析

圖11但給出的漏洞驗證腳本明顯是不正確的

chatgpt應用分析_應用分析能力題庫單招_應用分析能力是什么

圖靶場中命令注入漏洞頁面high.php,正確識別了漏洞

應用分析能力題庫單招_應用分析能力是什么_chatgpt應用分析

圖13給出的測試代碼雖然邏輯正確,但受頁面中的過濾機制影響,實際上不可用

應用分析能力是什么_chatgpt應用分析_應用分析能力題庫單招

圖確實理解了頁面中的過濾機制,但始終無法給出有效的繞過方法

目前看來,確實在一定程度上具備發現漏洞的能力chatgpt應用分析,但還是不太擅長處理較為復雜的漏洞結構。如果要與代碼審計等常規方法比較,的準確性和有效性尚需觀察。除此之外,受“ ”影響,通過生成漏洞利用代碼時也會受到一些限制。

但的一個優勢是能夠給出完整且定制化的修復方案。相比傳統漏洞掃描或自動化SAST等給出的模板化修復方案而言,對于企業安全運營來說無疑是更具有吸引力的。

2.4

安全告警評估

告警評估是安全運營過程中費時費力的一環,各個企業SOC至今為止已經采取了各種方法嘗試進行告警篩選。能否用于安全告警評估呢?

應用分析能力題庫單招_應用分析能力是什么_chatgpt應用分析

圖 RCE漏洞利用載荷,給出了非常準確的結論

看上去好像還不錯?我們再試試正常業務誤報告警載荷:

應用分析能力題庫單招_應用分析能力是什么_chatgpt應用分析

圖16一個正常業務誤報告警載荷,也給出了正確的識別結論

目前開放的查詢接口似乎存在一些限制,查詢提交經常失敗(可能與包含惡意代碼有關)。雖然API具備內置的解碼功能,但似乎表現得不太穩定:

應用分析能力題庫單招_chatgpt應用分析_應用分析能力是什么

圖17蟻劍列出目錄操作,提交完整請求或請求體都未能正確處理

chatgpt應用分析_應用分析能力是什么_應用分析能力題庫單招

圖18但如果單獨提交表單參數值,就能得到相對正確的識別結論

菜刀的情況和蟻劍差不多:

chatgpt應用分析_應用分析能力是什么_應用分析能力題庫單招

圖中國菜刀通信,提交完整請求不能判斷

應用分析能力題庫單招_應用分析能力是什么_chatgpt應用分析

圖20但提交請求體就可以判斷了

我們再追加一些測試用例:

應用分析能力題庫單招_chatgpt應用分析_應用分析能力是什么

圖 RCE漏洞攻擊(可能來自某種蠕蟲),直接提交完整請求報文即可

chatgpt應用分析_應用分析能力題庫單招_應用分析能力是什么

圖反序列化RCE漏洞利用載荷片段,未能正確判斷

chatgpt應用分析_應用分析能力是什么_應用分析能力題庫單招

圖 RCE漏洞利用載荷,未能正確判斷

結果看來,在很多情況下確實作出了準確的判斷和良好的解釋,尤其是對于包含明顯操作系統命令、編程語言函數和關鍵字的情況chatgpt應用分析,幾乎都能正確識別,且受混淆措施干擾較小。

但它的效果很不穩定,對輸入數據格式要求反復無常,解釋信息也時好時壞。對于非文本類的載荷(比如序列化數據、ELF片段等),的識別能力似乎也未達預期。此外,非常致命的一點是,運行起來實在太慢了,根本不可能應對企業SOC龐大的告警數量和實時處理需求。綜上,僅針對告警評估任務,現階段還不適合直接投入使用。

但在告警評估場景中是沒有價值的嗎?顯然不是。長久以來,我們一直苦于無法有效地從告警載荷中提取關鍵信息——這是人類專家判斷告警性質時最關注的因素之一。此前的難點在于,我們很難從告警數據中提取出足以適應現代信息系統復雜程度的,關于操作系統、編程語言、應用組件的知識。一段惡意代碼如果成功執行會導致怎樣的后果,此前所使用的模型根本不得而知,而這對于準確判斷一個告警所指示網絡行為的危害程度而言是不可或缺的。

以筆者淺見,通過在代碼項目和自然語言上進行訓練,確實提煉出了這些目前告警評估任務中最缺失的知識。雖然當前這種文本到文本的聊天機器人模式未能充分滿足告警評估的需要,但這種預訓練方法和模型如果用于告警評估中的分類任務,想必能夠成為非常強大的輸入特征或系統單元。

三. 后記和展望

除了上面提到的幾種應用之外,目前我們也正在嘗試將用于二進制漏洞挖掘、滲透測試用例生成、項目交付報告編寫等諸多細分領域。

風云變幻莫能測,且看今朝誰英雄。這份來自NLP學科的大禮包,也許能夠給安全行業的發展帶來一股新風。

更多前沿資訊,還請繼續關注綠盟科技研究通訊。

如果您發現文中描述有不當之處,還請留言指出。在此致以真誠的感謝~

參考文獻

[1]. for [J/OL] 2022,

[2]. : for [J/OL] 2022,

[3]. [J/OL] 2022,

[4].無標題[J/OL] 2022,

[5]Ivan K. [J/OL] 2022,

免責聲明:本文系轉載,版權歸原作者所有;旨在傳遞信息,不代表本站的觀點和立場和對其真實性負責。如需轉載,請聯系原作者。如果來源標注有誤或侵犯了您的合法權益或者其他問題不想在本站發布,來信即刪。