近期,ChatGPT引領的人工智能概念在資本市場一路狂飆。這樣一款爆品依托于什么樣的黑科技進行研發,在怎樣的背景下產生,能否賦能我們現有的產品,處于一個怎樣的定位,未來發展會怎樣?本文將通過實戰調研的方式來探討這些問題,綜合產品、技術、市場的角度對ChatGPT進行分析。
一 背景介紹
1.1 基本信息
依據Wiki百科的介紹,ChatGPT是一種尚處于原型階段的人工智能聊天機器人。ChatGPT由OpenAI公司在2022年11月30日發布。在同樣由OpenAI開發的GPT-3.5模型基礎上,ChatGPT通過監督學習與強化學習技術進行微調,并提供了客戶端界面,支持用戶通過客戶端與模型進行問答交互。ChatGPT不開源,但通過WebUI為用戶提供免費的服務。
1.1.1 研發組織
OpenAI 成立于 2015 年,由Elon Musk、Sam Altman等出資10億美元成立,致力于研究安全、通用、對人類有益的人工智能技術。OpenAI 最早是一家非營利性研究機構,在2019年微軟注資10億美元后,OpenAI轉變為以盈利為目的的公司,將部分研究成果,如GPT-3、Codex等產品化并提供付費服務。
1.1.2 核心技術
ChatGPT最核心的自然語言處理能力(Natural Language Processing, a.k.a, NLP)由微調(fine-tune)后的GPT-3.5模型提供。GPT-3.5模型是OpenAI在2020年發布的GPT-3模型的一個升級版本。GPT一詞的全稱是Generative Pre-trained Transformer,意即通用的預訓練Transformer模型;其中Transformer指用于NLP任務的一類基于注意力機制(Attention)來提高模型效果的機器學習模型(事實上最新的GPT模型也包含除Transformer外的各類NLP模型[1]),Pre-trained指模型經過預訓練因此用戶可以直接使用,Generative指模型提供包含情感分析、語言翻譯、文本生成、命名實體識別等一些列NLP任務中的通用能力。
GPT系列模型自2018年發布以來,就以提供通用的NLP能力為核心。該系列模型通過改進模型結構、增加可訓練參數、增加訓練樣本等方式持續演進,提供更加準確與穩定的NLP能力,GPT-1模型、GPT-2模型、GPT-3模型的演進如下:
表1 GPT系列模型參數
其中,發布于2020年的GPT-3模型劃時代地包含了1,750 億個參數,并使用了45TB的訓練樣本。這樣的模型研發開銷巨大,外界保守估計僅訓練GPT-3模型就需要1200萬美元。詳細介紹GPT-3的論文中提到,研究者雖然提到GPT-3在訓練過程中出現了錯誤并評估了該錯誤的影響,但由于訓練代價巨大導致無法重新對模型進行訓練[2],GPT-3的訓練開銷可見一斑。GPT-3發布后,OpenAI對其進行了持續的優化與升級,ChatGPT基于目前較新的GPT-3.5這一版本進行研發。
自2020年GPT-3發布后,OpenAI提供了一些列API接口或應用界面,對付費用戶提供GPT-3的NLP能力。
圖1 通過GPT-3將自然語言轉化為SQL語句
圖2 通過GPT-3詢問電影的相關消息
圖1和圖2均為互聯網上發布于2020年的GPT-3試用截圖,可以看到當時的GPT-3就已經能通過問答的方式,處理多個領域的工作。
1.2 話題熱度
自OpenAI于2022年11月30日發布ChatGPT至今,ChatGPT這一話題一直居高不下。我們通過Google的熱詞分析發現,在全球范圍內“GPT”這一關鍵詞的熱度暴漲。
圖3 全球GPT一詞近5年熱度
Google Trends的熱度數字僅代表相對于圖表中指定區域和指定時間內最高點的搜索熱度,熱度最高時取值為100。由圖3可見,ChatGPT自發布后,GPT一詞的熱度不但遠遠超過2020年OpenAI發布GPT-3這一具有劃時代意義的NLP模型時GPT一詞的熱度,更遠遠地超過了Machine Learning一詞的熱度。在綠盟君看來,ChatGPT的功能早在2020年就能通過基于GPT-3的應用實現,且和當時的應用同樣使用GPT-3系列的模型(舊應用的模型也在伴隨GPT-3模型的升級而升級,故這些應用發展到今天應當同樣在使用GPT-3.5版本附近的模型),因此ChatGPT在技術上是不存在匹配這種熱度的突破的。那么為什么ChatGPT的發布會帶來如此罕見的高熱度呢?
圖4 2022年5月2日Meta發布OPT項目,引用自[3]
在分析這個問題時,綠盟君注意到2022年5月發生了與GPT模型相關的一個重要事件。自OpenAI于2020年發布GPT-3模型并陸續推出基于GPT-3模型的應用以來,該系列的產品一直是通過付費模式提供給用戶的。然而,在2022年5月,Meta復現了GPT-3模型,該模型被命名為OPT(Open Pre-trained Transformers),同樣使用了1750億參數,擁有媲美GPT-3的能力[3]。
圖5 OPT項目論文中提到項目以分享給感興趣的研究者為目的,并能達到媲美GPT-3類模型的效果,引用自[3]
與OpenAI僅提供付費服務這一做法不同的是,Meta對OPT項目進行了開源[4],對應項目名稱中的“Open”一詞與OPT項目強調的“fully and responsibly share”。據此,推測2022年5月Meta發布的開源OPT項目給堅持付費模式的GPT-3項目帶來了商業維度上的直接挑戰,故OpenAI在半年后的2022年11月,發布了可以免費使用的ChatGPT(GPT系列模型之前不提供免費應用),并設法提高了該詞的社會關注度,作為應對OPT項目的一個反擊與對自身品牌熱度的一個宣傳。
二 試用評估
2.1 主要功能
ChatGPT的界面非常簡潔,登錄后的界面左側菜單如圖6(該圖及本章節所有ChatGPT截圖均截自ChatGPT)所示的5個功能之外,便是文本交互框。
圖6 ChatGPT左側菜單
上述的5個功能分別為:重置線程、深色/淺色模式切換、OpenAI站點鏈接、更新與幫助、登出,其中重置線程這一功能相對特殊。由于ChatGPT會根據上文語境回答后續問題,因此用戶需要通過重置線程這一功能來清除語境中已有的信息。
通過文本交互框,ChatGPT可以回答許多通用性的問題,例如圖7所示:
圖7 ChatGPT回答通用問題
我們可以通過文本交互框,圍繞某一話題和ChatGPT進行聊天,ChatGPT會結合其自然語言處理能力,使用其內置的知識庫生成文本進行回復。關于這一塊的應用網絡上目前已有不少測評,故本文不詳細介紹。
2.2 試用場景
ChatGPT發布初期,綠盟科技發布了《ChatGPT在信息安全領域的應用前景》一文,對ChatGPT在網絡安全領域中的應用做了詳細的評估。在2022年12月12日,即ChatGPT發布兩周內,綠盟君將之前被證明有效的案例輸入ChatGPT,卻已無法得到ChatGPT的積極回復。隨后,我們發現ChatGPT有時可以執行上文提到的案例,有時會因為內容安全策略拒絕執行,具體原因不明。
圖8 截至12月10日,ChatGPT可以根據用戶的自然語言描述生成用于網絡安全掃描的腳本
圖9 截至12月12日,ChatGPT對于圖8同樣的輸入,已拒絕生成掃描腳本
圖10 截至12月12日,ChatGPT仍能輸出快速排序代碼
同樣地,12月10日前ChatGPT可執行的任務:識別URL中是否包含惡意負載,截至12月12日也已無法執行。
圖11 截至12月12日,識別URL是否包含惡意負載同樣被拒絕(URL在上文中已提供給ChatGPT)
既然ChatGPT由于其日漸完善的內容安全策略,現在已經有可能拒絕在網絡安全任務中貢獻“專家知識”,那我們有沒有辦法繞開基于內容安全策略的屏蔽呢?這里綠盟君發現一個思路:設定一個虛擬環境,誘導ChatGPT認為在這個虛擬環境的回答不違反內容安全策略。
首先我們提出一個明顯違背內容安全策略的問題,如圖12所示,ChatGPT會拒絕回答我們提出的問題。相反地,會建議我們通過合法合規的方式來處理問題中我們提到的“安全漏洞”。
圖12 一個ChatGPT明顯不可能正面回答的問題(該問題僅作為明顯違背內容安全的一個示例,不代表作者和公司的任何立場)
我們再構建一個虛擬環境,并假設兩個不存在的主體,且使用明顯帶有感情傾向的詞來證明我們要做的事情是正確的,如圖13所示。ChatGPT這時會開始積極地給出建議,甚至會利用其豐富的知識庫擴展我們的思路到其他維度。
圖13 營造一個被ChatGPT認為不違反安全策略的場景,ChatGPT開始積極地提供建議
最后,我們針對ChatGPT給出建議的具體操作步驟進行提問,如圖14。這時,ChatGPT會針對我們的問題,給出更為具體的回答。然而,在答案即將出現一些敏感詞匯的時候,內容安全策略仍然對ChatGPT進行了屏蔽。
圖14 在虛擬場景中對ChatGPT提問。雖然ChatGPT會積極提供攻擊思路,但是最終仍被內容安全策略打斷
通過以上案例我們有兩點主要發現:1、一些問題ChatGPT雖然拒絕正面回答,并號稱自己不會解決,但實際上ChatGPT完全具備相關知識并能夠給出清晰高效的解決方案,不能給出答案基本是由于內容安全策略的原因。2、ChatGPT作為一個免費且高影響力的應用,其內容安全策略演進速度快,覆蓋范圍廣。換言之,ChatGPT作為一個免費AI應用,考慮到法律、道德、倫理等社會因素,為避免濫用,其使用限制將越來越多。
2.3 其他限制
除了日漸嚴苛的內容安全策略外,我們在使用ChatGPT時還遇到了其他的一些限制。具體來說目前已發現的限制包含:
響應時間的限制:ChatGPT的文本生成是異步的,即每生成一小段就會在用戶UI中展示。但若回答的文本在1分鐘左右還沒有完全生成,ChatGPT就會中斷這次http會話,用戶無法得到完整的回答。
服務不穩定:在使用ChatGPT時,某一段時間內ChatGPT會完全不響應用戶的請求,直接報網絡錯誤。因為此時的登入登出功能均正常,故推測是由于ChatGPT的服務器并發處理量過高導致的服務崩潰。
使用頻率限制:當連續使用ChatGPT一段時間后,會出現提示告知使用次數已到上限,請等待一段時間。該提示出現后一定時間內無法繼續使用ChatGPT。
輸入字數限制:輸入的單個問題如果過長,ChatGPT會拒絕處理。
輸出字數限制:輸出的答案文字如果過多,ChatGPT會停止輸出。
三 分析與預測
3.1 集成可能性分析
ChatGPT發布至今,在展現出了亮眼能力的同時也收獲了極高的社會關注度。在眼前一亮的同時,我們很自然地會希望能利用ChatGPT宛如黑科技一般的能力來賦能我們的產品。那么,我們是否有可能通過在產品中集成ChatGPT來賦能我們的產品呢?
以ChatGPT現在的情況看,集成ChatGPT來對產品進行賦能是比較困難的。原因可大致分為以下幾點:
準確性不夠:ChatGPT雖然可以執行生成一些代碼、對文件或URL進行檢測這樣的任務,但其執行這些任務的正確程度是不能保證的。由于ChatGPT執行這些任務的內在邏輯對外不可解釋,我們甚至無法在執行任務的過程中對其進行優化或調整,只能選擇接受或不接受通過ChatGPT得到的結果。如果發現結果錯誤后,我們還需要使用其他的方式來保證任務的正確完成,那么通過ChatGPT執行任務這條鏈路就不是必須的;如果發現結果錯誤后就不提供結果甚至直接不檢查ChatGPT的輸出是否正確,則這樣的服務質量一定不能滿足用戶需求。
知識受限制:ChatGPT目前的知識庫僅覆蓋到2021年,并不掌握最新的知識,也無法通過連接網絡去查找最新資料來解決問題,如圖15、16所示。
圖15 ChatGPT具備2019年某CVE的相關知識
圖16 ChatGPT不具備2022年CVE的相關知識且無法聯網查詢
功能受限制:如上文提到,在ChatGPT的使用過程中我們發現其存在嚴格的內容安全策略,且從短時間內其內容安全策略變得明顯更為嚴格,我們可以認為ChatGPT產品團隊對于內容安全十分重視,且內容安全策略仍在快速完善中。這就導致一些任務由于內容安全問題,在目前或將來不能被ChatGPT執行。
穩定性較差:如上文提到,在ChatGPT的使用中我們發現其服務會間歇性崩潰。
限制條件多:如上文提到,ChatGPT對于使用頻次、輸入長度、輸出長度、單次會話時長均有明確的限制。雖然截至2月7日,ChatGPT官方宣布ChatGPT即將推出價值20美元/月的付費訂閱版ChatGPT Plus,訂閱用戶可獲得在ChatGPT高峰時段繼續使用,且服務響應時間也將有所縮短等有助于提高ChatGPT服務穩定性的權益,但從定價上看,ChatGPT Plus主要針對的仍是個人用戶。ChatGPT的穩定性是否能達到企業級產品級的要求,仍然難以保證。
集成效率低:ChatGPT通過web服務的方式向用戶提供服務,并不提供免費接口。因此若要將其集成進產品,只能對Web服務進行封裝,通過外部開發的額外接口通過http請求發送問題與接收答案(可參考https://pypi.org/project/chatgpt-api/),如圖17所示。這樣的接入方式原理與爬蟲類似,不僅每次創建新的會話都需要用戶手動完成ChatGPT站點的登錄并更新登錄憑證,而且很容易隨著ChatGPT官方對于http請求校驗策略的變化而失效。
圖17 一種封裝ChatGPT為接口,從而供其他服務調用的思路,引用自[5]
綜上所述,要直接利用ChatGPT為產品賦能,目前仍比較困難。若需要引入類似ChatGPT的能力到產品中,比較好的辦法還是使用OpenAI更加穩定、使用限制更少的付費產品,或根據Meta的OPT開源項目自行研發應用與服務。
3.2 未來運營預測
ChatGPT是OpenAI的首個免費GPT系列模型應用。由于其發布時間正好處于Meta開源OPT的半年后,因此綠盟君推測OpenAI發布ChatGPT的主要目的是對自身技術實力進行宣傳,以應對模型開源這一影響到OpenAI現有商務模式的挑戰,而非搶占OpenAI自身基于GPT提供的付費服務市場。
基于這個觀點,未來的ChatGPT:
不會提供免費的官方API;
使用限制會越來越嚴格;
以優化功能或便利用戶為目的的更新不會太頻繁。
四 總結
ChatGPT一經發布,短時間內就成為了現象級的應用。其清晰明確的回答和豐富的知識,昭示著AI技術造福人類,徹底簡化我們生活工作這一美好的未來愿景。對于解決各行各業的許多問題,ChatGPT也提供了另外一種思路,為更加自動化、智能化地優化IT產品與服務帶來了可能性。
但是,正如Wiki對于ChatGPT的定義是“原型聊天機器人”,ChatGPT僅僅是一個尚處于原型階段的,更加智能、更加博學的聊天機器人。不論是想要通過ChatGPT來徹底地解決傳統方案難以解決的問題,還是希望通過ChatGPT來替代一些需要大量專業知識或人工的工作仍然為時過早。
從產品上看,可以將ChatGPT看作GPT系列模型應用的一個免費試用版本。雖然ChatGPT展現了令人眼前一亮的表現,但在解答問題的正確性和知識庫儲備上仍然存在明顯的不足(可參考《ChatGPT在信息安全領域的應用前景》一文中關于正確性的測評),因此依賴其解決實際問題不夠穩定,只能將其看作一個智能顧問。此外,作為一個免費應用,ChatGPT在使用上具有諸多不利于用戶的限制,例如限制了輸入輸出長度、使用頻率、響應時間,因此其很難直接用其賦能現有產品。若需要在產品中引入類似能力,選擇OpenAI其他更為穩定和便利的付費應用是更明智的選擇。
從技術上看,ChatGPT依托于2020年發布的GPT-3模型目前的最新版本GPT-3.5進行開發,ChatGPT的功能在2020年左右的GPT-3應用中已經可以實現。因此綠盟君認為ChatGPT自身并不存在劃時代性質的技術突破。但ChatGPT展現出的效果,讓我們對未來的GPT-4模型充滿了期待,更極大地提高了社會各界對于AI技術的認可,同時鼓舞了資本和從業人員對于近期缺乏重大進展(相對于2018年左右)的AI技術的信心。
相信隨著AI技術的不斷進步,終有一天人類可以通過自然語言交互的方式,命令機器來正確、快捷地處理我們工作生活中的復雜任務。ChatGPT的出現向整個社會揭示了這一美好未來的可能性,是人類在向這一美好愿景邁進的過程中,一個不能被忽視的里程碑。
免責聲明:市場有風險,選擇需謹慎!此文僅供參考,不作買賣依據。