2022 年 11 月 30 日,OpenAI公司的對(duì)話式人工智能應(yīng)用ChatGPT正式發(fā)布,因其對(duì)話能力遠(yuǎn)超同類(lèi)應(yīng)用而迅速引爆互聯(lián)網(wǎng)。2023年1月份,其月活用戶(hù)數(shù)已經(jīng)破億,成為史上發(fā)展最快的應(yīng)用。2023年3月15日,GPT-4的發(fā)布再次引爆互聯(lián)網(wǎng),原有的自然語(yǔ)言理解、推理和對(duì)話能力繼續(xù)增強(qiáng),更引入了識(shí)圖等多模態(tài)識(shí)別功能,有研究認(rèn)為可以將其視為“通用性人工智能”的初步階段。在國(guó)內(nèi),百度同類(lèi)產(chǎn)品“文心一言“的發(fā)布同樣引起了極大關(guān)注。
本文旨在分析ChatGPT類(lèi)生成式人工智能產(chǎn)品及技術(shù)對(duì)我國(guó)網(wǎng)信工作和輿情工作的影響。主要內(nèi)容為:1. 該類(lèi)產(chǎn)品可能會(huì)形成新的、占據(jù)大量用戶(hù)使用時(shí)間的互聯(lián)網(wǎng)流量入口。2. 技術(shù)上短期內(nèi)會(huì)呈現(xiàn)OpenAI領(lǐng)跑,其他國(guó)內(nèi)外的大型科技公司跟隨的局面。3. 該類(lèi)產(chǎn)品和技術(shù)短期內(nèi)可以提升特定行業(yè)的生產(chǎn)力,并在長(zhǎng)期對(duì)社會(huì)各行各業(yè)都有有利影響。4. 該類(lèi)產(chǎn)品在提供監(jiān)管和引導(dǎo)的情況下對(duì)社會(huì)文化發(fā)展有利,但也有部分需要特別關(guān)注的問(wèn)題。5. 應(yīng)該采取一系列措施,鼓勵(lì)該類(lèi)產(chǎn)品健康發(fā)展,并在形成規(guī)模后配套一系列監(jiān)管措施保證其符合社會(huì)倫理。6.具體建議。
1. 產(chǎn)品發(fā)展預(yù)測(cè)。
該類(lèi)產(chǎn)品可以分核心產(chǎn)品和衍生產(chǎn)品。
核心產(chǎn)品是類(lèi)似ChatGPT的對(duì)話式聊天工具。該類(lèi)產(chǎn)品從OpenAI已經(jīng)建立了較為明顯的領(lǐng)先優(yōu)勢(shì)。其產(chǎn)品ChatGPT能力明顯領(lǐng)先于競(jìng)爭(zhēng)對(duì)手,甚至在一項(xiàng)之前被人類(lèi)認(rèn)為自身獨(dú)有的能力創(chuàng)造力評(píng)估中,只有9.4%的人可以超過(guò)GPT4 (arxiv.org/abs/2303.12003)。谷歌作為其底層技術(shù)(transformers)的發(fā)明者,在公司高層非常重視、不缺技術(shù)不缺資金的情況下,其同類(lèi)產(chǎn)品bard在功能、體驗(yàn)上仍然明顯落后于ChatGPT。在短期內(nèi),仍然會(huì)呈現(xiàn)ChatGPT占據(jù)市場(chǎng)主要份額,其他類(lèi)產(chǎn)品如Bard、Sage、Claude等競(jìng)爭(zhēng)少量剩余市場(chǎng)份額的局面。國(guó)內(nèi)來(lái)看,上海秘塔網(wǎng)絡(luò)科技有限公司在2023年2月28日推出了“對(duì)話寫(xiě)作貓”類(lèi)產(chǎn)品,采用秘塔自研MetaLLM大模型,主要聚焦于寫(xiě)作輔助場(chǎng)景。不過(guò)更具影響力的還是3月16日百度發(fā)布的生成式AI產(chǎn)品“文心一言”。
衍生產(chǎn)品國(guó)際上以微軟為主導(dǎo)。因?yàn)槲④浐蚈penAI的深度合作關(guān)系,微軟率先在自家搜索引擎bing中引入對(duì)話機(jī)器人而搶占了不少Google的市場(chǎng)份額。同時(shí)還在自己的多個(gè)產(chǎn)品線如Office、Github、Loop中宣布引入類(lèi)似的技術(shù)。國(guó)內(nèi)因發(fā)展較晚,衍生產(chǎn)品還沒(méi)有大規(guī)模發(fā)展。
從ChatGPT的發(fā)展來(lái)看,該類(lèi)產(chǎn)品可能會(huì)形成新的、占據(jù)大量用戶(hù)使用時(shí)間的互聯(lián)網(wǎng)流量入口,并逐漸侵入其他垂直領(lǐng)域。
2. 技術(shù)發(fā)展預(yù)測(cè)。
ChatGPT采用的GPT-4語(yǔ)言模型為目前公認(rèn)的效果最好的語(yǔ)言模型,但其技術(shù)細(xì)節(jié)OpenAI并沒(méi)有公布。Facebook開(kāi)源了他們的大語(yǔ)言模型LLaMA。國(guó)內(nèi)來(lái)看,復(fù)旦大學(xué)在2月份曾打算公開(kāi)發(fā)布類(lèi)ChatGPT模型MOSS,但因熱度過(guò)大而暫停公開(kāi)。清華大學(xué)在3月14日發(fā)布了ChatGLM-6B開(kāi)源雙語(yǔ)對(duì)話語(yǔ)言模型,其中文對(duì)話能力較強(qiáng)。百度的文心一言模型為非開(kāi)源的自研大語(yǔ)言模型。
值得注意的是,已經(jīng)有多個(gè)研究發(fā)現(xiàn)基于一個(gè)并不先進(jìn)的開(kāi)源大型語(yǔ)言模型 (LLM),結(jié)合OpenAI的語(yǔ)言模型或其他先進(jìn)語(yǔ)料進(jìn)行微調(diào),即可獲得相似于ChatGPT 的能力。如斯坦福大學(xué)開(kāi)源的Alpaca和databricks的Hello Dolly,都可以利用已發(fā)布的語(yǔ)言模型和較少的訓(xùn)練資源來(lái)達(dá)到類(lèi)似于ChatGPT的能力。
從底層技術(shù)上看,大預(yù)言模型的訓(xùn)練都要使用大量的先進(jìn)GPU。目前該項(xiàng)技術(shù)主要為NVIDIA所獨(dú)有。我國(guó)的GPU技術(shù)起步較晚,目前且NVIDIA最先進(jìn)的產(chǎn)品如Tesla A100已被美國(guó)禁運(yùn),國(guó)內(nèi)只能提供性能差一級(jí)的特供版。
綜上來(lái)看,技術(shù)上短期內(nèi)仍然呈現(xiàn)OpenAI一家獨(dú)大的局面,與其深度合作的微軟公司可以共享其技術(shù)成果。其他國(guó)內(nèi)國(guó)外的大型科技公司公司雖然無(wú)法達(dá)到OpenAI的高度,但也可以在短期內(nèi)擁有一個(gè)效果類(lèi)似于ChatGPT初期的語(yǔ)言模型。對(duì)國(guó)內(nèi)企業(yè)來(lái)說(shuō),相對(duì)于美國(guó)企業(yè)有兩個(gè)額外的難點(diǎn):1. 用于訓(xùn)練的中文高質(zhì)量語(yǔ)料不足。2. 先進(jìn)GPU進(jìn)口受限。
本章節(jié)主要預(yù)測(cè)ChatGPT類(lèi)生成式人工智能產(chǎn)品在發(fā)展到一定程度后的社會(huì)影響。
其影響顯然是多方面的,限于能力和篇幅,本文僅嘗試從社會(huì)生產(chǎn)力影響、社會(huì)文化影響輿論動(dòng)員能力、互聯(lián)網(wǎng)產(chǎn)業(yè)影響、網(wǎng)絡(luò)數(shù)據(jù)安全影響角度做淺析。
1. 社會(huì)生產(chǎn)力影響
工作效率方面,該類(lèi)產(chǎn)品在一些領(lǐng)域可以顯著的提高工作效率。目前來(lái)看,ChatGPT類(lèi)產(chǎn)品和技術(shù)在外語(yǔ)翻譯、寫(xiě)作輔助、編程輔助等領(lǐng)域都體現(xiàn)出了非常好的效果。其對(duì)專(zhuān)業(yè)技術(shù)文章的快速總結(jié)能力也已經(jīng)得到了驗(yàn)證。在其他一些較為小眾的專(zhuān)業(yè)領(lǐng)域,也可以通過(guò)諸如ChatGPT Retrieval Plugin這樣的插件結(jié)合專(zhuān)業(yè)文檔來(lái)得到一個(gè)幫助用戶(hù)快速入門(mén)和檢索的問(wèn)答式機(jī)器人。OpenAI的研究人員估計(jì) ChatGPT 和使用該程序構(gòu)建的未來(lái)應(yīng)用可能影響美國(guó)大約 19% 的工作崗位,和他們至少 50% 的工作任務(wù)(相關(guān)論文:arxiv.org/pdf/2303.10130v1.pdf )。
總體來(lái)說(shuō),該類(lèi)產(chǎn)品還是會(huì)顯著的增加各行各業(yè)的生產(chǎn)力。
2. 社會(huì)文化影響和輿論動(dòng)員能力
該類(lèi)應(yīng)用的輿論動(dòng)員能力主要體現(xiàn)在顯式和隱式兩個(gè)方面。
顯式方面,因?yàn)樵擃?lèi)應(yīng)用可能會(huì)發(fā)展成為新的互聯(lián)網(wǎng)流量入口。其首頁(yè)上的推薦信息等會(huì)成為新聞門(mén)戶(hù),其影響力類(lèi)似于現(xiàn)有其他類(lèi)互聯(lián)網(wǎng)門(mén)戶(hù)。
隱式方面則更為重要。在有大量用戶(hù)的前提下,語(yǔ)言模型可以被認(rèn)為獲得了對(duì)世界觀價(jià)值觀人生觀的解釋權(quán)。語(yǔ)言模型的意識(shí)形態(tài)是隱藏在訓(xùn)練數(shù)據(jù)和訓(xùn)練過(guò)程中的,無(wú)法直接通過(guò)文字或代碼來(lái)檢查驗(yàn)證。在2022年12月,清華大學(xué)·交叉信息研究院·助理教授于洋帶領(lǐng)團(tuán)隊(duì)對(duì)GPT-2做了性別歧視水平評(píng)估,測(cè)試結(jié)果發(fā)現(xiàn)其存在一定的歧視行為。2月份 OpenAI 首席執(zhí)行官 Sam Altman 在 2 月初發(fā)推文表示其在偏見(jiàn)方面存在偏見(jiàn)。
雖然語(yǔ)言模型的偏見(jiàn)是不可避免的,但從另一個(gè)角度來(lái)說(shuō),正式上市的語(yǔ)言模型,包括國(guó)外的ChatGPT類(lèi),整體還是表現(xiàn)出了較高的倫理/道德水準(zhǔn),相對(duì)于日常人們接觸到的互聯(lián)網(wǎng)環(huán)境,接觸ChatGPT帶來(lái)的影響可能更為正面。對(duì)語(yǔ)言模型只需加以監(jiān)管和引導(dǎo),其益處會(huì)明顯大于壞處。非正式上市的語(yǔ)言模型,因可能不做倫理方面的訓(xùn)練而更容易被用作灰產(chǎn),這類(lèi)產(chǎn)品可以生成大量的爭(zhēng)議性文章用作引流、在封閉性社群挑逗吸粉等,如果被用作未成年教育可能危害極大。
教育領(lǐng)域,ChatGPT是否可應(yīng)用于教學(xué),特別是大學(xué)生在完成作業(yè)時(shí)能否使用ChatGPT也產(chǎn)生了巨大爭(zhēng)議。
除了對(duì)話類(lèi)產(chǎn)品,還應(yīng)該考慮ChatGPT類(lèi)技術(shù)帶來(lái)的影響。ChatGPT類(lèi)技術(shù)可以在短期內(nèi)生成大量的同類(lèi)但不完全相同的文章,目前已可被用于灰產(chǎn)、批量廣告、SEO技術(shù)等。如果和水軍機(jī)器人技術(shù)結(jié)合,可能會(huì)產(chǎn)生大量以假亂真的帖子攪亂互聯(lián)網(wǎng)空間。對(duì)互聯(lián)網(wǎng)平臺(tái)和管理部門(mén)而言,如何監(jiān)控人工智能生成的批量數(shù)據(jù)是個(gè)新的監(jiān)管難點(diǎn)。
3. 互聯(lián)網(wǎng)產(chǎn)業(yè)的影響
該類(lèi)應(yīng)用可能會(huì)重塑互聯(lián)網(wǎng)格局。ChatGPT成為最快達(dá)到1億月活用戶(hù)的互聯(lián)網(wǎng)公司。根據(jù)分析公司Similarweb的數(shù)據(jù),在微軟將OpenAI的AI聊天技術(shù)整合到搜索引擎必應(yīng)(Bing)之后,必應(yīng)的頁(yè)面訪問(wèn)量較一個(gè)月前增長(zhǎng)15.8%,而谷歌同期搜索引擎的訪問(wèn)量下降了近1%。在ChatGPT開(kāi)放插件體系后,已有預(yù)測(cè)其將成為一個(gè)新的互聯(lián)網(wǎng)門(mén)戶(hù)。
4. 網(wǎng)絡(luò)數(shù)據(jù)安全的影響
OpenAI作為一個(gè)已AI研究起家的小公司,其產(chǎn)品能力要明顯弱于其他老牌互聯(lián)網(wǎng)大廠,上線以來(lái)已經(jīng)歷過(guò)多輪宕機(jī)和數(shù)據(jù)丟失現(xiàn)象。3月25日,OpenAI公司披露有1.2% 的 ChatGPT Plus 用戶(hù)可能向其他用戶(hù)泄露了個(gè)人數(shù)據(jù)。
從OpenAI和隱私協(xié)議看,用戶(hù)在使用ChatGPT期間的提示和回復(fù)等數(shù)據(jù),將被該公司繼續(xù)用于訓(xùn)練AI算法模型。這也是ChatGPT能力可以持續(xù)提升,保持對(duì)其他同類(lèi)產(chǎn)品競(jìng)爭(zhēng)力的一個(gè)重要原因。
如果國(guó)外產(chǎn)品在國(guó)內(nèi)提供服務(wù),主管部門(mén)需要考慮跨境數(shù)據(jù)的安全問(wèn)題以及產(chǎn)品本身的安全能力。如果是國(guó)內(nèi)產(chǎn)品在國(guó)內(nèi)提供服務(wù),也需要考慮其訓(xùn)練數(shù)據(jù)是否確實(shí)剔除了隱私內(nèi)容,特別是有多項(xiàng)業(yè)務(wù)的互聯(lián)網(wǎng)大廠,是否會(huì)挪用用戶(hù)的輸入數(shù)據(jù)用于其他業(yè)務(wù)。
這部分嘗試從上文中的分析,對(duì)網(wǎng)信等互聯(lián)網(wǎng)主管部門(mén)如何引導(dǎo)ChatGPT類(lèi)產(chǎn)品和技術(shù)健康發(fā)展提出初步建議。僅供參考。
1. 鑒于其對(duì)社會(huì)生產(chǎn)力進(jìn)步的積極作用,因積極鼓勵(lì)互聯(lián)網(wǎng)公司大力發(fā)展同類(lèi)產(chǎn)品和技術(shù),并在一些具體問(wèn)題上給予支持。
a) 數(shù)據(jù)問(wèn)題:可以開(kāi)放可公開(kāi)的政務(wù)數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)。這部分?jǐn)?shù)據(jù)內(nèi)容質(zhì)量高且符合。在合法、保證隱私的前提下引導(dǎo)各互聯(lián)網(wǎng)平臺(tái)數(shù)據(jù)流通。
b) 算力問(wèn)題:可協(xié)調(diào)國(guó)家超算為互聯(lián)網(wǎng)公司提供有償服務(wù),彌補(bǔ)算力不足的因素。
c) 對(duì)訓(xùn)練數(shù)據(jù)的使用過(guò)程中,法律不明確的地方提供支持。
2. 網(wǎng)信部門(mén)可以總結(jié)符合我國(guó)社會(huì)文化發(fā)展需要的語(yǔ)言倫理模型或其他可供參考的條款供互聯(lián)網(wǎng)公司訓(xùn)練模型時(shí)應(yīng)用。同時(shí),對(duì)于用戶(hù)數(shù)超過(guò)一定數(shù)量級(jí)的產(chǎn)品應(yīng)定期監(jiān)控評(píng)估其倫理模型的合理性。
3. 可主動(dòng)應(yīng)用該類(lèi)技術(shù),為群眾提供領(lǐng)域內(nèi)的咨詢(xún)服務(wù),如網(wǎng)絡(luò)安全、政策法規(guī)問(wèn)答等。
4. 鑒于對(duì)該類(lèi)技術(shù)監(jiān)控存在技術(shù)難點(diǎn),可鼓勵(lì)第三方公司開(kāi)發(fā)評(píng)估大語(yǔ)言模型的倫理是否恰當(dāng)?shù)谋O(jiān)測(cè)工具。為AI發(fā)展的監(jiān)管提供技術(shù)支撐能力。
5. 鑒于新技術(shù)可能帶來(lái)的爭(zhēng)議性,應(yīng)監(jiān)測(cè)該項(xiàng)技術(shù)在互聯(lián)網(wǎng)上引發(fā)的爭(zhēng)議,對(duì)涉及社會(huì)公共領(lǐng)域的問(wèn)題及時(shí)回應(yīng)。
6. 鑒于該類(lèi)技術(shù)可能在短期內(nèi)應(yīng)用于水軍類(lèi)黑灰產(chǎn),可要求互聯(lián)網(wǎng)平臺(tái)加強(qiáng)在該技術(shù)下對(duì)水軍的識(shí)別,并鼓勵(lì)第三方公司提供該類(lèi)技術(shù)下的監(jiān)測(cè)能力。
7. 鑒于對(duì)該類(lèi)技術(shù)在大量應(yīng)用后可能會(huì)取代部分崗位,可以牽頭評(píng)估短期內(nèi)影響較大工作崗位,并提請(qǐng)其他相關(guān)部門(mén)提前做出應(yīng)對(duì)。
8. 鑒于該類(lèi)技術(shù)存在安全性的心理預(yù)期偏差(用戶(hù)認(rèn)為自己面對(duì)的是機(jī)器人而實(shí)際這些數(shù)據(jù)可能被用于其他研究)??商嵝讶罕娮⒅刈陨淼臄?shù)據(jù)安全,詳細(xì)了解其使用協(xié)議,并監(jiān)管廠商是否依法依規(guī)使用用戶(hù)數(shù)據(jù)。
蟻坊軟件輿情監(jiān)測(cè)系統(tǒng)試用》》
(部分文字、圖片來(lái)自網(wǎng)絡(luò),如涉及侵權(quán),請(qǐng)及時(shí)與我們聯(lián)系,我們會(huì)在第一時(shí)間刪除或處理侵權(quán)內(nèi)容。電話:4006770986 負(fù)責(zé)人:張明)