今日快看!炒作機(jī)器的算法如何影響我們做選擇?
本書摘編自《炒作機(jī)器》,作者:[美]錫南·阿拉爾著,36氪經(jīng)授權(quán)發(fā)布。
在數(shù)字社交網(wǎng)絡(luò)、機(jī)器智能和智能手機(jī)這三個領(lǐng)域里的設(shè)計和開發(fā)共同決定了炒作機(jī)器將如何構(gòu)建我們這個世界。
(相關(guān)資料圖)
在很大程度上,數(shù)字社交網(wǎng)絡(luò)構(gòu)建了當(dāng)今社會的信息流;通過好友推薦和在饋送算法引導(dǎo)下的網(wǎng)絡(luò)信息流動,機(jī)器智能引領(lǐng)了當(dāng)今數(shù)字社交網(wǎng)絡(luò)的演化;而智能手機(jī)為炒作機(jī)器的運(yùn)作創(chuàng)造了一個“永遠(yuǎn)在線”的環(huán)境。
從我們的行為與表達(dá)的觀點(diǎn)中,智能手機(jī)和數(shù)字社交網(wǎng)絡(luò)每時每刻都在搜集各種數(shù)據(jù),然后將這些數(shù)據(jù)輸入機(jī)器智能中,機(jī)器智能構(gòu)建了我們獲取信息的渠道,限制了我們可以接觸的觀點(diǎn)和信念。數(shù)字社交網(wǎng)絡(luò)、機(jī)器智能和智能手機(jī)的三位一體已經(jīng)改變了我們生產(chǎn)與消費(fèi)信息的方式,改變了我們的日常行為以及獲取信息的方式,也改變了炒作機(jī)器對我們產(chǎn)生影響的方式。
理解信息處理機(jī)器總共分幾步?
要想真正理解這樣一臺信息處理機(jī)器,我們必須首先了解它的三個基本組成部分:底層、處理層以及媒介層。
底層指的是數(shù)字社交網(wǎng)絡(luò),這個網(wǎng)絡(luò)構(gòu)建起了我們進(jìn)行互動的方式;處理層又被稱作“炒作環(huán)路”,它通過機(jī)器智能和人類智能的互動來控制信息在底層的流動;最后是媒介層,也就是智能手機(jī)(至少目前是智能手機(jī)),它是主要的輸入與輸出設(shè)備,大多數(shù)人都是通過智能手機(jī)向炒作機(jī)器提供或接收有關(guān)信息的。任何我們可以用來進(jìn)行解釋的理論或分析,比如,為什么虛假新聞在網(wǎng)上傳播的速度會比真相更快,或者為什么炒作機(jī)器以其目前的形式會破壞“群體智慧”,都需要我們對這三個組成部分有基本的了解(見圖 3.3)。
這里所謂的“底層”實際上是網(wǎng)絡(luò)本身,而底層就是炒作機(jī)器的核心。這種網(wǎng)絡(luò)是一種不斷演化的、數(shù)量達(dá)到了人口規(guī)模的各種鏈接的集合,它通過臉書、推特、領(lǐng)英以及其他社交網(wǎng)站把我們連接在一起。底層塑造了炒作機(jī)器當(dāng)下的形態(tài),并且在很大程度上構(gòu)建了能夠決定“誰能知道什么,以及在什么時候知道”的基礎(chǔ)架構(gòu)。與炒作機(jī)器連接的網(wǎng)絡(luò)結(jié)構(gòu)決定了信息流動的方式,所以只要了解了這些結(jié)構(gòu)以及它們是如何演化的,那么無論是面對政治兩極分化的興起、社會運(yùn)動發(fā)展的勢頭,還是面對虛假新聞的傳播或定位廣告的成功,我們都可以從中獲得關(guān)于這個社會運(yùn)作方式的洞見。
具體規(guī)范網(wǎng)絡(luò)的演化并管理信息在網(wǎng)絡(luò)上的流動的“處理層”就是我所說的炒作環(huán)路。
正是機(jī)器智能和人類智能的循環(huán)互動決定了我們會關(guān)注什么,以及信息和知識如何在世界各地傳播。推動人和機(jī)器互動的是機(jī)器智能的興起,以及我們已經(jīng)擁有的在人口規(guī)模上搜集有關(guān)人類思想、行為和觀點(diǎn)的數(shù)據(jù)的能力。機(jī)器智能吸收了我們的思想、行為和觀點(diǎn),反過來又策劃了我們在信息流中看到的那些故事、在Instagram上看到的圖片、在領(lǐng)英上被推薦的同事和在Tinder上被推薦的約會對象,以及我們在這些內(nèi)容旁看到的廣告。隨后,我們就會消費(fèi)這些信息并在這些信息的基礎(chǔ)上進(jìn)行決策。我們會點(diǎn)擊一些被推送給我們的鏈接和圖片,然后放棄其他的鏈接和圖片;我們會對一些帖子進(jìn)行評論或點(diǎn)贊,但同時會完全無視其他帖子和內(nèi)容;我們甚至?xí)谕镀闭竞痛笮唾徫镏行囊勒瘴覀冊诰W(wǎng)上看到的內(nèi)容改變我們的線下行為。
炒作機(jī)器會在一旁觀察我們的決策過程,了解我們喜歡什么,我們會喜歡誰,以及我們是如何進(jìn)行思考的。這樣,等到下一次在同樣的場合,它在調(diào)整后給出的建議就會更符合我們的心意。這種人類和機(jī)器循環(huán)互動的過程,也就是被我稱作炒作環(huán)路的處理層。在它左右我們決策的同時,我們實際上也對它產(chǎn)生了影響。但是這種循環(huán)互動的結(jié)果是非常真實的,你會決定買下它推薦的產(chǎn)品、投票給網(wǎng)上曾經(jīng)提到過的那個人,你還會跟隨其他人出現(xiàn)在市內(nèi)的廣場上進(jìn)行抗議。當(dāng)然,有時候事情還會像發(fā)生在巴格達(dá)的塔利爾廣場上的那些事情一樣具有戲劇性的效果。
媒介層指的是我們與炒作機(jī)器進(jìn)行互動時使用的輸入與輸出設(shè)備。今天,媒介層主要指的是智能手機(jī),但明天,它或許會是AR或者VR頭盔、數(shù)字隱形眼鏡、虛擬人、室內(nèi)音響設(shè)備或上述這些設(shè)備的某種組合。無論實際采用的是什么設(shè)備,媒介層都是極其重要的一環(huán),因為它決定了炒作機(jī)器會在什么樣的背景下了解我們,并隨后影響我們。
你和誰聯(lián)系不是你決定的
我們在網(wǎng)上會和誰建立聯(lián)系,這在很大程度上是由一系列的好友推薦算法推動的,這種算法幾乎在炒作機(jī)器的所有平臺上都可以找到,無論是臉書的好友推薦算法,還是領(lǐng)英的PYMK算法以及其他各種各樣的算法,所有算法都會向我們建議應(yīng)該和誰約會、和誰做生意或者和誰交往。
拉爾斯·巴克斯托姆在成為臉書的工程副總裁之前,具體負(fù)責(zé)臉書的PYMK算法。正如他在2010年指出的那樣,“在臉書上,大多數(shù)互加好友的行為”都是由臉書的好友推薦算法推動的。盡管PYMK算法是領(lǐng)英公司在2006年發(fā)明的,但現(xiàn)在,在炒作機(jī)器上把陌生人相互聯(lián)系在一起的機(jī)器智能幾乎無所不在。
雖然這些算法的細(xì)節(jié)屬于技術(shù)專利,但毫無疑問的是,我們都知道它們會利用我們的朋友和他們的朋友的信息,以及關(guān)于我們在哪里工作、去哪里上學(xué)等這樣一些信息來向我們推薦新的聯(lián)系人。還有一種普遍的看法認(rèn)為,炒作機(jī)器會利用不在其平臺上的人的電子郵件和電話號碼來增強(qiáng)它們對真實的、潛在的人類社交網(wǎng)絡(luò)的理解。
2014年,臉書申請了一項專利,這項新的技術(shù)可以通過嗅探網(wǎng)絡(luò)數(shù)據(jù)包來推斷兩部手機(jī)是否在同一時間出現(xiàn)在了同一地點(diǎn),然后再以此為依據(jù)來進(jìn)行好友推薦。這項專利還描述了臉書如何通過比較手機(jī)的加速度計和陀螺儀的數(shù)據(jù)來推斷兩個人正面對面行走,還是正朝同方向一起行走。2015年,臉書又申請了一項專利,新的專利可以通過用戶拍攝照片的相機(jī)鏡頭上的灰塵顆粒,推斷出兩個人上傳的照片是否出自同一臺相機(jī)。我們知道,PYMK算法中的“鏈接預(yù)測算法”需要整個系統(tǒng)向其提供大量的數(shù)據(jù),而數(shù)據(jù)的采集過程對隱私造成的影響很可能是一件非常麻煩的事情,但是在炒作機(jī)器的內(nèi)部,這一部分機(jī)器智能產(chǎn)生的更加系統(tǒng)化的結(jié)果或許會帶來更加廣泛的影響,那就是PYMK算法會更傾向于促成“三元閉包”。
算法如何塑造我們的思維方式?
炒作機(jī)器的智能程序不僅僅通過推薦好友來塑造社交圖譜,還通過推薦我們消費(fèi)的內(nèi)容,即通過推薦新聞、圖片、視頻、故事以及廣告來塑造我們的思維方式。毫不夸張地說,饋送算法在很大程度上決定了我們可以知道什么以及在什么時候知道。理解這些算法的設(shè)計可以幫助我們理解它們可能帶來的后果。盡管不同的平臺有不同的饋送算法,但所有的饋送算法在設(shè)計上都非常相似(雖然有些平臺,比如推特,現(xiàn)在依然允許我們選擇不參與算法的內(nèi)容管理)。
當(dāng)內(nèi)容的供應(yīng)超過了我們消費(fèi)內(nèi)容所需的認(rèn)知能力時,主動推送的需求就自然而然地出現(xiàn)了。剛開始的時候,炒作機(jī)器用倒序的方式來顯示內(nèi)容就足夠了,但是隨著社交媒體上內(nèi)容的數(shù)量逐漸超過了我們認(rèn)知的容量,炒作機(jī)器不得不開始為我們安排這些內(nèi)容的優(yōu)先級。雖然這樣的優(yōu)先排序可以幫助我們發(fā)現(xiàn)與我們最密切相關(guān)的東西,但與此同時,這使得炒作機(jī)器有了巨大的權(quán)力來決定我們可以看到哪些信息。
信息流算法會根據(jù)內(nèi)容的相關(guān)性對其進(jìn)行排序。首先,對于每一篇內(nèi)容,信息流算法都會給出一個對每個人來說都獨(dú)一無二的“相關(guān)性評分”。隨后,在推送給我們的新聞中,這些內(nèi)容會被按照相關(guān)性評分依次遞減的順序進(jìn)行排列。這個相關(guān)性評分是由一些預(yù)測模型給出的,而這些模型會去了解是什么驅(qū)使著我們與某一段內(nèi)容進(jìn)行互動。
在這里,互動是通過我們在處理這些內(nèi)容的過程中表現(xiàn)出來的數(shù)十種行為來定義的。例如,我們可以點(diǎn)贊、點(diǎn)擊、分享、花時間仔細(xì)閱讀或觀看、針對具體的內(nèi)容撰寫簡短的評論等。預(yù)測模型會基于是誰上傳了相關(guān)的內(nèi)容、內(nèi)容涉及了哪些領(lǐng)域或行業(yè)、其中是否包含了圖片或視頻、視頻中有什么樣的內(nèi)容、是否是最新的內(nèi)容,以及我們有多少朋友曾經(jīng)點(diǎn)贊或分享了這些內(nèi)容等,來預(yù)測我們是否也會參與這些內(nèi)容互動。在根據(jù)數(shù)十種不同的參與度衡量標(biāo)準(zhǔn)得出了我們會參與互動的概率后,所有這些參與互動的概率都會被匯總成唯一的相關(guān)性評分。一旦每一篇內(nèi)容都有了一個相關(guān)性評分(每一次當(dāng)你打開信息流服務(wù)時,臉書的算法就會針對2000篇不同的內(nèi)容為你計算出所有的相關(guān)性評分),它們就會被按照相關(guān)性評分逐次降低的順序進(jìn)行排列并顯示在你的信息流服務(wù)中。
臉書在2006年推出信息流服務(wù)的時候,其主要目的還是向用戶提供朋友的資料、照片以及狀態(tài)的更新信息。在2009年點(diǎn)贊按鈕被發(fā)明出來之前,信息流是根據(jù)有關(guān)內(nèi)容發(fā)布的時間以及我們有多少個朋友曾經(jīng)提到過某個帖子等因素來進(jìn)行排序的。當(dāng)然,這項服務(wù)的推出(站在臉書的角度)從根本上還是為了最大限度地提高用戶的留存率和他們在網(wǎng)站上滯留的時間。點(diǎn)贊按鈕的推出把信息流中的每一條新聞的價值和某種衡量“流行度”的標(biāo)準(zhǔn)捆綁在了一起,從而使優(yōu)化的重點(diǎn)轉(zhuǎn)向了那些具有更高的流行度的項目。
點(diǎn)贊按鈕成了某種衡量流行度的公共標(biāo)準(zhǔn),這一事實意味著出版商和普通的用戶可以通過調(diào)整自己的內(nèi)容來獲取更多的點(diǎn)贊,而這又可以讓內(nèi)容贏得更高的“收視率”。很多顧問公司聲稱自己可以“玩弄”算法,比如通過提高帖子的流行度使帖子在網(wǎng)上火起來,而現(xiàn)在這已經(jīng)成了司空見慣的事。
但是,如果你認(rèn)為信息流只考慮了點(diǎn)贊、評論和分享這些因素,那就過于簡單了。臉書的工程師們很早就意識到,這些衡量指標(biāo)并沒有完全捕捉到人們想要從信息流中得到的東西,因此,他們決定通過直接提問來衡量用戶的滿意度。剛開始的時候,整個項目還只是一個針對1000個客戶的小型“焦點(diǎn)小組”,項目人員的辦公室位于田納西州的諾克斯維爾,而諾克斯維爾只不過是一個試點(diǎn)項目隨意選取的“具有某些歷史意義”的地址而已。但這個項目很快就成長為一個全球性的“信息推送質(zhì)量論壇”,這已經(jīng)相當(dāng)于一個針對臉書的信息流服務(wù)而設(shè)立的“尼爾森評級小組”了。
具體來講,世界各地的用戶可以就他們的信息流的內(nèi)容和質(zhì)量,有償?shù)貐⑴c評估并回答一系列的問題。通過將定量和定性的指標(biāo)結(jié)合起來,臉書了解到,那些用戶花了很多時間去閱讀但并沒有點(diǎn)贊的帖子對他們來講依然是有價值的。比較典型的是,用戶在看到關(guān)于他們自己朋友和家人的悲慘消息時,他們當(dāng)然不會點(diǎn)贊(為了應(yīng)對這一類情形,有關(guān)憤怒、悲傷和驚訝的反應(yīng)后來也被添加了進(jìn)來)。在上述實驗中,臉書還設(shè)置了一個控制組,用戶在這個組中是無法看到任何新的設(shè)計變更的,這樣他們就能夠具體評估哪些做法是有用的,而哪些做法根本沒有效果。
當(dāng)炒作機(jī)器通過感知并向人類推薦好友和內(nèi)容的方式來架構(gòu)我們?nèi)祟惖默F(xiàn)實時,我們會通過消費(fèi)炒作機(jī)器給出的建議,并按照這些建議采取行動的方式使整個過程都受到人類的主觀能動性的影響。在炒作環(huán)路中,與人類能動性有關(guān)的“消費(fèi)和行動”環(huán)路是我們將建議轉(zhuǎn)變?yōu)樾袆?,并將由此而產(chǎn)生的行為、反應(yīng)以及觀點(diǎn)反饋給炒作機(jī)器的過程。
書名:《炒作機(jī)器:社交時代的群體盲區(qū)》作者:[美]錫南·阿拉爾(Sinan Aral),出版社:中信出版集團(tuán)
作者簡介
[美]錫南·阿拉爾
l數(shù)據(jù)科學(xué)家,麻省理工學(xué)院社會分析實驗室負(fù)責(zé)人。他在社交網(wǎng)絡(luò)與傳播領(lǐng)域探索了20多年,專注于研究資訊如何透過社交媒體擴(kuò)散,影響市場與消費(fèi)者行為。
l企業(yè)家、投資人。他曾聯(lián)合創(chuàng)辦風(fēng)險投資基金Manifest Capital,并與臉書、推特、微軟等企業(yè)密切合作。
l他還是英國艾倫·圖靈數(shù)據(jù)科學(xué)研究所、英國國家數(shù)據(jù)科學(xué)研究所顧問委員會的成員。
標(biāo)簽: