幸福彩票

趙超越:本體性意義與學科反思:大數據時代社會學研究的回應

選擇字號:   本文共閱讀 191 次 更新時間:2020-01-01 23:50:10

進入專題: 大數據   理論終結   本體性意義   學科反思  

趙超越  

幸福彩票   內容提要:大數據應用對社會學的研究產生了巨大的影響,以至于出現方法學轉向乃至“理論終結說”的主張。但是,從本體論角度來說,大數據的局限性在于它過度簡單化了社會生活,因而忽略抑或懸置了社會生活所具有的歷史特殊意義。而大數據推崇者所宣稱的意義指的是客觀、普遍的意義,這無疑是一種曲解。此外,如果越來越多的學者熱衷于“計算社會學”“新計算社會學”的研究,那么很可能會導致學科的分支化傾向。因而在大數據時代,我們更要秉持學科中的重要內容,即理論的意義以及人文的關懷。簡言之,在學科反思的層面上,“溯洄涵泳”式的回應必要且緊迫。

   關 鍵 詞:大數據/理論終結/本體性意義/學科反思

   作者簡介:趙超越(1990- ),男,上海人,南京大學社會學院博士研究生,研究方向:當代中國研究、社會學理論、文化社會學,南京 210023

幸福彩票   從社會學學科總體發展的情況來看,定性與量化研究是兩條并駕齊驅的方法學路徑。但由于涉及主客觀主義、事實與價值、理解與規律等諸多方法學的問題,兩種研究方法在一系列的研究問題上又處于長期的紛爭狀態。而自大數據(Big Data)一詞被提出并迅速成為當代最熱門的研究主題之一,加上隨之而來的全球性的時代浪潮,傳統的量化研究方式受到了猛烈的沖擊。

幸福彩票   大數據因其巨大的數據庫存(在量上正趨向于全體數據)使得量化研究方法不再完全依賴于過去傳統的抽樣、假設檢驗,并為其研究的目的和內容提供了前所未有的便利。由此,大數據社會學研究應運而生。至此,量化研究在一些(暫且稱之為)定量極端主義論者的鼓吹下逐漸占據了社會科學方法論領域的“霸權”地位;而與人文主義、建構主義相關聯的理論研究、定性研究則逐步落入學科的“邊緣化”處境。因而,本文的寫作目的在于兩方面:其一,從人類社會生活意義的視角對大數據時代下的方法學轉向(以新計算社會學為主要形式)進行回應。因為方法手段上的紛爭并非是大數據的根本局限性所在,而超越兩種研究中的方法手段并站在人類社會歷史生活層面上來看,其所具有的意義、意義的歷史性與多樣性才是大數據研究的軟肋。也基于此意義,社會學等學科的自然科學化趨勢才能被合理地反對。其二,大數據的到來和以此為基礎的生活方式及全球格局的變化,絕不意味著傳統研究的方法學和理論的終結。

  

   一、學科量化研究的來源與發展簡述

   17世紀甚至更早,人們普遍受到自然科學的邏輯思維模式的影響,嘗試去了解自然界乃至人類生活世界運行的規律,從而找出能夠放之四海而皆準的普遍法則,同時,人們普遍追求一種可以計算和分類的方式來探求其中的知識體系。但是,即便研究對象是自然界,自然科學仍然受到人類主觀因素或者其他非自然條件的影響,更不用說更為復雜的人類生活。所以,克服社會生活中諸多不可控因素的嘗試,使得社會科學或者道德科學逐步發展起來。

幸福彩票   就社會研究中的統計而言,在三百多年前就已開始初步呈現。大致來說,在17世紀,這種尤其關注到規范、治理層面的技術同歐美當時所謂的統治理性是密切相關的。從詞源學上來看,國家一詞“state”就是統計一詞“statistics”的原初形式,同樣印證了統計的定量技術本身同國家統治的關系。而統計學(die Statistik)概念則由時任哥廷根大學的哥特弗里德·阿亨瓦爾(Gottfried Achenwall)正式提出。[1]19當時的目的無非是要尋求一個系統,在這個系統中政府能夠更方便地記住其中人口數量及其各種社會事實,以便為其所用。英國、法國在這一方面大同小異,統計學最初的運用,是國家的領導者為了方便掌握其國家中人員的狀況(人口容量、人口流動規模等),以便更好地實行統治政策和相關治理術。[1]16其中值得一提的是,當時國家的領導者和學者都或多或少地接觸過類型學的思想,通過對所謂子民的數量以及活動軌跡的量化研究,實施對其不同職業、層級的劃分,以便于對其監控。這個由統治者所構建的、社會成員受監控的社會,在很大程度上可以看作福柯所稱的全景監獄(prison de panoramique)或者戈夫曼所說的“精神病院”(Asylum)的管理機制,統治者通過一系列的治理技術和設施對社會成員進行肉體和精神的規訓,以至于他們終將成為溫順的受控者。[2][3]而隨著社會形態的轉變,尤其是從17世紀中葉伊始,“特別是資產階級日漸掌握到社會的導引權,而市民社會(civil society)也日益成熟之后,其社會屬性有了改變”,[4]統計研究不再純粹為統治理性所服務,社會變遷過程中的諸多問題使得其研究目的發生改變:一方面為確信某個事實或某物提供理由(或支持涉及未來的決定);另一方面通過誤差的理論(theory of errors)來評估科學知識的確定性程度(degrees of certainty)。[1]17由此,近代意義上的社會科學從之前統治理性主導時期的邊緣地位脫離出來,朝更大的研究范圍(自身研究逐步占主導)進行量化統計研究。

幸福彩票   而到19世紀末20世紀初,隨著概率論的發展和成熟,量化研究逐步趨于數理化、公式復雜化以及模型化,并“展現成為一個具有自我組織、自我再制與自我衍生能力的語言體系”。[5]由于社會屬性的根本改變,研究無法從絕對宰制的層面上獲取所需的大規模數據,所以,與之前大規模的記錄方式不同,近現代的量化研究以一個或多個研究假設為前提,通過對有限的樣本規模進行梳理統計以建構不同的模型,從而憑借所得出的因果或相關關系來對當前假設進行驗證。一方面,研究者嘗試用量化的統計公式和統計模型來實現所謂的學科精確化;另一方面,由于自古以來一直有著對普遍主義的追求,使得量化研究愈發趨向于對人類行動乃至現象的發生進行預測。換言之,量化研究者從事社會學研究時已經采取了兩種預設,即客觀性預設和規律性預設。[6]95但問題在于,試圖用上述兩種去囊括所有的社會學研究是徒勞的。就前一個預設而言,所能獲取的也只是表面上的外在行動(行動的頻次、問卷上的信息等),這些外在數據只是社會學研究領域的冰山一角;后一個預設則更不可能實現,因為規律“只是在近似的情況下以及一定的限制條件下成立”。[7][8]在人類歷史的多樣化情形下,諸多自然科學中的定律和假說都是相對且不確定的。因此,利用量化的統計分析必須要對社會生活的諸多因素進行過濾和限定,才勉強能在“理想類型”的范圍內著手進行。這樣一種受限的量化研究,由于社會生活復雜性質的影響,“無法獨自承擔起社會學研究的重任”,[6]96它必須依靠定性研究進入意義世界的理論能力,方可更深入地解釋和看待社會,同時它也能在定性研究的理論基礎上呈現數字化的精確證明。所以,作為社會學研究的方法路徑之一,量化研究不僅無法單獨研究社會,更要時刻“向新的經驗證據和反思的目光敞開”。[6]96

   但是,大數據以及相關新型數據采集手段的引入,似乎給傳統的量化統計研究注入了一劑強心劑。在很多量化研究者看來,大數據在很大程度上意味著對傳統的數據采集方法軟肋的一種拯救,從而使其從原本諸多的手段限制中抽離出來。這樣一來,社會學研究中新的重要問題便產生了:大數據研究究竟何為?既然量化研究和定性研究都有各自的本職工作,并分擔研究社會的使命,那么大數據的到來在何種程度上影響這一格局?又在多大的程度上左右了定性、理論研究的作用?

  

   二、大數據、方法學轉向與理論終結說

幸福彩票   大數據的正式概念始于2011年麥肯錫的報告《大數據:革新、競爭和生產力的下一個“前沿”》:“大數據——能夠獲取、交流、整合、儲存乃至分析的海量數據——如今已成為全球經濟里每一部門和功能的組成部分。就像其他的生產要素,比如硬資產和人力資本。數據越來越成為現代經濟活動、革新和增長中不可或缺的要素。”[9]報告中強調運用大數據的科學技術將被廣泛地應用到統計學、計算科學、應用數學乃至經濟學中,同時,這也意味著從大數據中獲取信息的組織等需要面臨的是一個更為靈活性的、多重規則的方法手段。正是由于大數據量的龐大,因而如何駕馭這個龐然大物(Riding the Juggernaut)[10]來為人們服務越發受到重視。由于大數據應用領域的擴大,因而當今它甚至可以囊括“環境衛星、基因數據、GPS和地圖數據、數字圖像,以及諸如社交媒體數據之類的人們有意識產生的數據,等等”。[11]所以,《大數據時代:生活、工作與思維的大變革》一書的兩位作者舍恩伯格(Viktor Mayer-)和庫克耶(Kenneth Cukier)亦將大數據視為“社會以新的方法手段處理信息的一種能力,以生產出具有巨大價值的商品和服務或者產生有用的洞見”。[12]20

   相較于傳統數據采集及統計分析,大數據最為突出的特點是舍恩伯格和庫克耶所強調的三大特性:模糊性、相關性和大樣本性。首先,是模糊性代替精確性。對于傳統數據采集而建立的數據庫而言,收集的數據信息是相對有限的。在有限樣本量的情況下,對于數據采集以及建構模型精確性具有很高的要求。但是,在大數據的前提下,“允許不精確的出現已經成為一個新的亮點,而非缺點”。[12]63這種所謂的“非缺點”表現為兩個方面:一方面,對于小型數據過多的各種統計方法的計算倒不如從大數據出發的簡單運算來得實際,從而在效率層面上完全可以省下更多時間來收集更大的數據,使得手頭的數據庫存累積起來以便獲取更多有用的價值信息;另一方面,大數據之所以被提出乃至風靡全球,是因為它能夠滿足人類的追求,即掌握現在和預知未來,尤其是后者。預測代表著一種概率邏輯,而非事實的確定性,所以數據的海量采集為預測大方向的追求而不得不或者主動地喪失其精確性,并“擁抱混亂”。其次,是相關性代替因果性。舍恩伯格和庫克耶認為,因果關系存在的前提在于人們的主觀直覺,“在小數據時代,很難證明由直覺而來的因果聯系是錯誤的。……大數據之間的相關關系,將經常會用來證明直覺的因果關系是錯誤的”,[12]103而相關關系則代表著客觀的事實,且后者作用更為明顯。例如,將預測作為最終目的的評估機構和企業,只需要知道用戶的目前狀況和需求,就能夠為其提供相應的產品和服務;他們無須也不想去了解用戶之所以會有某類需求的原因。最后,是大樣本性代替小樣本性。當數據的收集量越來越龐大乃至可以稱為海量時,以至于可以直接采用這一超大型樣本量而無須顧及小樣本所帶來的一系列代表性問題。如果說傳統統計方法下的抽樣研究是為了描述或解決即時的、有限的、特定的社會現象或問題,那么,在大數據時代運用更為先進的信息技術對任何與研究旨趣相關的海量數據分析則可能著眼于更長遠的、更為龐雜的事件和趨勢。

大數據對于社會科學的影響如此巨大,以至于其研究方式的轉變使得社會學成為大數據時代下方法學被撼動得最厲害的學科之一。典型的例子是“新計算社會學”的誕生及其研究應用。20世紀90年代,拉策爾、加里·金等學者在《科學》上提出了“計算社會科學”的概念,[13]721即通過計算機軟件作為媒介對社交關系進行測量的一種應用方法。這一新型學科的研究主要涉及社會網絡理論與研究方法的發展、基于行動者模擬方法(agent-based modeling)以及互聯網研究等。從研究范圍來看,這一新興領域是一種社會世界諸多方面的跨學科研究,通過計算的媒介可以從個體的行動者一直到群體。[14]2它主要利用計算機中的“自動化信息提取”(Automated Information Extraction)技術進行信息搜集。例如,我們可以將谷歌圖書語料庫的書本大數據、新浪微博、百度搜索等巨大庫存作為數據來源,以所需相關變量(關鍵詞)作為指標,從不同維度進行統計分析。[15][16][17]因為這是一門相對較新的領域,所以,計算社會科學需要同其他的跨學科研究領域之間建立起一個新的范式和系統,(點擊此處閱讀下一頁)

    進入專題: 大數據   理論終結   本體性意義   學科反思  

本文責編:陳冬冬
發信站:愛思想(http://6mmmmmm.com),欄目:天益學術 > 社會學 > 社會研究方法
本文鏈接:http://6mmmmmm.com/data/119686.html
文章來源:《上海大學學報:社會科學版》2019年第1期

0 推薦

在方框中輸入電子郵件地址,多個郵件之間用半角逗號(,)分隔。

愛思想(aisixiang.com)網站為公益純學術網站,旨在推動學術繁榮、塑造社會精神。
凡本網首發及經作者授權但非首發的所有作品,版權歸作者本人所有。網絡轉載請注明作者、出處并保持完整,紙媒轉載請經本網或作者本人書面授權。
凡本網注明“來源:XXX(非愛思想網)”的作品,均轉載自其它媒體,轉載目的在于分享信息、助推思想傳播,并不代表本網贊同其觀點和對其真實性負責。若作者或版權人不愿被使用,請來函指出,本網即予改正。
Powered by aisixiang.com Copyright © 2020 by aisixiang.com All Rights Reserved 愛思想 京ICP備12007865號 京公網安備11010602120014號.