杜甫影響力高于李白?大數據研究唐詩宋詞結論很顛覆_老虎機公式

play
stop

mute
max volume

repeat

澳門 角子機 法規

大數據研究唐詩宋詞 結論很推翻

用大數據解析:唐代詩人白居易作品量第一 但陰礙力排十名之外 單孔 拉霸機宋詞名篇中收錄詞作最多的不是蘇軾、辛棄疾而是周邦彥

用大數據解析唐宋詩詞,結論可能超出你的想象——唐代詩人中作品量居第一的白居易,陰礙力排在十名之外;宋詞名篇中收錄詞作最多的不是蘇軾、辛棄疾而是周邦彥;綜合陰礙指數表明,杜甫高于李白、辛棄疾強于蘇軾……

以上新發明,是國家社科基金重大項目唐宋文學紀年系地信息平臺建設首席專家、四川大學文學與新聞學院講席教授王兆鵬解析所得。

唐詩是中國詩歌史上第一座高峰。唐代詩歌五萬多首,詩人三千余位,詩人和詩作都到達前所未有的量級。宋代詞人近一千五百位,詞作超兩萬一千闋。

從個體詩人來看,唐詩宋詞里誰的作品最多?王兆鵬的大數據顯示,白居易名列唐詩作品量的榜首,詩作近三千;杜甫和李白緊隨其后,都過份千首大關。宋詞中辛棄疾的詞作量位居第一,有六百余闋,其次是蘇軾、劉辰翁。宋詩的篇數,則由陸游稱雄,凡九千多首,其次是劉克莊和楊萬里。

依據綜合陰礙指數排名,唐代詩人陰礙力第一的是杜甫,其次為李白、王維,而作品量居第一的白居易,陰礙力排在十名之外。宋代詞人作品量和陰礙力第一的都是辛棄最新吃角子老虎機攻略疾,蘇軾和周邦彥差別居第二、第三。高居宋詩陰礙力榜首的是蘇軾,作品量雄居榜首的陸游緊隨其后。

提到唐詩宋詞的名家,人們習稱李杜蘇辛,好像李優于杜、蘇勝于辛。但綜合陰礙指數表明,杜甫高于李白、辛棄疾強于蘇軾。更令人意外的是,最受追捧的詞人不是蘇、辛而是周邦彥。在一百首和三百首宋詞名篇中,周邦彥各占十五首和四十首,占有率遠高于蘇、辛。

用客觀的數據去衡量、解析頗為主觀的詩詞鑒賞,是否科學、可否可行?在接納北京年輕報記者專訪時,王兆鵬強調,固然數據能在一定水平上描述顯示文學史的發展面貌和歷程,但也有明顯的局限性。

30年前開始研究

積累了上百萬條數據

問:《大數據里的唐宋詩詞世界》課題的初衷是什麼?

答:我1992年就開始做唐宋詩詞的定量解析了。初衷是每人心目中都有自己的唐宋詩詞名篇。到底歷史上哪些唐宋詩詞被視為名篇,我想用統計數據來解析衡量。

問:那您是如何利用大數據來衡量唐宋詩詞質量的呢?這些數據是如何統計出來的?

答:唐宋詩詞作品的質量,現在還沒找到有效數據來評估、衡量。我現在正在努力嘗試構建文學作品格量的評價指標體系,以便搜集數據。這需要對照長的過程。此外,個人創建的評價指標體系,需要學界的認同和共識。

問:關于文學指標體系,學界現在的研究近況怎樣?

答:大數據時代的文學數據,需要分類分層創建起文學史數據的指標體系,以確保數據的信度和效度。但現在用大數據來做唐詩宋詞研究的學者不多,為學界共享的唐宋詩詞大數據也相當有限。

從1992年到目前,我固然積累了一百多萬條和唐詩宋詞有關的數據,但還不完備、不平衡。有的時段數據多,有的時段數據少;有的這一類數據多,那一類數據少;有的詩人數據多,有的詩人數據少。我們常感觸書到用時方恨少,數據更是這樣。全方向解析唐詩宋詞時,經常覺得數據不夠用。

在我看來,文學評價指標體系應該以作品為中央來創建。作家的陰礙力是以作品的陰礙力為條件。而作品評價,可分兩個維度,一是相對不亂作品的內在文學價值,二是動態不居作品的外在陰礙力。其文學老虎機優惠獎金價值,可考慮從內容和格式兩個層面來評估。

作品陰礙力則從創作者、評論者、平凡讀者三個層面來衡量。一是對創作者的陰礙,包含有引用、化用、仿效、改編、翻譯等,體現出作品的典范性和吸引力;二是對評點者的評論和學者的研究,反應出作品在文學批駁、學術研究層面的佳譽度和關注度;三是在平凡讀者中的傳閱度和知曉率。確認作品的價值、陰礙的根本要素和結構后,再構建算計模子,然后由算計機在相關資本庫、語料庫和網絡運行,發掘提取相關數據,最后算計出每篇作品的得分。

數據無法測度藝術含量

和審美價值高矮

問:您在課題里提到,據統計,東漢到隋末近六百年,詩歌總共才五千余首,而到唐代,詩歌第一次過份萬首并直接跨越到五萬多首。唐詩比之前的八代詩增加了七倍多,詩人由六百余位增加到三千余位,詩人和詩作都到達前所未有的量級。這個數據從何而來,有參考哪些主要的文獻資料嗎?

答:數據來歷于我的老朋友尚永亮教授的兩篇論文:《八代詩歌分布情境與發展態勢的定量解析》和《唐著名詩人之層級分布與代群發展的定量解析》。

問:白居易的詩數目最多,陰礙力卻在前十名開外,這是如何判斷的?

答:用數據衡定的。我們用了多種數據,對唐代詩人陰礙力進行排名。白居易的陰礙力,在現現代大于古代。他的綜合陰礙力,遠不如李白、杜甫。

問:那您通過大數據判斷唐詩宋詞質量的根據是什麼?

答:現在只能用大數據衡量唐詩宋詞陰礙力的大小——包含有對后代詞人創作的吸引力,在后代詞評家中的佳譽度,在平凡作者中的著名度等等。現在臨時還不能用數據測度唐詩宋詞藝術含量和審美價值的高矮。

文學中央在北宋初

就完全移到南邊

問:用大數據研究唐宋詩詞有無遭遇一些學術上的難題,又是如何降服的?

答:文學研究從來沒有數據意識,難題不僅在于到哪兒去找數據,更在于找什麼樣的數據。到底什麼樣的數據有用有效,既需要理論的支撐,也需要在實踐中檢修。理論上,我們連續不斷探求,從統計學、計量信息學和計量歷史學中去尋找理論和想法的啟示;實踐上,反復試驗,失敗了重來。最苦惱的是,數據庫建好了,文章也寫完了,忽然BNG老虎機發明數據來歷不全,只好從頭補齊數據,寫好的論文又推倒重來。

問:您在大數據具體研究中還有哪些新發明呢?

答:數據的意義,既能確證傳統的結論,也會改正傳統的結論,更能發明新疑問,變更傳統的認知。比如,中國文化地理有一個知名的結論,中國文化中央,是由北方中原逐漸向南邊挪動,第一次南移是東晉永嘉之亂,第二次南移是唐代安史之亂,第三次南移是宋代靖康之亂。三次戰亂推動了文化中央的南移,靖康之亂后,文化中央就徹底移到南邊。我們的大數據發明,文學中央在北宋初就完全移到南邊,南邊作者的數目全面超越北方,無需等到靖康之亂后。而且,戰爭不是推動文化中央南移的唯一因素。