RM新时代平台足球

大數據揭秘3億年生命演化
發(fā)布時(shí)間:2021-04-07 來(lái)源:北京日報

科技部高技術(shù)研究發(fā)展中心日前發(fā)布“2020年度中國科學(xué)十大進(jìn)展”,其中一項進(jìn)展是,南京大學(xué)沈樹(shù)忠、樊雋軒團隊聯(lián)合國內外專(zhuān)家創(chuàng )建國際大型數據庫,自主研發(fā)人工智能算法,利用“天河二號”超算取得突破,獲得了全球第一條高精度的古生代3億多年的海洋生物多樣性演化曲線(xiàn),時(shí)間分辨率較國際同類(lèi)研究提高400多倍。


古生代約3億年海洋生物多樣性曲線(xiàn)與重要演化事件。

生命起源與演化是自然科學(xué)領(lǐng)域的十大科學(xué)問(wèn)題之一。地球生命從最早的單細胞生命,到紛繁復雜、高度多樣化的現今生命世界,中間經(jīng)歷了復雜的甚至可以稱(chēng)之為波瀾壯闊的演化過(guò)程。本報約請樊雋軒教授撰文向讀者解讀該項研究的科學(xué)內容。


寒武紀萊得利基蟲(chóng)化石。


奧陶紀鏡眼蟲(chóng)化石。


志留紀王冠蟲(chóng)化石。


泥盆紀鸮頭貝化石。


石炭紀櫛羊齒化石。


二疊紀扇貝化石。

早先化石古生物數據庫識別出五大滅絕事件

2011年國際著(zhù)名學(xué)術(shù)期刊《自然》報道,根據科學(xué)家的估算,現今地球上一共有870萬(wàn)種生物物種。地球已經(jīng)有46億年的歷史,其中最早的地球生命出現在38億年前。在這漫長(cháng)的生命歷史中,不斷有物種消失,以及新的生命類(lèi)型的出現。那么,在整個(gè)地球歷史中,一共存在過(guò)多少物種呢?根據科學(xué)家的估算,這個(gè)數字是40億!也就是說(shuō),如果要恢復生命演化的全部歷史,我們就必須對所有現生的以及已經(jīng)消失的物種進(jìn)行全面的統計。對于這些已經(jīng)消失的物種,只能通過(guò)它們留下來(lái)的化石記錄來(lái)進(jìn)行統計分析。比如三葉蟲(chóng)最后的化石記錄發(fā)現于二疊紀末的沉積巖里,因此科學(xué)家就可以推測,三葉蟲(chóng)最終消失的時(shí)間是在2.5億年前。

對化石記錄開(kāi)展的研究已有數百年歷史,地質(zhì)學(xué)家和古生物學(xué)家已經(jīng)積累了海量的化石記錄信息。對這樣龐大的數據進(jìn)行準確、可靠的分析,就必須利用大數據的手段。

上世紀70到80年代,美國芝加哥大學(xué)的演化古生物學(xué)家杰克·塞普柯普斯基教授,耗費十多年時(shí)間,收集了北美、歐洲等地的化石記錄,構建了第一個(gè)較為完整的古生物數據庫。這個(gè)數據庫里,只有化石的分類(lèi)名稱(chēng),以及該種化石出現的時(shí)間以及消失的時(shí)間,雖然信息很簡(jiǎn)單,但是已經(jīng)可以用來(lái)統計各個(gè)時(shí)段有多少種化石生物了。

地球歷史很長(cháng),以?xún)|年計。塞普柯普斯基的這項研究,時(shí)間精度或者說(shuō)時(shí)間單位只能做到以千萬(wàn)年計,也就是說(shuō)只能統計到每一千萬(wàn)年地球上生活過(guò)多少種生物。通過(guò)這個(gè)方法,他識別出過(guò)去6億年的地球生物多樣性的變化規律。這就相當于人類(lèi)五千年歷史中,統計出了每一百年的人口變化。在這個(gè)生物多樣性變化曲線(xiàn)上,他識別出了五次顯著(zhù)的生物類(lèi)群數目快速下降的事件,他稱(chēng)之為五大滅絕事件,代表了地球歷史上最為重要的五次生命災難。這項研究被譽(yù)為20世紀后半葉地球科學(xué)領(lǐng)域最為重要的發(fā)現之一。

后來(lái)的學(xué)者覺(jué)得這個(gè)數據庫太簡(jiǎn)單,有必要建立一個(gè)更為龐大的數據庫,收錄種類(lèi)更豐富的信息,不僅可以重新檢驗上述結果,還可以進(jìn)一步揭示生命演化的機理、機制及其與地球環(huán)境變遷間的關(guān)系等。1998年,在美國國家自然科學(xué)基金委的支持下,一批美國與歐洲的古生物學(xué)家聯(lián)合,發(fā)起了一個(gè)大型的古生物網(wǎng)絡(luò )數據庫項目。這個(gè)數據庫的結構要復雜得多,不僅包含了上述化石的名稱(chēng)以及出現和消失的時(shí)間信息,還包括了產(chǎn)出化石的巖石信息、化石生物的地理位置信息、化石生物的生活狀態(tài)信息等。利用這些數據,這些科學(xué)家在2008年重新計算了過(guò)去6億年的地球生物多樣性曲線(xiàn),時(shí)間精度與上述曲線(xiàn)類(lèi)似,也是一千萬(wàn)年。這一新曲線(xiàn)與塞普柯普斯基的曲線(xiàn)相比,既有相似的地方,但也存在一些不同的地方。這兩條曲線(xiàn),究竟哪條曲線(xiàn)更準確呢?如果我們重新回顧一下這兩項研究,可以發(fā)現他們統計生物數目的時(shí)候時(shí)間單位是以千萬(wàn)年計,這個(gè)精度是很粗糙的,因此容易帶入一些因為時(shí)間不準確導致的偏差。

數據、算法和算力創(chuàng )新

推動(dòng)古生物時(shí)間分辨率大大提高

為了獲得更加全面、可靠的古生物多樣性曲線(xiàn),需要實(shí)現三方面的突破,一是需要更加準確的海量化石記錄,也就是古生物大數據的支撐;二是需要研發(fā)全新的算法,實(shí)現數據的有效計算與分析;三是需要強大的算力,從而可以在有限的時(shí)間里,比如數周內完成計算與分析。

南京大學(xué)沈樹(shù)忠、樊雋軒團隊聯(lián)合國內外專(zhuān)家開(kāi)發(fā)了一個(gè)全新的國際大數據平臺,可以實(shí)現全球古生物資料的高效數字化、集成、管理與應用。并組建了一個(gè)國際一流的數字化隊伍,耗費數年時(shí)間將中國85%以上的化石記錄都收集起來(lái),并開(kāi)放給全球的同行使用。

在算法方面,傳統的定量統計方法不再適用??茖W(xué)家團隊嘗試與信息科學(xué)相結合,研發(fā)全新的算法。在古生物學(xué)領(lǐng)域有一個(gè)重要的基本概念,即化石的保存和采樣概率。前者指古代生物有多大的概率變成化石,后者指化石有多大的概率被我們發(fā)掘出來(lái)。比如,某片森林里曾經(jīng)生活過(guò)幾只松鼠,當它們死后,未必都能被埋到土里成為化石。因為有可能被狐貍叼走了,也可能被細菌分解破壞了。就算埋到土里成為化石,也未必能被古生物學(xué)家所發(fā)現,因為古生物學(xué)家不可能把整個(gè)森林都挖開(kāi)去找尋每一個(gè)化石。

正因為化石存在保存和采樣概率,所以在各個(gè)化石挖掘點(diǎn)找到的化石出現和消失的時(shí)間就有可能存在問(wèn)題,這就導致化石的出現或消失的先后順序可能會(huì )顛倒。舉個(gè)例子,比如李白出生在公元701年,杜甫出生在公元712年,李白的出生比杜甫早了11年,但是,假設史書(shū)中的記錄有偏差,缺了李白的一些編年史記錄,導致關(guān)于李白的最早記錄是公元713年,那么后人在整理資料時(shí)就會(huì )以為杜甫的出生比李白早一年。如果將每個(gè)化石挖掘點(diǎn)找到的化石記錄看作是一本化石編年史,每本編年史都是不完整的,有的記錄了李白出生更早,有的則是杜甫更早。假設李白應該比杜甫更早,然后看看有多少本書(shū)里的記錄與之不符,每一次不符記為1,其總和就代表了“李白早于杜甫”這一假設與實(shí)際記錄的不吻合程度。假設有100種化石,對每?jì)煞N化石的先后順序都進(jìn)行這樣的假設和比較,最后就可以得到這100種化石的一個(gè)假設的順序以及對應的總不吻合度。求取不吻合度最小的那個(gè)順序,這就是化石在全球出現的最合理的順序,在這個(gè)基礎上,就可以計算出高分辨率的生物多樣性曲線(xiàn)。

通過(guò)這種方法,將可以獲得時(shí)間精度是2萬(wàn)至3萬(wàn)年的多樣性曲線(xiàn)。如果將過(guò)去6億年的生命歷史對應到人類(lèi)文明的五千年,這一分辨率就相當于我們每?jì)扇齻€(gè)月就統計一次全球的人口總數,看看變化趨勢是什么。生命演化的時(shí)間精度達到萬(wàn)年尺度,這代表的就是生命演化領(lǐng)域目前的世界紀錄了。

獲得這樣的時(shí)間分辨率,需要非常龐大的算力的支撐。根據科學(xué)家的估算,如果對1萬(wàn)種化石的地質(zhì)記錄計算和分析一次,當前主流的臺式機需要17年!所以,研究團隊拜訪(fǎng)了中國的多個(gè)超級計算機。其中,位于廣東中山大學(xué)的“天河二號”超級計算機在2013年到2016年都是世界上最快的超級計算機??茖W(xué)家最終采用了“天河二號”,同時(shí)使用1萬(wàn)多個(gè)CPU核心進(jìn)行計算,原本需要17年才能完成的一次計算,最終只用了兩三天。

更精細的生物多樣性曲線(xiàn)

揭示3億年生命演化史

在大數據、算法和算力方面都取得了突破之后,科學(xué)家團隊正式開(kāi)始了計算,并最終獲得了從5.4億年前開(kāi)始到2.4億年前的3億年地球生物多樣性變化的曲線(xiàn)。與國際的同類(lèi)研究相比,這一新曲線(xiàn)的時(shí)間分辨率提高了400倍,徹底改變了對該時(shí)期海洋生物演化的一些傳統認識。

該項研究表明,前人使用的低分辨率且不均一的時(shí)間標尺,會(huì )直接影響對古生物多樣性的估算,導致無(wú)法準確評估生物多樣性的變化速率和模式,并可能掩蓋突發(fā)性的重大事件以及短時(shí)間的劇烈波動(dòng)。比如有的時(shí)候生物正面臨多樣性危機,或者是生命形式正快速爆發(fā)、增長(cháng)的時(shí)候,前人的曲線(xiàn)會(huì )顯示完全不同的規律。

新的多樣性變化曲線(xiàn)更加準確地重現了地質(zhì)歷史中最大的三次生物滅絕事件和三次重大生物輻射事件的精細過(guò)程。

三次生物大滅絕事件,其中2.52億年前發(fā)生了人類(lèi)迄今為止識別出的最大規模的生物滅絕事件,導致超過(guò)70%的海洋生物在數萬(wàn)年內迅速滅亡,這一事件的發(fā)生,與當時(shí)全球氣候的快速升溫密切相關(guān)。

——奧陶紀末生物大滅絕:五大滅絕事件之一;發(fā)生在奧陶紀、志留紀之交(4.47億至4.45億年前),導致34%的海洋生物快速消失。

——中-晚泥盆世生物大滅絕:五大滅絕事件之一;始于3.93億年前,并一直延續至3.68億年前,持續兩千五百萬(wàn)年,導致59%的海洋生物消失。

——二疊紀末生物大滅絕:五大滅絕事件之首;發(fā)生在二疊紀、三疊紀之交(2.52億年前),生物多樣性在數萬(wàn)年里急劇下降超過(guò)70%。

三次重要的生物輻射事件,多與當時(shí)全球氣候的逐漸變冷同步。深刻理解這些重大生物事件的驅動(dòng)機制,對于我們認識當今地球生物多樣性以及與全球氣候變化之間的關(guān)系具有重要啟示意義。

——奧陶紀生物大輻射事件:發(fā)生在4.97億至4.67億年前,物種多樣性快速增長(cháng),并增加了近三倍。

——志留紀初生物輻射事件:發(fā)生在4.45億至4.37億年前,奧陶紀末生物大滅絕結束后,生物快速復蘇并輻射,多樣性增加約80%。

——石炭紀-二疊紀生物輻射事件:發(fā)生在3.35億至2.95億年前,多樣性增加三倍,基本與奧陶紀大輻射事件相當。

地質(zhì)歷史中生物多樣性的重大變化,通常也伴隨著(zhù)環(huán)境的劇烈波動(dòng)。前人研究表明,生物多樣性變化可能與多項環(huán)境因子的變化同步,如古氣候、海平面、總棲息地面積和大陸連通性等。各重要生物事件與環(huán)境變化之間存在一些相關(guān)性,如:

奧陶紀大輻射事件和石炭紀-二疊紀的生物多樣化事件均與氣候變冷相關(guān);

中-晚泥盆世生物大滅絕事件與該時(shí)期古溫度變化相關(guān)。

生物的演化與環(huán)境的變遷經(jīng)常是彼此聯(lián)系的。為了探究?jì)烧咧g的關(guān)系,科學(xué)家團隊將一些關(guān)鍵環(huán)境指標參數與新的多樣性曲線(xiàn)進(jìn)行了初步的比較,發(fā)現生命的興衰與大氣中二氧化碳含量的變化存在同步的現象,二氧化碳含量高,生物多樣性通常也較高,二氧化碳含量變低,生物多樣性也會(huì )變低。目前尚不清楚究竟是什么機制將這兩種變化聯(lián)系在了一起,但相信隨著(zhù)研究的不斷深入,比如未來(lái)收集了環(huán)境變化的大數據,就可以去嘗試揭秘這兩者之間的真正關(guān)系了。

地球生命演化有著(zhù)無(wú)窮的奧秘,利用大數據繪制出高分辨率的生物多樣性曲線(xiàn)不過(guò)是第一步。隨著(zhù)大數據、人工智能等新技術(shù)手段的應用,科學(xué)家們將會(huì )不斷揭示地球生命演化的奧秘。



責編:梅亞川
RM新时代平台足球
rm新时代跑路 RM新时代成立多久了 rm官网怎么登录 RM新时代注册 RM新时代正常可以出正常提 RM新时代专业团队|首入球时间 rm新时代公司官网 rm官网 RM新时代资金盘 RM新时代正规网址|首入球时间