新冠疫情暴發之初,
科學預測疫情“拐點”。
連續八年關注大氣污染,
從百萬條數據中解讀藍天“密碼”。
他是北大教授陳松蹊,
今年新晉中國科學院院士。
作為數學家的他,
經常到不同學科串門,
而統計學正是他手中的“萬能鑰匙”。
一場跨時區的晝夜接力
2020年1月23日,新冠疫情突發,武漢封城,各地的人們都為疫情走向和防控憂心。
得知疫情消息時,陳松蹊正在美國進行學術交流。他立即意識到這將是一件對社會影響極大的事,也許可以用自己的研究做點什么。陳松蹊決定帶領自己的團隊跟進疫情形勢,運用統計學理論對疫情數據進行建模評估,進行傳染形勢預測與防控策略研究。于是,他和他的團隊開啟了一場跨越時區的晝夜接力。
“應該是大年初一那天,老師建了一個群,把我們都拉進去收集疫情相關的數據,大家協同工作。”統計科學中心博士生顧嘉同學回憶。面對緊迫的疫情形勢,團隊每天早晚兩次數據匯總,隨時進行線上會議,不分日夜地反饋模型進度……這場線上協作跨越12個時區,陳松蹊淡淡笑著說:“不同時區的優勢來了,我們接力工作,省下了大量的時間。”
在飛機上,陳松蹊也在伏案推演,昏暗的機艙里面只有他的一角亮著小燈。之前并沒有做傳染病相關模型的經驗,那就邊做邊學唄。陳松蹊依舊是一副遇到問題迎難而上的姿態。
陳松蹊在回京的行程中仍在投入研究
短短一周,他們便在一個新的領域里有了研究成果。2020年2月3日,陳松蹊帶領團隊著手編寫疫情分析簡報,之后幾乎以每天一份的頻率更新疫情分析日報。
“我的團隊早在2月初就發現傳染力在湖北及各省市急速下降”,陳松蹊團隊根據數據模型計算發現,盡管2月初每日新增病例仍在增加,但國內疫情總體情況在持續改善。事實證明,2月底國內疫情基本得到控制,數據模型的預測是準確的。
這樣緊密的工作節奏其實是陳松蹊多年來的常態。除了上課時間,他每天在辦公室從早上八點半泡到晚六點,跟進數據、閱讀文獻、備課、答疑;晚飯后,再回來工作至十點。這已經成為他最享受的生活模式。
“差不多是學術即生活的‘007’工作制”,顧嘉同學笑稱,“如果陳老師不在一個工作場合,總能在另一個工作場合找到他。”
新冠成為全球流行的大疾病,而各國的應對政策并不統一。陳松蹊又將目光轉移到了研究各國的措施與新冠肺炎傳播控制效果之間的關系上。
扎實的數據模型證明:嚴格的人群限制性措施對控制疫情傳播有顯著成效,政府迅速地采取有力的應對措施可以顯著縮短疫情到達拐點的時間,并有效減少感染和死亡人數。
2020年10月和2021年4月,陳松蹊團隊分別在國家科學評論National Science Review和英國皇家學會會刊Proceedings of the Royal Society A上發表了關于25國新型冠狀病毒肺炎疫情防控效果分析的研究論文。這為中國在新冠疫情防控上的國際話語權提供了客觀、堅實有力的依據。
各國新冠疫情應對政策影響研究
談到對這些研究課題的選擇時,陳松蹊的第一反應是:You have to do it。出于社會責任感,也出于學者的本心,陳松蹊從不停留在舒適區,而是會選擇內心深處認為真正重要的問題,憑借著學術直覺與熱情信念,全身心地投入到新理論與新領域的開拓中去。
“在開啟一個新的方向時,總有著想象不到的困難,但陳老師總是憑借著他的研究激情、克服問題的信念,全身心的投入以及天賦去解決一個接著一個的問題。”組里的博士生閆晗談及導師時十分欽佩,“這種精神深深感染著我們。”
“人努力 - 天幫忙”
人類面臨越來越多的不確定性和挑戰,幸而我們總能以專業的能力和認真的態度去改善環境,改善所呼吸的空氣。而改善這個世界離不開我們所有人共同的努力。
——在陳松蹊團隊的空氣質量報告里,寫著這份愿景。為著這份呼喚藍天的愿景,他們行動了八年。
2013年7月,陳松蹊計劃邀請美國斯坦福大學一位著名的統計學者來北大統計科學中心訪問、講學,這位學者對訪學北大非常感興趣,但后來沒有回復來華邀請。在陳松蹊的詢問下,對方發來了統計實時空氣質量指數的網站鏈接,言外之意是擔心北京霧霾可能帶來健康上的隱患,遂決定不來了。老北京陳松蹊不干了——“就像以前北京隊踢球兒輸了,這怎么行。”
之后查閱這一網站的數據成為了陳松蹊的“每日打卡”。2014年3月,北京大學統計科學中心的八位老師同學開始收集和分析北京的PM2.5數據,希望通過統計學的分析判斷,為防治空氣污染、維護生態環境提供依據與建議。
面對全新的方向和浩如煙海般的數據,科研進程宛如征戰。為了環境研究的項目,陳松蹊多次帶著學生尋找數據,與環境科學工作人員座談,向他們細致地講解研究內容。團隊爆發出驚人的凝聚力和生產力,從大數據和非參數統計學方法入手,不斷發現新問題,學習新的技術手段。
兩年多以后,他們成為了國家重點研發大氣項目中唯一一支統計學團隊,在大氣污染評估、時空模型、大氣污染的模式、數據質量、經濟與環境的關系等各方面都取得了一系列豐碩成果。團隊做大數據統計與落地的能力也隨之鍛煉出來。
大氣污染的治理實際上是對污染排放的管理,正是統計學的研究告訴了我們觀測數據背后排放物污染的規律,讓數據開口“說話”。陳松蹊團隊構建了科學度量大氣污染的統計方法,提出有效評估城市污染治理需要分離人為減排效果和天氣干擾的影響。盡管計算指數的過程是精密繁雜的,他們給這一指數起的名字卻相當形象、易懂:“人努力-天幫忙”指數。
從關注北京的幾個站點、到京津冀地區,再到3+95城市,陳松蹊帶領團隊發布了八份空氣質量報告,也提出了多項具體的防治政策建議。每份研究報告的形成都是反復推進迭代的過程,陳松蹊總能從同學們的報告中敏銳地發現一些待修改的細節和可持續挖掘的數據,他每次都會把報告打印出來手批指導意見,一份成稿的背后可能是幾十次的修改。
大氣污染的研究仍在繼續。目前,他與團隊又關注到“碳達峰與碳中和”問題,致力于構建出測算碳排放與碳吸收更加準確的算法。重大的民生問題與社會發展問題,似乎已經成為他關注世界的重要落點。
到其他學科“串門”
海洋漁業、人口普查、金融經濟……這些看起來并無相通之處的領域,陳松蹊也常有涉及。因為,他的手中拿著一把到其他學科“串門”的“萬能鑰匙”——統計學。
像在進行著一場場探秘,去看世界紛繁現象之下的沉睡的事實,而這把有力的鑰匙,便是統計分析。采集、分析、計算、解讀、應用,哪里有數據,哪里就有統計學。
在新西蘭深造時,陳松蹊的導師曾用“foolhardy”一詞評價他,這反映了他敢于解決問題的闖勁和追逐真知的好奇心。
在陳松蹊眼中,學者的最高境界是根據問題發展出新的理論,而后轉回到實際應用,認知與探索世界的最終落點是圍繞國家需要、社會福祉進行科研創新。一切統計學的研究,都需要數學理論與計算方法上的支撐。這更接近于人們想象中高深艱澀的數學理論。陳松蹊在超高維假設檢驗方法和非參數經驗似然方法等理論方面取得的豐碩成果,推動了統計學的幾個關鍵性發展。
“超高維大數據統計分析”,這個炫酷的名字背后,解決的是人類認知進入大數據時代后統計學的理論方法問題。以往,數據維度較少,假如研究藥效在幾十個樣本患者身上的表現,這其中的變量只有性別、體重、年齡、病因、病況、藥效等非常有限的幾個。而隨著人類認知世界變得更為廣闊豐富,數據的維度大為增加。以生物學為例,本世紀初人類基因組計劃取得突破進展后,成千上萬的基因序列數據使得數據維度遠遠大于樣本量,許多傳統的統計算法失效,更新統計理論和方法就成為迫切需要。
陳松蹊提出了一些在小樣本-超高維數據統計時能有效控制發生兩類錯誤的概率的統計檢驗方法,這一研究也在2017年獲得教育部自然科學一等獎。超高維數據的統計方法可以研究更復雜的影響因子情況,比如究竟是哪個基因影響某人的某種疾病。
北大空氣質量報告截圖:“3+95”城市2020年PM2.5秋冬和8小時臭氧春夏平均濃度散點分布圖
有了理論方法,便可以追著“問題”應用,時不時“到其他學科里串串門”。對他們而言,研究新方向時要先學習了解新領域的新知識,是常有的事情。
“有什么不懂的,我可以向北大各個方向、專業的老師們請教,問問他們,也許未來還可以合作做研究。”
陳松蹊稱贊北大完備的學科實力優勢能夠為交叉科學研究提供更多的發展空間。
問題導向的研究,引向了知識交流、學科交叉、專業合作。陳松蹊本人在北大數學科學學院、光華管理學院、北大統計科學中心、大數據國家工程實驗室等機構身兼數職,這本身就在打破壁壘。
“我們”:學術感召力
“回到北京,一方面是為國家社會需求作貢獻,另一方面也想對北大統計、經濟計量學科的發展和學生的科研培養起一些積極的作用。”
陳松蹊曾先后在澳大利亞、新加坡、美國等國高校任職,2008年,他選擇到北大任教。2010年,陳松蹊與北大的老師們一起創立了統計科學中心,并出任首屆聯席主任。
在這里,一支統計學團隊源源不斷地壯大。十余位優秀的統計與經濟計量學者先后加盟,初有興趣的學生們向著科學運用數據統計的目標成長。
十三年時光流逝,陳松蹊與北大同學們的聯結也越來越緊密。在他眼中,這里的年輕人聰明勤奮、能人輩出,這也使他愈發嚴格要求自己的教學工作,
“這么好的學生到這兒來了,你能把他培養成什么樣子?別把人給耽誤了。”
而在學生眼里,陳松蹊勤勉的治學和純粹的熱愛常令他們看到理想學者的模樣。“要有內生的動力參與到研究中,陳老師引導本科同學時就特別注重這一點。”組里博士生童培峰回憶起他大三時跟隨陳松蹊接觸科研的情形。
每當有新課題時,陳松蹊通常會讓學生們自由探索一段時間,再提出可能存在的問題與改進方向。當學生的研究取得突破時,他全力支持,抓住各種機會推薦學生和優秀的學術前輩交流,經常用自己的科研經費支持學生參加國內外學術會議、出國訪問學習,一步步地帶領學生走入學術的大門,也一同體會科研的困難與成功。
“有時候陳老師會提出一個idea,看起來天馬行空,我們真正著手去做一下就發現它是合理的,能夠落下來。”碩士生孫浩軒覺得這種將數學理論與方法應用到實際問題中的過程帶給他無窮的吸引。
“親力親為”“亦師亦友”,這是學生們談起導師時最常出現的兩個詞。學生們每一篇報告、論文,陳松蹊都會親自上手修改。團隊例行的組會上,大家同步進展,自由分享想法,他認真地聽取并給出意見,也樂于與學生分享自己求學時的科研經歷與英語寫作的過程,提供學術研究與求職的幫助和建議。
在與學生的日常交往中你能見到這位熱情的學者的另一面:細致、周到。在發現學生的心理波動時,及時、恰當地開導;當得知有些同學的電腦不能支持繁重的計算任務時,陳松蹊立刻給組里的博士生配備了工作站;出差歸來,他總會為學生們帶一些當地特產;在重要的傳統節日,他邀請在異鄉讀書的同學們去家里做客聚餐;閑暇時,陳松蹊也會組織團隊里的學生一起爬山,頗愛戶外運動的他還會策劃幾條非常規的路線。
牽引、隨行、凝聚,這是一個以“我們”為主體的活力團隊。無論學術或生活,陳松蹊自身的信念與行動總能散發出一種強大的感召力。你仍能看到陳松蹊在闡述科研問題時眼神里所透露出的那種美好的愿景,這將驅動著他和團隊里的青年們,一同用統計學這把鑰匙,更久遠也更深切地在科研世界的各個領域探秘。