2025年4月3日上午,北京大學中國農業(yè)政策研究中心(CCAP)成立30周年系列活動暨 CCAP國際知名學者講座第187期成功舉辦。德國哥廷根大學于曉華教授應邀作題為“Variable Selection in Economic Models: Perspectives from Machine Learning”的學術報告。本次講座由北京大學現(xiàn)代農學院副院長、 CCAP副主任劉承芳教授主持。
首先,于曉華教授簡要介紹了機器學習方法的發(fā)展歷程及其對現(xiàn)代研究范式的影響。他指出,在大數(shù)據(jù)時代,基于中心極限定理(CLT)的傳統(tǒng)統(tǒng)計與計量經濟學面臨巨大挑戰(zhàn):隨著樣本量增大,標準誤減小,近乎所有的變量系數(shù)都會顯著,統(tǒng)計檢驗失去意義。善于處理大數(shù)據(jù)的機器學習方法的重要性日益凸顯。但是,于教授也強調,傳統(tǒng)的統(tǒng)計與計量經濟學方法與機器學習方法并不存在孰優(yōu)孰劣,只是代表著不同的哲學思想。他從數(shù)據(jù)結構、模型設定、因果與相關、用途這四個維度闡述了計量經濟學與機器學習的區(qū)別。隨后,他介紹了機器學習主要可以完成五方面任務:識別與預測(Supervised Learning,監(jiān)督學習)、聚類與關聯(lián)(Unsupervised Learning,非監(jiān)督學習)、博弈(Reinforcement Learning,強化學習)、內容生成(ChatGPT)以及變量選擇(Feature Engineering,特征工程)。

于曉華教授介紹研究成果
接下來,于教授重點講解如何利用機器學習進行變量選擇。機器學習主要基于變量的相關性(Relevance)、有用性(Usefulness)以及重要性(Importance)選擇變量,常見方法包括過濾法(Filtering Method)、包裹法(Wrapper Method)、嵌入法(Embedded Method)、提取法(Extraction Method)以及夏普利值法(Shapley Value Method)。他進一步引用Wolpert(1996)提出的“沒有免費的午餐”理論來闡釋利用機器學習進行變量選擇的深刻原理,并逐一介紹了上述方法。最后,于教授以自己的四篇論文為例分享了如何在實證研究中利用機器學習進行變量選擇。


于曉華教授與現(xiàn)場師生深入交流
講座上,黃季焜教授、易紅梅教授、解偉副教授、侯玲玲副教授、黃開興研究員、賴汪洋研究員、皮魯魯研究員,CCAP校友代表蔡金陽老師和項誠老師,以及來自校內外的博士后、學生等踴躍提問,現(xiàn)場討論氣氛熱烈。此次講座加深了大家對如何利用機器學習方法進行變量選擇的理解,為后續(xù)相關研究提供了有益啟示。最后,劉承芳教授代表參會師生向于曉華教授表示誠摯感謝,講座在熱烈的掌聲中圓滿落幕。

現(xiàn)場師生合影