🚀介紹我們的新工作:配置到性能的擴展法則與神經方法。 一個在大規模預訓練日誌上訓練的語言模型可以準確預測訓練配置如何影響預訓練性能,並能夠推廣到計算能力提高10倍的運行。