智能系統應用

大型語言模型編譯與最佳化技術

技術特色
應用於大型語言模型的編譯與最佳化技術,提升模型運行效率和性能。

技術內容

大型語言模型的運算力需求高,如何減少運算量,提昇效能,以佈署於邊緣端/裝置端,已成為業界所面臨的挑戰。大型語言模型的編譯與最佳化技術,包括算子融合、排程和量化,可以加速運行效率和性能,藉由這些先進的編譯技術,得以在資源受限的環境中高效運行這些模型,實現邊緣運算,減少雲端傳輸風險,不僅有助於降低計算成本,也能提升數據隱私性。
 

單位:電子與光電系統研究所
姓名:陳鼎升  
電話:03-5915499
信箱:justinchen@itri.org.tw