資訊管理學系何承遠老師分享:「High Efficient Data Center in Smart City ─ A Survey of TCP Incast Solutions to Improve Data Center Network Performance」

院行政辦公室

撰文者/邱怡瑄

臺大管理學院於2023年4月26日舉辦教師跨領域研究計畫成果分享會,本次榮幸邀請資管系何承遠老師擔任主講人,分享研究主題「High Efficient Data Center in Smart City ─ A Survey of TCP Incast Solutions to Improve Data Center Network Performance」。

 

承遠老師於2005年獲得微軟學者獎,曾服務於微軟亞洲研究院(MSRA)、友訊交大聯合研發中心、資策會前瞻所、亞洲大學資訊工程系,曾兼任後兩者的專利協助顧問。主要研究領域為網路架構、協定和其效能與人工智慧應用。具實測開發經驗,例:Windows XP到Windows 10的網路功能部分程式、友訊Dlink產品網路通訊和資料傳輸核心(MyDlink前身)等。

首先,承遠老師闡述,智慧城市(smart city)透過科技手法和技術來改善城市居民和旅客的生活品質,這種改善是持續不斷和具有效率的。其中的技術包含了資料與數據分析、感測器偵測數據和以自動化方式讓智慧城市達成資源分配最佳化、減少各種浪費並加強公眾服務。

智慧城市涵蓋多個領域和面向,諸如交通、能源、醫療保健、公共安全等。

智慧城市收集如此大量資料所需的儲存空間、即時跟離線運算所需資源皆來自於資料中心(data center)支援。

資料中心是一種電腦系統、電信設備和儲存系統的設備,專門用來儲存大量資料和數據以及快速計算和運算。它包含支持數據處理和儲存所必需的服務器、網路交換機和儲存設備,為關鍵資料及數據提供可靠的儲存,同時支持各類業務和應用的部署。然而,資料中心也是有其挑戰,包括TCP Incast問題、高能耗、安全性和基礎設施要求等。

接下來,承遠老師藉由架構圖和模擬實驗效能圖介紹,什麼是TCP Incast:

TCP Incast是網際網路中的一種現象,尤其發生在多個節點(node)同時向/從單個節點發送/請求資料或數據,導致網路擁塞、各個節點的吞吐量(throughput)下降,甚至是崩潰,造成整體頻寬使用率大幅降低,進而使得資料中心的服務品質(QoS)下降。

許多網路應用程式在資料中心有很高機會發生TCP Incast,像是透過Google做網頁搜尋,需要同時向大量伺服器要求資料,或是在分散式儲存和MapReduce等這一類的應用。

而後,承遠老師逐一從多個面向闡述Scopus資料庫上相關的TCP Incast論文數據:

1.出版時間範圍和數量:2018年一月到2023年四月,共有199篇文章,其中在2015年為第一次爆發期,共26篇文章;第二次爆發期在2019年,共19篇文章;近三年整體趨勢約略維持在一年10篇文章;

2.文章種類:在這199篇文章裡,主要成員是研討會論文和期刊論文,其中研討會論文共116篇、期刊論文共76篇、其他類型共7篇;

3.出版刊物:在網通界較知名的頂級期刊和研討會幾乎每年都會固定收錄一篇或兩篇與TCP Incast相關文章。期刊類像是有IEEE ACM Transactions On Networking, IEEE Journal On Selected Areas In Communications, Computer Communication Review, Computer Networks、研討會則是有IEEE INFOCOM, IEEE International Conference On Communications;

4.國家排行:中國大陸投入最多資源,將近85篇,佔了總文章數約4.2成,是第二名美國的1.8倍之多,反觀臺灣位居第八名,僅有八篇文章被收錄於Scopus資料庫;

5.臺灣論文分布:往下細看,發現論文零散在各個學校與研究單位,各單位最少一篇、最多兩篇。並無一個單位集中火力在研究此領域。

因此,承遠老師希冀自己著力在這個領域,對TCP Incast的研究推動有所助益。

最後,承遠老師從技術的角度分別來探討這199篇論文的架構、OSI網路七層跟其使用的機制。例如:絕大多數的論文是做在傳統TCP/IP網路、做在軟體定義網路(Software-Defined Networking,SDN)只有少部分;做在傳統TCP/IP網路的,又可以再分成做在端和端(End-to-end)還是中間網路設備上,如switch跟router。

以OSI七層來看,絕大多數的論文都是以單層為主,無論是application layer, TCP layer還是link layer上;而較少論文是做跨層(cross layer)或是多層(multiple layers);以機制來看,做在端和端的是以壅塞控制和重傳與恢復為主、做在中間網路設備則是以管理為多,像是排程管理(Scheduling)和主動佇列管理(Active Queue Management)。

承遠老師分享的研究內容扎實豐富,引起熱烈迴響,老師們的腦力激盪,提出許多精闢見解,讓這場分享會更加精采。透過跨領域研究思辨與交流,彙集多面向的知識,有助拓展學術視野,啟發創新思維,使研究更加精進。