事故減少70%是什麼魔法?AWS如何助金融巨頭成本降低33%?

33%的成本降低、70%的事故減少、65%的效能提升——這並不是魔法,而是兩大金融巨頭藉由Amazon Elastic Container Service (Amazon ECS) 容器技術實現的實際成果。當Fannie Mae每月需處理2億筆會計事件、Vanguard每日面對超過10億股的交易量時,傳統架構已無法支撐這樣的處理量。本文將揭開這場容器魔法背後的祕密,探索這兩家金融巨擘如何透過AWS容器服務徹底重塑其核心系統,在不犧牲穩定性的前提下加速創新,實現業務與技術的雙贏局面。
現代企業容器化的決勝點
應用程式複雜度與標準化的平衡挑戰
當代企業正面臨前所未有的應用部署挑戰。隨著應用數量激增、技術堆疊多樣化,以及雲端服務使用的爆炸性成長,平台團隊需要在開發者最大自主與平台團隊嚴格控制間取得平衡。過度標準化會限制創新速度,而過度自主則可能導致系統零散、安全隱憂及資源利用率低下。
這正是容器技術,特別是Amazon ECS能夠提供價值的關鍵所在。根據最新數據,Amazon ECS每週啟動超過24億個任務,有超過65%的AWS新容器客戶選擇ECS,顯示市場對這種容器管理模式的高度認同。
AWS 無伺服器容器的魔力來源
Amazon ECS與AWS Fargate的強大組合為何能成為平台團隊的致勝關鍵?關鍵在於其無伺服器特性與深度整合的 AWS 生態系統。
Amazon ECS是AWS專有的容器編排服務,提供了多種運算選項,其中AWS Fargate是隨用隨付模式的無伺服器容器計算引擎。使用AWS Fargate最大的好處是AWS會為企業管理作業系統、修補程式、安全更新等基礎工作,讓平台團隊能夠專注於應用程式的開發與創新。
最令人印象深刻的是,Amazon ECS沒有需要管理的控制平面,意味著沒有需要維護、升級或修補的基礎設施。若選擇AWS Fargate作為代管控制介面,AWS還會管理數據介面的修補和擴展,大幅減輕平台團隊的運營負擔。
兩大金融巨頭的共通成功因素
Fannie Mae:從龐大單體到彈性微服務的華麗轉身
Fannie Mae是美國一家擁有8,100名員工的組織,成立於1938年,主要任務是促進住房所有權和可負擔住房。他們為美國四分之一的抵押貸款提供融資,管理超過1,800萬筆貸款,持有4萬億美元資產。
然而,作為一個有86年歷史的組織,Fannie Mae面臨著傳統系統的挑戰。他們的貸款會計系統是個龐大的單體應用,由200多人花費3年多的時間建設,最終成為管理其90%資產負債表的關鍵系統。該系統建立在35萬行Java程式碼上,高度依賴提取、轉換、加載(Extract,Transform,Load, ETL)流程,業務規則嵌入在非直覺的孤島中,並與70個其他系統對接,擁有超過500個數據表。
面對這些挑戰,Fannie Mae選擇了Amazon ECS和AWS Fargate進行系統重構。他們採用樣板即服務模式,讓開發團隊(而非專門的基礎設施團隊)實施系統,同時結合低程式碼平台來自動收集需求、建模、驗證並生成Node.js程式碼。
在技術架構上,他們利用 AWS Fargate 容器和多種 AWS 服務構建了高效的事件驅動架構:
- AWS Step Functions協調整個流程
- AWS Lambda、Amazon EventBridge和Amazon Simple Queue Service(Amazon SQS)促成事件驅動模式
- Amazon Aurora PostgreSQL作為交易數據庫
- Amazon Simple Storage Service(Amazon S3)管理輸入和輸出數據
- Amazon CloudWatch提供可觀察性
每月關鍵的會計結算時期,他們會啟動 128 個 Fargate 任務,這些任務共同啟動 900 個 Node.js 工作程式進行並行處理。他們的數據庫被分為 128 個雜湊(Hash)分區,每個 AWS Fargate 任務在自己的隔離部分運作並不會有數據庫爭用。處理完成後,容器就會自動關閉,進一步降低成本。
Vanguard:金融交易平台的雲端轉型之旅
Vanguard作為全球資產管理巨擘,服務超過5,000萬客戶,管理著高達9.9兆美元的投資資產。在數位時代,99%的客戶透過數位渠道與Vanguard互動,使其交易平台成為業務核心。
然而,這艘金融航母卻面臨著遺留系統的沉重負擔 — 一個建立於大型主機上的單體應用程式,每季度才能部署一次更新,嚴重限制了創新速度與市場回應能力。隨著2019年佣金費用的取消,行業日交易量從約5-6億股激增至10-11億股,「迷因股票」熱潮等市場事件更是考驗著平台的擴展極限。
Vanguard確立了五大關鍵目標開啟其交易平台的轉型之路:提升交易處理能力、強化系統可用性、優化投資者體驗、提高客戶滿意度、降低總體擁有成本。
在技術選擇上,Vanguard採取了精明的策略,在系統基礎設施中創建抽象層,實現應用程式各層之間的解耦,使它們能以不同速度演進。這種方法允許團隊以增量方式交付價值,而非等待整個系統一次性現代化。
在運算層面,Vanguard從資料中心的Pivotal Cloud Foundry遷移到Amazon ECS與AWS Fargate。雖然考慮過Amazon Elastic Kubernetes Service(Amazon EKS),但團隊決定繼續使用他們已經熟悉的ECS平台,避免在關鍵交易系統上嘗試相對較新的技術。
選擇AWS Fargate而非EC2執行ECS容器,讓團隊免於管理底層基礎設施,專注於應用程式開發。這符合Vanguard的策略 — 最大化利用AWS服務減輕營運負擔。
Fannie Mae的驚人轉變
Fannie Mae通過採用Amazon ECS和AWS Fargate實現了以下顯著成果:
- 程式碼行數減少22%
- 系統效能提升65%
- 90%的程式碼自動生成
- 技術成本降低33%
這些數字清晰地展示了Amazon ECS和AWS Fargate如何幫助企業實現顯著的效能和成本改進,同時提高開發者體驗。
Vanguard的商業與技術雙贏
- Vanguard的現代化努力也取得顯著成果:
- 重大事故減少70%
- 軟體部署速度提高5倍
- 產品上市時間大幅縮短,新產品如高收益現金帳戶Cash Plus僅用不到12個月就完成開發與上線
- 客戶滿意度全面提升,新平台獲得Celent網路財富管理創新獎
這些成果顛覆了傳統「成本、品質、時間」三選二的專案管理概念,證明透過合適的雲端技術與策略,三者確實可以兼得。
企業平台團隊的未來藍圖
內部開發者平台與服務模式的進化
隨著容器技術和平台工程的持續發展,我們正看到一個新趨勢:內部開發者平台(Internal Developer Platform, IDP)。IDP 是平台團隊構建的,旨在創建黃金路徑並使開發人員能夠自助服務。
IDP 具有許多共同特點:
- 基於角色的訪問控制(限制應用團隊可以使用的樣板和資源)
- 自助服務(應用團隊可以登錄或使用 API 消費樣板和查看資源)
- 可配置性(通過工作負載規格或工作負載定義自定義樣板)
- 與部署管道的整合(從 IDP 中可視化正在進行的部署)
- 編排能力(觸發自動化,在環境中部署資源)
Backstage.io 是一個流行的開源 IDP 框架,最初由Spotify內部創建,現在作為雲原生運算基金會(Cloud Native Computing Foundation, CNCF)孵化項目蓬勃發展。AWS內部的一個團隊創建了Harmonix on AWS專案,作為在AWS上部署Backstage.io時的參考,來為不同的應用團隊創建和分發環境。
從經驗中學習:全面思考、保持彈性、持續演進
從Fannie Mae和Vanguard的經驗中,我們可以總結出幾點關鍵經驗:
- 全面思考:雖然增量交付價值很重要,但必須設定全面現代化的願景。正如一位企業團隊主管所說:「我們正在從像素到磁碟進行現代化」。
- 保持彈性:雲端技術快速發展,必須願意重新評估決策並適時調整方向。
- 現代化是馬拉松,不是短跑:特別是對關鍵應用程式,需透過平行測試技術如藍/綠部署、金絲雀部署等,逐步建立信心。
- 專注開發者體驗:正如Fannie Mae的專家強調的:「開發者體驗非常重要。如果要給你一個專業建議,就是:有些工具大家都在講,但實際上沒人用。如果你的開發者都沒有抱怨,這其實就是一個信號。」
結語
Fannie Mae 和 Vanguard 的案例清晰地展示了 Amazon ECS 和 AWS Fargate 如何協助企業實現顯著的效能和成本改進。通過精心設計的架構、戰略性 AWS 服務選擇與分階段實施,這些金融巨頭不僅解決了當前挑戰,還為未來增長奠定了堅實基礎。
對於正在考慮容器化和雲端現代化的企業,這些案例提供了寶貴啟示:成功需要全面願景、靈活態度與堅定決心。透過採用 Amazon ECS 和 AWS Fargate,企業不僅能享受無需管理基礎設施的便利,還能實現更高的客戶滿意度、更強的系統彈性與更快的創新速度。
參考資料
- AWS re:Invent 2024 - Fannie Mae - Unleashing the power of Amazon ECS for platform teams (SVS330)
- AWS re:Invent 2024 - How Vanguard rebuilt its mission-critical trading application on AWS (FSI322)
- Amazon Elastic Container Service (Amazon ECS)
- AWS Fargate
- AWS Cloud Map
- AWS Identity and Access Management (AWS IAM)
- Amazon GuardDuty
- Amazon Virtual Private Cloud (Amazon VPC)
- AWS Step Functions
- AWS Batch
- Elastic Load Balancing
- Amazon VPC Lattice
- Amazon CloudWatch
- AWS App Runner
- AWS Lambda
- Amazon EventBridge
- Amazon Simple Queue Service (Amazon SQS)
- Amazon Aurora PostgreSQL
- Amazon Simple Storage Service (Amazon S3)
- Amazon Elastic Kubernetes Service (Amazon EKS)
- Amazon Kinesis