Gartner รายงานว่าองค์กรส่วนใหญ่ Overpay ค่า Cloud 30–35% เนื่องจาก Resource ที่ Provision มากเกิน, Zombie Resource ที่ไม่ได้ใช้แล้ว และการเลือก Pricing Model ที่ไม่เหมาะสม
ข่าวดีคือปัญหาเหล่านี้แก้ได้ และแก้ได้เร็วด้วย
Summit ของค่าใช้จ่าย Cloud ที่พบบ่อย
Zombie Resources
Server, Database, Load Balancer ที่ Provision ไว้แต่ไม่มีใครใช้แล้ว หรือใช้น้อยกว่า 5% Utilization ยังคิดค่าใช้จ่ายตามปกติ
วิธีหา: Cloud Provider ทุกเจ้ามี Cost Explorer รายงาน Low Utilization Resource
Over-provisioned Resources
เลือก Instance ใหญ่เพราะกลัวไม่พอ แต่จริงๆ ใช้ CPU แค่ 10–20%
วิธีหา: Datadog, CloudWatch, หรือ Cloud Provider Native Monitoring ดู Average CPU/Memory ตลอด 30 วัน
On-demand เกินจำเป็น
On-demand pricing ราคาสูงสุด แต่คนมักใช้แม้กับ Workload ที่ Predictable
ทางออก: Reserved Instances (1–3 ปี) ประหยัดได้ 30–60%, Spot Instances สำหรับ Batch Processing ประหยัด 70–90%
Optimization Techniques ที่ทำได้ทันที
1. Right-Sizing
วิเคราะห์ Utilization ของ Server ทุกตัว:
| Metric | Threshold ที่ควร Right-size |
|---|---|
| CPU Utilization | ต่ำกว่า 30% เป็น Average |
| Memory Utilization | ต่ำกว่า 40% เป็น Average |
| Network I/O | ต่ำกว่า 20% ของ Bandwidth |
ถ้าต่ำกว่า Threshold พิจารณา Downsize 1 ระดับ
2. Delete Zombie Resources
Checklist:
- EC2/VM ที่ Stopped นานกว่า 30 วัน
- Unattached EBS Volume / Persistent Disk
- Snapshots เก่ากว่า 90 วัน ที่ไม่ได้ใช้
- Load Balancer ที่ไม่มี Target
- Elastic IP ที่ไม่ได้ Attach กับ Instance
- NAT Gateway ที่แทบไม่มี Traffic
3. เปลี่ยนจาก On-demand เป็น Reserved / Savings Plans
สำหรับ Workload ที่ Run ตลอดเวลา:
- AWS Reserved Instances: ประหยัดสูงสุด 60% เทียบ On-demand
- AWS Savings Plans: ยืดหยุ่นกว่า Reserved, ประหยัด 40–60%
- GCP Committed Use Discounts: 25–57%
แนะนำ: Analyze 3 เดือนก่อนหน้าก่อน Commit
4. ใช้ Spot / Preemptible Instances สำหรับ Batch Jobs
Spot Instances ราคาถูกกว่า On-demand ถึง 70–90% แต่อาจถูก Interrupt เหมาะกับ: Data Processing, CI/CD Build, ML Training, Video Encoding
5. Optimize Storage
| Storage Type | ลดราคาโดย |
|---|---|
| S3 / GCS | ใช้ Lifecycle Policy ย้ายไป Infrequent Access หลัง 30 วัน |
| Database | ลด Backup Retention Period ที่ยาวเกินจำเป็น |
| Log Storage | Compress และ Archive ไปยัง Cold Storage หลัง 30 วัน |
6. Database Optimization
- Read Replica แทน Master สำหรับ Read-heavy Workload
- Serverless Database (Aurora Serverless, AlloyDB) Pay ตาม Query จริง
- Connection Pooling ลด Connection จำนวนมากที่ Idle อยู่
7. CDN และ Caching
- ใช้ CDN (CloudFront, Cloudflare) สำหรับ Static Assets → ลด Origin Server Load
- Cache API Response ที่ไม่ต้องการ Real-time → ลด Compute
- เป้าหมาย: Cache Hi Rate > 80%
8. Auto-scaling ที่ดี
ตั้ง Auto-scaling ให้ Scale Down ได้จริง ไม่ใช่แค่ Scale Up:
- Minimum Instances: เท่าที่ใช้จริงในช่วง Low Traffic
- Cooldown Period: ไม่นานเกินไปเพราะ Scale Down ช้า
- Scale DOWN Metric: ตั้งให้เหมาะสม ไม่ต้องรอนานเกินไป
Dashboard และ Alerting สำหรับ Cost
ติดตั้งก่อนทุกอย่าง:
- Budget Alert — แจ้งเตือนเมื่อใช้ไปถึง 80% ของ Budget
- Anomaly Detection — แจ้งเตือนเมื่อค่าใช้จ่ายขึ้นผิดปกติ (AWS Cost Anomaly Detection ฟรี)
- Monthly Cost Report — By Service, By Team, By Environment
ตัวอย่างการลดต้นทุนจริง
ก่อน Optimization — Startup Stage:
- 3x m5.xlarge EC2 (On-demand) — $600/เดือน
- RDS db.r5.large (On-demand) — $200/เดือน
- Unattached EBS Volumes — $50/เดือน
- NAT Gateway ที่แทบไม่ใช้ — $100/เดือน
- รวม: $950/เดือน
หลัง Optimization:
- 3x m5.large Reserved (1ปี) — $180/เดือน (-70%)
- RDS db.t4g.medium Reserved — $60/เดือน (-70%)
- ลบ Zombie Resources — $0
- ย้ายไป VPC Endpoint แทน NAT — $20/เดือน
- รวม: $260/เดือน (ประหยัด 73%)
สรุป
Cloud Cost Optimization ไม่ใช่ One-time Activity แต่เป็น Ongoing Practice
Checklist ทำทันที:
- หา Zombie Resources และลบ
- Right-size Instance ที่ Utilization ต่ำ
- เปลี่ยน On-demand → Reserved สำหรับ Stable Workload
- ตั้ง Budget Alert และ Anomaly Detection
- Review Monthly ทุกเดือน
ทีมที่ดีประหยัดค่า Cloud ได้ 30–50% โดยไม่กระทบ Performance เลย
Adowbig ช่วย Cloud Architecture Design และ Cost Optimization สำหรับ AWS, GCP และ DigitalOcean ติดต่อเราเพื่อ Cloud Review ฟรี