การจัดการข้อมูลถือเป็นความท้าทายบนทุกสภาพแวดล้อมการทำงาน โดยเฉพาะบนคลาวด์ ไม่ว่าจะเป็นทั้งด้านความปลอดภัย การบริหารค่าใช้จ่าย และแก้ปัญหาด้านประสิทธิภาพการใช้งานที่มีลักษณะจำเพาะไมเหมือนใคร
ดังนั้นทาง ITProToday จึงได้แนะนำเคล็ดลับที่จะช่วยทีมงานด้านไอทีในการปรับปรุงการจัดการข้อมูลบนคลาวด์ สร้างสมดุลระหว่างความต้องการแต่ละด้านที่เกี่ยวข้องกับข้อมูลทั้งในสภาพแวดล้อมแบบพับลิก ไพรเวท และไฮบริดจ์คลาวด์ดังนี้
1. แบ่งระดับสตอเรจ
วิธีพื้นฐานที่ดีที่สุดในการหาจุดสมดุลระหว่างค่าใช้จ่ายที่เกิดขึ้นกับสตอเรจบนคลาวด์และประสิทธิภาพการใช้งานที่ได้รับนั้นก็คือการใช้ Tier สำหรับสตอเรจเก็บข้อมูล ซึ่งผู้ให้บริการพับลิกคลาวด์ส่วนใหญ่ต่างให้เลือก Tier หรือประเภทสตอเรจที่แตกต่างกันได้
โดยระดับที่มีราคาแพงที่สุดจะให้การเข้าถึงข้อมูลอย่างรวดเร็ว ขณะที่ราคารองลงมาอาจจะต้องใช้เวลาเข้าถึงนานมากขึ้นตามลำดับ ที่เป็นไปได้ตั้งแต่ระดับนาทีไปจนถึงหลายชั่วโมง ซึ่งเราสามารถเลือกจัดเก็บข้อมูลที่ไม่ได้เข้าถึงบ่อยๆ ไปเก็บในสตอเรจที่ราคาถูกลงได้
2. เลือกกรณีการใช้สตอเรจแบบอ็อปเจ็กต์อย่างฉลาด
หลายครั้งที่บริการสตอเรจแบบอ็อปเจ็กต์อย่าง AWS S3 หรือ Azure Blob Storage ได้กลายเป็นโซลูชั่นที่นิยมใช้ในการจัดเก็บข้อมูลบนคลาวด์ เนื่องจากเปิดให้อัพโหลดข้อมูลได้ทุกรูปแบบ เรียกดูได้อย่างรวดเร็วโดยไม่ต้องกังวลเกี่ยวกับโครงสร้างข้อมูลหรือการตั้งค่าฐานข้อมูล
แต่จุดบอดของสตอเรจแบบอ็อปเจ็กต์ก็คือ จะมีค่าใช้จ่ายในการจัดการข้อมูลเสมอ ตัวอย่างเช่น ถ้าต้องการแสดงรายการเนื้อหาในบักเก็ตสตอเรจหรืออยากคัดลอกไฟล์ ก็ต้องจ่ายค่าบริการแยกในแต่ละคำขอ ถึงแม้ราคาไม่แพงในแต่ละครั้ง แต่พอต้องเข้าถึงหรือจัดการข้อมูลต่อเนื่องก็อาจแพงขึ้นมาโดยไม่คาดคิด
ขณะที่การดำเนินการเกี่ยวกับข้อมูลบนบริการสตอเรจบนคลาวด์แบบอื่นนั้นมักไม่มีค่าบริการพิเศษแบบนี้ เช่น สตอเรจแบบบล็อกหรือฐานข้อมูลบนคลาวด์แบบอื่น ดังนั้นเพื่อประหยัดค่าใช้จ่ายมากที่สุด ก็ควรสร้างสมดุลระหว่างความสะดวกในการใช้กับค่าบริการด้วย
3. การป้องกันข้อมูลบนคลาวด์รั่วไหล
หนึ่งในความท้าทายที่สำคัญด้านความปลอดภัยในการจัดการข้อมูลบนคลาวด์ก็คือ ความเสี่ยงที่ทีมงานไม่มีวันรู้ว่าข้อมูลความลับของตัวเองถูกเก็บไว้ตรงไหนบนระบบคลาวด์ ทำให้เวลาอัพโหลดข้อมูลที่ระบุตัวตนได้ขึ้นไปก็ไม่สามารถติดตามความเคลื่อนไหวได้
โดยเฉพาะอย่างยิ่งถ้าระบบคลาวด์ของคุณถูกแบ่งกันใช้งานร่วมกับผู้ใช้อีกจำนวนมากภายในองค์กร ที่แต่ละคนก็มีรูปแบบการจัดการข้อมูลของตัวเองแตกต่างกันไป จึงมึทูลอย่าง Cloud Data Loss Prevention (DLP) เข้ามาช่วยจุดนี้
4. ใช้สถาปัตยกรรมที่หลีกเลี่ยงการส่งข้อมูลออกมาจากคลาวด์
ข้อมูลขาออกจากคลาวด์หรือ Data Egress นั้นหมายถึงการเคลื่อนย้ายข้อมูลออกมาจากระบบพับลิกคลาวด์ ซึ่งมักถูกคิดค่าบริการ และเกี่ยวข้องกับการบริหารจัดการด้านประสิทธิภาพ ยิ่งมีข้อมูลนำออกมาเท่าไร ก็ยิ่งถูกคิดค่าบริการคลาวด์แพงมากเท่านั้น
การปล่อยให้เคลื่อนย้ายข้อมูลออกมาจากคลาวด์ยังกระทบกับประสิทธิภาพด้วยเนื่องจากต้องใช้อินเทอร์เน็ตในการสื่อสาร ดังนั้นจึงควรพิจารณาจุดนี้ตั้งแต่ตอนออกแบบระบบคลาวด์ของตัวเอง ให้จัดเก็บข้อมูลให้อยู่แต่ภายในคลาวด์ให้ได้มากที่สุด
5. การวิเคราะห์ข้อมูลบนคลาวด์
นอกจากบริการจัดเก็บข้อมูลพื้นฐานแล้ว ตอนนี้ผู้ให้บริการคลาวด์รายใหญ่ทั้งหลายยังเปิดบริการวิเคราะห์จัดการข้อมูลให้ด้วย อย่างเช่น AWS OpenSearch และ Azure Data Lake Analytics ช่วยให้วิเคราะห์ได้โดยไม่ต้องย้ายข้อมูลออกมานอกคลาวด์ให้เปลือง
แต่ก็ต้องพิจารณาถึงค่าบริการด้านการวิเคราะห์โดยตรงนี้ด้วย ที่อาจแพงเกินคาดได้ขึ้นกับปริมาณข้อมูลที่คุณใช้ประมวลผล รวมทั้งอาจมีความกังวลเกี่ยวกับความเป็นส่วนตัวของข้อมูลจากการใช้บริการวิเคราะห์ข้อมูลที่อ่อนไหวจากเธิร์ดปาร์ตี้
ที่มา : ITProToday