หน้าแรก Cloud 7 ปัจจัยสำคัญ ในการเลือกสตอเรจให้ระบบบิ๊กดาต้า

[บทความ] 7 ปัจจัยสำคัญ ในการเลือกสตอเรจให้ระบบบิ๊กดาต้า

แบ่งปัน

ระบบวิเคราะห์ฐานข้อมูลปริมาณมหาศาลหรือ Big Data นั้น มักมีคนสงสัยว่าดาต้านี่มันบิ๊กมากขนาดไหน แต่ข้อเท็จจริงนั้นสิ่งที่บิ๊กไม่ใช่แค่ปริมาณอย่างเดียว แต่ยังพ่วงความซับซ้อนของข้อมูลจากหลายที่มา ที่มักเป็นข้อมูลที่ไม่ได้ผ่านการเรียบเรียงอะไรมาก่อนเพื่อรอเข้าระบบวิเคราะห์ดึงประโยชน์ออกมาใช้ให้ได้มากที่สุด

ดังนั้น การกระจายความจุอย่างเดียว อาจทำให้ฐานข้อมูลที่มีกลายเป็นถังขยะขนาดบิ๊กแทนก็ได้ เราต้องพิจารณาถึงการจัดการข้อมูลควบคู่กันไป โดยเฉพาะในยุคใหม่นี้ที่ข้อมูล CRM ของลูกค้าสร้างความได้เปรียบในการแข่งขันอย่างมหาศาล รวมถึงกฎหมายใหม่อย่างในอียูที่บริษัทต้องปกป้องและบริหารจัดการข้อมูลลูกค้าให้เป็นระบบและมีความปลอดภัยเพียงพอ

อีกทั้งในแง่ของฝ่ายไอทีที่ยังคุ้นเคยกับความจุหลักเทอราไบต์ การก้าวขึ้นไปสู่หลักเพตาไบต์ก็ดูเป็นอะไรที่แพงและเพิ่มภาระอย่างมาก โดยเฉพาะในกรณีสตอเรจแบบ RAID แต่เทคโนโลยีปัจจุบันมีทางเลือกให้หลากหลายกว่าเดิมเยอะ โดยเฉพาะซอฟต์แวร์จัดการฐานข้อมูลแบบโอเพ่นซอร์สที่ไม่มีค่าใช้จ่าย

ทาง NetworkComputing.com จึงรวบรวมเอา 7 ปัจจัยสำคัญที่องค์กรควรพิจารณาในการวางระบบสตอเรจเพื่อนำ Big Data มาใช้ ดังต่อไปนี้

1. ขนาดและการเติบโต รวมทั้งการเคลื่อนไหวของข้อมูล
พยายามมองหาวิธีลดขนาดของข้อมูลที่บริหารจัดการอยู่ตลอดเวลา โดยเฉพาะการดูเรื่องข้อมูลที่หมดอายุ รวมทั้งข้อมูลบางกลุ่มที่สำคัญและหายาก ที่จำเป็นต้องเข้ารหัสและจัดเก็บนานเป็นพิเศษ ทั้งนี้อย่าลืมเรื่องของการเพิ่มขึ้นของความต้องการสตอเรจอย่างรวดเร็วและรุนแรง อย่างข้อมูลที่มีอายุสั้นนั้นอาจเหมาะกับบริการบนพับลิกคลาวด์ที่ยืดหยุ่นมากกว่า เป็นต้น ที่สำคัญต้องเปลี่ยนความคิดว่า บิ๊กดาต้าไม่ได้บิ๊กขนาด 100 PB เสมอไป องค์กรปัจจุบันมักใช้ความจุอยู่แค่ 100 TB – 10 PB เท่านั้น

2. บทบาทของอ๊อพเจ็กต์สตอเรจ
ที่สามารถรองรับอ๊อพเจ็กต์ที่มีขนาดแตกต่างกันได้ง่ายกว่า พร้อมโครงสร้างเมต้าดาต้าที่หลากหลายและยืดหยุ่นในการจัดการข้อมูลปริมาณมหาศาลได้ดี นอกจากนี้ยังถูกกว่าสตอเรจแบบ RAID ดั้งเดิมเสียอีก เนื่องจากมักใช้ซอฟต์แวร์แบบโอเพ่นซอร์สพร้อมฮาร์ดแวร์แบบ COTS ที่ไม่ผูกขาดด้วย

3. การจัดการวงจรชีวิตของข้อมูล
เป็นความท้าทายอย่างยิ่งในการจัดการข้อมูลที่เข้าออกจากสตอเรจ มากกว่าการเตรียมฐานข้อมูลไว้รองรับเสียอีก ลองพิจารณาอย่างการติดป้ายแท๊กข้อมูลที่หมดอายุบนซอฟต์แวร์สตอเรจของคุณ พร้อมตั้งโพลิซีทำลายข้อมูลหมดอายุเพื่อให้จัดการข้อมูลได้ง่ายขึ้น เป็นต้น

4. กฎหมายด้านการรักษาความเป็นส่วนตัวของข้อมูล
โดยเฉพาะกฎ GDPR ที่บังคับใช้ในยูโรโซน ซึ่งค่าปรับแพงมากถึง 4% ของรายได้องค์กรทั่วโลกเลยทีเดียว แถมยังมีผลไม่ว่าจะเก็บข้อมูลไว้ส่วนไหนของโลกอีกด้วย ซึ่งกฎหมายนร้แม้ส่วนหนึ่งจะเกี่ยวข้องกับผู้ผลิตสตอเรจ แต่ส่วนใหญ่เกี่ยวพันกับกระบวนการจัดการขององค์กรคุณเอง ระวังว่าบริการด้านการเข้ารหัสข้อมูลบนไดรฟ์ที่มีให้จากผู้ผลิตสตอเรจหรือผู้ให้บริการคลาวด์ มักไม่เพียงพอต่อมาตรฐานอย่าง HIPAA, SOX, หรือ GDPR เพราะคุณจำเป็นต้องเป็นเจ้าของคีย์เข้าและถอดรหัสในฐานะเจ้าของข้อมูลด้วย

storage

5. ไดรฟ์แบบ Solid-State
ทำให้ได้ขนาดจัดเก็บที่เล็กมากแต่จุสูงมากกว่าเดิม เช่นเซิร์ฟเวอร์ขนาด 1U ปัจจุบันก็สามารถจุ SSD ขนาด 1.2PB ได้สบายๆ แน่นอนว่าราคาเว่อร์วังพอสมควร แต่ถ้าชั่งข้อดีข้อเสียกับประสิทธิภาพที่จำเป็นต้องใช้แล้วคุ้มก็น่าสนใจมาก แต่ระวังในเรื่องของความก้าวหน้าทางเทคโนโลยีด้านนี้ที่เปลี่ยนแปลงเร็วมาก จนไม่น่าลงทุนกับ SSD มากเกินไป

6. การบีบอัดข้อมูล
ถ้าเป็นกรณีที่ต้องใช้สตอเรจที่ความจุน้อยกว่าเพื่อแลกกับประสิทธิภาพ เช่นการใช้ SSD 1 PB แทนดิสก์ธรรมดาแบบ 5 PB เพื่อความเร็ว การบีบอัดข้อมูลก็เป็นทางเลือกที่น่าสนใจ นอกจากนั้นยังช่วยลดปริมาณทราฟิกบนเครือข่ายได้ด้วย อย่างไรก็ดี กระบวนการบีบอัดและขยายข้อมูลก็ค่อนข้างใช้ทรัพยากรประมวลผลมากพอสมควรที่คุณต้องชั่งน้ำหนักให้ดี

Cloud storage

7. ทางเลือกในการใช้บริการคลาวด์
ถ้ามองว่าเรื่องฮาร์ดแวร์ที่เกี่ยวข้องเป็นเรื่องซับซ้อนและมีภาระในการจัดการหนักเกินไป อาจมองหาผู้ให้บริการคลาวด์ที่ทำหน้าที่ทั้งหมดแทนคุณ โดยเฉพาะผู้ให้บริการระดับท็อปสามอย่าง Amazon, Google, และไมโครซอฟท์ ที่ถือเป็นผู้นำด้านสถาปัตยกรรมใหม่รวมทั้งการบริหารจัดการด้านซอฟต์แวร์ แถมยังช่วยคุณควบคุมค่าใช้จ่ายโดยจ่ายตามปริมาณการใช้งานจริง และรับภาระช่วงที่ข้อมูลมีปริมาณพุ่งสูงผิดปกติได้ด้วย แต่ถ้าเทียบกับระบบภายในองค์กรตัวเองแล้ว อาจเสียเปรียบด้านการปรับแต่งที่ละเอียดอย่างทรัพยากรซีพียูและหน่วยความจำที่จัดให้แต่ละ Instance เป็นต้น

ที่มา : http://www.networkcomputing.com/storage/big-data-storage-7-key-factors/1380415337