ทุกวันนี้ ถ้าใครไม่เคยได้ยินคำว่า Big Data ก็คงจะเชยน่าดู แต่จริงๆแล้ว Big Data จะมีความสำคัญไม่ได้ หากไม่มีการเอา Big Data ไปทำ Anatlysis แต่การทำ Analysis Big Data นั้นจะต้องใช้ Resource มหาศาล หากคิดไม่ออก ลองจิตนาการดูว่า เรามี Database ที่มีขนาดเป็นล้าน Record แล้วเราต้องการดึงข้อมูลเป็นล้านนี้ออกมาทำการวิเคราะห์ ไม่อยากจะคิดว่าเครื่องจะวิ่งอย่างไรไหว
ทุกวันนี้ ต้องบอกว่า SERVER นั้นมีประสิทธิภาพสูงขึ้นเรื่อยๆ แต่สิ่งที่พัฒนาคือ CPU , Memory แต่สำหรับ Disk นั้นเรียกได้ว่าเกิดคอขวดมานานแล้ว ถ้าจำได้ในสมัย 20 ปีที่แล้วเราก็ยังใช้ Disk แบบนี้คือ 7200 รอบ 10000 รอบและ 15000 รอบมันก็เป็นอย่างนี้มาหลายสิบปีแล้ว แม้จะพัฒนา Connector ด้านหลังจาก ATA เป็น Serial ATA ก็ตาม หรือแม้กระทั้งเพิ่ม Speed ด้านหลังจาก 1.5 -> 3.0 -> 6.0 Gbps ก็ตาม มันก็ไม่ทำให้ Disk นั้นหายจากอาการคอขวด
จึงเป็นที่มาของเทคโนโลยี่ตอนนี้ ที่เรียกกันว่า Flash Storage นั้นคือการเอา Chip memory มาทำเป็น Storage ก็คือไม่มีหัวอ่าน ไม่ต้องวิ่งกันที่ระดับว่ากีรอบ กี่รอบ มีความเร็วมากกว่าแบบเก่าเป็นหลายสิบเท่า ถ้าเรียกให้เข้าใจง่ายๆคือ Solid State Disk นั้นเอง แต่คำว่า Flash Storage นั้นไปไกลกว่านั้น มันคือการเอา SSD มาทำให้ Storage หรือระบบทำงานได้ไวขึ้น อันที่จริงแล้วมันมีหลาย Level ที่จะทำได้เพื่อให้ Storage นั้นทำงานได้ไวขึ้นตั้งแต่
- เอา SSD มาทำเป็น Cache เพื่อให้ใช้งาน Data ที่ใช้งานบ่อยๆนั้น Access ได้ไว เราลองสังเกตุ Report บางอย่างหากเราดึงครั้งแรกจะใช้เวลานานมาก แต่พอดึงอีกครั้งจะเร็วขึ้น เพราะว่าโดยทั่วไปแล้วมันจะถูกเก็บไว้ใน Memory (Ram) ทำให้ดึงมาได้ไวขึ้น
- การเอา SSD มาทำเป็น Storage เลย แบบนี้ก็ทำให้ระบบทำงานได้ไวขึ้นไปอีก แต่ก็ใช้งบประมาณมากขึ้นไปด้วยเช่นกัน
- การเอา SSD มาทำเป็น Storage แบบเป็น Card PCI เลย เรามักจะเริ่มเห็นแบบนี้ว่า บางยี่ห้อ SERVER ทำออกมาเป็นการ์ดเสียบที่ตัว Server เลย ด้วยเหตุที่ปัญหา Storage Disk แบบเดิมๆ มีปัญหาเพราะว่าสุดท้าย Disk ยังคงถูกเสียบผ่าน backplain แล้วต่อไปยัง RAID Controller ก็เริ่มเกิดคอขวดว่าเจ้าสาย SAS ที่เสียบระหว่าง Backplain กับ RAID Controller นั้นวิ่งด้วยความเร็ว 6Gbps แล้วก็ทำให้การทำงานนั้นช้าลง
- Step สุดท้ายเท่าที่ผมเห็นก็คือ การทำแผง Flash Storage แบบที่ 3 เสียบแทน Disk แล้วมี CPU ภายในตัวมาบริหารจัดการ Chip ของ Disk เพื่อให้การเขียนผ่านมีประสิทธิภาพมากขึ้น การลงทุนแบบที่ 4 นี้ ใช้เงิน 1.x ล้านเป็นอย่างน้อย แต่ถ้าเทียบประสิทธิภาพระดับ ล้าน IOPs นั้นแล้วถ้าองค์กรมีการทำการวิเคราะห์ข้อมูลมากขึ้น แล้วมีผลทางธุรกิจ การลงทุนหลักล้าน แล้วใช้ได้หลายปีนั้น ก็ถือว่าไม่ได้แพงมาก เพราะผลทางธุรกิจนั้น มันมากกว่านั้นมากมาย บางธุรกิจทำเงินกับการวิเคราะห์ข้อมูลได้ในระดับ นาทีนึงหลายแสนบาท
คำถามต่อมาคือ เราควรจะใช้แบบไหนมากกว่า บางคนทำแบบง่ายๆก็ไปซื้อ SSD ที่ใส่กับ Notebook มาเสียบบน Server ใช้ได้ไม่นานก็เสียเพราะ SSD ถือว่าเป็นเทรน ก็จะมีหลายเกรดเช่นกัน เกรด Consumer ที่ใช้กับตาม Notebook หรือเกรด Enterprise ก็แบ่งออกเป็น EP (Enterprise Performance) กับ EV (Enterprise Value) นั้นคือ มีการเขียนลงบน Chip ต่อวันได้กี่ครั้ง EV เขียนได้ 1 ครั้งต่อวันแบบ Full Disk size ส่วน EP ก็เขียนได้ 10 ครั้ง ก็จะเหมาะกับระบบงานที่แตกต่างกันไป แล้วแต่การเขียนของเรา เพราะ EP ราคาแพงกว่า 2 เท่าของ EV เป็นต้น
เพราะต้องไม่ลืมว่า SSD นั้นใช้ Chip ในการทำเป็น memory ดังนั้นหาก Chip มันพัง ก็พังเลย ไม่เหมือนหัวอ่านแบบ Disk ที่เราใช้กัน เพราะ Disk มีหัวอ่าน มีความเร็วรอบ หาก Disk พัง เรายังพบว่ามีการกู้คืนของ Data ได้เพราะมันอยู่บนจาน แต่ SSD นี่ถ้าพังก็ Chip ห... กันเลยทีเดียว ผมเคยใช้ SSD บน Notebook แล้วมันพัง ก็คือ ALL Data Gone แล้วไม่สามารถกู้คืนได้