What is Fivetran? Fivetran คืออะไร?

ผู้เขียน

–Yongyuth Likitpattanakul, CPIM–

,

          Fivetran คือ The Automated Data Movement Platform ถ้าจะอธิบายตรงตามศัพท์ก็คือ แพลตฟอร์มสำหรับทำการ Move Data จากที่หนึ่ง ไปยังอีกที่หนึ่งโดยอัตโนมัติ สโลแกนที่น่าสนใจของ Fivetran คือ Making Data as Simple & Reliable as Electricity คือการทำให้ข้อมูลง่ายและเชื่อถือได้เหมือนกับไฟฟ้า เช่น ในบ้านพักอาศัยของเรา แค่เปิดไฟก็ได้ใช้ไฟเลยทันที อะไรทำนองนี้

แต่คำอธิบายข้างต้นอาจจะไม่เข้าใจกระจ่างเพียงพอ ดังนั้นผู้เขียนจึงขอเกริ่นเรื่องราวให้เข้าใจดังนี้

การมาของ Cloud Computing ในโลกของ Data

ผู้เขียนเชื่อว่า Cloud Computing เป็นผู้เปลี่ยนเกมส์ (Game Changer) เพราะมีข้อดีหลายอย่าง เช่น

  1. เข้าถึงได้ง่าย โดยผ่าน Internet ไม่ใช่ระบบที่เป็น Intranet ที่จะเข้าถึงเฉพาะภายในองค์กร
  2. ไม่ต้องลงทุนสูงตอนเริ่มต้น เพราะไม่ต้องลงทุน Hardware และ Software โดยผู้ให้บริการส่วนใหญ่จะเป็นแบบ SaaS ดังนั้นค่าใช้จ่ายจึงแปรผันกับปริมาณการใช้งาน ใช้น้อยจ่ายน้อย ใช้มากจ่ายมาก
  3. มีการส่งเสริมให้เก็บข้อมูลไว้บน Cloud มากขึ้น เพราะข้อดีในการเข้าถึงได้ง่าย ขยายได้ง่าย การก่อกำเนิดของ Cloud Data Warehouse และ Cloud Data Lake ที่ให้บริการเก็บข้อมูลบน Cloud ทำให้มีทางเลือกมากขึ้น
  4. มีซอฟต์แวร์ทางด้าน Data ต่าง ๆ เกิดขึ้นมากมาย ที่เกาะกระแส Cloud Computing ทำให้ซอฟต์แวร์เหล่านั้นทำงานบน Cloud ได้
  5. การมาของ AI ในส่วนของ Generative AI ที่ต้อง Connect Internet ที่เชื่อมต่อกับ Cloud จึงจะสามารถประมวลผลได้

ด้วยเหตุผลข้างต้นทำให้แนวโน้มการใช้ Cloud จึงเพิ่มขึ้นอย่างต่อเนื่อง ดังนั้นในอนาคตเราพอจะคาดการณ์ได้ว่าการใช้งาน Cloud จะเพิ่มขึ้นอย่างแน่นอน

Modern Tools

          “Time is money” เวลาเป็นสิ่งสำคัญมากในปัจจุบัน เพราะการเปลี่ยนแปลงต่าง ๆ นั้นรวดเร็วมาก การที่สามารถปรับตัวให้ทันตามสถานการณ์ในเวลาอันรวดเร็วจึงมีความสำคัญ ดังนั้นเครื่องมือทางด้าน Data จึงต้องปรับเปลี่ยนให้ทันสมัย และมีประสิทธิภาพ ลดเวลาในการพัฒนาให้สั้นลงแต่มีประสิทธิภาพมากขึ้น สามารถทำงานร่วมกันกับ Cloud Computing ได้ดี เครื่องมือที่เกี่ยวกับ Data ต่าง ๆ เหล่านี้จึงขนานนามตัวว่าตัวเองว่าเป็นเครื่องมือยุคใหม่ หรือเครื่องมือทันสมัย (Modern Tools)

เมื่อเรานำ Modern Tools มารวบรวมกันตาม Flow ของ Data ที่ไหลตั้งแต่ต้นน้ำ ไปยังปลายน้ำ เราเรียกชุดเครื่องมือเหล่านี้ว่า Modern Data Stack

Modern Data Stack

          คือกลุ่มหรือชุดเครื่องมืออันทันสมัยที่เกี่ยวกับ Data จากรูปที่ 1 คือรูปแสดงส่วนประกอบต่าง ๆ ของ Modern Data Stack ซึ่งอธิบายโดยคร่าว ๆ ได้ดังนี้

รูปที่ 1 Modern Data Stack[1]

  1. Data sources คือแหล่งข้อมูลต้นทาง ในอดีตเราจะเน้นที่ Databases แต่ในสมัยใหม่เราพบเจอ SaaS apps และ Event streams เพิ่มขึ้นอย่างมาก ซึ่งส่วนใหญ่ให้บริการผ่าน Cloud แทบทั้งหมด
  2. Data Integration คือการ Extract การ Transform และการ Load ข้อมูล ในอดีตเราเน้นที่ ETL แต่ในปัจจุบันเราเน้นที่ ELT มากกว่า
  3. Data storage คือการเก็บข้อมูล ในอดีตเราจะเก็บข้อมูลไว้ใน Database ภายในองค์กร แต่ปัจจุบันเราเก็บข้อมูลไว้ใน Cloud data warehouse สำหรับ Structure Data และ Data Lake สำหรับ Simi Structure และ Un-structure Data
  4. Data uses คือการนำข้อมูลไปใช้ ณ ปลายทาง ในปัจจุบันเรามี Modern BI ที่ทรงพลัง ใช้งานง่าย เช่น Tableau, Power BI เป็นต้น หรือแม้แต่ Data science ที่ใช้ Machine Learning Model กับ Data ได้
  5. Data governance, orchestration and monitoring คือการกำกับดูแล ควบคุมจังหวะ และมอนิเตอร์ข้อมูล ตั้งแต่ต้นน้ำจนถึงปลายน้ำให้ ถูกต้อง ถูกจังหวะ
  6. Data versioning คือ การกำหนดเวอรชันของข้อมูลในแต่ละช่วงเวลา

Fivetran อยู่ส่วนไหนใน Modern Data Stack?

          Fivetran อยู่ในส่วนของ Data Integration ใน Modern Data Stack (ตามรูปที่ 1) โดย Fivetran เป็นเครื่องมือแบบ ELT (Extract Load and Transform) และเน้นที่ EL-Extract Load ดังนั้น Fivetran จึงนิยามตัวเองว่าเป็น Data Movement เพราะหน้าที่หลักก็คือการ Move Data จาก Data sources ไปเก็บไว้ใน Data storage นั่นเอง

ข้อมูลเสริม

  • ELT ต่างจาก ETL อย่างไร ในอดีตเรามักจะทำ ETL (Extract Transform Load) คือเรามักจะ Transform ข้อมูลก่อนที่จะ Load ข้อมูลไปเก็บที่ Data Warehouse แต่สมัยใหม่เรากลับนิยมทำ ELT (Extract Load Transform) คือเรา Load ข้อมูลไปเก็บก่อน แล้วค่อย Transform ทีหลัง สาเหตุที่ทำเช่นนี้อาจเป็นเพราะ
    • Storage ราคาถูก สามารถเก็บข้อมูลขนาดใหญ่ได้ในต้นทุนต่ำ
    • Processing ทำงานเร็ว คือถึงแม้ข้อมูลจะมีขนาดใหญ่แต่ซอฟต์แวร์สมัยใหม่สามารถทำงานได้รวดเร็วกว่าในอดีตมาก
    • ยืดหยุ่นกว่า เพราะได้ข้อมูลที่มีความละเอียดเท่ากับต้นทาง เช่นในกรณีของ Data Science ที่ต้องการข้อมูลที่ละเอียด
  • หมายเหตุ ในกรณีที่ต้องมีการ Transform Data ใน Fivetran ใช้โปรแกรม dbt ซึ่งเป็น Opensource โดยสามารถรัน dbt Model ภายใต้ระบบ Fivetran ได้

ทำไมต้อง Fivetran?

          คำตอบอาจจะเป็นเพราะประโยค “เพราะโลกของ Data ได้เปลี่ยนไป” จากรูปที่ 2 เป็นการเปรียบเทียบระหว่างโลกเก่า (ซ้ายมือ) และโลกใหม่ (ขวามือ) ซึ่งพอสรุปได้ดังนี้

  • แหล่งข้อมูลหลากหลายมากขึ้น ในอดีตเราอาจสนใจข้อมูลเฉพาะระบบภายในองค์กร เช่นระบบ ERP, CRM แต่สมัยใหม่เรามีแหล่งข้อมูลที่หลากหลายมากขึ้น เช่น ข้อมูลจาก Social Media หรือข้อมูลจากระบบ Cloud อื่น ๆ
  • ในอดีตระบบส่วนใหญ่จะเป็น On-premise ซึ่งสมัยใหม่ระบบจะอยู่บน Cloud มากขึ้น ทำให้การเข้าถึงเป็นไปได้มากขึ้นด้วย
  • ในอดีตเราอาจจะทำ รายงาน (Report) ที่ไม่ยืดหยุ่นมากเท่าไร แต่สมัยใหม่มี Use Cases ต่าง ๆ มากขึ้น ดังนั้นจึงต้องการ Report ที่ตอบสนอง และยืดหยุ่นมากขึ้น
  • ในอดีตเราทำการวิเคราะห์เพื่อนำเสนอโดยเน้นผู้บริหาร แต่สมัยใหม่เราเน้นให้ทุกคนในองค์กรเข้าถึงข้อมูลได้ เป็น Data Driven Organization

รูปที่ 2 Old World Vs. New World

แล้วทำไมต้องเป็น Fivetran? ผู้เขียนคิดว่าสาเหตุที่สำคัญที่สุดคือ เวลา (Time) เพราะ Fivetran นั้นเป็นระบบ Data Movement ที่ค่อนข้างสำเร็จรูปมาแล้ว ดังนั้นเราจึงไม่ต้องใช้เวลาในการพัฒนาระบบ ลองคิดดูว่าถ้าหากเราตั้งทีมงานเพื่อพัฒนา Data Movement เราต้องใช้เวลานานเท่าไร? อาจจะเป็นเดือนหรือหลายเดือน แต่ Fivetran นั้นแทบจะพร้อมใช้ทันที (สำหรับ Connector ที่มีอยู่แล้ว)

Fivetran เริ่มใช้งานอย่างไร?

          Fivetran เป็นระบบแบบ SAAS (Software as a Service) คือเป็นซอฟต์แวร์บนระบบ Cloud ที่ผู้ใช้ปลายทาง (End User) ทำงานผ่าน Web Browser ดังนั้นผู้ใช้ปลายทางจึงไม่จำเป็นต้องติดตั้งโปรแกรมบนเครื่องคอมพิวเตอร์ขององค์กรใด ๆ ทั้งสิ้น การเริ่มใช้งานก็เพียงแค่สมัครสมาชิก (Sign Up) ด้วย Email Address แล้วก็เริ่มใช้งานได้ทันที

          ที่เคยบอกว่า Fivetran ค่อนข้างสำเร็จรูปนั้น กล่าวคือเราใช้เวลาในการ Setup หรือ Configuration เพียงแค่ไม่กี่นาทีเท่านั้นเก็เริ่มใช้งานได้เลย การ Configuration เพื่อให้ Fivetran ทำงานแบ่งออกเป็น 2 ส่วนคือ (1) Connector และ (2) Destination 2 ส่วนเท่านั้นเอง เราลองมาทำความเข้าใจว่า Connector และ Destination คืออะไรดังนี้

  1. Connectors

Connector ใน Fivetran คือการเชื่อมต่อข้อมูลระหว่าง Fivetran กับ Sources (แหล่งข้อมูลต้นทาง) คืออยู่ในส่วนซ้ายมือของรูปที่ 3 นั่นเอง

รูปที่ 3 Fivetran Data Movement

Fivetran ได้พัฒนา Connectors มากกว่า 700 connectors[2] (ข้อมูล ณ กลางปีค.ศ. 2025) และยังมีการพัฒนา connectors เพิ่มขึ้นอยู่ตลอด นั่นหมายความว่าถ้าองค์กรของเราต้องการข้อมูลจากที่ไหน เราก็มาตรวจสอบว่า Fivetran มี Connectors นั้นหรือไม่ ถ้ามี ก็สามารถใช้ Fivetran ดึงข้อมูลได้ทันที ในกรณีที่ Fivetran ยังไม่มี Connectors นั้นทาง Fivetran ก็พร้อมที่จะพัฒนา Connectors เหล่านั้นสำหรับลูกค้าได้ แต่อาจต้องรอคิวด้วย

  1. Pre-Defined Schemas

ในแต่ละ Connectors ของ Fivetran นั้น จะมี Schemas ของข้อมูลที่พร้อมใช้งาน Schemas นี้จะแตกต่างกันไปในแต่ละ Connectors ข้อดีอย่างมากคือ ผู้ใช้งานไม่จำเป็นต้องไปสร้างระบบเพื่อเลือกดึงข้อมูลจาก Table, View หรือต้องไป Join, Union ข้อมูลเลย เพราะ Fivetran ทำ Schemas ที่เชื่อมโยงข้อมูล Table, View ต่าง ๆ เข้าด้วยกันให้แล้ว

ตัวอย่างเช่น ถ้าหากองค์กรของท่านต้องการดึงข้อมูลจากระบบ Salesforces ออกมาเก็บไว้ที่ Data Warehouse ทาง Fivetran ก็มี Connectors Salesforces ซึ่งมี Schemas สำเร็จรูปให้เลือกว่าจะเอาข้อมูลอะไรบ้าง เช่นข้อมูลทางด้าน Sales ด้าน Support หรือด้าน Events ดังรูปที่ 4

รูปที่ 4  Fivetran Salesforces[3] Schema Information

          หรือกรณีที่ท่านต้องการดึงข้อมูลจาก Tiktok  ทาง Fivetran ก็มี Connectors Tiktok Ads ไว้ให้อยู่แล้ว ซึ่งมี Schemas ที่พร้อมจะดึงข้อมูลตามรูปที่ 5

รูปที่ 5  Fivetran TikTok Ads Schema Information

หรือกรณีที่ท่านต้องการดึงข้อมูลจาก Line  ทาง Fivetran ก็มี Connectors Line Ads ไว้ให้อยู่แล้วเช่นกัน ซึ่งมี Schemas ที่พร้อมจะดึงข้อมูลตามรูปที่ 6

รูปที่ 6  Fivetran LINE Ads ERD

จากตัวอย่างที่ยกมาเพียง 3 Connectors จะเห็นว่าทาง Fivetran ได้เตรียม Schema ซึ่งเรียบร้อยแล้ว เราสามารถเลือกข้อมูลที่ต้องการได้ทันที เราไม่จำเป็นต้องไปพัฒนาหรือเขียน code เพื่อดึงข้อมูลจาก Table หรือ API เพราะ Fivetran เตรียมไว้ให้เราเลือกใช้ได้ทันที

  • Destination

Destination คือ ปลายทางของ Data Movement คือปลายทางที่เราจะนำข้อมูลไปเก็บ หรือพักไว้นั่นเอง อ้างอิงตามรูปที่ 3   Destination จะอยู่ในด้านขวามือของรูป โดย Destination ที่ Fivetran รองรับมีหลายรูปแบบ ทั้ง Database, Cloud Data Warehouse, Data Lakes หรือ Streaming

ปัจจุบัน (ข้อมูล ณ กลางปีค.ศ. 2025) Fivetran มี Destination ที่รองรับอยู่ 21 Destination ดังรูปที่ 7

รูปที่ 7  Destination ที่ Fivetran รองรับ

Deployment Model ของ Fivetran

          โดยปกติแล้วการ Deploy Fivetran จะเป็นแบบ SaaS deployment คือทุกสิ่งอยู่บน Cloud กล่าวคือ Source และ Destination อยู่บนระบบ Cloud ทั้งหมดดังรูปที่ 8 ซึ่งรูปแบบการ Deploy บน Cloud นี้เป็นรูปแบบที่มีการใช้งานมากที่สุดของผู้ใช้งาน Fivetran

รูปที่ 8  การ Deploy Fivetran แบบ Cloud

          อย่างไรก็ดีในบางองค์กรก็ไม่ได้นำข้อมูลไว้บน Cloud ทั้งหมด ดังนั้น Fivetran จึงมี Deployment Model อีก 2 รูปแบบที่สามารถทำได้คือ การ Deploy Fivetran แบบ Hybrid คือระบบ Fivetran ยังอยู่บน Cloud แต่ Data Pipeline อยู่บน Environment ขององค์กร ดังรูปที่ 9

รูปที่ 9  การ Deploy Fivetran แบบ Hybrid

หรือในกรณีที่ Deploy Fivetran แบบ On-prem คือ ระบบทุกอย่าง อยู่บน Local Environment ทั้งหมด ทั้ง Sources, Destination รวมถึง Fivetran ด้วย ก็สามารถทำได้ ดังรูปที่ 10

รูปที่ 10  การ Deploy Fivetran แบบ On-prem

การคิดค่าใช้จ่ายของ Fivetran

          Fivetran กล่าวว่า “Only pay for what you use” หรือจ่ายเฉพาะที่คุณใช้งานเท่านั้น แล้วคำว่า ”ที่คุณใช้งาน” นั้น วัดยังไง แล้วคิดยังไงก็แน่

ในหัวข้อนี้ขออธิบายหลักการคิดราคาของ Fivetran โดยราคาของ Fivetran ขึ้นกับปัจจัยหลัก 2 ส่วน คือ Pricing Plan และ MAR ซึ่งขออธิบายให้เข้าใจรายละเอียดดังนี้

ตามรูปที่ 11 แผนราคาของ Fivetran มี 4 รูปแบบ คือ 1) Free, 2) Standard, 3) Enterprise และ 4) Business Critical สิ่งที่แตกต่างกันระหว่างแผน 4 แบบหลัก ๆ คือ

  1. อัตราราคา (Price Rate)
    1. ฟีเจอร์ (Features) ที่ไม่เท่ากัน

โดยเราสามารถแบ่งแผนทั้ง 4 แบบได้เป็น 2 กลุ่มคือ

  1. Free Plan คือ แผนที่ใช้งานได้ฟรีไม่เสียค่าใช้จ่ายเลย ถ้าการใช้งานไม่มากถึงจุดที่กำหนดคือ 500,000 MAR (หมายเหตุ Free Plan มีฟีเจอร์เทียบเท่า Standard Plan)
  2. Paid Plan คือ แผนที่ต้องเสียค่าใช้จ่าย ประกอบด้วย 1) Standard, 2) Enterprise และ 3) Business Critical คุณต้องเสียค่าใช้จ่ายเมื่อคุณใช้งานเกิน 500,000 MAR

รูปที่ 11  แผนราคา (Pricing Plan) ของ Fivetran

Pricing Plan ไม่ได้วัดปริมาณการใช้งาน แต่เป็นตัวระบุ Rate ราคา ซึ่งปริมาณการใช้งาน    มากหรือน้อยนั้น Fivetran วัดค่าด้วย Monthly Active Rows (MAR) ซึ่งถือว่าเป็นปัจจัยที่ 2 ที่ควรทำความเข้าใจในการคิดราคาของ Fivetran

MAR ย่อมาจาก Monthly Active Rows เป็นวิธีการวัดปริมาณข้อมูล (measure data volume) ของ Fivetran เพื่อให้ลูกค้าของ Fivetran จ่ายเฉพาะที่ใช้งานจริงได้อย่างเป็นธรรม

การคิด MAR[4] มีแนวคิดดังนี้

  • แถว (Row) ของข้อมูลที่ Active ในเดือนนั้น ได้แก่มีการ inserted, updated หรือ deleted
  • ถ้ามีการ updated แถว (Row) เดิมในเดือนนั้น เราจะนับแค่ 1 MAR เท่านั้น
  • มีการคิด MAR ใหม่ทุก ๆ เดือน คือ Reset การนับ MAR ใหม่เมื่อขึ้นเดือนใหม่
  • ตั้งแต่เดือน March 2025 ทาง Fivetran คำนวณ MAR ต่อ Connectors

ตามที่ได้กล่าวมาก่อนนี้ว่าการคิดราคาของ Fivetran ขึ้นกับ Pricing Plan และ จำนวน MAR ถ้าเรารู้ข้อมูล 2 ส่วนนี้ เราก็สามารถคำนวณราคาได้ ตามรูปที่ 12 เป็นตารางราคาของ Standard Plan ถ้าเรารู้จำนวน Mar เราก็สามารถมาเปรียบเทียบกับข้อมูลในตารางเพื่อหาค่าใช้จ่ายต่อเดือนได้

ท่านสามารถคำนวณราคาได้บน Website ของ Fivetran ที่ Link https://fivetran.com/pricing-estimator

รูปที่ 12  การคิดราคาตาม Standard Plan

สิ่งที่ยากคือ จะรู้ได้ยังไงว่าองค์กรของเรานั้นจะใช้จำนวน MAR เท่าใด? ซึ่งคำถามนี้ตอบยากอยู่พอสมควร ดังนั้นทางออกเพื่อให้ตอบคำถามนี้ได้ ทาง Fivetran จึงออกแบบระบบให้ลูกค้าเข้ามาทดลองใช้ได้ฟรี เพื่อให้เห็นปริมาณ MAR จริง ๆ ที่จะเกิดขึ้นได้

ทดลองใช้งานโดยไม่มีค่าใช้จ่ายฟรี 14 วัน

          คุณสามารถใช้งาน Fivetran โดยไม่มีค่าใช้จ่ายในเวลา 14 วัน ต่อ Connectors เรียกว่าช่วง Free Trials  โดยมีคุณสมบัติดังนี้

  • ในช่วง Free trials นี้ท่านจะได้ใช้งานฟีเจอร์เทียบเท่า Enterprise Plan
  • ในช่วง Free trials นี้ท่านสามารถ Sync ข้อมูลได้ไม่จำกัด ท่านสามารถ Sync ข้อมูลได้หลายล้าน MAR ได้ฟรี พูดง่าย ๆ ว่า Fivetran ให้ท่านใช้งานจริงได้เลย ไม่ใช่แต่การทดลองใช้
  • ในช่วง Free trials ท่านจะพอรู้ว่า MAR ที่ท่านใช้มีปริมาณเท่าใด เพราะได้ Sync ข้อมูลมาระยะนึงแล้ว
  • เมื่อครบกำหนด Free trials แล้ว ถ้าหากท่านใช้ MAR ไม่เกิน 500,000 MAR ระบบจะเปลี่ยนให้เป็น Free Plan และท่านสามารถใช้งานได้ฟรีตลอดไปตราบที่ไม่เกิน 500,000 MAR (หมาเหตุ Free Plan มีฟีเจอร์เทียบเท่า Standard Plan)
  • เมื่อครบกำหนด Free trials แล้ว ถ้าหากท่านใช้ MAR เกิน 500,000 MAR ท่านต้องเปลี่ยนเป็น Paid Plan ซึ่งมี Pricing Plan 3 แบบให้เลือกคือ 1)Standard 2)Enterprise 3)Business Critical แล้วก็สามารถใช้งานได้ต่อทันที

ข้อสรุป

  • Fivetran ถือเป็นเครื่องมือในหมวด Data Integration และอยู่ใน Modern Data Stack
  • Fivetran ใช้งานได้ทันทีภายในไม่กี่ Click ถ้าองค์กรท่านต้องการไปดึงข้อมูลจาก Connectors ที่ Fivetran มี และองค์กรท่านมี Destination ที่ Fivetran รองรับ
  • Fivetran คิดราคาตามการใช้งานจริง โดยขึ้นกับ Pricing Plan และจำนวน MAR
  • Fivetran สามารถทดลองใช้งานได้ฟรีในช่วง Free Trials เป็นระยะเวลา 14 วัน โดยไม่จำกัดปริมาณข้อมูล
  • Fivetran สามารถใช้งานได้ฟรี (ตลอดไป) ถ้าหากจำนวน MAR น้อยกว่า 500,000 MAR

Reference


[1] รูปนี้อ้างอิงจาก https://www.altexsoft.com/blog/modern-data-stack/

[2] ท่านสามารถดูรายชื่อ Connectors ทั้งหมดได้ที่ https://www.fivetran.com/connectors

[3]  รูปนี้ไม่ใช่ ER Diagram ที่สมบูรณ์ แต่ว่าเป็นการแสดงความสัมพันธ์ของ Entities และ Workflows ส่วนกลาง เราสามารถเจาะลึกลงไปในระดับ Table หรือ View ของระบบ Salesforces ได้

[4] สามารถดู Video การคิด MAR ได้ที่ https://www.fivetran.com/resources/videos/understand-pricing-monthly-active-rows-explained

Leave a Reply

Your email address will not be published. Required fields are marked *