Data Science คืออะไร? ต่างกับ Machine Learning, Data Mining, Data Analysis ยังไง

คำ ๆ หนึ่งที่ผมคิดว่าเป็น Buzzword แห่งปี ที่คนใช้กันเยอะมาก และส่วนใหญ่ขาดความเข้าใจถึงความหมายจริง ๆ ของมัน คือคำว่า “Data Science” ครับ เรามาดูกันว่า Data Science คืออะไร ? แล้วต่างกับอีกคำที่คนใช้บ่อย ๆ ว่า “Machine Learning” ยังไงบ้าง

ผมก็เป็นคนหนึ่งที่สงสัยและไม่มั่นใจว่า Data Science มันหมายความว่าอะไรกันแน่ จนมาเรียนวิชา Introduction to Data Science ก็เลยได้ข้อสรุปที่น่าพอใจดังนี้ครับ

Data Science คืออะไร

Data Science หมายถึง การนำข้อมูลมาใช้ประโยชน์ เพื่อค้นหาสิ่งที่เราไม่รู้ (หรือเรียกแบบดูดีว่า Insights) นั่นเองครับ

ซึ่งแน่นอนว่าความหมายด้านบนฟังดูกว้างมาก จริง ๆ มันก็กว้างแบบนั้นแหละครับ คำว่า Data Science ครอบคลุมทุกอย่างที่เป็นขั้นตอนในการนำข้อมูลมาใช้ประโยชน์ เช่น:

Data Mining คือ การเอาข้อมูลในอดีตมาค้นหาแบบแผน (Pattern) เพื่อนำไปใช้ทำนายผล (Predict) ในอนาคต ตัวอย่างง่าย ๆ เลยก็คือ การนำข้อมูลการซื้อขายในอดีตมาทำนายว่าอนาคตอะไรจะขายดีในช่วงไหน

ตัวอย่างข้างต้นเป็น Summer Project ที่ผมทำในช่วงปิดเทอมนี้ด้วยครับ เดี๋ยวถ้าโปรเจคจบล่ะคงได้มาเล่าให้ฟังว่าทำอะไรไปบ้าง ได้ความรู้เยอะมากฮะ

Data Analysis คือ การวิเคราะห์ข้อมูลโดยใช้เทคนิคต่าง ๆ เพื่ออธิบายข้อมูล คำนี้เป็นคำที่ค่อนข้างกว้างเหมือนกันครับ เทคนิคต่าง ๆ ที่ใช้ ก็เช่น เราอาจจะลองพลอตกราฟ (Data Visualization) หรือเอาไปรัน Clustering พวกนี้สามารถเรียกว่าทำ Data Analysis ได้ทั้งหมดครับ

แล้ว Machine Learning คืออะไร

ในการทำ Data Science หรือ การเอาข้อมูลมาใช้ประโยชน์ เนี่ย เราไม่สามารถวิเคราะห์ข้อมูลได้ด้วยตาคนอย่างเดียวครับ ไม่ต้องถึงกับ Big Data แค่คนกรอกบัญชีลง Excel ก็พลาดได้ง่าย ๆ แล้ว (ถ้าอยากฟัง เดี๋ยวมาเล่าให้ฟังทีหลังว่า Big Data คืออะไรนะฮะ)

ด้วยเหตุผลข้างต้น เราเลยเอาคอมพิวเตอร์มาช่วย โดย Machine Learning หมายถึง การทำให้คอมพิวเตอร์สามารถเรียนรู้ด้วยตัวเองได้ !

ตัวอย่างการใช้ Machine Learning ที่เราเห็นได้ในข่าวล่าสุด ก็เช่น AlphaGo คอมพิวเตอร์เล่นโกะสุดเมพที่ชนะเซียนโกะทั่วโลกมาแล้วมากมาย อันนี้นอกจาก Machine Learning จะมีคำว่า Deep Learning มาด้วย ซึ่งขอไปศึกษาแพรพเดี๋ยวมาเล่าให้ฟังนะฮะ

หรือลองมาดูตัวอย่าง Machine Learning แบบเก๋ ๆ เอาคอมมาเรียนรู้วิธีเล่น Mario จนสามารถเล่นผ่านด่านได้ง่าย ๆ โดยไม่ต้องถอยหลัง แบบนี้

ส่วนในธุรกิจมีการนำ Machine Learning ไปใช้กับระบบต่าง ๆ มากมาย อาทิ:

  • Credit Scoring (เอาไว้ให้คะแนนคนที่มาขอสินเชื่อ ว่าเค้าจะโกงมั้ย)
  • Web Search (Google นั่นไง Product เค้ามี ML เต็มเลย)
  • Recommender System (ระบบแนะนำสินค้าน่าซื้อ เช่น เวลาเราชอปใน Amazon จะเจอส่วนที่บอกว่าคนซื้อชิ้นนี้จะซื้อชิ้นนี้ด้วย)
  • Spam Filter (ระบบป้องกันแสปมใน Email)
  • ฯลฯ

ขอบคุณข้อมูลบางส่วนจาก AnalyticsVidhya


Also published on Medium.

Leave a Reply

Your email address will not be published. Required fields are marked *