โดยหลักการแล้ว Data Science ประกอบขึ้นจากศาสตร์หลักๆ คือ Hacking Skill (สกิลเกี่ยวกับ Computer Programimg, Data Base, Big data Technologies) Statistic & Math (ทักษะทางคณิตศาสตร์และสถิติศาสตร์) Substantive Expertise (หรือ Domain Knowledge) Presentation (ทักษะการนำเสนอข้อมูล) และ Visualization
Data Science ไม่ใช่ศาสตร์ใหม่ แต่มันคือการนำความรู้เดิมที่มีอยู่มารวมและประยุกต์เข้าด้วยกันจนเกิดเป็นของใหม่ ด้วยลักษณะของข้อมูลขนาดใหญ่ (Big Data) ในโลกปัจจุบัน การเข้ามาของ Internet of Things หรือ Censor ต่างๆ ตลอดจน Social media ทำให้เกิดเป็นข้อมูลปริมาณมหาศาล และนำมาสู่ Data Science นั่นเอง
2 ผลลัพธ์ที่ได้จาก Data Science
- ค้นพบสิ่งที่ไม่เคยรู้มาก่อนจากข้อมูลที่ได้
- ได้ Predictive Model เพื่อนำไปปฏิบัติจริง
- สร้าง Data Product ใหม่ๆ ที่จะส่งผลกระทบต่อธุรกิจ
- ช่วยให้ฝ่ายธุรกิจมีความมั่นใจและสามารถตัดสินใจได้ดีขึ้น
คนทำงานด้านวิทยาศาสตร์ข้อมูล จะนำข้อมูลที่กระจัดกระจายจากแหล่งต่างๆ มาจัดการและวิเคราะห์ เพื่อใช้ประโยชน์ตามโจทย์หรือวัตถุประสงค์การใช้งาน เช่น สร้าง Predictive Model หรือระบบอัลกอริทึมขึ้นมาประมวลผล เพื่อค้นหาอินไซต์เกี่ยวกับผู้ใช้งาน (user) หรือเก็บข้อมูลเพื่อใช้ประกอบการตัดสินใจขององค์กรบริษัท เป็นต้น และนี่คือผลลัพธ์ที่จะได้จาก Data Science
ตำแหน่งงาน Data Scientist ถูกตั้งขึ้นโดย DJ Patil และ Jeff Hammerbacher ในปี 2008 โดยทั้งคู่เป็น ผู้บุกเบิกการสร้างทีม Data Science ที่ LinkedIn และ Facebook และตอนนี้ DJ Patil ได้รับแต่งตั้งให้เป็น Chief Data Scientist of the United States ไปเรียบร้อย
ในปี 2012 วารสาร Harward Business Review ตีพิมพ์บทความชื่อ Data Scientist: The Sexiest Job of the 21st Century ทำให้อาชีพนี้กลายเป็น Talk of the town ในวงการธุรกิจและวงการสื่อตั้งแต่นั้นมา และทำให้เกิดความต้องการจ้างงานจากวงการธุรกิจสูง จนขาดแคลนบุคคลากรทางด้านนี้เป็นอย่างมาก ถือเป็นอาชีพที่เกิดขึ้นอย่างฉับพลันในวงการธุรกิจ โดยที่ยังไม่มีการเรียนการสอนในมหาวิทยาลัยจริงจัง
การจะหาคนที่เป็น Data Scientist หรือคนเดียวที่เก่งทุกอย่างแบบเต็มตัว ไม่ใช่เรื่องง่าย ส่วนใหญ่แล้วจะเป็นการทำงานเป็น ทีม Data Science ที่ประกอบด้วยคนที่เก่งแต่ละด้านมาอยู่ในทีมเดียวกัน