Monthly Archives: July 2015

Apache Spark (Python) ดึงข้อมูลจากฐานข้อมูล MySQL

หลังจากที่ได้พูดถึงการเก็บข้อมูลเข้า Elasticsearch ด้วย Apache Spark แล้ว วันนี้มาดูวิธีดึงข้อมูลจาก Relational Database อย่าง MySQL กันบ้าง ซึ่งปกติแล้ว Spark จะดึงข้อมูลทั้งหมดที่อยู่ใน table ออกมาให้เลย แต่ก็มีเทคนิคที่จะดึงข้อมูลจากเงื่อนไขที่เราต้องการได้เหมือนกัน ^^

Apache Spark เก็บข้อมูลเข้า Elasticsearch

Apache Spark เป็นระบบประมวลแบบ cluster ซึ่งมี API ให้เราใช้ได้หลายภาษาอยู่เหมือนกัน ขึ้นอยู่กับความถนัดของเราเลย ไม่ว่าจะเป็น JAVA, Scala, Python, R และมีการปรับปรุงให้รองรับ Graph processing ด้วย

Zen of Python

ผมมีโอกาสได้ศึกษาและใช้งาน Python มาซักระยะนึงแล้ว รู้สึกชอบในความง่ายและความเป็นระเบียบของภาษา ซึ่งจริงๆ แล้วแต่ละภาษาก็มีข้อตกลงของรูปแบบในการเขียน (code style) ที่แตกต่างกันออกไป และแต่ละภาษาก็อาจจะมีหลายๆ รูปแบบ แล้วแต่ว่าชอบแบบไหน Python เองก็มีแนวทางที่ให้ไว้เหมือนกัน เรียกว่า “Zen of Python