4 กรกฎาคม 2560
เกษตรกรผู้ปลูกแตงกวาชาวญี่ปุ่นใช้ Deep Learning อย่างไร
ประมาณหนึ่งปีที่ผ่านมาอดีตผู้ออกแบบระบบฝังตัวจากอุตสาหกรรมยานยนต์ของญี่ปุ่นชื่อ Makoto Koike ได้เริ่มต้นกลับไปช่วยพ่อแม่ของเขาทำฟาร์มแตงกวา และเขารู้สึกประหลาดใจกับงานหลายๆอย่างที่ต้องทำ ไม่ว่าจะเป็นการจัดเรียงแตงกวาตามขนาด รูปร่าง สีและคุณลักษณะอื่นๆ พ่อของ Makoto รู้สึกภาคภูมิใจกับแตงกวาที่เขาได้ทุ่มเทชีวิตเพื่อปลูกแตงกวาให้สดและกรอบ ซึ่งแตงกวาที่ ตรง ทึบ และมีสีสดใส จะถือว่าเป็นเกรดพิเศษและสามารถขายได้ราคาสูงมากขึ้นในตลาด แต่ Makoto ได้เรียนรู้อย่างรวดเร็วว่าการคัดแยกแตงกวาเป็นเรื่องยากและการปลูกก็ยุ่งยาก "แตงกวาแต่ละลูกมี สี รูปร่าง และคุณภาพที่แตกต่างกัน" Makoto กล่าว
การใช้ Deep learning ในการจดจำภาพช่วยให้คอมพิวเตอร์สามารถเรียนรู้จากชุดข้อมูลที่นำมาสอนมันได้ว่า "คุณสมบัติ" ที่สำคัญของภาพมีอะไรบ้างโดยการใช้ชั้นของเซลล์ประสาทเทียมจำนวนมาก ทำให้ Deep learning สามารถจัดแบ่งประเภทภาพโดยอัตโนมัติได้อย่างแม่นยำ ดังนั้นโครงข่ายประสาทเทียมสามารถนำไปใช้จำแนกชนิดของแมวหรือโมเดลของรถยนต์หรือเครื่องบินออกจากภาพได้
การออกแบบระบบคัดแยกแตงกวา
นี่คือแผนภาพระบบของเครื่องคัดแยกแตงกวาที่ Makoto สร้างขึ้น ระบบนี้ใช้ Raspberry Pi 3 เป็นตัวควบคุมหลักในการถ่ายภาพของแตงกวาด้วยกล้องและในระยะแรกจะใช้โครงข่ายประสาทเทียมเล็กๆของ TensorFlow เพื่อตรวจจับว่าเป็นภาพของแตงกวาหรือไม่ จากนั้นจะส่งต่อภาพไปยังโครงข่ายประสาทเทียมของ TensorFlow ที่มีขนาดใหญ่ซึ่งทำงานอยู่บนเซิร์ฟเวอร์ Linux เพื่อทำการจำแนกรายละเอียดมากขึ้น Makoto ใช้ตัวอย่างโค้ด Deep MNIST for Experts โดยมีการแก้ไข convolution, pooling และ layers สุดท้าย เพื่อเปลี่ยนการออกแบบโครงข่ายประสาทเทียมให้เข้ากับรูปแบบพิกเซลของแตงกวาและจำนวนชนิดของแตงกวา
หนึ่งในความท้าทายในการใช้ Deep learning ในปัจจุบันคือคุณต้องมีชุดข้อมูลจำนวนมากสำหรับนำมาสอนมัน ดังนั้น Makoto จึงต้องใช้เวลาประมาณ 3 เดือนในการถ่ายภาพแตงกวา 7,000 รูปที่มีการจัดเรียงประเภทโดยแม่ของเขา แต่นั่นก็อาจไม่เพียงพอ
"เมื่อทดสอบโดยใช้ภาพถ่าย มันสามารถรู้จำภาพได้ถูกต้องเกิน 95% แต่ถ้าคุณนำไปใช้งานจริงความถูกต้องลดลงประมาณ 70% อาจเป็นเพราะรูปแบบโครงเครือข่ายประสาทเทียมมีปัญหา "overfitting" เนื่องจากจำนวนภาพที่นำมาใช้สอนโมเดลมีไม่เพียงพอ"
ความท้าทายที่สองของ Deep learning คือการใช้พลังงานของคอมพิวเตอร์เป็นจำนวนมาก ปัจจุบันใช้พีซีเดสก์ท็อป Windows ทั่วไปเพื่อสอนโมเดลของโครงข่ายประสาทเทียม แม้ว่าจะแปลงภาพของแตงกวาให้เป็นภาพความละเอียดต่ำเหลือเพียงขนาด 80 x 80 พิกเซล แต่ยังคงใช้เวลา 2-3 วันในการสอนโมเดลด้วยภาพ 7,000 ภาพ
"แม้จะใช้ภาพที่มีความละเอียดต่ำ แต่ระบบนี้สามารถจำแนกแตงกวาได้โดยพิจารณาจากรูปทรง ความยาว และระดับของการบิด ซึ่งไม่สามารถจำแนกสี พื้นผิว รอยขีดข่วนและหนามของแตงกวาได้" Makoto อธิบายเพิ่มเติม ความละเอียดของภาพแตงกวาจากการซูมเข้าจะส่งผลให้มีความแม่นยำสูงกว่ามาก แต่จะเพิ่มระยะเวลาการสอนมากขึ้นด้วย
Please login for comment