หัวข้อ: 5 Python Projects เกี่ยวกับ Computer Vision พร้อมตัวอย่าง Code แบบง่ายๆ
Computer Vision (หรือการมองเห็นของคอมพิวเตอร์) เป็นหนึ่งในสาขาที่น่าตื่นเต้นที่สุดในโลกของการเรียนรู้ของเครื่อง (Machine Learning) และปัญญาประดิษฐ์ (AI) ในปัจจุบันนี้ Python ได้กลายเป็นหนึ่งในภาษาโปรแกรมมิ่งที่นิยมที่สุดสำหรับการพัฒนาโปรเจคที่เกี่ยวข้องกับ Computer Vision เนื่องจากมีไลบรารีที่มีประสิทธิภาพและชุมชนที่หนาแน่น เราจะมาดูโปรเจค Python ที่เกี่ยวข้องกับ Computer Vision ที่มาพร้อมกับตัวอย่าง Code เพื่อให้คุณเริ่มต้นได้ทันที!
การจดจำใบหน้าเป็นหนึ่งในงานประจำของ Computer Vision ที่เห็นได้ทั่วไป การใช้ไลบรารีอย่าง OpenCV ซึ่งเป็นไลบรารี Computer Vision ยอดนิยมสำหรับ Python, สามารถช่วยให้เร็วขึ้นในการพัฒนาโปรเจคที่เกี่ยวข้องกับการจดจำใบหน้าได้อย่างง่ายดาย
ตัวอย่าง Code การจดจำใบหน้าโดยใช้ OpenCV:
import cv2
# โหลด pre-trained face detection model
face_cascade = cv2.CascadeClassifier('haarcascade_frontalface_default.xml')
# อ่านรูปภาพ
image = cv2.imread('image.jpg')
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
# จดจำใบหน้าในภาพ
faces = face_cascade.detectMultiScale(gray, 1.1, 4)
# วาดสี่เหลี่ยมรอบๆ ใบหน้าที่ถูกจดจำ
for (x, y, w, h) in faces:
cv2.rectangle(image, (x, y), (x+w, y+h), (255, 0, 0), 2)
# แสดงผลรูปภาพ
cv2.imshow('Face Detected', image)
cv2.waitKey()
ใช้ Python และไลบรารี TensorFlow หรือ Keras ในการสร้างโมเดล Machine Learning เพื่อจำแนกประเภทวัตถุในภาพ การฝึกฝนโมเดลด้วยชุดข้อมูลที่แม่นยำช่วยให้สามารถระบุวัตถุต่างๆ ได้อย่างรวดเร็วและถูกต้อง
# ต้องติดตั้ง TensorFlow และ/หรือ Keras ก่อนนะจ๊ะ
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, Conv2D, Flatten
# สร้างโมเดล CNN
model = Sequential([
Conv2D(64, kernel_size=3, activation='relu', input_shape=(28,28,1)),
Flatten(),
Dense(10, activation='softmax')
])
# แทรนโมเดลกับข้อมูล
# model.fit(ข้อมูลที่น่า่นักศึกษาได้เตรียมไว้)
การแปลงภาพข้อความเป็นข้อความที่สามารถแก้ไขได้ (Editable Text) คืองานยอดนิยมของ Computer Vision และ Python ให้การสนับสนุนเต็มที่ด้วยไลบรารีเช่น Tesseract และ Pytesseract.
import pytesseract
from PIL import Image
# ต้องติดตั้ง Tesseract OCR ก่อนนะจ้ะ
# โหลดรูปภาพ
image = Image.open('text-image.png')
# ใช้ Pytesseract ในการตรวจจับข้อความ
text = pytesseract.image_to_string(image)
print(text)
การประมวลผลวิดีโอเป็นเรียลไทม์เป็นหนึ่งในโปรเจ็คที่ท้าทายและน่าสนใจอย่างมาก คุณสามารถพัฒนาโปรแกรมที่สามารถจดจำและติดตามวัตถุ, การเปลี่ยนแปลงวัตถุ, หรือกระทำต่างๆ ในวิดีโอ
ตัวอย่างเช่น การตรวจจับรอยยิ้มในเวลาจริง:
import cv2
# โหลด face และ smile classifier
face_cascade = cv2.CascadeClassifier('haarcascade_frontalface_default.xml')
smile_cascade = cv2.CascadeClassifier('haarcascade_smile.xml')
def detect_smile(frame):
gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
faces = face_cascade.detectMultiScale(gray, 1.1, 5)
for (x, y, w, h) in faces:
roi_gray = gray[y:y+h, x:x+w]
smiles = smile_cascade.detectMultiScale(roi_gray, 1.8, 20)
for (sx, sy, sw, sh) in smiles:
cv2.rectangle(frame, (x+sx, y+sy), (x+sx+sw, y+sy+sh), (255, 255, 0), 2)
return frame
# เรียกใช้วิดีโอคาเมราของคุณ
cap = cv2.VideoCapture(0)
while True:
_, frame = cap.read()
frame = detect_smile(frame)
cv2.imshow('Smile Detector', frame)
# กด 'q' เพื่อออก
if cv2.waitKey(1) & 0xFF == ord('q'):
break
cap.release()
cv2.destroyAllWindows()
Style Transfer เป็นการใช้ AI ในการผสมผสานสไตล์จากภาพหนึ่งไปยังอีกภาพหนึ่ง โดยปัจจุบันสามารถทำได้โดยใช้ neural style transfer ซึ่งเป็นเทคนิคใน Deep Learning
# ตัวอย่างนี้ต้องมีไลบรารีต่างๆ เช่น TensorFlow, Keras
from keras.applications import vgg19
from keras.preprocessing.image import load_img, img_to_array
# โหลดรูปภาพสไตล์และรูปที่ต้องการทำ Transfer
target_image_path = 'target.jpg'
style_reference_image_path = 'style.jpg'
# ตามด้วยคำสั่งใน Deep Learning ในการทำ Style Transfer
# บทสรุปและข้อสังเกต
การสร้างโปรเจค Computer Vision ด้วย Python ไม่เพียงแต่เป็นเรื่องที่น่าสนุจในโลกของการพัฒนาซอฟต์แวร์เท่านั้น แต่ยังเป็นหนทางในการเรียนรู้และสำรวจปัญญาประดิษฐ์ที่ก้าวไกลไปอีกขั้น ความจริงที่ว่า Python มีไลบรารีที่หลากหลายและชุมชนการใช้งานที่แข็งแกร่ง ทำให้มันเป็นภาษาโปรแกรมมิ่งที่เหมาะอย่างยิ่งสำหรับการเริ่มต้นและการพัฒนาโปรเจคเหล่านี้
ผู้ที่สนใจในการเรียนรู้และพัฒนาฝีมือในด้านนี้ สามารถเริ่มต้นได้โดยการสร้างโปรเจคขนาดเล็กและสำรวจไลบรารีต่างๆ ที่มีให้ อีกทั้งยังสามารถขยายแนวความคิดและประสบการณ์จากโปรเจคที่มีมากขึ้น ไม่ว่าจะเป็นเพื่อการศึกษาหรือการพัฒนาซอฟต์แวร์เชิงพาณิชย์ และนี่เป็นเพียงแค่การเริ่มต้นเท่านั้นในโลกของ Computer Vision ที่กว้างใหญ่และซับซ้อน
หมายเหตุ: ข้อมูลในบทความนี้อาจจะผิด โปรดตรวจสอบความถูกต้องของบทความอีกครั้งหนึ่ง บทความนี้ไม่สามารถนำไปใช้อ้างอิงใด ๆ ได้ ทาง EPT ไม่ขอยืนยันความถูกต้อง และไม่ขอรับผิดชอบต่อความเสียหายใดที่เกิดจากบทความชุดนี้ทั้งทางทรัพย์สิน ร่างกาย หรือจิตใจของผู้อ่านและผู้เกี่ยวข้อง
หากเจอข้อผิดพลาด หรือต้องการพูดคุย ติดต่อได้ที่ https://m.me/expert.Programming.Tutor/
Tag ที่น่าสนใจ: python computer_vision machine_learning ai opencv tensorflow keras optical_character_recognition ocr real-time_video_processing neural_networks deep_learning style_transfer artificial_intelligence programming
หากมีข้อผิดพลาด/ต้องการพูดคุยเพิ่มเติมเกี่ยวกับบทความนี้ กรุณาแจ้งที่ http://m.me/Expert.Programming.Tutor
085-350-7540 (DTAC)
084-88-00-255 (AIS)
026-111-618
หรือทาง EMAIL: NTPRINTF@GMAIL.COM
Copyright (c) 2013 expert-programming-tutor.com. All rights reserved. | 085-350-7540 | 084-88-00-255 | ntprintf@gmail.com