ในการแนะนำนี้ พวกเราจะพูดถึง 8 โปรเจค Machine Learning ที่สนุกสนาน สำหรับผู้เริ่มต้น โปรเจคเป็นการลงทุนที่ดีที่สุดในเวลาของคุณ คุณจะเพลิดเพลิน ไปกับการเรียนรู้ มีแรงจูงใจและมีการดำเนินงานที่รวดเร็ว
คุณจะเห็นได้ว่าไม่มีทฤษฏีใดสามารถที่จะมาแทนที่การฝึกฝนแบบลงมือทำได้ ตำราเรียนและบทเรียนต่างๆสามารถขับกล่อมคุณไปยังความเชื่อที่ผิดๆของการ เรียนรู้ เพราะว่าวัสดุอุปกรณ์อยู่ตรงหน้าคุณแล้วตอนนี้ แต่เมื่อคุณลองที่จะใช้งาน มัน คุณอาจพบว่ามันยากกว่าที่คิด
โปรเจคจะช่วยให้คุณสามารถปรับปรุงการนำไปประยุกต์ใช้ทักษะ ML ของคุณ ได้อย่างรวดเร็ว ในขณะที่ยังให้โอกาสคุณที่จะสำรวจหัวข้อที่น่าสนใจอีกด้วย
บวกกับคุณสามารถใส่โปรเจคลงไปในแฟ้มสะสมผลงานของคุณได้ด้วย ทำให้ มันง่ายขึ้นสำหรับการหางานทำ หาโอกาสทางอาชีพที่มันเจ๋งๆและแม้แต่ต่อรอง เงินเดือนที่สูงขึ้น
นี่คือ 8 โปรเจค Machine Learning ที่สนุกสนาน สำหรับผู้เริ่มต้น คุณสามารถ ทำมันให้เสร็จได้ภายในสุดสัปดาห์เดียวหรือจะขยายพวกมัน ให้เป็นโปรเจคที่ยาว ขึ้นถ้าคุณเพลิดเพลินไปกับมัน
เนื้อหา
--
Machine Learning ฉบับ Gladiator
พวกเราเรียกมันว่า “Machine Learning ฉบับ Gladiator” ด้วยสเน่ห์หา แต่ว่ามันไม่ใช่อะไรที่ใหม่ นี่เป็นอีกหนึ่งวิธีการที่รวดเร็วที่สุดเพื่อที่จะสร้าง ปรีชาญาณทางปฏิบัติใน Machine Learning
เป้าหมายก็คือการใช้โมเดล out-of-the-box และประยุกต์ใช้มันไปกับชุด ข้อมูลที่แตกต่างกันออกไป โปรเจคนี้เจ๋งมากๆสำหรับเหตุผลหลัก 3 ข้อ :
ข้อแรก คุณสามารถสร้างสัญชาตญาณสำหรับรูปแบบของปัญหาที่เหมาะสมได้ โมเดลอันไหนที่แข็งแกร่งในการทำข้อมูลหาย? โมเดลใดมีการจัดการคุณสมบัติได้ ดีอย่างเด็ดขาด? ใช่ คุณสามารถดูมันได้จากตำราเพื่อที่จะหาคำตอบแต่คุณจะเรียน รู้ได้ดีขึ้นโดยการเห็นการกระทำของมัน
ข้อ 2 โปรเจคนี้จะสอนคุณเกี่ยวกับทักษะที่ล้ำค่าของการสร้างต้นแบบโมเดลได้ อย่างรวดเร็ว ในโลกของความเป็นจริง มันมักยากที่จะรู้ว่าโมเดลอันไหนที่จะ แสดงได้ดีที่สุดโดยไม่ต้องพยายามให้พวกมันทำ
ท้ายที่สุด แบบฝึกหัดนี้จะช่วยให้คุณสามารถควบคุมกระบวนการสร้างของโมเดลได้ ตัวอย่างเช่นคุณจะได้รับการฝึกฝน…
เพราะว่าคุณจะใช้โมเดล out-of-the-box คุณมีโอกาสที่จะโฟกัสไปที่การ สร้างเสริมขั้นตอนที่สำคัญเหล่านี้
ไปดูหน้าหนังสืออ้างอิง sklearn (Python) หรือ caret (R) สำหรับคำแนะนำ คุณ ควรจะฝึกฝนการถดถอย , การจัดหมวดหมู่และการจัดกลุ่มอัลกอริทึม
การเรียนการสอน
แหล่งข้อมูล
2. เล่น Money Ball
ในหนังสือ Moneyball ทีมเบสบอลที่ถูกปฏิวัติของ Oakland A ผ่านการ สืบเหตุการณ์ผู้เล่นอย่างคิดวิเคราะห์ พวกเขาสร้างทีมที่ชอบแข่งขันขณะที่ใช้จ่าย เพียง 1 ใน 3 ของทีมตลาดอย่าง Yankees ที่จ่ายเงินเดือนให้
อย่างแรก ถ้าคุณยังไม่ได้อ่านหนังสือเล่มนี้ คุณควรไปอ่าน มันเป็นหนึ่งในอันที่ พวกเราชอบ!
ช่างโชคดี โลกของกีฬา มีข้อมูลเป็นตันๆให้เล่นด้วย ข้อมูลสำหรับทีม , เกม , คะแนนและผู้เล่น ทั้งหมดมีการติดตามและมีอยู่บนออนไลน์อย่างอิสระ
มันมีโปรเจคMachine Learning ที่สนุกสนานมากมายสำหรับผู้เริ่มต้น ตัวอย่างเช่น คุณสามารถลอง…
กีฬายังเป็นขอบเขตที่ดีสำหรับฝึกฝนการสร้างภาพข้อมูลและการ วิเคราะห์การสำรวจ คุณสามารถใช้ทักษะเหล่านี้ช่วยคุณตัดสินใจว่าชนิดของข้อมูล ไหนที่ถูกรวมอยู่ในการวิเคราะห์ของคุณ
แหล่งข้อมูล
3. ทำนายราคาหุ้น
ในตลาดหุ้นเป็นเหมือนดินแดนขนมหวานสำหรับนักวิทยาศาสตร์ข้อมูล ที่สนใจด้านการเงินมาเป็นระยะเวลานาน
อย่างแรก คุณมีชนิดของข้อมูลมากมายที่คุณจะสามารถเลือกจากมันได้ คุณ สามารถหาราคา , ปัจจัยพื้นฐาน , ตัวชี้วัดเศรษฐกิจมหภาคและระดับความผันผวน ฯลฯ ได้ รายการนี้ดำเนินต่อไปเรื่อยๆ
อย่างที่ 2 ข้อมูลสามารถกลายเป็นเม็ดเล็กๆได้ คุณสามารถรับข้อมูล time series เป็นวัน (หรือแม้แต่นาที) สำหรับแต่ละบริษัทซึ่งอนุญาตให้คุณคิดอย่างสร้างสรรค์ เกี่ยวกับกลยุทธ์การเทรดหุ้น (ซื้อขายหุ้นนั่นแหละ)
อย่างสุดท้าย โดยปกติแล้วตลาดทางการเงินมีวงจรฟีดแบคแบบสั้น แต่อย่างไรก็ ตาม คุณสามารถตรวจสอบการทำนายของคุณได้อย่างรวดเร็วบนข้อมูลใหม่
ตัวอย่างของโปรเจค Machine Learning ที่เป็นมิตรกับผู้เริ่มต้นใช้งาน คุณสามารถลอง…
ข้อสังเกต : การสร้างโมเดลการค้าขายเพื่อที่จะฝึก Machine Learning เป็นเรื่องที่ ง่าย ทำพวกมันให้เป็นผลประโยชน์เป็นเรื่องที่ยากมากๆ ที่นี่ไม่มีคำแนะนำใดๆ เกี่ยวกับการเงินและพวกเราไม่แนะนำให้ค้าขายเงินจริงๆ
การเรียนการสอน
แหล่งข้อมูล
4. สอนเครือข่าย Neural ให้อ่านการเขียนลายมือ
เครือข่าย Neural และการเรียนรู้ที่ลึกซึ้งเป็นเรื่องราวความสำเร็จ 2 เรื่องใน ปัญญาประดิษฐ์ที่ทันสมัย พวกเขานำความก้าวหน้าที่สำคัญในการรับรู้ภาพ , การ สร้างข้อความอัตโนมัติและแม้กระทั่งในรถยนต์ที่ขับด้วยตนเอง ในการเข้าร่วมกับสาขาที่น่าสนใจนี้ คุณควรเริ่มต้นด้วยชุดข้อมูลที่สามารถจัดการได้
MNIST Handwritten Digit Classification Challenge เป็นจุดเริ่มต้นที่คลาสสิค ข้อมูลรูปภาพโดยปกติทำงานยากกว่าข้อมูลเชิงสัมพันธ์ “flat” ข้อมูล MNIST เป็น มิตรกับผู้เริ่มต้นใหม่และเล็กพอที่จะเข้ากับคอมพิวเตอร์เครื่องหนึ่งได้
การจดจำลายมือจะท้าทายคุณ แต่มันไม่จำเป็นต้องใช้พลังการคำนวณในระดับสูง ในการเริ่มต้น เราแนะนำบทแรกในบทเรียนด้านล่างนี้ มันจะสอนคุณถึงวิธีการสร้างเครือข่าย Neural จาก scratch ที่ช่วยแก้ปัญหาความท้าทายของ MNIST ได้ด้วย ความแม่นยำสูง
การเรียนการสอน
Neural Networks and Deep Learning (Online Book) – บทที่ 1 จะพูดใน เรื่องวิธีการเขียนเครือข่าย Neural จาก scratch ใน Python เพื่อจำแนก ตัวเลขจาก MNIST ผู้เขียนยังให้คำอธิบายที่ดีมากๆเกี่ยวกับสัญชาตญาณ เบื้องหลังเครือข่าย Neural
แหล่งข้อมูล
MNIST – MNIST เป็นชุดย่อยของชุดข้อมูลสองชุดที่ได้รับการแก้ไขซึ่ง จัดทำโดยสถาบันมาตรฐานและเทคโนโลยีแห่งชาติของสหรัฐอเมริกา ประกอบ ด้วยรูปภาพตัวเลขที่เขียนด้วยลายมือ 70,000 รูป
5. สืบสวน Enron
เรื่องอื้อฉาวและการล่มสลายของ Enron เป็นหนึ่งในการล้มละลายของบริษัท ที่ใหญ่ที่สุดในประวัติศาสตร์ ในปี 2000 Enron เป็นหนึ่งในบริษัทด้านพลังงานที่ใหญ่ที่สุดในอเมริกา หลังจากถูก ฉ้อโกง มันก็ค่อยๆตกลงไปสู่การล้มละลายภายใน 1 ปี โชคดีสำหรับพวกเรา เรามีฐานข้อมูลอีเมลของ Enron มันประกอบไปด้วย 500,000 อีเมลระหว่างอดีตพนักงาน Enron 150 คน ส่วนใหญ่เป็นผู้บริหารอาวุโส มันยังเป็น ฐานข้อมูลอีเมลจริงๆที่เปิดสาธารณะที่ใหญ่มากเพียงอันเดียว ซึ่งทำให้มันมีค่ามาก ในความจริง นักวิทยาศาสตร์ข้อมูลเคยใช้ชุดข้อมูลนี้สำหรับการศึกษาและการวิจัย อยู่หลายปี
ตัวอย่างของโปรเจค Machine Learning สำหรับผูู้เริ่มต้น คุณสามารถลอง…
แหล่งข้อมูล
6. เขียนอัลกอริทึม ML จาก Scratch
เขียนอัลกอริทึม Machine Learning จาก scratch เป็นเครื่องมือการ เรียนรู้ที่ยอดเยี่ยมสำหรับ 2 เหตุผลหลัก เหตุผลแรก มันไม่มีทางที่ดีกว่านี้ที่จะสร้างความเข้าใจที่ถูกต้องของระบบกลไกของ พวกมัน คุณจะถูกบังคับให้คิดในทุกๆขั้นตอนและจะนำไปสู่การเรียนรู้ที่ถูกต้อง อีกเหตุผล คือ คุณจะได้เรียนรู้วิธีการแปลคำแนะนำทางคณิตศาสตร์ไปเป็นการทำ งานของโค้ด คุณจำเป็นต้องใช้ทักษะนี้เมื่อประยุกต์ใช้อัลกอริทึมจากงานวิจัยทาง วิชาการ
ในการเริ่มต้น เราแนะนำว่าให้เลือกอัลกอริทึมที่ไม่ซับซ้อนมากเกินไป มันมีการตัดสินใจที่ละเอียดอ่อนมากมาย คุณจำเป็นที่จะต้องทำแม้กับอัลกอริทึมที่ง่ายที่สุด หลังจากที่คุณสะดวกสบายในการสร้างอัลกอริทึมแบบง่ายแล้ว ลองขยายพวกมันให้ มีฟังก์ชั่นที่มากขึ้น ตัวอย่างเช่น พยายามขยายอัลกอริทึมขั้นตอนวิธีการถดถอย โลจิสติกวานิลลา ไปเป็นการถดถอย lasso/ridge โดยการเพิ่ม Paramiters การทำให้ เป็นระเบียบ สุดท้ายนี้ นี่เป็นเคล็ดลับสำหรับผู้เริ่มต้นทุกคนควรรู้ : อย่าไปท้อใจถ้าอัลกอริทึมของ คุณไม่เป็นที่รวดเร็วหรือเป็นที่พอใจเท่ากับในแพ็กเกจของพวกมันที่มีอยู่ แพ็กเกจ เหล่านั้นเป็นผลผลิตของการพัฒนามาหลายปี!
การเรียนการสอน
7. ความเชื่อมั่นของการวิเคราะห์ Social Media
Social Media เกือบจะเป็นความหมายที่เหมือนกันกับ “ข้อมูลใหญ่” เนื่องจากการเลี่ยงจำนวนของเนื้อหาที่ผู้ใช้สร้างขึ้น การวิเคราะห์นี้มีข้อมูลมากมาย ที่สามารถพิสูจน์หนทางที่ไม่เคยมีมาก่อนเพื่อให้ชีวิตแก่ความคิดเห็น , แนวโน้มและ ความเชื่อมั่นต่อสาธารณะ Facebook , Twitter , YouTube , WeChat , WhatsApp , Reddit… รายการยังคงดำเนินต่อไปเรื่อยๆ
มากไปกว่านั้น ในทุกๆรุ่นจะใช้เวลามากขึ้นบน Social Media มากกว่า บรรพบุรุษของพวกเขา นี่หมายความว่าข้อมูล Social Media จะกลายมามีความ เกี่ยวข้องมากขึ้นสำหรับการตลาด , การสร้างยี่ห้อและธุรกิจทั้งหมด
ในขณะที่ มันมีแพลตฟอร์ม Social Media ที่ได้รับความนิยมมากมาย Twitter เป็นจุดเริ่มต้นที่คลาสสิกสำหรับการฝึก Machine Learning ด้วยข้อมูล Twitter คุณจะได้รับการผสมผสานของข้อมูลที่น่าสนใจ (เนื้อหาทวีต) และ meta-data (ตำแหน่งที่ตั้ง , แฮชแท็ก , ผู้ใช้ , รีทวิตและอื่นๆ) ที่เปิดเส้นทาง ที่เกือบจะไม่มีที่สิ้นสุดสำหรับการวิเคราะห์
การเรียนการสอน
แหล่งข้อมูล
8. ปรับปรุงการดูแลสุขภาพ
อีกหนึ่งอุตสาหกรรมที่ประสบกับการเปลี่ยนแปลงที่รวดเร็วเนื่องจาก Machine Learning คือ สุขภาพและการดูแลสุขภาพทั่วโลก ในประเทศส่วนใหญ่ การเป็นแพทย์ต้องใช้เวลาหลายปีในการศึกษา เป็น สาขาที่มีความต้องการมาก การเดิมพันสูงและมีอุปสรรคที่สูงมากในการเข้าถึง ดังนั้น เมื่อเร็วๆ นี้มีความพยายามอย่างมากที่จะช่วยลดภาระงานของ แพทย์และปรับปรุงประสิทธิภาพโดยรวมของระบบการดูแลสุขภาพด้วยความ ช่วยเหลือของ Machine Learning
กรณีที่ใช้ :
ในขณะที่โรงพยาบาลยังคงปรับปรุงระเบียนผู้ป่วยให้ทันสมัยขึ้นและในขณะ ที่เรารวบรวมข้อมูลด้านสุขภาพที่ละเอียดขึ้น มันจะมีการไหลเข้ามาของโอกาสของ ผลผลิตที่อยู่ในการตัดสินว่าต่ำสำหรับนักวิทยาศาสตร์ข้อมูลเพื่อสร้างความแตกต่าง
การเรียนการสอน
R: Building meaningful machine learning models for disease prediction
Machine Learning in Health Care – การนำเสนอที่ยอดเยี่ยมโดยงานวิจัย ของ Microsoft
แหล่งข้อมูล
Large Health Data Sets – การรวบรวมของชุดข้อมูลใหญ่ที่เกี่ยวกับ สุขภาพ
data.gov/health – ชุดข้อมูลที่เกี่ยวข้องกับสุขภาพและการดูแลสุขภาพ จัดหาให้โดยรัฐบาลสหรัฐฯ
Health Nutrition and Population Statistics – สุขภาพ , โภชนาการและ สถิติประชากรทั่วโลก จัดหาให้โดยธนาคารโลก
References :
https://elitedatascience.com/machine-learning-projects-for-beginners
Tag ที่น่าสนใจ: machine_learning beginner projects gladiator moneyball stock_price_prediction neural_networks enron_investigation ml_algorithms social_media_analysis healthcare_improvement sklearn caret data_analysis sports_statistics
หากมีข้อผิดพลาด/ต้องการพูดคุยเพิ่มเติมเกี่ยวกับบทความนี้ กรุณาแจ้งที่ http://m.me/Expert.Programming.Tutor
085-350-7540 (DTAC)
084-88-00-255 (AIS)
026-111-618
หรือทาง EMAIL: NTPRINTF@GMAIL.COM