การเข้าใจใน Machine Learning หรือปัญญาประดิษฐ์ ไม่ใช่งานที่ง่ายๆ มืออาชีพและผู้ที่สนใจหลายคนพบว่ามันยากที่จะสร้างเส้นทางใหม่ที่เหมาะสม ในสาขานี้ ทำให้ทุกวันนี้มีแหล่งข้อมูลที่มีอยู่เป็นจำนวนมหาศาล สาขานี้มีการ พัฒนาอย่างต่อเนื่องและมันก็สำคัญมากที่เราจะก้าวย่างไปต่อกับการพัฒนาที่รวดเร็วนี้ เพื่อที่จะรับมือกับความเร็วที่ท่วมท้นมากเกินของวิวัฒนาการและ นวัตกรรม หนทางที่ดีที่จะมีการอัปเดต(เหมือนทันตลอด)และมีความรู้ในเรื่องของ ความก้าวหน้าของ ML คือรวมแรงร่วมใจกันของ Comunity นักพัฒนา การสนับสนุนให้มีแหล่งข้อมูลโปรเจคและเครื่องมือที่เป็น opensource มากมาย ที่ถูกใช้เป็นประจำโดยผู้เชี่ยวชาญที่มี ความก้าวหน้า
นี่คือ สิ่งที่เราปรับปรุงข้อมูลใหม่และตรวจสอบแนวโน้มตั้งแต่โพสต์ก่อนของ พวกเรา Top 20 Python Machine Learning Open Source Projects (พฤศจิกายน ปี 2016)
Tensorflow เลื่อนขึ้นมาเป็นอันดับที่ 1 ด้วยการเติบโตขึ้น 3 หลักของผู้ สนับสนุน Scikit-learn ตกไปเป็นที่ 2 แต่ยังคงมีฐานของผู้สนับสนุนที่ใหญ่ มากๆอยู่
เมื่อเปรียบเทียบกับปี 2016 โปรเจคที่มีการเจริญเติบโตรวดเร็วที่สุดในจำนวน ของผู้สนับสนุน คือ
และยังใหม่ในปี 2018 :
20 อันดับ Python AI และโปรเจค Machine Learning บน Github
ขนาดเป็นสัดส่วนต่อจำนวนของผู้สนับสนุน และสีเป็นตัวแทนของการเปลี่ยน แปลงของจำนวนผู้สนับสนุน สีแดง คือ สูงสุด สีฟ้า คือ ต่ำสุด รูปร่างเกล็ดหิมะ คือ สำหรับโปรเจคที่มีการเรียนรู้อย่างลึกซึ้ง โดยรอบสำหรับโปรเจคอื่นๆ
เราจะเห็นว่าโปรเจคที่มีการเรียนรู้อย่างลึกซึ้งอย่าง TensorFlow , Theano และ Caffe อยู่ท่ามกลางความนิยมสูงสุด รายการด้านล่างนี้ให้โปรเจคตามลำดับ จากมากไปน้อยขึ้นอยู่กับจำนวนผู้สนับสนุน บน Github การเปลี่ยนแปลงของ จำนวนผู้สนับสนุน คือ เทียบกับ 2016 KDnuggets Post on Top 20 Python Machine Learning Open Source Projects
ผมหวังว่าคุณจะเพลิดเพลินไปกับหน้าเอกสารประกอบของแต่ละแห่งเพื่อเริ่มต้น การทำงานร่วมกันและเรียนรู้วิธีต่างๆของ Machine Learning โดยใช้ Python
TensorFlow ดั้งเดิมถูกพัฒนาโดยนักวิจัยและวิศวกรที่ทำงานอยู่ในทีม Google Brain Team โดยใช้การจัดการวิจัย Google’s Machine Intelligence ระบบถูกออกแบบขึ้นเพื่อจะอำนวยความสะดวกต่องานวิจัยใน Machine Learning และเพื่อทำให้มันรวดเร็วและง่ายต่อการเปลี่ยนแปลง จากต้นแบบงานวิจัยเพื่อผลิตระบบ
ผู้สนับสนุน : 1324 (ขึ้น 168%) , จำนวนการกระทำ : 28476 ,
Stars: 92359 , Github URL: Tensorflow
Scikit-learn เป็นเครื่องมือที่ง่ายและมีประสิทธิภาพสำหรับการสำรวจและ วิเคราะห์ข้อมูล สามารถเข้าถึงได้โดยทุกๆคนและสามารถนำกลับมาใช้ได้ ใหม่ในเนื้อหาที่หลากหลาย สร้างบน NumPy , SciPy และ matplotlib เป็น แหล่งข้อมูลเปิด สามารถใช้ในทางการค้าได้ – ลิขสิทธิ์ BSD
ผู้สนับสนุน : 1019 (ขึ้น 39%) , จำนวนการกระทำ : 22575 ,
Github URL : Scikit-learn
Keras เป็นเครือข่าย Neural API ในระดับสูง ถูกเขียนใน Python ทำงาน อยู่เหนือ TensorFlow , CNTK หรือ Theano
ผู้สนับสนุน : 629 (ใหม่) , จำนวนการกระทำ : 4371 ,
Github URL : Keras
PyTorch , เครือข่าย Neural Tensors และ Dynamic ใน Python ด้วยการ เร่ง GPU ที่แข็งแกร่ง
ผู้สนับสนุน : 399 (ใหม่) , จำนวนการกระทำ : 6458 ,
Github URL : pytorch
Theano อนุญาตให้คุณกำหนด , เพิ่มประสิทธิภาพ , และประเมินผลนิพจน์ ทางคณิตศาสตร์ รวมไปถึง arrays หลายมิติได้อย่างมีประสิทธิภาพ
ผู้สนับสนุน : 327 (ขึ้น 24%) , จำนวนการกระทำ : 27931 ,
Github URL : Theano
Gensim เป็นไลบรารี Python ฟรีด้วยฟีเจอร์ต่างๆ เช่น ความหมายทาง
สถิติที่ปรับขนาดได้ , การวิเคราะห์เอกสารข้อความธรรมดาสำหรับ
โครงสร้างความหมาย , ดึงเอกสารที่มีความหมายคล้ายคลึงกันกลับ
ผู้สนับสนุน : 262 (ขึ้น 81%) , จำนวนการกระทำ : 3549 ,
Github URL : Gensim
Caffe เป็นการเรียนรู้ Framework อย่างลึกซึ้ง ทำขึ้นด้วยนิพจน์ ,
ความเร็วและต้นแบบในใจ มันถูกพัฒนาขึ้นโดย Berkeley Vision and
Learning Center (BVLC) และชุมชนผู้สนับสนุน
ผู้สนับสนุน : 260 (ขึ้น 21%) , การกระทำ : 4099, Github URL: Caffe
Chainer เป็นรากฐานของ Python เป็นแหล่งข้อมูล Framework เปิดแบบ
Standalone สำหรับการเรียนรู้โมเดลที่ลึกซึ้ง Chainer ให้ความยืดหยุ่น ,
ปรีชาญาณและการแสดงผลที่ดีมากๆ หมายถึงการใช้การเรียนรู้โมเดล
อย่างลึกซึ้งแบบเต็มรูปแบบ รวมไปถึงโมเดล state-of-the-art เช่น
เครือข่าย Neural ที่เกิดขึ้นซ้อนๆกันและเครื่องเข้ารหัสอัตโนมัติแปรผัน
ผู้สนับสนุน : 154 (ขึ้น 84%) , การกระทำ : 12613 ,
Github URL : Chainer
Statsmodels เป็นโมดูล Python ที่อนุญาตให้ผู้ใช้สำรวจข้อมูล , ประเมิน
ค่าโมเดลเชิงสถิติและแสดงผลการทดสอบเชิงสถิติได้ รายการที่ครอบ
คลุมของสถิติเชิงพรรณนา , การทดสอบทางสถิติ , ฟังก์ชั่นการวางแผน
และผลสถิติยังมีอยู่สำหรับชนิดของข้อมูลที่แตกต่างและตัวประเมินค่า
แต่ละตัว
ผู้สนับสนุน : 144 (ขึ้น 33%) , การกระทำ : 9729 ,
Github URL: Statsmodels
Shogun เป็นกล่องเครื่องมือ Machine Learning ที่ให้การจัดอันดับ
ที่กว้างของวิธีการ ML ที่เป็นอันหนึ่งอันเดียวกันและมีประสิทธิภาพ
กล่องเครื่องมืออนุญาตให้รวมการเป็นตัวแทนของข้อมูลที่หลากหลาย ,
คลาสอัลกอริทึมและจุดประสงค์ของเครื่องมือต่างๆ โดยทั่วไปได้ง่ายอย่าง
ลงตัว
ผู้สนับสนุน : 139 (ขึ้น 32%) , การกระทำ : 16362 ,
Github URL: Shogun
Pylearn2 เป็น machine learning library ฟังก์ชั่นของมันส่วนใหญ่
ถูกสร้างขึ้นบน Theano นี่หมายความว่าคุณสามารถเขียน
Pylearn2 plugins (โมเดลใหม่ , อัลกอริทึมและอื่นๆ) โดยใช้นิพจน์ทาง
คณิตศาสตร์ และ Theano ซึ่งจะเพิ่มประสิทธิภาพและเสถียรภาพให้กับ
นิพจน์เหล่านั้นเพื่อคุณและ compile พวกมันเป็นตัวเลือก backend
ของคุณ (CPU หรือ GPU) ได้
ผู้สนับสนุน : 119 (ขึ้น 3.5%) , การกระทำ : 7119 ,
Github URL: Pylearn2
NuPIC เป็นแหล่งข้อมูลโปรเจคเปิดโดยมีรากฐานอยู่บนทฤษฎีของ
neocortex ที่เรียกว่า Hierarchical Temporal Memory (HTM) ส่วนของ
ทฤษฎี HTM ได้เคยถูกใช้งาน , ทดสอบและใช้ในแอพพลิเคชั่นและส่วน
อื่นๆของทฤษฎี HTM ยังคงกำลังพัฒนา
ผู้สนับสนุน : 85 (ขึ้น 12%) , การกระทำ : 6588 ,
Github URL: NuPIC
Neon Neon เป็นไลบรารีการเรียนรู้ลึกของ Python ของ Nervana ให้ความสะดวกในการใช้งานในขณะที่ส่งการแสดงผลที่ดีที่สุด
ผู้สนับสนุน : 78 (ขึ้น 66%) , การกระทำ : 1112 , Github URL: Neon
Nilearn เป็นโมดูล Python สำหรับการเรียนรู้เชิงสถิติที่ง่ายและรวดเร็ว
บนข้อมูล NeuroImaging มันยกระดับกล่องเครื่องมือ Python
scikit-learn สำหรับสถิติหลายตัวแปรด้วยแอพพลิเคชั่น เช่น ทำนาย
โมเดล , การจัดกลุ่ม , decoding หรือการวิเคราะห์แบบเชื่อมโยง
ผู้สนับสนุน : 69 (ขึ้น 50%), การกระทำ : 6198 , Github URL: Nilearn
Orange3 แหล่งข้อมูล Machine Learning เปิดและการสร้างภาพข้อมูล
สำหรับผู้เริ่มต้นและผู้เชี่ยวชาญ ขั้นตอนการทำงานเชิงโต้ตอบของการ
วิเคราะห์ข้อมูลด้วยกล่องข้อมูลที่ใหญ่
ผู้สนับสนุน: 53 (ขึ้น 33%), การกระทำ: 8915, Github URL: Orange3
Pymc เป็นโมดูล Python ที่ใช้งานโมเดลเชิงสถิติ Bayesian และ
อัลกอริทึมที่เหมาะสม รวมไปถึง Markov chain Monte Carlo ความ
สามารถในการยืดหยุ่นและขยายของมันทำให้มันสามารถใช้ได้กับ
ปัญหาใหญ่ๆ
ผู้สนับสนุน : 39 (ขึ้น 5.4%), การกระทำ: 2721, Github URL: Pymc
Deap เป็น Framework การคำนวณวิวัฒนาการใหม่สำหรับการสร้างต้น
แบบที่รวดเร็วและการทดสอบไอเดีย มันพยายามที่จะทำให้อัลกอริทึม
ชัดเจนและโครงสร้างข้อมูลที่โปร่งใส มันทำงานได้อย่างกลมกลืนกับ
กลไกคู่ขนาน เช่น การดำเนินการที่หลากหลายและ SCOOP
ผู้สนับสนุน : 39 (ขึ้น 86%), การกระทำ: 1960, Github URL: Deap
Annoy (Approximate Nearest Neighbors) เป็นไลบรารี C++ ด้วยการ
ผูก Python เพื่อที่จะค้นหาสำหรับจุดในพื้นที่ว่างที่อยู่ใกล้ เพื่อให้จุด
สืบค้นและมันยังสร้างโครงสร้างข้อมูลไฟล์ขนาดใหญ่ที่อ่านได้เพียง
อย่างเดียวที่ถูกวางแผนลงในหน่วยความจำเพื่อให้หลายๆกระบวนการ
แชร์ข้อมูลเดียวกันได้
ผู้สนับสนุน : 35 (ขึ้น 46%), การกระทำ: 527, Github URL: Annoy
PyBrain เป็น Machine Learning Library สำหรับ Python
แบบแยกส่วน เป้าหมายของมัน คือ การเสนอความยืดหยุ่น ใช้งานง่าย
และยังเป็นอัลกอริทึมที่มีประสิทธิภาพสำหรับภาระงานของการเรียนรู้
ด้วยตนเองของเครื่องจักรและสิ่งแวดล้อมที่ถูกกำหนดไว้ก่อนที่
หลากหลาย เพื่อทดสอบและเปรียบเทียบอัลกอริทึมของคุณ
ผู้สนับสนุน : 32 (ขึ้น 3%), การกระทำ: 992, Github URL: PyBrain
Fuel เป็น Framework ท่อส่งข้อมูลที่ให้โมเดล Machine Learning
ของคุณด้วยข้อมูลที่พวกเขาต้องการ มันถูกวางแผนให้ถูกใช้โดย
ทั้งไลบรารีเครือข่าย Neural Blocks และ Pylearn2
ผู้สนับสนุน : 32 (ขึ้น 10%), การกระทำ: 1116, Github URL: Fuel
จำนวนผู้สนับสนุนและจำนวนการกระทำถูกบันทึกไว้ในเดือนกุมภาพันธ์ ปี 2018
ที่เกี่ยวข้อง :
References :
https://www.kdnuggets.com/2018/02/top-20-python-ai-machine-learning-open-source-projects.html
Tag ที่น่าสนใจ: python machine_learning open_source tensorflow scikit-learn keras pytorch theano gensim caffe neural_networks programming github deep_learning ai
หากมีข้อผิดพลาด/ต้องการพูดคุยเพิ่มเติมเกี่ยวกับบทความนี้ กรุณาแจ้งที่ http://m.me/Expert.Programming.Tutor
085-350-7540 (DTAC)
084-88-00-255 (AIS)
026-111-618
หรือทาง EMAIL: NTPRINTF@GMAIL.COM