ໂຄງຮ່າງການແຂງກະດ້າງເຮັດໃຫ້ຄວາມວຸ່ນວາຍນັ້ນກາຍເປັນຂະບວນການເຮັດວຽກທີ່ສາມາດໃຊ້ໄດ້. ໃນຄູ່ມືນີ້, ພວກເຮົາຈະເປີດເຜີຍ ສິ່ງທີ່ເປັນກອບຊອບແວສໍາລັບ AI , ເປັນຫຍັງມັນຈຶ່ງສໍາຄັນ, ແລະວິທີການເລືອກຫນຶ່ງໂດຍບໍ່ມີການເດົາເທື່ອທີສອງຕົວທ່ານເອງທຸກໆຫ້ານາທີ. ຄວ້າກາເຟ; ຮັກສາແຖບເປີດ. ☕️
ບົດຄວາມທີ່ທ່ານອາດຈະຢາກອ່ານຫຼັງຈາກບົດຄວາມນີ້:
🔗 ການຮຽນຮູ້ເຄື່ອງຈັກທຽບກັບ AI ແມ່ນຫຍັງ
ເຂົ້າໃຈຄວາມແຕກຕ່າງທີ່ສໍາຄັນລະຫວ່າງລະບົບການຮຽນຮູ້ເຄື່ອງຈັກ ແລະປັນຍາປະດິດ.
🔗 AI ທີ່ສາມາດອະທິບາຍໄດ້ແມ່ນຫຍັງ
ຮຽນຮູ້ວິທີ AI ທີ່ສາມາດອະທິບາຍໄດ້ເຮັດໃຫ້ຕົວແບບທີ່ສັບສົນມີຄວາມໂປ່ງໃສ ແລະເຂົ້າໃຈໄດ້.
🔗 AI ຫຸ່ນຍົນມະນຸດແມ່ນຫຍັງ
ສຳຫຼວດເທັກໂນໂລຍີ AI ທີ່ໃຫ້ພະລັງກັບຫຸ່ນຍົນທີ່ຄ້າຍຄືກັບມະນຸດ ແລະພຶດຕິກຳການໂຕ້ຕອບ.
🔗 ເຄືອຂ່າຍ neural ໃນ AI ແມ່ນຫຍັງ
ຄົ້ນພົບວິທີການເຄືອຂ່າຍ neural mimic ສະຫມອງຂອງມະນຸດເພື່ອປະມວນຜົນຂໍ້ມູນ.
ໂຄງຮ່າງການຊອບແວສໍາລັບ AI ແມ່ນຫຍັງ? ຄຳຕອບສັ້ນໆ🧩
ໂຄງ ຮ່າງຊອບແວສໍາລັບ AI ແມ່ນຊຸດໂຄງສ້າງຂອງຫ້ອງສະໝຸດ, ອົງປະກອບຂອງເວລາແລ່ນ, ເຄື່ອງມື ແລະສົນທິສັນຍາທີ່ຊ່ວຍໃຫ້ທ່ານສ້າງ, ຝຶກຝົນ, ປະເມີນ ແລະນຳໃຊ້ການຮຽນຮູ້ເຄື່ອງຈັກ ຫຼືແບບຈໍາລອງການຮຽນຮູ້ເລິກໄດ້ໄວຂຶ້ນ ແລະເຊື່ອຖືໄດ້ຫຼາຍຂຶ້ນ. ມັນຫຼາຍກ່ວາຫ້ອງສະຫມຸດດຽວ. ຄິດວ່າມັນເປັນ scaffolding ຄວາມຄິດເຫັນທີ່ເຮັດໃຫ້ທ່ານ:
-
ບົດຄັດຫຍໍ້ຫຼັກສຳລັບ tensors, layers, estimators, or pipelines
-
ຄວາມແຕກຕ່າງອັດຕະໂນມັດແລະແກ່ນຄະນິດສາດທີ່ດີທີ່ສຸດ
-
ທໍ່ການປ້ອນຂໍ້ມູນ ແລະສິ່ງອຳນວຍຄວາມສະດວກໃນການປະມວນຜົນກ່ອນ
-
ການຝຶກອົບຮົມ loops, metrics, ແລະ checkpointing
-
Interop ກັບເຄື່ອງເລັ່ງຄວາມໄວເຊັ່ນ GPUs ແລະຮາດແວພິເສດ
-
ການຫຸ້ມຫໍ່, ການຮັບໃຊ້, ແລະບາງຄັ້ງການຕິດຕາມການທົດລອງ
ຖ້າຫ້ອງສະຫມຸດເປັນຊຸດເຄື່ອງມື, ກອບເປັນກອງປະຊຸມທີ່ມີແສງສະຫວ່າງ, ເກົ້າອີ້, ແລະເຄື່ອງເຮັດປ້າຍທີ່ເຈົ້າຈະທໍາທ່າວ່າເຈົ້າບໍ່ຕ້ອງການ ... ຈົນກວ່າເຈົ້າຈະເຮັດ. 🔧
ເຈົ້າຈະເຫັນຂ້ອຍເວົ້າຄືນປະໂຫຍກທີ່ແນ່ນອນ ຄືໂຄງຮ່າງຊອບແວສໍາລັບ AI ສອງສາມເທື່ອ. ນັ້ນແມ່ນຄວາມຕັ້ງໃຈ, ເພາະວ່າມັນເປັນຄໍາຖາມທີ່ຄົນສ່ວນໃຫຍ່ພິມໃນເວລາທີ່ພວກເຂົາສູນເສຍໄປໃນ maze ເຄື່ອງມື.

ສິ່ງທີ່ເຮັດໃຫ້ໂຄງຮ່າງການຊອບແວທີ່ດີສໍາລັບ AI? ✅
ນີ້ແມ່ນບັນຊີລາຍຊື່ສັ້ນທີ່ຂ້ອຍຕ້ອງການຖ້າຂ້ອຍເລີ່ມຕົ້ນຈາກຈຸດເລີ່ມຕົ້ນ:
-
ergonomics ຜະລິດຕະພັນ - APIs ສະອາດ, sane defaults, ຂໍ້ຄວາມຜິດພາດທີ່ເປັນປະໂຫຍດ
-
ການປະຕິບັດ - ແກ່ນໄວ, ຄວາມແມ່ນຍໍາປະສົມ, ການລວບລວມກາຟຫຼື JIT ບ່ອນທີ່ມັນຊ່ວຍ
-
ຄວາມເລິກຂອງລະບົບນິເວດ - ສູນກາງແບບຈໍາລອງ, ການສອນ, ນໍ້າໜັກທີ່ໄດ້ຝຶກອົບຮົມ, ການເຊື່ອມໂຍງ
-
Portability - ເສັ້ນທາງສົ່ງອອກເຊັ່ນ ONNX, runtimes ມືຖືຫຼືຂອບ, ຄວາມເປັນມິດກັບ container
-
ການສັງເກດການ - metrics, ການບັນທຶກ, profileing, ການຕິດຕາມການທົດລອງ
-
Scalability - multi-GPU, ການຝຶກອົບຮົມແຈກຢາຍ, ການຮັບໃຊ້ elastic
-
ການປົກຄອງ - ລັກສະນະຄວາມປອດໄພ, ການສ້າງເວີຊັນ, ເຊື້ອສາຍ, ແລະເອກະສານທີ່ບໍ່ເຮັດໃຫ້ເຈົ້າຫຼົງໄຫຼ
-
ຊຸມຊົນ & ອາຍຸຍືນ - ຜູ້ຮັກສາທີ່ຫ້າວຫັນ, ການຮັບຮອງເອົາໃນໂລກທີ່ແທ້ຈິງ, ແຜນທີ່ເສັ້ນທາງທີ່ເຊື່ອຖືໄດ້
ເມື່ອຕ່ອນເຫຼົ່ານັ້ນຄລິກ, ທ່ານຂຽນລະຫັດກາວຫນ້ອຍລົງແລະເຮັດ AI ຕົວຈິງຫຼາຍຂຶ້ນ. ຊຶ່ງເປັນຈຸດ. 🙂
ປະເພດຂອງກອບທີ່ເຈົ້າຈະເຂົ້າໄປໃນ 🗺️
ບໍ່ແມ່ນທຸກໆກອບພະຍາຍາມເຮັດທຸກຢ່າງ. ຄິດເປັນປະເພດ:
-
ກອບການຮຽນຮູ້ເລິກເຊິ່ງ : tensor ops, autodiff, neural nets
-
PyTorch, TensorFlow, JAX
-
-
ໂຄງຮ່າງການ ML ຄລາສສິກ : ທໍ່, ການຫັນປ່ຽນຄຸນສົມບັດ, ການຄາດຄະເນ
-
scikit-learn, XGBoost
-
-
ສູນກາງຕົວແບບ & stacks NLP : ແບບທີ່ໄດ້ຝຶກອົບຮົມໄວ້ລ່ວງໜ້າ, ເຄື່ອງໝາຍໂທເຄັນ, ການປັບລະອຽດ
-
ກອດຕົວຫັນໜ້າ
-
-
ການໃຫ້ບໍລິການ & ເວລາແລ່ນ inference : optimized deployment
-
ONNX Runtime, NVIDIA Triton Inference Server, Ray Serve
-
-
MLOps & ວົງຈອນຊີວິດ : ການຕິດຕາມ, ການຫຸ້ມຫໍ່, ທໍ່, CI ສໍາລັບ ML
-
MLflow, Kubeflow, Apache Airflow, Prefect, DVC
-
-
ຂອບ & ມືຖື : ຮອຍຕີນນ້ອຍ, ເປັນມິດກັບຮາດແວ
-
TensorFlow Lite, Core ML
-
-
ຂອບເຂດຄວາມສ່ຽງ ແລະການຄຸ້ມຄອງ : ຂະບວນການ ແລະການຄວບຄຸມ, ບໍ່ແມ່ນລະຫັດ
-
NIST AI ຂອບການຄຸ້ມຄອງຄວາມສ່ຽງ
-
ບໍ່ມີ stack ດຽວເຫມາະກັບທຸກທີມ. ບໍ່ເປັນຫຍັງ.
ຕາຕະລາງປຽບທຽບ: ຕົວເລືອກຍອດນິຍົມໃນທັນທີ 📊
ລວມເອົາຂໍ້ຄິດເລັກໆນ້ອຍໆ ເພາະຊີວິດຈິງເປັນເລື່ອງຫຍຸ້ງ. ລາຄາມີການປ່ຽນແປງ, ແຕ່ຫຼາຍຊິ້ນສ່ວນຫຼັກແມ່ນແຫຼ່ງເປີດ.
| ເຄື່ອງມື / Stack | ດີທີ່ສຸດສຳລັບ | ລາຄາປະມານ | ເປັນຫຍັງມັນຈຶ່ງໃຊ້ໄດ້ |
|---|---|---|---|
| PyTorch | ນັກຄົ້ນຄວ້າ, Pytonic devs | ໂອເພນຊອສ | ເສັ້ນສະແດງແບບເຄື່ອນໄຫວມີຄວາມຮູ້ສຶກທໍາມະຊາດ; ຊຸມຊົນຂະຫນາດໃຫຍ່. 🙂 |
| TensorFlow + Keras | ການຜະລິດໃນລະດັບ, ຂ້າມເວທີ | ໂອເພນຊອສ | ໂໝດກຣາບ, TF Serving, TF Lite, ເຄື່ອງມືແຂງ. |
| JAX | ຜູ້ໃຊ້ພະລັງງານ, ຫນ້າທີ່ຫັນປ່ຽນ | ໂອເພນຊອສ | ການລວບລວມ XLA, ສະອາດ vibe ຄະນິດສາດທໍາອິດ. |
| ຮຽນຮູ້ Scikit | ML ຄລາສສິກ, ຂໍ້ມູນຕາຕະລາງ | ໂອເພນຊອສ | ທໍ່, ວັດແທກ, API ຄາດຄະເນພຽງແຕ່ຄລິກ. |
| XGBoost | ຂໍ້ມູນໂຄງສ້າງ, ຊະນະພື້ນຖານ | ໂອເພນຊອສ | ການຊຸກຍູ້ແບບປົກກະຕິທີ່ມັກຈະຊະນະ. |
| ກອດຕົວຫັນໜ້າ | NLP, ວິໄສທັດ, ການແຜ່ກະຈາຍທີ່ມີການເຂົ້າເຖິງສູນ | ສ່ວນຫຼາຍແມ່ນເປີດ | ໂມເດລທີ່ຝຶກໄວ້ + ເຄື່ອງໝາຍໂທເຄັນ + ເອກະສານ, ວ້າວ. |
| ເວລາແລ່ນ ONNX | Portability, ກອບການປະສົມ | ໂອເພນຊອສ | ສົ່ງອອກຄັ້ງດຽວ, ແລ່ນໄວໃນຫຼາຍ backends. [4] |
| MLflow | ການທົດລອງການຕິດຕາມ, ການຫຸ້ມຫໍ່ | ໂອເພນຊອສ | Reproducibility, ການລົງທະບຽນແບບຈໍາລອງ, APIs ງ່າຍດາຍ. |
| Ray + Ray ໃຫ້ບໍລິການ | ແຈກຢາຍການຝຶກອົບຮົມ + ຮັບໃຊ້ | ໂອເພນຊອສ | Scales Python workloads; ໃຫ້ບໍລິການ micro-batching. |
| NVIDIA Triton | ການອະພິປາຍສູງ | ໂອເພນຊອສ | Multi-framework, batching ແບບໄດນາມິກ, GPUs. |
| Kubeflow | ທໍ່ Kubernetes ML | ໂອເພນຊອສ | End-to-end ໃນ K8s, ບາງຄັ້ງກໍ່ກວນແຕ່ແຂງແຮງ. |
| Airflow ຫຼື Prefect | Orchestration ປະມານການຝຶກອົບຮົມຂອງທ່ານ | ໂອເພນຊອສ | ການກຳນົດເວລາ, ພະຍາຍາມ, ການເບິ່ງເຫັນ. ເຮັດວຽກໄດ້. |
ຖ້າທ່ານຢາກໄດ້ຄໍາຕອບຫນຶ່ງເສັ້ນ: PyTorch ສໍາລັບການຄົ້ນຄວ້າ, TensorFlow ສໍາລັບການຜະລິດໃນໄລຍະຍາວ, scikit-learn ສໍາລັບຕາຕະລາງ, ONNX Runtime ສໍາລັບການເຄື່ອນທີ່, MLflow ສໍາລັບການຕິດຕາມ. ຂ້ອຍຈະຕິດຕາມພາຍຫຼັງຖ້າຈໍາເປັນ.
ພາຍໃຕ້ຫົວຂໍ້: ກອບການເຮັດວຽກຕົວຈິງຂອງຄະນິດສາດຂອງເຈົ້າແນວໃດ ⚙️
ຂອບການຮຽນຮູ້ທີ່ເລິກເຊິ່ງສ່ວນໃຫຍ່ຈະຈູງສາມຢ່າງໃຫຍ່:
-
Tensors - arrays ຫຼາຍມິຕິລະດັບທີ່ມີການຈັດວາງອຸປະກອນແລະກົດລະບຽບການອອກອາກາດ.
-
Autodiff - ຄວາມແຕກຕ່າງໃນຮູບແບບປີ້ນກັບຄືນໄປບ່ອນເພື່ອຄໍານວນ gradients.
-
ຍຸດທະສາດການປະຕິບັດ - ຮູບແບບຄວາມກະຕືລືລົ້ນທຽບກັບຮູບແບບກາຟິກທຽບກັບການລວບລວມ JIT.
-
PyTorch ເລີ່ມຕົ້ນທີ່ຈະປະຕິບັດຢ່າງກະຕືລືລົ້ນແລະສາມາດລວບລວມກຣາຟດ້ວຍ
torch.compileເພື່ອປະສົມປະສານ ops ແລະເລັ່ງສິ່ງຕ່າງໆດ້ວຍການປ່ຽນແປງລະຫັດຫນ້ອຍທີ່ສຸດ. [1] -
TensorFlow ເຮັດວຽກຢ່າງກະຕືລືລົ້ນໂດຍຄ່າເລີ່ມຕົ້ນແລະໃຊ້
tf.functionເພື່ອຈັດ Python ເຂົ້າໄປໃນກາຟ dataflow ແບບເຄື່ອນທີ່, ເຊິ່ງຕ້ອງການສໍາລັບການສົ່ງອອກ SavedModel ແລະມັກຈະປັບປຸງການປະຕິບັດ. [2] -
JAX leans ເຂົ້າໄປໃນການຫັນເປັນ composable ເຊັ່ນ
jit,grad,vmap, ແລະpmap, ລວບລວມໂດຍຜ່ານ XLA ສໍາລັບການເລັ່ງແລະຂະຫນານ. [3]
ນີ້ແມ່ນບ່ອນທີ່ການປະຕິບັດດໍາລົງຊີວິດ: ແກ່ນ, fusions, ຮູບແບບຫນ່ວຍຄວາມຈໍາ, ຄວາມແມ່ນຍໍາປະສົມ. ບໍ່ແມ່ນ magic - ພຽງແຕ່ວິສະວະກໍາທີ່ເບິ່ງ magic. ✨
ການຝຶກອົບຮົມທຽບກັບ inference: ສອງກິລາທີ່ແຕກຕ່າງກັນ 🏃♀️🏁
-
ການຝຶກອົບຮົມ ເນັ້ນຫນັກເຖິງການຜ່ານແລະຄວາມຫມັ້ນຄົງ. ທ່ານຕ້ອງການການນໍາໃຊ້ທີ່ດີ, ການຂະຫຍາຍ gradient, ແລະຍຸດທະສາດການແຈກຢາຍ.
-
Inference chases latency, ຄ່າໃຊ້ຈ່າຍ, ແລະ concurrency. ທ່ານຕ້ອງການ batching, quantization, ແລະບາງຄັ້ງ fusion ປະຕິບັດການ.
ຄວາມສາມາດເຮັດວຽກຮ່ວມກັນມີຄວາມສໍາຄັນຢູ່ທີ່ນີ້:
-
ONNX ເຮັດຫນ້າທີ່ເປັນຮູບແບບການແລກປ່ຽນແບບທົ່ວໄປ; ONNX Runtime ແລ່ນແບບຈໍາລອງຈາກກອບແຫຼ່ງຫຼາຍໃນທົ່ວ CPUs, GPUs, ແລະຕົວເລັ່ງອື່ນໆທີ່ມີການຜູກມັດພາສາສໍາລັບ stacks ການຜະລິດປົກກະຕິ. [4]
ປະລິມານ, ການຕັດ, ແລະການຕົ້ມກັ່ນມັກຈະໄດ້ຮັບໄຊຊະນະອັນໃຫຍ່ຫຼວງ. ບາງຄັ້ງກໍ່ເປັນເລື່ອງຕະຫຼົກຫຼາຍ - ເຊິ່ງຮູ້ສຶກຄືກັບການໂກງ, ເຖິງແມ່ນວ່າມັນບໍ່ແມ່ນ. 😉
ບ້ານ MLOps: ເກີນຂອບເຂດຫຼັກ 🏗️
ເຖິງແມ່ນວ່າເສັ້ນສະແດງການຄິດໄລ່ທີ່ດີທີ່ສຸດຈະບໍ່ຊ່ວຍຊີວິດທີ່ສັບສົນ. ໃນທີ່ສຸດເຈົ້າຈະຕ້ອງການ:
-
ການທົດລອງການຕິດຕາມ & ການຈົດທະບຽນ : ເລີ່ມຕົ້ນດ້ວຍ MLflow ເພື່ອບັນທຶກ params, metrics, ແລະ artifacts; ສົ່ງເສີມໂດຍຜ່ານທະບຽນ
-
ທໍ່ & ຂັ້ນຕອນການເຮັດວຽກ : Kubeflow ໃນ Kubernetes, ຫຼືນັກທົ່ວໄປເຊັ່ນ Airflow ແລະ Prefect
-
ການສ້າງສະບັບຂໍ້ມູນ : DVC ຮັກສາຂໍ້ມູນ ແລະແບບຈໍາລອງສະບັບພ້ອມກັບລະຫັດ
-
Containers & deployment : Docker images ແລະ Kubernetes ສໍາລັບສະພາບແວດລ້ອມທີ່ຄາດເດົາໄດ້, ຂະຫຍາຍໄດ້
-
ຕົວແບບ hubs : pretrain- then-fine-tune beats greenfield ເລື້ອຍໆກ່ວາບໍ່
-
ການຕິດຕາມກວດກາ : latency , drift , ແລະການກວດສອບຄຸນນະພາບເມື່ອຕົວແບບໄດ້ຮັບການຜະລິດ
ເລື່ອງຫຍໍ້ຂອງພາກສະໜາມດ່ວນ: ທີມງານອີຄອມເມີຊຂະໜາດນ້ອຍຕ້ອງການ “ທົດລອງອີກອັນໜຶ່ງ” ທຸກໆມື້, ຈາກນັ້ນຈື່ບໍ່ໄດ້ວ່າແລ່ນໃດໃຊ້ຄຸນສົມບັດໃດ. ພວກເຂົາເຈົ້າໄດ້ເພີ່ມ MLflow ແລະກົດລະບຽບ "ສົ່ງເສີມພຽງແຕ່ຈາກການລົງທະບຽນ". ທັນໃດນັ້ນ, ການທົບທວນຄືນປະຈໍາອາທິດແມ່ນກ່ຽວກັບການຕັດສິນໃຈ, ບໍ່ແມ່ນໂບຮານຄະດີ. ຮູບແບບສະແດງໃຫ້ເຫັນຢູ່ທົ່ວທຸກແຫ່ງ.
ການເຮັດວຽກຮ່ວມກັນ & ການເຄື່ອນທີ່: ຮັກສາທາງເລືອກຂອງທ່ານໃຫ້ເປີດ🔁
ລັອກອິນຄ່ອຍໆຂຶ້ນຢ່າງງຽບໆ. ຫຼີກລ້ຽງການມັນໂດຍການວາງແຜນສໍາລັບການ:
-
ເສັ້ນທາງສົ່ງອອກ : ONNX, SavedModel, TorchScript
-
ຄວາມຍືດຫຍຸ່ນຂອງເວລາແລ່ນ : ONNX Runtime, TF Lite, Core ML ສໍາລັບມືຖື ຫຼື edge
-
ການບັນຈຸ : ການສ້າງທໍ່ທີ່ຄາດເດົາໄດ້ດ້ວຍຮູບພາບ Docker
-
ຮັບໃຊ້ຄວາມເປັນກາງ : ການເປັນເຈົ້າພາບ PyTorch, TensorFlow, ແລະ ONNX ຂ້າງຄຽງກັນເຮັດໃຫ້ທ່ານມີຄວາມຊື່ສັດ.
ການປ່ຽນຊັ້ນການໃຫ້ບໍລິການ ຫຼືການລວບລວມຕົວແບບສໍາລັບອຸປະກອນທີ່ນ້ອຍກວ່າຄວນຈະເປັນສິ່ງລົບກວນ, ບໍ່ແມ່ນການຂຽນຄືນໃຫມ່.
ການເລັ່ງ ແລະຂະໜາດຂອງຮາດແວ: ເຮັດໃຫ້ມັນໄວໂດຍບໍ່ຕ້ອງເສຍນ້ຳຕາ ⚡️
-
GPUs ຄອບງໍາວຽກງານການຝຶກອົບຮົມໂດຍທົ່ວໄປຍ້ອນ kernels optimized ສູງ (ຄິດວ່າ cuDNN).
-
ການຝຶກອົບຮົມແບບແຈກຢາຍ ສະແດງໃຫ້ເຫັນໃນເວລາທີ່ GPU ດຽວບໍ່ສາມາດຕິດຕາມໄດ້: ຄວາມຂະຫນານຂອງຂໍ້ມູນ, ຄວາມຂະຫນານຕົວແບບ, ເຄື່ອງມືເພີ່ມປະສິດທິພາບ sharded.
-
ຄວາມແມ່ນຍໍາປະສົມ ຊ່ວຍປະຫຍັດຄວາມຊົງຈໍາແລະເວລາທີ່ມີການສູນເສຍຄວາມຖືກຕ້ອງຫນ້ອຍທີ່ສຸດເມື່ອຖືກນໍາໃຊ້ຢ່າງຖືກຕ້ອງ.
ບາງຄັ້ງລະຫັດທີ່ໄວທີ່ສຸດແມ່ນລະຫັດທີ່ທ່ານບໍ່ໄດ້ຂຽນ: ໃຊ້ຕົວແບບທີ່ໄດ້ຝຶກໄວ້ລ່ວງໜ້າ ແລະປັບໃຫ້ລະອຽດ. ຢ່າງຈິງຈັງ. 🧠
ການປົກຄອງ, ຄວາມປອດໄພ, ແລະຄວາມສ່ຽງ: ບໍ່ພຽງແຕ່ເອກະສານ 🛡️
ການຂົນສົ່ງ AI ໃນອົງການຈັດຕັ້ງທີ່ແທ້ຈິງຫມາຍຄວາມວ່າຄິດກ່ຽວກັບ:
-
ເຊື້ອສາຍ : ຂໍ້ມູນມາຈາກໃສ, ມັນຖືກປະມວນຜົນແນວໃດ, ແລະຮຸ່ນໃດທີ່ມີຊີວິດຢູ່
-
Reproducibility : ການສ້າງທີ່ຕັ້ງໃຈ, ການເພິ່ງພາອາໄສ pinned, ຮ້ານຄ້າປອມ
-
ຄວາມໂປ່ງໃສ & ເອກະສານ : ບັດແບບຈໍາລອງ ແລະໃບລາຍງານຂໍ້ມູນ
-
ການຄຸ້ມຄອງຄວາມສ່ຽງ : NIST AI Risk Management Framework ສະຫນອງແຜນທີ່ເສັ້ນທາງປະຕິບັດສໍາລັບການສ້າງແຜນທີ່, ການວັດແທກແລະການຄຸ້ມຄອງລະບົບ AI ທີ່ເຊື່ອຖືໄດ້ໃນທົ່ວວົງຈອນຊີວິດ. [5]
ເຫຼົ່ານີ້ບໍ່ແມ່ນທາງເລືອກໃນໂດເມນທີ່ມີການຄວບຄຸມ. ເຖິງແມ່ນວ່າຢູ່ນອກພວກເຂົາ, ພວກເຂົາປ້ອງກັນບໍ່ໃຫ້ເກີດຄວາມສັບສົນແລະການປະຊຸມທີ່ງຸ່ມງ່າມ.
ວິທີການເລືອກ: ລາຍການກວດສອບການຕັດສິນໃຈດ່ວນ🧭
ຖ້າຫາກວ່າທ່ານຍັງກໍາລັງເບິ່ງຫ້າແຖບ, ໃຫ້ພະຍາຍາມນີ້:
-
ພາສາຫຼັກ ແລະຄວາມເປັນມາຂອງທີມ
-
ທີມວິໄຈ Python-first: ເລີ່ມຕົ້ນດ້ວຍ PyTorch ຫຼື JAX
-
ການຄົ້ນຄວ້າປະສົມແລະການຜະລິດ: TensorFlow ກັບ Keras ເປັນການເດີມພັນທີ່ປອດໄພ
-
ການວິເຄາະແບບຄລາດສິກ ຫຼືການສຸມໃສ່ຕາຕະລາງ: scikit-learn ບວກກັບ XGBoost
-
-
ເປົ້າໝາຍການຈັດຕັ້ງປະຕິບັດ
-
Cloud inference ໃນລະດັບ: ONNX Runtime ຫຼື Triton, containerized
-
ມືຖື ຫຼືຝັງໄວ້: TF Lite ຫຼື Core ML
-
-
ຄວາມຕ້ອງການຂະຫນາດ
-
GPU ດຽວຫຼືສະຖານີເຮັດວຽກ: ກອບ DL ທີ່ສໍາຄັນໃດໆເຮັດວຽກ
-
ການຝຶກອົບຮົມການແຜ່ກະຈາຍ: ກວດສອບການສ້າງໃນຍຸດທະສາດຫຼືການນໍາໃຊ້ Ray Train
-
-
MLOps ຄົບກຳນົດ
-
ມື້ເລີ່ມຕົ້ນ: MLflow ສໍາລັບການຕິດຕາມ, ຮູບພາບ Docker ສໍາລັບການຫຸ້ມຫໍ່
-
ທີມທີ່ເຕີບໃຫຍ່: ເພີ່ມ Kubeflow ຫຼື Airflow/Prefect ສໍາລັບທໍ່
-
-
ຄວາມຕ້ອງການພົກພາ
-
ວາງແຜນການສົ່ງອອກ ONNX ແລະຊັ້ນການໃຫ້ບໍລິການທີ່ເປັນກາງ
-
-
ທ່າທາງສ່ຽງ
-
ສອດຄ່ອງຕາມຄຳແນະນຳ NIST, ລຳດັບເອກະສານ, ບັງຄັບໃຫ້ກວດສອບ [5]
-
ຖ້າຄໍາຖາມຢູ່ໃນຫົວຂອງທ່ານຍັງຄົງ ເປັນກອບຊອບແວສໍາລັບ AI , ມັນແມ່ນທາງເລືອກທີ່ເຮັດໃຫ້ລາຍການກວດສອບທີ່ຫນ້າເບື່ອ. ເບື່ອແມ່ນດີ.
gotchas ທົ່ວໄປ & myths ເລັກນ້ອຍ 😬
-
Myth: ກອບຫນຶ່ງກົດລະບຽບພວກເຂົາທັງຫມົດ. ຄວາມເປັນຈິງ: ທ່ານຈະປະສົມແລະຈັບຄູ່. ນັ້ນຄືສຸຂະພາບ.
-
Myth: ຄວາມໄວການຝຶກອົບຮົມແມ່ນທຸກສິ່ງທຸກຢ່າງ. ຄ່າໃຊ້ຈ່າຍໃນການອະພິປາຍແລະຄວາມຫນ້າເຊື່ອຖືມັກຈະສໍາຄັນຫຼາຍ.
-
Gotcha: ລືມທໍ່ຂໍ້ມູນ. ການປ້ອນຂໍ້ມູນທີ່ບໍ່ດີຈົມລົງຕົວແບບທີ່ດີ. ໃຊ້ loaders ທີ່ເຫມາະສົມແລະການກວດສອບ.
-
Gotcha: ຂ້າມການຕິດຕາມການທົດລອງ. ເຈົ້າຈະລືມວ່າແລ່ນໃດດີທີ່ສຸດ. ໃນອະນາຄົດ - ເຈົ້າຈະລໍາຄານ.
-
Myth: ການພົກພາແມ່ນອັດຕະໂນມັດ. ບາງຄັ້ງການສົ່ງອອກຈະແຕກໃນ ops ແບບກຳນົດເອງ. ທົດສອບໄວ.
-
Gotcha: MLOps ວິສະວະກອນເກີນໄວເກີນໄປ. ເຮັດໃຫ້ມັນງ່າຍດາຍ, ຫຼັງຈາກນັ້ນເພີ່ມ orchestration ເມື່ອຄວາມເຈັບປວດປາກົດ.
-
ການປຽບທຽບທີ່ຜິດພາດເລັກນ້ອຍ : ຄິດເຖິງໂຄງຮ່າງການຂອງເຈົ້າຄືກັບໝວກກັນກະທົບລົດຖີບສຳລັບຕົວແບບຂອງເຈົ້າ. ບໍ່ stylish? ບາງທີ. ແຕ່ເຈົ້າຈະພາດມັນເມື່ອທາງຍ່າງເວົ້າວ່າສະບາຍດີ.
FAQ ຂະໜາດນ້ອຍກ່ຽວກັບກອບ ❓
ຖາມ: ໂຄງຮ່າງການແຕກຕ່າງຈາກຫ້ອງສະຫມຸດຫຼືເວທີບໍ?
-
ຫໍສະໝຸດ : ໜ້າທີ່ສະເພາະ ຫຼືຕົວແບບທີ່ທ່ານເອີ້ນ.
-
Framework : ກຳນົດໂຄງສ້າງ ແລະວົງຈອນຊີວິດ, ສຽບໃນຫ້ອງສະໝຸດ.
-
ເວທີ : ສະພາບແວດລ້ອມທີ່ກວ້າງກວ່າດ້ວຍ infra, UX, ໃບບິນ, ແລະການບໍລິການທີ່ມີການຄຸ້ມຄອງ.
ຖາມ: ຂ້ອຍສາມາດສ້າງ AI ໂດຍບໍ່ມີກອບບໍ?
ດ້ານວິຊາການແມ່ນແລ້ວ. ຕົວຈິງແລ້ວ, ມັນຄ້າຍຄືກັບການຂຽນຕົວລວບລວມຂໍ້ມູນຂອງທ່ານເອງສໍາລັບການຕອບ blog. ເຈົ້າສາມາດ, ແຕ່ເປັນຫຍັງ.
ຖາມ: ຂ້ອຍຕ້ອງການທັງການຝຶກອົບຮົມ ແລະກອບວຽກບໍ?
ມັກແລ້ວ. ລົດໄຟໃນ PyTorch ຫຼື TensorFlow, ສົ່ງອອກໄປ ONNX, ໃຫ້ບໍລິການດ້ວຍ Triton ຫຼື ONNX Runtime. seams ແມ່ນຢູ່ທີ່ນັ້ນຈຸດປະສົງ. [4]
ຖາມ: ການປະຕິບັດທີ່ດີທີ່ສຸດທີ່ມີອຳນາດຢູ່ໃສ?
AI RMF ຂອງ NIST ສໍາລັບການປະຕິບັດຄວາມສ່ຽງ; docs ຜູ້ຂາຍສໍາລັບຖາປັດຕະຍະ; ຄູ່ມື ML ຂອງຜູ້ໃຫ້ບໍລິການຄລາວແມ່ນການກວດສອບຂ້າມທີ່ເປັນປະໂຫຍດ. [5]
ສະຫຼຸບຫຍໍ້ຂອງ keyphrase ດ່ວນເພື່ອຄວາມຊັດເຈນ 📌
ປະຊາຊົນມັກຈະຄົ້ນຫາ ສິ່ງທີ່ເປັນກອບຊອບແວສໍາລັບ AI ເພາະວ່າພວກເຂົາພະຍາຍາມເຊື່ອມຕໍ່ຈຸດລະຫວ່າງລະຫັດການຄົ້ນຄວ້າແລະບາງສິ່ງບາງຢ່າງທີ່ສາມາດປະຕິບັດໄດ້. ດັ່ງນັ້ນ, ໂຄງຮ່າງການຊອບແວສໍາລັບ AI ແມ່ນຫຍັງ ໃນການປະຕິບັດ? ມັນເປັນຊຸດຄອມພິວເຕີ້, ບົດຄັດຫຍໍ້, ແລະສົນທິສັນຍາທີ່ຄັດສັນມາທີ່ຊ່ວຍໃຫ້ທ່ານຝຶກອົບຮົມ, ປະເມີນ, ແລະນໍາໃຊ້ຕົວແບບທີ່ມີຄວາມແປກໃຈຫນ້ອຍລົງ, ໃນຂະນະທີ່ຫຼີ້ນກັບທໍ່ຂໍ້ມູນ, ຮາດແວ, ແລະການປົກຄອງ. ຢູ່ທີ່ນັ້ນ, ເວົ້າມັນສາມຄັ້ງ. 😅
ຂໍ້ສັງເກດສຸດທ້າຍ - ດົນເກີນໄປຂ້ອຍບໍ່ໄດ້ອ່ານມັນ🧠➡️🚀
-
ໂຄງ ຮ່າງການຊອຟແວສໍາລັບ AI ໃຫ້ທ່ານມີຄວາມຄິດເຫັນກ່ຽວກັບ scaffolding: tensors, autodiff, ການຝຶກອົບຮົມ, ການຕິດຕັ້ງ, ແລະເຄື່ອງມື.
-
ເລືອກຕາມພາສາ, ເປົ້າໝາຍການນຳໃຊ້, ຂະໜາດ, ແລະຄວາມເລິກຂອງລະບົບນິເວດ.
-
ຄາດວ່າຈະປະສົມ stacks: PyTorch ຫຼື TensorFlow ເພື່ອຝຶກອົບຮົມ, ONNX Runtime ຫຼື Triton ເພື່ອຮັບໃຊ້, MLflow ເພື່ອຕິດຕາມ, Airflow ຫຼື Prefect ເພື່ອ orchestrate. [1][2][4]
-
Bake in portability, observability, and risk practices early. [5]
-
ແລະແມ່ນແລ້ວ, ເອົາພາກສ່ວນທີ່ຫນ້າເບື່ອ. ຫນ້າເບື່ອແມ່ນຄວາມຫມັ້ນຄົງ, ແລະເຮືອທີ່ຫມັ້ນຄົງ.
ກອບທີ່ດີຈະບໍ່ເອົາຄວາມສັບສົນອອກ. ພວກມັນຕິດພັນກັບມັນເພື່ອໃຫ້ທີມງານຂອງທ່ານສາມາດເຄື່ອນຍ້າຍໄດ້ໄວຂຶ້ນດ້ວຍຊ່ວງເວລາ oops ໜ້ອຍລົງ. 🚢
ເອກະສານອ້າງອີງ
[1] PyTorch - ແນະນໍາ torch.compile (ເອກະສານທີ່ເປັນທາງການ): ອ່ານເພີ່ມເຕີມ
[2] TensorFlow - ການປະຕິບັດທີ່ດີກວ່າກັບ tf.function (ຄູ່ມືຢ່າງເປັນທາງການ): ອ່ານເພີ່ມເຕີມ
[3] JAX - Quickstart: ວິທີການຄິດໃນ JAX (ເອກະສານທີ່ເປັນທາງການ): ອ່ານເພີ່ມເຕີມ
[4] ONNX Runtime - ONNX Runtime for Inferencing (ເອກະສານທາງການ): ອ່ານເພີ່ມເຕີມ
[5] NIST - AI Risk Management Framework (AI RMF 1.0) : ອ່ານເພີ່ມເຕີມ