ເຈົ້າບໍ່ໄດ້ມາທີ່ນີ້ເພື່ອຄວາມລຶກລັບ. ເຈົ້າຕ້ອງການເສັ້ນທາງທີ່ຊັດເຈນສຳລັບ ວິທີການກາຍເປັນນັກພັດທະນາ AI ໂດຍບໍ່ຕ້ອງຈົມຢູ່ໃນແຖບທີ່ບໍ່ມີຂອບເຂດ, ແກງຄຳສັບສະເພາະ, ຫຼື ການວິເຄາະທີ່ບໍ່ເປັນອຳມະພາດ. ດີ. ຄູ່ມືນີ້ໃຫ້ແຜນທີ່ທັກສະ, ເຄື່ອງມືທີ່ສຳຄັນແທ້ໆ, ໂຄງການທີ່ໄດ້ຮັບການໂທກັບຄືນ, ແລະ ນິໄສທີ່ແຍກການສ້ອມແປງອອກຈາກການຂົນສົ່ງ. ມາເລີ່ມສ້າງກັນເລີຍ.
ບົດຄວາມທີ່ທ່ານອາດຈະຢາກອ່ານຫຼັງຈາກບົດຄວາມນີ້:
🔗 ວິທີການເລີ່ມຕົ້ນບໍລິສັດ AI
ຄູ່ມືແນະນຳແບບເທື່ອລະຂັ້ນຕອນໃນການສ້າງ, ການສະໜອງທຶນ ແລະ ການເປີດຕົວບໍລິສັດ startup AI ຂອງທ່ານ.
🔗 ວິທີການສ້າງ AI ໃນຄອມພິວເຕີຂອງທ່ານ
ຮຽນຮູ້ການສ້າງ, ຝຶກອົບຮົມ ແລະ ນຳໃຊ້ຮູບແບບ AI ໃນທ້ອງຖິ່ນໄດ້ຢ່າງງ່າຍດາຍ.
🔗 ວິທີການສ້າງຮູບແບບ AI
ການແບ່ງແຍກຢ່າງຄົບຖ້ວນຂອງການສ້າງແບບຈຳລອງ AI ຕັ້ງແຕ່ແນວຄວາມຄິດຈົນເຖິງການນຳໃຊ້.
🔗 AI ທີ່ເປັນສັນຍາລັກແມ່ນຫຍັງ
ສຳຫຼວດວິທີການເຮັດວຽກຂອງ AI ແບບສັນຍາລັກ ແລະ ເປັນຫຍັງມັນຍັງມີຄວາມສຳຄັນຈົນເຖິງທຸກມື້ນີ້.
ສິ່ງທີ່ເຮັດໃຫ້ນັກພັດທະນາ AI ທີ່ດີເລີດ✅
ນັກພັດທະນາ AI ທີ່ດີບໍ່ແມ່ນຄົນທີ່ຈື່ຈຳທຸກໆຕົວເພີ່ມປະສິດທິພາບ. ແຕ່ແມ່ນຄົນທີ່ສາມາດແກ້ໄຂບັນຫາທີ່ບໍ່ຊັດເຈນ, ວາງກອບມັນ , ເຊື່ອມຕໍ່ຂໍ້ມູນ ແລະ ແບບຈຳລອງເຂົ້າກັນ, ສົ່ງສິ່ງທີ່ເຮັດວຽກໄດ້, ວັດແທກມັນຢ່າງຊື່ສັດ, ແລະ ເຮັດຊ້ຳໆໂດຍບໍ່ມີບັນຫາ. ຕົວຢ່າງບາງຢ່າງ:
-
ຄວາມສະດວກສະບາຍກັບວົງຈອນທັງໝົດ: ຂໍ້ມູນ → ຮູບແບບ → ການປະເມີນຜົນ → ການນຳໃຊ້ → ຕິດຕາມກວດກາ.
-
ມີອະຄະຕິໃນການທົດລອງຢ່າງວ່ອງໄວຫຼາຍກວ່າທິດສະດີທີ່ບໍລິສຸດ... ດ້ວຍທິດສະດີທີ່ພຽງພໍທີ່ຈະຫຼີກລ່ຽງກັບດັກທີ່ຊັດເຈນ.
-
ຜົນງານທີ່ພິສູດວ່າທ່ານສາມາດສົ່ງຜົນໄດ້ຮັບ, ບໍ່ພຽງແຕ່ປື້ມບັນທຶກເທົ່ານັ້ນ.
-
ແນວຄິດທີ່ມີຄວາມຮັບຜິດຊອບກ່ຽວກັບຄວາມສ່ຽງ, ຄວາມເປັນສ່ວນຕົວ, ແລະ ຄວາມຍຸຕິທຳ - ບໍ່ແມ່ນການປະຕິບັດຕົວຈິງ, ແຕ່ເປັນການປະຕິບັດໄດ້ຈິງ. ໂຄງສ້າງພື້ນຖານຂອງອຸດສາຫະກຳເຊັ່ນ: ຂອບການຄຸ້ມຄອງຄວາມສ່ຽງ AI ຂອງ NIST ແລະ ຫຼັກການ AI ຂອງ OECD ຊ່ວຍໃຫ້ທ່ານເວົ້າພາສາດຽວກັນກັບຜູ້ທົບທວນ ແລະ ຜູ້ມີສ່ວນຮ່ວມ. [1][2]
ຄຳສາລະພາບເລັກນ້ອຍ: ບາງຄັ້ງເຈົ້າອາດຈະສົ່ງຕົວແບບໜຶ່ງໄປໃຫ້ ແລະ ຫຼັງຈາກນັ້ນກໍ່ຮູ້ວ່າສິ່ງສຳຄັນທີ່ສຸດແມ່ນໄຊຊະນະ. ຄວາມຖ່ອມຕົວນັ້ນ - ແປກປະຫຼາດ - ເປັນພະລັງວິເສດ.
ບົດຄວາມສັ້ນໆ: ທີມງານໄດ້ສ້າງຕົວຈັດປະເພດທີ່ທັນສະໄໝສຳລັບການຄັດແຍກການສະໜັບສະໜູນ; ກົດລະບຽບຄຳຫລັກພື້ນຖານໄດ້ເອົາຊະນະມັນໃນເວລາຕອບສະໜອງຄັ້ງທຳອິດ. ພວກເຂົາຮັກສາກົດລະບຽບ, ໃຊ້ຮູບແບບສຳລັບກໍລະນີຂອບ, ແລະສົ່ງມອບທັງສອງຢ່າງ. ເວດມົນໜ້ອຍລົງ, ຜົນໄດ້ຮັບຫຼາຍຂຶ້ນ.
ແຜນທີ່ເສັ້ນທາງສຳລັບວິທີການກາຍເປັນນັກພັດທະນາ AI 🗺️
ນີ້ແມ່ນເສັ້ນທາງທີ່ຊ້ຳໆ ແລະ ບໍ່ຊ້ຳກັນ. ວົນຊ້ຳອີກສອງສາມເທື່ອເມື່ອທ່ານເລື່ອນລະດັບ:
-
ຄວາມຄ່ອງແຄ້ວໃນການຂຽນໂປຣແກຣມ ໃນ Python ບວກກັບ DS libs ຫຼັກ: NumPy, pandas, scikit-learn. ອ່ານຄູ່ມືຢ່າງເປັນທາງການແບບອ່ານຜ່ານໆ ແລະ ຈາກນັ້ນສ້າງສະຄຣິບນ້ອຍໆຈົນກວ່ານິ້ວມືຂອງທ່ານຈະຮູ້. ຄູ່ມືຜູ້ໃຊ້ ເປັນສອງແບບປຶ້ມແບບຮຽນທີ່ໃຊ້ໄດ້ຈິງຢ່າງໜ້າປະຫຼາດໃຈ. [3]
-
ພື້ນຖານ ML ຜ່ານຫຼັກສູດທີ່ມີໂຄງສ້າງ: ຮູບແບບເສັ້ນຊື່, ການເຮັດໃຫ້ເປັນລະບຽບ, ການກວດສອບຄວາມຖືກຕ້ອງຂ້າມ, ຕົວຊີ້ວັດຕ່າງໆ. ບັນທຶກການບັນຍາຍແບບຄລາສສິກ ແລະ ຫຼັກສູດການປະຕິບັດຕົວຈິງປະສົມປະສານກັນໄດ້ດີ.
-
ເຄື່ອງມືການຮຽນຮູ້ເລິກ : ເລືອກ PyTorch ຫຼື TensorFlow ແລະຮຽນຮູ້ພຽງພໍທີ່ຈະຝຶກອົບຮົມ, ບັນທຶກ ແລະ ໂຫຼດຮູບແບບຕ່າງໆ; ຈັດການຊຸດຂໍ້ມູນ; ແລະ ແກ້ໄຂຂໍ້ຜິດພາດຮູບຮ່າງທົ່ວໄປ. ເລີ່ມຕົ້ນດ້ວຍ ບົດແນະນຳ PyTorch ຖ້າທ່ານມັກ "ລະຫັດກ່ອນ." [4]
-
ໂຄງການທີ່ຈັດສົ່ງຕົວຈິງ : ແພັກເກດດ້ວຍ Docker, ຕິດຕາມການແລ່ນ (ເຖິງແມ່ນວ່າບັນທຶກ CSV ກໍ່ບໍ່ມີຫຍັງດີກວ່າ), ແລະ ນຳໃຊ້ API ຂະໜາດນ້ອຍທີ່ສຸດ. ຮຽນຮູ້ Kubernetes ເມື່ອທ່ານພັດທະນາເກີນກວ່າການນຳໃຊ້ກ່ອງດຽວ; Docker ກ່ອນ. [5]
-
ຊັ້ນ AI ທີ່ມີຄວາມຮັບຜິດຊອບ : ຮັບຮອງເອົາບັນຊີກວດສອບຄວາມສ່ຽງທີ່ມີນ້ຳໜັກເບົາທີ່ໄດ້ຮັບແຮງບັນດານໃຈຈາກ NIST/OECD (ຄວາມຖືກຕ້ອງ, ຄວາມໜ້າເຊື່ອຖື, ຄວາມໂປ່ງໃສ, ຄວາມຍຸຕິທຳ). ມັນເຮັດໃຫ້ການສົນທະນາເປັນຮູບປະທຳ ແລະ ການກວດສອບເປັນຕາເບື່ອ (ໃນທາງທີ່ດີ). [1][2]
-
ຊ່ຽວຊານດ້ານນີ້ໜ້ອຍໜຶ່ງ : NLP ກັບ Transformers, ວິໄສທັດກັບການສົນທະນາ/ViTs ທີ່ທັນສະໄໝ, ຜູ້ແນະນຳ, ຫຼື ແອັບ ແລະ ຕົວແທນ LLM. ເລືອກຊ່ອງທາງໜຶ່ງ, ສ້າງໂຄງການຂະໜາດນ້ອຍສອງໂຄງການ, ຈາກນັ້ນຂະຫຍາຍສາຂາ.
ເຈົ້າຈະກັບຄືນໄປເຮັດຂັ້ນຕອນທີ 2–6 ຕະຫຼອດໄປ. ແທ້ໆແລ້ວ, ນັ້ນແມ່ນໜ້າທີ່.
ຊຸດທັກສະທີ່ເຈົ້າຈະໃຊ້ຕົວຈິງໃນແຕ່ລະມື້ 🧰
-
Python + Data wrangling : ການແບ່ງ array, joins, groupbys, vectorization. ຖ້າທ່ານສາມາດເຮັດໃຫ້ໝີແພນດ້າເຕັ້ນໄດ້, ການຝຶກອົບຮົມຈະງ່າຍຂຶ້ນ ແລະ ການປະເມີນຜົນກໍ່ສະອາດກວ່າ.
-
Core ML : ການແບ່ງການທົດສອບລະຫວ່າງການຝຶກອົບຮົມ, ການຫຼີກລ່ຽງການຮົ່ວໄຫຼ, ການຮູ້ໜັງສືຕົວຊີ້ວັດ. ຄູ່ມື Scikit-learn ແມ່ນໜຶ່ງໃນບົດເລື່ອງທີ່ດີທີ່ສຸດຢ່າງງຽບໆ. [3]
-
ກອບ DL : ເລືອກອັນໜຶ່ງ, ເຮັດໃຫ້ການເຮັດວຽກແບບ end-to-end, ຈາກນັ້ນເບິ່ງອີກອັນໜຶ່ງໃນພາຍຫຼັງ. ເອກະສານຂອງ PyTorch ເຮັດໃຫ້ຮູບແບບທາງຈິດໃຈຊັດເຈນ. [4]
-
ສຸຂະອະນາໄມໃນການທົດລອງ : ການແລ່ນຕາມເສັ້ນທາງ, ພາລາມິເຕີ, ແລະ ສິ່ງປະດິດ. ອະນາຄົດ-ເຈົ້າກຽດຊັງໂບຮານຄະດີ.
-
ການຈັດລຽງ ແລະ ການຈັດການ : Docker ເພື່ອຈັດແພັກເກດ stack ຂອງທ່ານ; Kubernetes ເມື່ອທ່ານຕ້ອງການການສຳເນົາ, ການຂະຫຍາຍອັດຕະໂນມັດ, ແລະ ການອັບເດດແບບມ້ວນ. ເລີ່ມຕົ້ນທີ່ນີ້. [5]
-
ພື້ນຖານຂອງ GPU : ຮູ້ວ່າເວລາໃດຄວນເຊົ່າ, ຂະໜາດຂອງ batch ມີຜົນກະທົບຕໍ່ throughput ແນວໃດ, ແລະເປັນຫຍັງບາງ opers ຈຶ່ງຖືກຜູກມັດດ້ວຍໜ່ວຍຄວາມຈຳ.
-
AI ທີ່ມີຄວາມຮັບຜິດຊອບ : ບັນທຶກແຫຼ່ງຂໍ້ມູນ, ປະເມີນຄວາມສ່ຽງ, ແລະວາງແຜນການຫຼຸດຜ່ອນຜົນກະທົບໂດຍໃຊ້ຄຸນສົມບັດທີ່ຊັດເຈນ (ຄວາມຖືກຕ້ອງ, ຄວາມໜ້າເຊື່ອຖື, ຄວາມໂປ່ງໃສ, ຄວາມຍຸຕິທຳ). [1]
ຫຼັກສູດເລີ່ມຕົ້ນ: ລິ້ງບໍ່ຫຼາຍປານໃດທີ່ເກີນນ້ຳໜັກຂອງມັນ 🔗
-
ພື້ນຖານ ML : ຊຸດບັນທຶກທີ່ເນັ້ນທິດສະດີຫຼາຍ + ຫຼັກສູດປະຕິບັດຕົວຈິງ. ຈັບຄູ່ພວກມັນກັບການຝຶກຝົນໃນ Scikit-learn. [3]
-
Frameworks : ບົດແນະນຳ PyTorch (ຫຼື ຄູ່ມື TensorFlow ຖ້າທ່ານມັກ Keras). [4]
-
ສິ່ງຈຳເປັນດ້ານວິທະຍາສາດຂໍ້ມູນ ຄູ່ມືຜູ້ໃຊ້ ຂອງ scikit-learn ເພື່ອນຳໃຊ້ຕົວຊີ້ວັດ, ທໍ່ສົ່ງຂໍ້ມູນ ແລະ ການປະເມີນຜົນພາຍໃນ. [3]
-
ການຂົນສົ່ງ ເລີ່ມຕົ້ນ ຂອງ Docker ສະນັ້ນ "ເຮັດວຽກຢູ່ໃນເຄື່ອງຂອງຂ້ອຍ" ຈຶ່ງກາຍເປັນ "ເຮັດວຽກໄດ້ທຸກບ່ອນ." [5]
ບຸກມາກສິ່ງເຫຼົ່ານີ້. ເມື່ອຕິດຂັດ, ໃຫ້ອ່ານໜ້າໜຶ່ງ, ລອງສິ່ງໜຶ່ງ, ແລະ ເຮັດຊ້ຳອີກ.
ສາມໂຄງການພອດໂຟລິໂອທີ່ໄດ້ຮັບການສຳພາດ📁
-
ການຕອບຄຳຖາມທີ່ເພີ່ມຂຶ້ນໂດຍການດຶງຂໍ້ມູນຄືນໃນຊຸດຂໍ້ມູນຂອງທ່ານເອງ
-
ຂູດ/ນຳເຂົ້າພື້ນຖານຄວາມຮູ້ແບບ niche, ສ້າງການຝັງ + ການດຶງຂໍ້ມູນຄືນ, ເພີ່ມ UI ທີ່ມີນ້ຳໜັກເບົາ.
-
ຕິດຕາມຄວາມໜ่วงເວລາ, ຄວາມຖືກຕ້ອງໃນຊຸດຖາມ-ຕອບທີ່ຖືກຍົກເລີກ, ແລະ ຄຳຕິຊົມຂອງຜູ້ໃຊ້.
-
ລວມເອົາພາກສ່ວນ “ກໍລະນີຄວາມລົ້ມເຫຼວ” ສັ້ນໆ.
-
-
ຮູບແບບວິໄສທັດທີ່ມີຂໍ້ຈຳກັດໃນການນຳໃຊ້ຕົວຈິງ
-
ຝຶກຕົວຈັດປະເພດ ຫຼື ເຄື່ອງກວດຈັບ, ໃຫ້ບໍລິການຜ່ານ FastAPI, ເກັບມ້ຽນດ້ວຍ Docker, ຂຽນວິທີການຂະຫຍາຍ. [5]
-
ການກວດຈັບການເລື່ອນຂອງເອກະສານ (ສະຖິຕິປະຊາກອນແບບງ່າຍໆກ່ຽວກັບຄຸນສົມບັດຕ່າງໆ ເປັນການເລີ່ມຕົ້ນທີ່ດີ).
-
-
ການສຶກສາກໍລະນີ AI ທີ່ມີຄວາມຮັບຜິດຊອບ
-
ເລືອກຊຸດຂໍ້ມູນສາທາລະນະທີ່ມີຄຸນສົມບັດທີ່ລະອຽດອ່ອນ. ເຮັດການຂຽນ metrics-and-mitigations ທີ່ສອດຄ່ອງກັບຄຸນສົມບັດ NIST (ຄວາມຖືກຕ້ອງ, ຄວາມໜ້າເຊື່ອຖື, ຄວາມຍຸຕິທຳ). [1]
-
ແຕ່ລະໂຄງການຕ້ອງການ: README 1 ໜ້າ, ແຜນວາດ, ສະຄຣິບທີ່ສາມາດສຳເນົາໄດ້, ແລະ changelog ຂະໜາດນ້ອຍ. ເພີ່ມ emoji ແບບພິເສດເພາະວ່າມະນຸດກໍ່ອ່ານສິ່ງເຫຼົ່ານີ້ຄືກັນ 🙂
MLOps, ການນຳໃຊ້, ແລະ ສ່ວນທີ່ບໍ່ມີໃຜສອນເຈົ້າ 🚢
ການຂົນສົ່ງແມ່ນທັກສະ. ການໄຫຼວຽນໜ້ອຍທີ່ສຸດ:
-
ເປັນຄອນເທນເນີ ດ້ວຍ Docker ສະນັ້ນ dev ≈ prod. ເລີ່ມຕົ້ນດ້ວຍເອກະສານເລີ່ມຕົ້ນຢ່າງເປັນທາງການ; ຍ້າຍໄປທີ່ Compose ສຳລັບການຕັ້ງຄ່າຫຼາຍບໍລິການ. [5]
-
ຕິດຕາມການທົດລອງ (ແມ່ນແຕ່ຢູ່ໃນທ້ອງຖິ່ນ). ພາລາມິເຕີ, ຕົວຊີ້ວັດ, ສິ່ງປະດິດ ແລະ ແທັກ "ຜູ້ຊະນະ" ເຮັດໃຫ້ການກຳຈັດມີຄວາມຊື່ສັດ ແລະ ການຮ່ວມມືເປັນໄປໄດ້.
-
ປະສານງານ ກັບ Kubernetes ເມື່ອທ່ານຕ້ອງການການຂະຫຍາຍ ຫຼື ການແຍກ. ຮຽນຮູ້ການນຳໃຊ້, ການບໍລິການ ແລະ ການຕັ້ງຄ່າການປະກາດກ່ອນ; ຕ້ານທານຄວາມຢາກທີ່ຈະໂກນໜວດ.
-
ເວລາເຮັດວຽກຂອງຄລາວ : Colab ສຳລັບການສ້າງຕົ້ນແບບ; ແພລດຟອມທີ່ມີການຈັດການ (SageMaker/Azure ML/Vertex) ເມື່ອທ່ານຜ່ານແອັບເຄື່ອງຫຼິ້ນ.
-
ຄວາມຮູ້ດ້ານ GPU : ທ່ານບໍ່ຈຳເປັນຕ້ອງຂຽນ CUDA kernels; ທ່ານຈຳເປັນຕ້ອງຮັບຮູ້ວ່າເວລາໃດທີ່ dataloader ເປັນຈຸດຄ້າງຂອງທ່ານ.
ຄຳປຽບທຽບທີ່ມີຂໍ້ບົກຜ່ອງນ້ອຍໆ: ລອງຄິດເຖິງ MLOps ຄືກັບອາຫານເຈ - ໃຫ້ມັນກິນດ້ວຍລະບົບອັດຕະໂນມັດ ແລະ ການຕິດຕາມກວດກາ, ຖ້າບໍ່ດັ່ງນັ້ນມັນຈະມີກິ່ນເໝັນ.
AI ທີ່ມີຄວາມຮັບຜິດຊອບແມ່ນຄູນ້ຳແຂ່ງຂັນຂອງເຈົ້າ 🛡️
ທີມງານຕ່າງໆຢູ່ພາຍໃຕ້ຄວາມກົດດັນທີ່ຕ້ອງພິສູດຄວາມໜ້າເຊື່ອຖື. ຖ້າທ່ານສາມາດສົນທະນາຢ່າງເປັນຮູບປະທຳກ່ຽວກັບຄວາມສ່ຽງ, ເອກະສານ ແລະ ການຄຸ້ມຄອງ, ທ່ານຈະກາຍເປັນບຸກຄົນທີ່ຜູ້ຄົນຕ້ອງການຢູ່ໃນຫ້ອງ.
-
ໃຊ້ຂອບການເຮັດວຽກທີ່ໄດ້ສ້າງຕັ້ງຂຶ້ນແລ້ວ : ວາງແຜນຂໍ້ກຳນົດຕ່າງໆໃຫ້ກັບຄຸນສົມບັດຂອງ NIST (ຄວາມຖືກຕ້ອງ, ຄວາມໜ້າເຊື່ອຖື, ຄວາມໂປ່ງໃສ, ຄວາມຍຸຕິທຳ), ຈາກນັ້ນປ່ຽນພວກມັນໃຫ້ເປັນລາຍການກວດສອບ ແລະ ເງື່ອນໄຂການຍອມຮັບໃນ PRs. [1]
-
ຍຶດໝັ້ນຫຼັກການຂອງທ່ານ : ຫຼັກການ AI ຂອງ OECD ເນັ້ນໜັກເຖິງສິດທິມະນຸດ ແລະ ຄຸນຄ່າປະຊາທິປະໄຕ - ມີປະໂຫຍດຫຼາຍເມື່ອປຶກສາຫາລືກ່ຽວກັບການແລກປ່ຽນ. [2]
-
ຈັນຍາບັນວິຊາຊີບ : ການຮັບຮູ້ສັ້ນໆກ່ຽວກັບລະຫັດຈັນຍາບັນໃນເອກະສານອອກແບບມັກຈະເປັນຄວາມແຕກຕ່າງລະຫວ່າງ “ພວກເຮົາຄິດກ່ຽວກັບມັນ” ແລະ “ພວກເຮົາໄດ້ເຮັດມັນຕາມໃຈ.”
ນີ້ບໍ່ແມ່ນຂັ້ນຕອນທີ່ເຂັ້ມງວດ. ມັນເປັນຝີມື.
ຊ່ຽວຊານໜ້ອຍໜຶ່ງ: ເລືອກເລນ ແລະ ຮຽນຮູ້ເຄື່ອງມືຂອງມັນ 🛣️
-
LLMs ແລະ NLP : ຂໍ້ຜິດພາດຂອງການໃຫ້ໂທເຄັນ, ປ່ອງຢ້ຽມບໍລິບົດ, RAG, ການປະເມີນຜົນນອກເໜືອຈາກ BLEU. ເລີ່ມຕົ້ນດ້ວຍທໍ່ສົ່ງຂໍ້ມູນລະດັບສູງ, ຈາກນັ້ນປັບແຕ່ງ.
-
ວິໄສທັດ : ການເພີ່ມຂໍ້ມູນ, ການຮັກສາສຸຂະອະນາໄມຂອງປ້າຍກຳກັບ, ແລະ ການນຳໃຊ້ໄປຍັງອຸປະກອນຂອບບ່ອນທີ່ຄວາມໜ่วงເວລາເປັນສິ່ງສຳຄັນ.
-
ຜູ້ແນະນຳ : ຄວາມແຕກຕ່າງຂອງຄຳຕິຊົມໂດຍປະນິປະນອມ, ຍຸດທະສາດການເລີ່ມຕົ້ນແບບເຢັນໆ, ແລະ KPI ທຸລະກິດທີ່ບໍ່ກົງກັບ RMSE.
-
ຕົວແທນ ແລະ ການໃຊ້ເຄື່ອງມື : ການເອີ້ນຟັງຊັນ, ການຖອດລະຫັດທີ່ຈຳກັດ, ແລະ ຮາວປ້ອງກັນຄວາມປອດໄພ.
ແທ້ຈິງແລ້ວ, ໃຫ້ເລືອກໂດເມນທີ່ເຮັດໃຫ້ເຈົ້າຢາກຮູ້ຢາກເຫັນໃນຕອນເຊົ້າວັນອາທິດ.
ຕາຕະລາງປຽບທຽບ: ເສັ້ນທາງສຳລັບວິທີການກາຍເປັນນັກພັດທະນາ AI 📊
| ເສັ້ນທາງ / ເຄື່ອງມື | ດີທີ່ສຸດສຳລັບ | ຄວາມຮູ້ສຶກກ່ຽວກັບຄ່າໃຊ້ຈ່າຍ | ເປັນຫຍັງມັນຈຶ່ງເຮັດວຽກ - ແລະເປັນເລື່ອງແປກ |
|---|---|---|---|
| ການຮຽນດ້ວຍຕົນເອງ + ການຝຶກຝົນຮຽນຮູ້ | ຜູ້ຮຽນທີ່ຂັບເຄື່ອນດ້ວຍຕົນເອງ | ແບບອິດສະຫຼະ | ພື້ນຖານທີ່ແຂງແກ່ນບວກກັບ API ທີ່ໃຊ້ໄດ້ຈິງໃນ scikit-learn; ເຈົ້າຈະຮຽນຮູ້ພື້ນຖານຫຼາຍເກີນໄປ (ເປັນສິ່ງທີ່ດີ). [3] |
| ບົດແນະນຳການໃຊ້ PyTorch | ຜູ້ທີ່ຮຽນຮູ້ໂດຍການຂຽນໂປຣແກຣມ | ຟຣີ | ເຮັດໃຫ້ທ່ານຝຶກໄດ້ໄວ; tensors + autograd mental model ຄລິກໄວ. [4] |
| ຫຼັກການພື້ນຖານຂອງ Docker | ຜູ້ຮັບເໝົາກໍ່ສ້າງທີ່ວາງແຜນທີ່ຈະສົ່ງສິນຄ້າ | ຟຣີ | ສະພາບແວດລ້ອມທີ່ສາມາດຜະລິດຄືນໃໝ່ໄດ້ ແລະ ສາມາດພົກພາໄດ້ງ່າຍ ຈະຊ່ວຍໃຫ້ທ່ານມີສະຕິດີໃນເດືອນທີສອງ; ຂຽນພາຍຫຼັງ. [5] |
| ຫຼັກສູດ + ໂຄງການວົງວຽນ | ຜູ້ທີ່ມີວິໄສທັດ ແລະ ປະຕິບັດຕົວຈິງ | ຟຣີ | ບົດຮຽນສັ້ນໆ + ບົດຮຽນຕົວຈິງ 1–2 ຄັ້ງ ດີກວ່າວິດີໂອແບບ passive 20 ຊົ່ວໂມງ. |
| ແພລດຟອມ ML ທີ່ມີການຈັດການ | ຜູ້ປະຕິບັດທີ່ມີເວລາຈຳກັດ | ແຕກຕ່າງກັນ | ແລກປ່ຽນ $ ເພື່ອຄວາມລຽບງ່າຍດ້ານພື້ນຖານ; ດີຫຼາຍເມື່ອທ່ານເກີນກວ່າແອັບເຄື່ອງຫຼິ້ນ. |
ແມ່ນແລ້ວ, ໄລຍະຫ່າງບໍ່ສະເໝີກັນໜ້ອຍໜຶ່ງ. ຕາຕະລາງຕົວຈິງບໍ່ຄ່ອຍສົມບູນແບບ.
ວົງວຽນການສຶກສາທີ່ຕິດຢູ່ແທ້ໆ 🔁
-
ຮອບວຽນສອງຊົ່ວໂມງ : ອ່ານເອກະສານ 20 ນາທີ, ຂຽນລະຫັດ 80 ນາທີ, ແລະ ຂຽນສິ່ງທີ່ເສຍຫາຍ 20 ນາທີ.
-
ການຂຽນໜ້າດຽວ : ຫຼັງຈາກແຕ່ລະໂຄງການຂະໜາດນ້ອຍ, ໃຫ້ອະທິບາຍການວາງກອບບັນຫາ, ຂໍ້ມູນພື້ນຖານ, ຕົວຊີ້ວັດ, ແລະ ຮູບແບບຄວາມລົ້ມເຫຼວ.
-
ຂໍ້ຈຳກັດໂດຍເຈດຕະນາ : ຝຶກອົບຮົມພຽງແຕ່ໃນ CPU, ຫຼືບໍ່ມີ libs ພາຍນອກສຳລັບການປະມວນຜົນກ່ອນ, ຫຼືງົບປະມານ 200 ແຖວຢ່າງແນ່ນອນ. ຂໍ້ຈຳກັດກໍ່ໃຫ້ເກີດຄວາມຄິດສ້າງສັນ, ບາງຢ່າງ.
-
ການແລ່ນເຈ້ຍ : ປະຕິບັດພຽງແຕ່ການສູນເສຍ ຫຼື ຕົວໂຫຼດຂໍ້ມູນ. ເຈົ້າບໍ່ຕ້ອງການ SOTA ເພື່ອຮຽນຮູ້ຫຼາຍຢ່າງ.
ຖ້າໂຟກັສຫຼົ້ມເຫຼວ, ມັນເປັນເລື່ອງປົກກະຕິ. ທຸກຄົນຈະສັ່ນຄອນ. ຍ່າງໄປຍ່າງມາ, ກັບມາ, ສົ່ງສິ່ງຂອງນ້ອຍໆ.
ການກຽມຕົວສຳພາດ, ຍົກເວັ້ນການສະແດງລະຄອນ 🎯
-
ຜົນງານກ່ອນ : repos ທີ່ແທ້ຈິງດີກວ່າ slide decks. ນຳໃຊ້ຢ່າງໜ້ອຍໜຶ່ງຕົວຢ່າງຂະໜາດນ້ອຍ.
-
ອະທິບາຍການແລກປ່ຽນ : ຈົ່ງກຽມພ້ອມທີ່ຈະອະທິບາຍທາງເລືອກຕົວຊີ້ວັດ ແລະ ວິທີທີ່ທ່ານຈະແກ້ໄຂຄວາມລົ້ມເຫຼວ.
-
ການຄິດແບບລະບົບ : ແຕ້ມຮູບຂໍ້ມູນ → ຮູບແບບ → API → ແຜນວາດຕິດຕາມກວດກາ ແລະ ບັນຍາຍມັນ.
-
AI ທີ່ມີຄວາມຮັບຜິດຊອບ : ຮັກສາລາຍການກວດສອບງ່າຍໆໃຫ້ສອດຄ່ອງກັບ NIST AI RMF - ມັນສະແດງເຖິງຄວາມເປັນຜູ້ໃຫຍ່, ບໍ່ແມ່ນຄຳສັບທີ່ນິຍົມ. [1]
-
ຄວາມຄ່ອງແຄ້ວຂອງຂອບການເຮັດວຽກ : ເລືອກຂອບການເຮັດວຽກໜຶ່ງ ແລະ ລະວັງມັນໃຫ້ດີ. ເອກະສານທາງການແມ່ນຍຸດຕິທຳໃນການສຳພາດ. [4]
ປຶ້ມແຕ່ງອາຫານນ້ອຍໆ: ໂຄງການທຳອິດຂອງເຈົ້າທີ່ຄົບວົງຈອນໃນທ້າຍອາທິດ 🍳
-
ຂໍ້ມູນ : ເລືອກຊຸດຂໍ້ມູນທີ່ສະອາດ.
-
ພື້ນຖານ : ຮູບແບບ scikit-learn ພ້ອມດ້ວຍການກວດສອບຄວາມຖືກຕ້ອງຂ້າມ; ບັນທຶກຕົວຊີ້ວັດພື້ນຖານ. [3]
-
DL ຜ່ານ : ໜ້າວຽກດຽວກັນໃນ PyTorch ຫຼື TensorFlow; ປຽບທຽບໝາກໂປມກັບໝາກໂປມ. [4]
-
ການຕິດຕາມ : ການດຳເນີນການບັນທຶກ (ເຖິງແມ່ນວ່າ CSV ງ່າຍໆ + ປະທັບເວລາ). ແທັກຜູ້ຊະນະ.
-
ໃຫ້ບໍລິການ : ຫໍ່ການຄາດຄະເນໃນເສັ້ນທາງ FastAPI, dockerize, ດໍາເນີນການໃນທ້ອງຖິ່ນ. [5]
-
ພິຈາລະນາຄືນ : ຕົວຊີ້ວັດໃດທີ່ສຳຄັນສຳລັບຜູ້ໃຊ້, ມີຄວາມສ່ຽງຫຍັງແດ່, ແລະ ສິ່ງທີ່ທ່ານຈະຕິດຕາມຫຼັງຈາກການເປີດຕົວ - ຢືມເງື່ອນໄຂຈາກ NIST AI RMF ເພື່ອຮັກສາມັນໃຫ້ຊັດເຈນ. [1]
ອັນນີ້ສົມບູນແບບບໍ? ບໍ່. ມັນດີກ່ວາການລໍຖ້າຫຼັກສູດທີ່ສົມບູນແບບບໍ? ແນ່ນອນ.
ອຸປະສັກທົ່ວໄປທີ່ທ່ານສາມາດຫຼີກລ່ຽງໄດ້ແຕ່ຫົວທີ ⚠️
-
ການປັບການຮຽນຮູ້ຂອງເຈົ້າໃຫ້ເຂົ້າກັບບົດຮຽນສອນຫຼາຍເກີນໄປ : ເລີ່ມຕົ້ນໄດ້ດີ, ແຕ່ຄວນປ່ຽນໄປຄິດເຖິງບັນຫາກ່ອນໄວໆນີ້.
-
ການຂ້າມການອອກແບບການປະເມີນຜົນ : ກຳນົດຄວາມສຳເລັດກ່ອນການຝຶກອົບຮົມ. ປະຢັດເວລາຫຼາຍຊົ່ວໂມງ.
-
ການບໍ່ສົນໃຈສັນຍາຂໍ້ມູນ : ການເລື່ອນຂອງໂຄງຮ່າງທຳລາຍລະບົບຫຼາຍກວ່າທີ່ຮູບແບບເຮັດ.
-
ຄວາມຢ້ານກົວຂອງການນຳໃຊ້ : Docker ເປັນມິດກວ່າທີ່ມັນເບິ່ງຄືວ່າ. ເລີ່ມຕົ້ນຈາກສິ່ງເລັກໆນ້ອຍໆ; ຍອມຮັບວ່າການສ້າງຄັ້ງທຳອິດຈະຫຍຸ້ງຍາກ. [5]
-
ຈັນຍາບັນຍັງຄົງຢູ່ : ໃສ່ມັນໃນພາຍຫຼັງ ແລະ ມັນຈະກາຍເປັນວຽກທີ່ຕ້ອງປະຕິບັດຕາມ. ເຮັດໃຫ້ມັນກາຍເປັນການອອກແບບ - ເບົາກວ່າ, ດີກວ່າ. [1][2]
TL;DR 🧡
ຖ້າທ່ານຈື່ໄດ້ສິ່ງໜຶ່ງ: ວິທີການກາຍເປັນນັກພັດທະນາ AI ບໍ່ແມ່ນກ່ຽວກັບການສະສົມທິດສະດີ ຫຼື ການໄລ່ຕາມຮູບແບບທີ່ເຫຼື້ອມເປັນເງົາ. ມັນກ່ຽວກັບການແກ້ໄຂບັນຫາທີ່ແທ້ຈິງຊ້ຳແລ້ວຊ້ຳອີກດ້ວຍວົງຈອນທີ່ແໜ້ນໜາ ແລະ ແນວຄິດທີ່ມີຄວາມຮັບຜິດຊອບ. ຮຽນຮູ້ຊຸດຂໍ້ມູນ, ເລືອກເຟຣມເວີກ DL ໜຶ່ງອັນ, ສົ່ງສິ່ງນ້ອຍໆດ້ວຍ Docker, ຕິດຕາມສິ່ງທີ່ທ່ານເຮັດ, ແລະ ຍຶດໝັ້ນທາງເລືອກຂອງທ່ານໃສ່ກັບຄຳແນະນຳທີ່ເຄົາລົບນັບຖືເຊັ່ນ NIST ແລະ OECD. ສ້າງໂຄງການນ້ອຍໆທີ່ໜ້າຮັກສາມໂຄງການ ແລະ ເວົ້າກ່ຽວກັບພວກມັນຄືກັບເພື່ອນຮ່ວມທີມ, ບໍ່ແມ່ນນັກວິເສດ. ນັ້ນແມ່ນມັນ - ສ່ວນຫຼາຍແມ່ນ.
ແລະແມ່ນແລ້ວ, ເວົ້າປະໂຫຍກນີ້ອອກມາດັງໆຖ້າມັນຊ່ວຍໄດ້: ຂ້ອຍຮູ້ວິທີທີ່ຈະກາຍເປັນນັກພັດທະນາ AI . ຈາກນັ້ນໄປພິສູດມັນດ້ວຍການຝຶກຝົນສ້າງຕົນເອງເປັນເວລາໜຶ່ງຊົ່ວໂມງໃນມື້ນີ້.
ເອກະສານອ້າງອີງ
[1] NIST. ຂອບການຄຸ້ມຄອງຄວາມສ່ຽງດ້ານປັນຍາປະດິດ (AI RMF 1.0) . (PDF) - ລິ້ງ
[2] OECD. ຫຼັກການ AI ຂອງ OECD - ພາບລວມ - ລິ້ງ
[3] scikit-learn. ຄູ່ມືຜູ້ໃຊ້ (ໝັ້ນຄົງ) - ລິ້ງ
4] PyTorch. ບົດແນະນຳ (ຮຽນຮູ້ພື້ນຖານ, ແລະອື່ນໆ) - ລິ້ງ
[5] Docker. ເລີ່ມຕົ້ນ - ລິ້ງ