ວິທີການກາຍເປັນນັກພັດທະນາ AI. ຂໍ້ມູນຫຍໍ້.

ເຈົ້າບໍ່ໄດ້ມາທີ່ນີ້ເພື່ອຄວາມລຶກລັບ. ເຈົ້າຕ້ອງການເສັ້ນທາງທີ່ຊັດເຈນສຳລັບ ວິທີການກາຍເປັນນັກພັດທະນາ AI ໂດຍບໍ່ຕ້ອງຈົມຢູ່ໃນແຖບທີ່ບໍ່ມີຂອບເຂດ, ແກງຄຳສັບສະເພາະ, ຫຼື ການວິເຄາະທີ່ບໍ່ເປັນອຳມະພາດ. ດີ. ຄູ່ມືນີ້ໃຫ້ແຜນທີ່ທັກສະ, ເຄື່ອງມືທີ່ສຳຄັນແທ້ໆ, ໂຄງການທີ່ໄດ້ຮັບການໂທກັບຄືນ, ແລະ ນິໄສທີ່ແຍກການສ້ອມແປງອອກຈາກການຂົນສົ່ງ. ມາເລີ່ມສ້າງກັນເລີຍ.

ບົດຄວາມທີ່ທ່ານອາດຈະຢາກອ່ານຫຼັງຈາກບົດຄວາມນີ້:

🔗 ວິທີການເລີ່ມຕົ້ນບໍລິສັດ AI
ຄູ່ມືແນະນຳແບບເທື່ອລະຂັ້ນຕອນໃນການສ້າງ, ການສະໜອງທຶນ ແລະ ການເປີດຕົວບໍລິສັດ startup AI ຂອງທ່ານ.

🔗 ວິທີການສ້າງ AI ໃນຄອມພິວເຕີຂອງທ່ານ
ຮຽນຮູ້ການສ້າງ, ຝຶກອົບຮົມ ແລະ ນຳໃຊ້ຮູບແບບ AI ໃນທ້ອງຖິ່ນໄດ້ຢ່າງງ່າຍດາຍ.

🔗 ວິທີການສ້າງຮູບແບບ AI
ການແບ່ງແຍກຢ່າງຄົບຖ້ວນຂອງການສ້າງແບບຈຳລອງ AI ຕັ້ງແຕ່ແນວຄວາມຄິດຈົນເຖິງການນຳໃຊ້.

🔗 AI ທີ່ເປັນສັນຍາລັກແມ່ນຫຍັງ
ສຳຫຼວດວິທີການເຮັດວຽກຂອງ AI ແບບສັນຍາລັກ ແລະ ເປັນຫຍັງມັນຍັງມີຄວາມສຳຄັນຈົນເຖິງທຸກມື້ນີ້.

ສິ່ງທີ່ເຮັດໃຫ້ນັກພັດທະນາ AI ທີ່ດີເລີດ✅

ນັກພັດທະນາ AI ທີ່ດີບໍ່ແມ່ນຄົນທີ່ຈື່ຈຳທຸກໆຕົວເພີ່ມປະສິດທິພາບ. ແຕ່ແມ່ນຄົນທີ່ສາມາດແກ້ໄຂບັນຫາທີ່ບໍ່ຊັດເຈນ, ວາງກອບມັນ, ເຊື່ອມຕໍ່ຂໍ້ມູນ ແລະ ແບບຈຳລອງເຂົ້າກັນ, ສົ່ງສິ່ງທີ່ເຮັດວຽກໄດ້, ວັດແທກມັນຢ່າງຊື່ສັດ, ແລະ ເຮັດຊ້ຳໆໂດຍບໍ່ມີບັນຫາ. ຕົວຢ່າງບາງຢ່າງ:

ຄວາມສະດວກສະບາຍກັບວົງຈອນທັງໝົດ: ຂໍ້ມູນ → ຮູບແບບ → ການປະເມີນຜົນ → ການນຳໃຊ້ → ຕິດຕາມກວດກາ.
ມີອະຄະຕິໃນການທົດລອງຢ່າງວ່ອງໄວຫຼາຍກວ່າທິດສະດີທີ່ບໍລິສຸດ... ດ້ວຍທິດສະດີທີ່ພຽງພໍທີ່ຈະຫຼີກລ່ຽງກັບດັກທີ່ຊັດເຈນ.
ຜົນງານທີ່ພິສູດວ່າທ່ານສາມາດສົ່ງຜົນໄດ້ຮັບ, ບໍ່ພຽງແຕ່ປື້ມບັນທຶກເທົ່ານັ້ນ.
ແນວຄິດທີ່ມີຄວາມຮັບຜິດຊອບກ່ຽວກັບຄວາມສ່ຽງ, ຄວາມເປັນສ່ວນຕົວ, ແລະ ຄວາມຍຸຕິທຳ - ບໍ່ແມ່ນການປະຕິບັດຕົວຈິງ, ແຕ່ເປັນການປະຕິບັດໄດ້ຈິງ. ໂຄງສ້າງພື້ນຖານຂອງອຸດສາຫະກຳເຊັ່ນ: ຂອບການຄຸ້ມຄອງຄວາມສ່ຽງ AI ຂອງ NIST ແລະ ຫຼັກການ AI ຂອງ OECD ຊ່ວຍໃຫ້ທ່ານເວົ້າພາສາດຽວກັນກັບຜູ້ທົບທວນ ແລະ ຜູ້ມີສ່ວນຮ່ວມ. [1][2]

ຄຳສາລະພາບເລັກນ້ອຍ: ບາງຄັ້ງເຈົ້າອາດຈະສົ່ງຕົວແບບໜຶ່ງໄປໃຫ້ ແລະ ຫຼັງຈາກນັ້ນກໍ່ຮູ້ວ່າສິ່ງສຳຄັນທີ່ສຸດແມ່ນໄຊຊະນະ. ຄວາມຖ່ອມຕົວນັ້ນ - ແປກປະຫຼາດ - ເປັນພະລັງວິເສດ.

ບົດຄວາມສັ້ນໆ: ທີມງານໄດ້ສ້າງຕົວຈັດປະເພດທີ່ທັນສະໄໝສຳລັບການຄັດແຍກການສະໜັບສະໜູນ; ກົດລະບຽບຄຳຫລັກພື້ນຖານໄດ້ເອົາຊະນະມັນໃນເວລາຕອບສະໜອງຄັ້ງທຳອິດ. ພວກເຂົາຮັກສາກົດລະບຽບ, ໃຊ້ຮູບແບບສຳລັບກໍລະນີຂອບ, ແລະສົ່ງມອບທັງສອງຢ່າງ. ເວດມົນໜ້ອຍລົງ, ຜົນໄດ້ຮັບຫຼາຍຂຶ້ນ.

ແຜນທີ່ເສັ້ນທາງສຳລັບວິທີການກາຍເປັນນັກພັດທະນາ AI 🗺️

ນີ້ແມ່ນເສັ້ນທາງທີ່ຊ້ຳໆ ແລະ ບໍ່ຊ້ຳກັນ. ວົນຊ້ຳອີກສອງສາມເທື່ອເມື່ອທ່ານເລື່ອນລະດັບ:

ຄວາມຄ່ອງແຄ້ວໃນການຂຽນໂປຣແກຣມ ໃນ Python ບວກກັບ DS libs ຫຼັກ: NumPy, pandas, scikit-learn. ອ່ານຄູ່ມືຢ່າງເປັນທາງການແບບອ່ານຜ່ານໆ ແລະ ຈາກນັ້ນສ້າງສະຄຣິບນ້ອຍໆຈົນກວ່ານິ້ວມືຂອງທ່ານຈະຮູ້. ຄູ່ມືຜູ້ໃຊ້ ເປັນສອງແບບປຶ້ມແບບຮຽນທີ່ໃຊ້ໄດ້ຈິງຢ່າງໜ້າປະຫຼາດໃຈ. [3]
ພື້ນຖານ ML ຜ່ານຫຼັກສູດທີ່ມີໂຄງສ້າງ: ຮູບແບບເສັ້ນຊື່, ການເຮັດໃຫ້ເປັນລະບຽບ, ການກວດສອບຄວາມຖືກຕ້ອງຂ້າມ, ຕົວຊີ້ວັດຕ່າງໆ. ບັນທຶກການບັນຍາຍແບບຄລາສສິກ ແລະ ຫຼັກສູດການປະຕິບັດຕົວຈິງປະສົມປະສານກັນໄດ້ດີ.
ເຄື່ອງມືການຮຽນຮູ້ເລິກ: ເລືອກ PyTorch ຫຼື TensorFlow ແລະຮຽນຮູ້ພຽງພໍທີ່ຈະຝຶກອົບຮົມ, ບັນທຶກ ແລະ ໂຫຼດຮູບແບບຕ່າງໆ; ຈັດການຊຸດຂໍ້ມູນ; ແລະ ແກ້ໄຂຂໍ້ຜິດພາດຮູບຮ່າງທົ່ວໄປ. ເລີ່ມຕົ້ນດ້ວຍ ບົດແນະນຳ PyTorch ຖ້າທ່ານມັກ "ລະຫັດກ່ອນ." [4]
ໂຄງການທີ່ຈັດສົ່ງຕົວຈິງ: ແພັກເກດດ້ວຍ Docker, ຕິດຕາມການແລ່ນ (ເຖິງແມ່ນວ່າບັນທຶກ CSV ກໍ່ບໍ່ມີຫຍັງດີກວ່າ), ແລະ ນຳໃຊ້ API ຂະໜາດນ້ອຍທີ່ສຸດ. ຮຽນຮູ້ Kubernetes ເມື່ອທ່ານພັດທະນາເກີນກວ່າການນຳໃຊ້ກ່ອງດຽວ; Docker ກ່ອນ. [5]
ຊັ້ນ AI ທີ່ມີຄວາມຮັບຜິດຊອບ: ຮັບຮອງເອົາບັນຊີກວດສອບຄວາມສ່ຽງທີ່ມີນ້ຳໜັກເບົາທີ່ໄດ້ຮັບແຮງບັນດານໃຈຈາກ NIST/OECD (ຄວາມຖືກຕ້ອງ, ຄວາມໜ້າເຊື່ອຖື, ຄວາມໂປ່ງໃສ, ຄວາມຍຸຕິທຳ). ມັນເຮັດໃຫ້ການສົນທະນາເປັນຮູບປະທຳ ແລະ ການກວດສອບເປັນຕາເບື່ອ (ໃນທາງທີ່ດີ). [1][2]
ຊ່ຽວຊານດ້ານນີ້ໜ້ອຍໜຶ່ງ: NLP ກັບ Transformers, ວິໄສທັດກັບການສົນທະນາ/ViTs ທີ່ທັນສະໄໝ, ຜູ້ແນະນຳ, ຫຼື ແອັບ ແລະ ຕົວແທນ LLM. ເລືອກຊ່ອງທາງໜຶ່ງ, ສ້າງໂຄງການຂະໜາດນ້ອຍສອງໂຄງການ, ຈາກນັ້ນຂະຫຍາຍສາຂາ.

ເຈົ້າຈະກັບຄືນໄປເຮັດຂັ້ນຕອນທີ 2–6 ຕະຫຼອດໄປ. ແທ້ໆແລ້ວ, ນັ້ນແມ່ນໜ້າທີ່.

ຊຸດທັກສະທີ່ເຈົ້າຈະໃຊ້ຕົວຈິງໃນແຕ່ລະມື້ 🧰

Python + Data wrangling: ການແບ່ງ array, joins, groupbys, vectorization. ຖ້າທ່ານສາມາດເຮັດໃຫ້ໝີແພນດ້າເຕັ້ນໄດ້, ການຝຶກອົບຮົມຈະງ່າຍຂຶ້ນ ແລະ ການປະເມີນຜົນກໍ່ສະອາດກວ່າ.
Core ML: ການແບ່ງການທົດສອບລະຫວ່າງການຝຶກອົບຮົມ, ການຫຼີກລ່ຽງການຮົ່ວໄຫຼ, ການຮູ້ໜັງສືຕົວຊີ້ວັດ. ຄູ່ມື Scikit-learn ແມ່ນໜຶ່ງໃນບົດເລື່ອງທີ່ດີທີ່ສຸດຢ່າງງຽບໆ. [3]
ກອບ DL: ເລືອກອັນໜຶ່ງ, ເຮັດໃຫ້ການເຮັດວຽກແບບ end-to-end, ຈາກນັ້ນເບິ່ງອີກອັນໜຶ່ງໃນພາຍຫຼັງ. ເອກະສານຂອງ PyTorch ເຮັດໃຫ້ຮູບແບບທາງຈິດໃຈຊັດເຈນ. [4]
ສຸຂະອະນາໄມໃນການທົດລອງ: ການແລ່ນຕາມເສັ້ນທາງ, ພາລາມິເຕີ, ແລະ ສິ່ງປະດິດ. ອະນາຄົດ-ເຈົ້າກຽດຊັງໂບຮານຄະດີ.
ການຈັດລຽງ ແລະ ການຈັດການ: Docker ເພື່ອຈັດແພັກເກດ stack ຂອງທ່ານ; Kubernetes ເມື່ອທ່ານຕ້ອງການການສຳເນົາ, ການຂະຫຍາຍອັດຕະໂນມັດ, ແລະ ການອັບເດດແບບມ້ວນ. ເລີ່ມຕົ້ນທີ່ນີ້. [5]
ພື້ນຖານຂອງ GPU: ຮູ້ວ່າເວລາໃດຄວນເຊົ່າ, ຂະໜາດຂອງ batch ມີຜົນກະທົບຕໍ່ throughput ແນວໃດ, ແລະເປັນຫຍັງບາງ opers ຈຶ່ງຖືກຜູກມັດດ້ວຍໜ່ວຍຄວາມຈຳ.
AI ທີ່ມີຄວາມຮັບຜິດຊອບ: ບັນທຶກແຫຼ່ງຂໍ້ມູນ, ປະເມີນຄວາມສ່ຽງ, ແລະວາງແຜນການຫຼຸດຜ່ອນຜົນກະທົບໂດຍໃຊ້ຄຸນສົມບັດທີ່ຊັດເຈນ (ຄວາມຖືກຕ້ອງ, ຄວາມໜ້າເຊື່ອຖື, ຄວາມໂປ່ງໃສ, ຄວາມຍຸຕິທຳ). [1]

ຫຼັກສູດເລີ່ມຕົ້ນ: ລິ້ງບໍ່ຫຼາຍປານໃດທີ່ເກີນນ້ຳໜັກຂອງມັນ 🔗

ພື້ນຖານ ML: ຊຸດບັນທຶກທີ່ເນັ້ນທິດສະດີຫຼາຍ + ຫຼັກສູດປະຕິບັດຕົວຈິງ. ຈັບຄູ່ພວກມັນກັບການຝຶກຝົນໃນ Scikit-learn. [3]
Frameworks: ບົດແນະນຳ PyTorch (ຫຼື ຄູ່ມື TensorFlow ຖ້າທ່ານມັກ Keras). [4]
ສິ່ງຈຳເປັນດ້ານວິທະຍາສາດຂໍ້ມູນ : ຄູ່ມືຜູ້ໃຊ້ ຂອງ scikit-learn ເພື່ອນຳໃຊ້ຕົວຊີ້ວັດ, ທໍ່ສົ່ງຂໍ້ມູນ ແລະ ການປະເມີນຜົນພາຍໃນ. [3]
ການຂົນສົ່ງ : ເສັ້ນທາງ ເລີ່ມຕົ້ນ ຂອງ Docker ສະນັ້ນ "ເຮັດວຽກຢູ່ໃນເຄື່ອງຂອງຂ້ອຍ" ຈຶ່ງກາຍເປັນ "ເຮັດວຽກໄດ້ທຸກບ່ອນ." [5]

ບຸກມາກສິ່ງເຫຼົ່ານີ້. ເມື່ອຕິດຂັດ, ໃຫ້ອ່ານໜ້າໜຶ່ງ, ລອງສິ່ງໜຶ່ງ, ແລະ ເຮັດຊ້ຳອີກ.

ສາມໂຄງການພອດໂຟລິໂອທີ່ໄດ້ຮັບການສຳພາດ📁

ການຕອບຄຳຖາມທີ່ເພີ່ມຂຶ້ນໂດຍການດຶງຂໍ້ມູນຄືນໃນຊຸດຂໍ້ມູນຂອງທ່ານເອງ
- ຂູດ/ນຳເຂົ້າພື້ນຖານຄວາມຮູ້ແບບ niche, ສ້າງການຝັງ + ການດຶງຂໍ້ມູນຄືນ, ເພີ່ມ UI ທີ່ມີນ້ຳໜັກເບົາ.
- ຕິດຕາມຄວາມໜ่วงເວລາ, ຄວາມຖືກຕ້ອງໃນຊຸດຖາມ-ຕອບທີ່ຖືກຍົກເລີກ, ແລະ ຄຳຕິຊົມຂອງຜູ້ໃຊ້.
- ລວມເອົາພາກສ່ວນ “ກໍລະນີຄວາມລົ້ມເຫຼວ” ສັ້ນໆ.
ຮູບແບບວິໄສທັດທີ່ມີຂໍ້ຈຳກັດໃນການນຳໃຊ້ຕົວຈິງ
- ຝຶກຕົວຈັດປະເພດ ຫຼື ເຄື່ອງກວດຈັບ, ໃຫ້ບໍລິການຜ່ານ FastAPI, ເກັບມ້ຽນດ້ວຍ Docker, ຂຽນວິທີການຂະຫຍາຍ. [5]
- ການກວດຈັບການເລື່ອນຂອງເອກະສານ (ສະຖິຕິປະຊາກອນແບບງ່າຍໆກ່ຽວກັບຄຸນສົມບັດຕ່າງໆ ເປັນການເລີ່ມຕົ້ນທີ່ດີ).
ການສຶກສາກໍລະນີ AI ທີ່ມີຄວາມຮັບຜິດຊອບ
- ເລືອກຊຸດຂໍ້ມູນສາທາລະນະທີ່ມີຄຸນສົມບັດທີ່ລະອຽດອ່ອນ. ເຮັດການຂຽນ metrics-and-mitigations ທີ່ສອດຄ່ອງກັບຄຸນສົມບັດ NIST (ຄວາມຖືກຕ້ອງ, ຄວາມໜ້າເຊື່ອຖື, ຄວາມຍຸຕິທຳ). [1]

ແຕ່ລະໂຄງການຕ້ອງການ: README 1 ໜ້າ, ແຜນວາດ, ສະຄຣິບທີ່ສາມາດສຳເນົາໄດ້, ແລະ changelog ຂະໜາດນ້ອຍ. ເພີ່ມ emoji ແບບພິເສດເພາະວ່າມະນຸດກໍ່ອ່ານສິ່ງເຫຼົ່ານີ້ຄືກັນ 🙂

MLOps, ການນຳໃຊ້, ແລະ ສ່ວນທີ່ບໍ່ມີໃຜສອນເຈົ້າ 🚢

ການຂົນສົ່ງແມ່ນທັກສະ. ການໄຫຼວຽນໜ້ອຍທີ່ສຸດ:

ເປັນຄອນເທນເນີ ດ້ວຍ Docker ສະນັ້ນ dev ≈ prod. ເລີ່ມຕົ້ນດ້ວຍເອກະສານເລີ່ມຕົ້ນຢ່າງເປັນທາງການ; ຍ້າຍໄປທີ່ Compose ສຳລັບການຕັ້ງຄ່າຫຼາຍບໍລິການ. [5]
ຕິດຕາມການທົດລອງ (ແມ່ນແຕ່ຢູ່ໃນທ້ອງຖິ່ນ). ພາລາມິເຕີ, ຕົວຊີ້ວັດ, ສິ່ງປະດິດ ແລະ ແທັກ "ຜູ້ຊະນະ" ເຮັດໃຫ້ການກຳຈັດມີຄວາມຊື່ສັດ ແລະ ການຮ່ວມມືເປັນໄປໄດ້.
ປະສານງານ ກັບ Kubernetes ເມື່ອທ່ານຕ້ອງການການຂະຫຍາຍ ຫຼື ການແຍກ. ຮຽນຮູ້ການນຳໃຊ້, ການບໍລິການ ແລະ ການຕັ້ງຄ່າການປະກາດກ່ອນ; ຕ້ານທານຄວາມຢາກທີ່ຈະໂກນໜວດ.
ເວລາເຮັດວຽກຂອງຄລາວ: Colab ສຳລັບການສ້າງຕົ້ນແບບ; ແພລດຟອມທີ່ມີການຈັດການ (SageMaker/Azure ML/Vertex) ເມື່ອທ່ານຜ່ານແອັບເຄື່ອງຫຼິ້ນ.
ຄວາມຮູ້ດ້ານ GPU: ທ່ານບໍ່ຈຳເປັນຕ້ອງຂຽນ CUDA kernels; ທ່ານຈຳເປັນຕ້ອງຮັບຮູ້ວ່າເວລາໃດທີ່ dataloader ເປັນຈຸດຄ້າງຂອງທ່ານ.

ຄຳປຽບທຽບທີ່ມີຂໍ້ບົກຜ່ອງນ້ອຍໆ: ລອງຄິດເຖິງ MLOps ຄືກັບອາຫານເຈ - ໃຫ້ມັນກິນດ້ວຍລະບົບອັດຕະໂນມັດ ແລະ ການຕິດຕາມກວດກາ, ຖ້າບໍ່ດັ່ງນັ້ນມັນຈະມີກິ່ນເໝັນ.

AI ທີ່ມີຄວາມຮັບຜິດຊອບແມ່ນຄູນ້ຳແຂ່ງຂັນຂອງເຈົ້າ 🛡️

ທີມງານຕ່າງໆຢູ່ພາຍໃຕ້ຄວາມກົດດັນທີ່ຕ້ອງພິສູດຄວາມໜ້າເຊື່ອຖື. ຖ້າທ່ານສາມາດສົນທະນາຢ່າງເປັນຮູບປະທຳກ່ຽວກັບຄວາມສ່ຽງ, ເອກະສານ ແລະ ການຄຸ້ມຄອງ, ທ່ານຈະກາຍເປັນບຸກຄົນທີ່ຜູ້ຄົນຕ້ອງການຢູ່ໃນຫ້ອງ.

ໃຊ້ຂອບການເຮັດວຽກທີ່ໄດ້ສ້າງຕັ້ງຂຶ້ນແລ້ວ: ວາງແຜນຂໍ້ກຳນົດຕ່າງໆໃຫ້ກັບຄຸນສົມບັດຂອງ NIST (ຄວາມຖືກຕ້ອງ, ຄວາມໜ້າເຊື່ອຖື, ຄວາມໂປ່ງໃສ, ຄວາມຍຸຕິທຳ), ຈາກນັ້ນປ່ຽນພວກມັນໃຫ້ເປັນລາຍການກວດສອບ ແລະ ເງື່ອນໄຂການຍອມຮັບໃນ PRs. [1]
ຍຶດໝັ້ນຫຼັກການຂອງທ່ານ: ຫຼັກການ AI ຂອງ OECD ເນັ້ນໜັກເຖິງສິດທິມະນຸດ ແລະ ຄຸນຄ່າປະຊາທິປະໄຕ - ມີປະໂຫຍດຫຼາຍເມື່ອປຶກສາຫາລືກ່ຽວກັບການແລກປ່ຽນ. [2]
ຈັນຍາບັນວິຊາຊີບ: ການຮັບຮູ້ສັ້ນໆກ່ຽວກັບລະຫັດຈັນຍາບັນໃນເອກະສານອອກແບບມັກຈະເປັນຄວາມແຕກຕ່າງລະຫວ່າງ “ພວກເຮົາຄິດກ່ຽວກັບມັນ” ແລະ “ພວກເຮົາໄດ້ເຮັດມັນຕາມໃຈ.”

ນີ້ບໍ່ແມ່ນຂັ້ນຕອນທີ່ເຂັ້ມງວດ. ມັນເປັນຝີມື.

ຊ່ຽວຊານໜ້ອຍໜຶ່ງ: ເລືອກເລນ ແລະ ຮຽນຮູ້ເຄື່ອງມືຂອງມັນ 🛣️

LLMs ແລະ NLP: ຂໍ້ຜິດພາດຂອງການໃຫ້ໂທເຄັນ, ປ່ອງຢ້ຽມບໍລິບົດ, RAG, ການປະເມີນຜົນນອກເໜືອຈາກ BLEU. ເລີ່ມຕົ້ນດ້ວຍທໍ່ສົ່ງຂໍ້ມູນລະດັບສູງ, ຈາກນັ້ນປັບແຕ່ງ.
ວິໄສທັດ: ການເພີ່ມຂໍ້ມູນ, ການຮັກສາສຸຂະອະນາໄມຂອງປ້າຍກຳກັບ, ແລະ ການນຳໃຊ້ໄປຍັງອຸປະກອນຂອບບ່ອນທີ່ຄວາມໜ่วงເວລາເປັນສິ່ງສຳຄັນ.
ຜູ້ແນະນຳ: ຄວາມແຕກຕ່າງຂອງຄຳຕິຊົມໂດຍປະນິປະນອມ, ຍຸດທະສາດການເລີ່ມຕົ້ນແບບເຢັນໆ, ແລະ KPI ທຸລະກິດທີ່ບໍ່ກົງກັບ RMSE.
ຕົວແທນ ແລະ ການໃຊ້ເຄື່ອງມື: ການເອີ້ນຟັງຊັນ, ການຖອດລະຫັດທີ່ຈຳກັດ, ແລະ ຮາວປ້ອງກັນຄວາມປອດໄພ.

ແທ້ຈິງແລ້ວ, ໃຫ້ເລືອກໂດເມນທີ່ເຮັດໃຫ້ເຈົ້າຢາກຮູ້ຢາກເຫັນໃນຕອນເຊົ້າວັນອາທິດ.

ຕາຕະລາງປຽບທຽບ: ເສັ້ນທາງສຳລັບວິທີການກາຍເປັນນັກພັດທະນາ AI 📊

ເສັ້ນທາງ / ເຄື່ອງມື	ດີທີ່ສຸດສຳລັບ	ຄວາມຮູ້ສຶກກ່ຽວກັບຄ່າໃຊ້ຈ່າຍ	ເປັນຫຍັງມັນຈຶ່ງເຮັດວຽກ - ແລະເປັນເລື່ອງແປກ
ການຮຽນດ້ວຍຕົນເອງ + ການຝຶກຝົນຮຽນຮູ້	ຜູ້ຮຽນທີ່ຂັບເຄື່ອນດ້ວຍຕົນເອງ	ແບບອິດສະຫຼະ	ພື້ນຖານທີ່ແຂງແກ່ນບວກກັບ API ທີ່ໃຊ້ໄດ້ຈິງໃນ scikit-learn; ເຈົ້າຈະຮຽນຮູ້ພື້ນຖານຫຼາຍເກີນໄປ (ເປັນສິ່ງທີ່ດີ). [3]
ບົດແນະນຳການໃຊ້ PyTorch	ຜູ້ທີ່ຮຽນຮູ້ໂດຍການຂຽນໂປຣແກຣມ	ຟຣີ	ເຮັດໃຫ້ທ່ານຝຶກໄດ້ໄວ; tensors + autograd mental model ຄລິກໄວ. [4]
ຫຼັກການພື້ນຖານຂອງ Docker	ຜູ້ຮັບເໝົາກໍ່ສ້າງທີ່ວາງແຜນທີ່ຈະສົ່ງສິນຄ້າ	ຟຣີ	ສະພາບແວດລ້ອມທີ່ສາມາດຜະລິດຄືນໃໝ່ໄດ້ ແລະ ສາມາດພົກພາໄດ້ງ່າຍ ຈະຊ່ວຍໃຫ້ທ່ານມີສະຕິດີໃນເດືອນທີສອງ; ຂຽນພາຍຫຼັງ. [5]
ຫຼັກສູດ + ໂຄງການວົງວຽນ	ຜູ້ທີ່ມີວິໄສທັດ ແລະ ປະຕິບັດຕົວຈິງ	ຟຣີ	ບົດຮຽນສັ້ນໆ + ບົດຮຽນຕົວຈິງ 1–2 ຄັ້ງ ດີກວ່າວິດີໂອແບບ passive 20 ຊົ່ວໂມງ.
ແພລດຟອມ ML ທີ່ມີການຈັດການ	ຜູ້ປະຕິບັດທີ່ມີເວລາຈຳກັດ	ແຕກຕ່າງກັນ	ແລກປ່ຽນ $ ເພື່ອຄວາມລຽບງ່າຍດ້ານພື້ນຖານ; ດີຫຼາຍເມື່ອທ່ານເກີນກວ່າແອັບເຄື່ອງຫຼິ້ນ.

ແມ່ນແລ້ວ, ໄລຍະຫ່າງບໍ່ສະເໝີກັນໜ້ອຍໜຶ່ງ. ຕາຕະລາງຕົວຈິງບໍ່ຄ່ອຍສົມບູນແບບ.

ວົງວຽນການສຶກສາທີ່ຕິດຢູ່ແທ້ໆ 🔁

ຮອບວຽນສອງຊົ່ວໂມງ: ອ່ານເອກະສານ 20 ນາທີ, ຂຽນລະຫັດ 80 ນາທີ, ແລະ ຂຽນສິ່ງທີ່ເສຍຫາຍ 20 ນາທີ.
ການຂຽນໜ້າດຽວ: ຫຼັງຈາກແຕ່ລະໂຄງການຂະໜາດນ້ອຍ, ໃຫ້ອະທິບາຍການວາງກອບບັນຫາ, ຂໍ້ມູນພື້ນຖານ, ຕົວຊີ້ວັດ, ແລະ ຮູບແບບຄວາມລົ້ມເຫຼວ.
ຂໍ້ຈຳກັດໂດຍເຈດຕະນາ: ຝຶກອົບຮົມພຽງແຕ່ໃນ CPU, ຫຼືບໍ່ມີ libs ພາຍນອກສຳລັບການປະມວນຜົນກ່ອນ, ຫຼືງົບປະມານ 200 ແຖວຢ່າງແນ່ນອນ. ຂໍ້ຈຳກັດກໍ່ໃຫ້ເກີດຄວາມຄິດສ້າງສັນ, ບາງຢ່າງ.
ການແລ່ນເຈ້ຍ: ປະຕິບັດພຽງແຕ່ການສູນເສຍ ຫຼື ຕົວໂຫຼດຂໍ້ມູນ. ເຈົ້າບໍ່ຕ້ອງການ SOTA ເພື່ອຮຽນຮູ້ຫຼາຍຢ່າງ.

ຖ້າໂຟກັສຫຼົ້ມເຫຼວ, ມັນເປັນເລື່ອງປົກກະຕິ. ທຸກຄົນຈະສັ່ນຄອນ. ຍ່າງໄປຍ່າງມາ, ກັບມາ, ສົ່ງສິ່ງຂອງນ້ອຍໆ.

ການກຽມຕົວສຳພາດ, ຍົກເວັ້ນການສະແດງລະຄອນ 🎯

ຜົນງານກ່ອນ: repos ທີ່ແທ້ຈິງດີກວ່າ slide decks. ນຳໃຊ້ຢ່າງໜ້ອຍໜຶ່ງຕົວຢ່າງຂະໜາດນ້ອຍ.
ອະທິບາຍການແລກປ່ຽນ: ຈົ່ງກຽມພ້ອມທີ່ຈະອະທິບາຍທາງເລືອກຕົວຊີ້ວັດ ແລະ ວິທີທີ່ທ່ານຈະແກ້ໄຂຄວາມລົ້ມເຫຼວ.
ການຄິດແບບລະບົບ: ແຕ້ມຮູບຂໍ້ມູນ → ຮູບແບບ → API → ແຜນວາດຕິດຕາມກວດກາ ແລະ ບັນຍາຍມັນ.
AI ທີ່ມີຄວາມຮັບຜິດຊອບ: ຮັກສາລາຍການກວດສອບງ່າຍໆໃຫ້ສອດຄ່ອງກັບ NIST AI RMF - ມັນສະແດງເຖິງຄວາມເປັນຜູ້ໃຫຍ່, ບໍ່ແມ່ນຄຳສັບທີ່ນິຍົມ. [1]
ຄວາມຄ່ອງແຄ້ວຂອງຂອບການເຮັດວຽກ: ເລືອກຂອບການເຮັດວຽກໜຶ່ງ ແລະ ລະວັງມັນໃຫ້ດີ. ເອກະສານທາງການແມ່ນຍຸດຕິທຳໃນການສຳພາດ. [4]

ປຶ້ມແຕ່ງອາຫານນ້ອຍໆ: ໂຄງການທຳອິດຂອງເຈົ້າທີ່ຄົບວົງຈອນໃນທ້າຍອາທິດ 🍳

ຂໍ້ມູນ: ເລືອກຊຸດຂໍ້ມູນທີ່ສະອາດ.
ພື້ນຖານ: ຮູບແບບ scikit-learn ພ້ອມດ້ວຍການກວດສອບຄວາມຖືກຕ້ອງຂ້າມ; ບັນທຶກຕົວຊີ້ວັດພື້ນຖານ. [3]
DL ຜ່ານ: ໜ້າວຽກດຽວກັນໃນ PyTorch ຫຼື TensorFlow; ປຽບທຽບໝາກໂປມກັບໝາກໂປມ. [4]
ການຕິດຕາມ: ການດຳເນີນການບັນທຶກ (ເຖິງແມ່ນວ່າ CSV ງ່າຍໆ + ປະທັບເວລາ). ແທັກຜູ້ຊະນະ.
ໃຫ້ບໍລິການ: ຫໍ່ການຄາດຄະເນໃນເສັ້ນທາງ FastAPI, dockerize, ດໍາເນີນການໃນທ້ອງຖິ່ນ. [5]
ພິຈາລະນາຄືນ: ຕົວຊີ້ວັດໃດທີ່ສຳຄັນສຳລັບຜູ້ໃຊ້, ມີຄວາມສ່ຽງຫຍັງແດ່, ແລະ ສິ່ງທີ່ທ່ານຈະຕິດຕາມຫຼັງຈາກການເປີດຕົວ - ຢືມເງື່ອນໄຂຈາກ NIST AI RMF ເພື່ອຮັກສາມັນໃຫ້ຊັດເຈນ. [1]

ອັນນີ້ສົມບູນແບບບໍ? ບໍ່. ມັນດີກ່ວາການລໍຖ້າຫຼັກສູດທີ່ສົມບູນແບບບໍ? ແນ່ນອນ.

ອຸປະສັກທົ່ວໄປທີ່ທ່ານສາມາດຫຼີກລ່ຽງໄດ້ແຕ່ຫົວທີ ⚠️

ການປັບການຮຽນຮູ້ຂອງເຈົ້າໃຫ້ເຂົ້າກັບບົດຮຽນສອນຫຼາຍເກີນໄປ: ເລີ່ມຕົ້ນໄດ້ດີ, ແຕ່ຄວນປ່ຽນໄປຄິດເຖິງບັນຫາກ່ອນໄວໆນີ້.
ການຂ້າມການອອກແບບການປະເມີນຜົນ: ກຳນົດຄວາມສຳເລັດກ່ອນການຝຶກອົບຮົມ. ປະຢັດເວລາຫຼາຍຊົ່ວໂມງ.
ການບໍ່ສົນໃຈສັນຍາຂໍ້ມູນ: ການເລື່ອນຂອງໂຄງຮ່າງທຳລາຍລະບົບຫຼາຍກວ່າທີ່ຮູບແບບເຮັດ.
ຄວາມຢ້ານກົວຂອງການນຳໃຊ້: Docker ເປັນມິດກວ່າທີ່ມັນເບິ່ງຄືວ່າ. ເລີ່ມຕົ້ນຈາກສິ່ງເລັກໆນ້ອຍໆ; ຍອມຮັບວ່າການສ້າງຄັ້ງທຳອິດຈະຫຍຸ້ງຍາກ. [5]
ຈັນຍາບັນຍັງຄົງຢູ່: ໃສ່ມັນໃນພາຍຫຼັງ ແລະ ມັນຈະກາຍເປັນວຽກທີ່ຕ້ອງປະຕິບັດຕາມ. ເຮັດໃຫ້ມັນກາຍເປັນການອອກແບບ - ເບົາກວ່າ, ດີກວ່າ. [1][2]

TL;DR 🧡

ຖ້າທ່ານຈື່ໄດ້ສິ່ງໜຶ່ງ: ວິທີການກາຍເປັນນັກພັດທະນາ AI ບໍ່ແມ່ນກ່ຽວກັບການສະສົມທິດສະດີ ຫຼື ການໄລ່ຕາມຮູບແບບທີ່ເຫຼື້ອມເປັນເງົາ. ມັນກ່ຽວກັບການແກ້ໄຂບັນຫາທີ່ແທ້ຈິງຊ້ຳແລ້ວຊ້ຳອີກດ້ວຍວົງຈອນທີ່ແໜ້ນໜາ ແລະ ແນວຄິດທີ່ມີຄວາມຮັບຜິດຊອບ. ຮຽນຮູ້ຊຸດຂໍ້ມູນ, ເລືອກເຟຣມເວີກ DL ໜຶ່ງອັນ, ສົ່ງສິ່ງນ້ອຍໆດ້ວຍ Docker, ຕິດຕາມສິ່ງທີ່ທ່ານເຮັດ, ແລະ ຍຶດໝັ້ນທາງເລືອກຂອງທ່ານໃສ່ກັບຄຳແນະນຳທີ່ເຄົາລົບນັບຖືເຊັ່ນ NIST ແລະ OECD. ສ້າງໂຄງການນ້ອຍໆທີ່ໜ້າຮັກສາມໂຄງການ ແລະ ເວົ້າກ່ຽວກັບພວກມັນຄືກັບເພື່ອນຮ່ວມທີມ, ບໍ່ແມ່ນນັກວິເສດ. ນັ້ນແມ່ນມັນ - ສ່ວນຫຼາຍແມ່ນ.

ແລະແມ່ນແລ້ວ, ເວົ້າປະໂຫຍກນີ້ອອກມາດັງໆຖ້າມັນຊ່ວຍໄດ້: ຂ້ອຍຮູ້ວິທີທີ່ຈະກາຍເປັນນັກພັດທະນາ AI. ຈາກນັ້ນໄປພິສູດມັນດ້ວຍການຝຶກຝົນສ້າງຕົນເອງເປັນເວລາໜຶ່ງຊົ່ວໂມງໃນມື້ນີ້.

ເອກະສານອ້າງອີງ

[1] NIST. ຂອບການຄຸ້ມຄອງຄວາມສ່ຽງດ້ານປັນຍາປະດິດ (AI RMF 1.0). (PDF) - ລິ້ງ
[2] OECD. ຫຼັກການ AI ຂອງ OECD - ພາບລວມ - ລິ້ງ
[3] scikit-learn. ຄູ່ມືຜູ້ໃຊ້ (ໝັ້ນຄົງ) - ລິ້ງ
4] PyTorch. ບົດແນະນຳ (ຮຽນຮູ້ພື້ນຖານ, ແລະອື່ນໆ) - ລິ້ງ
[5] Docker. ເລີ່ມຕົ້ນ - ລິ້ງ

ຊອກຫາ AI ລ່າສຸດໄດ້ທີ່ຮ້ານ AI Assistant ຢ່າງເປັນທາງການ

ກ່ຽວກັບພວກເຮົາ

ກັບໄປທີ່ບລັອກ