ວິທີການກາຍເປັນນັກພັດທະນາ AI

ວິທີການກາຍເປັນນັກພັດທະນາ AI. ຂໍ້ມູນຫຍໍ້.

ເຈົ້າບໍ່ໄດ້ມາທີ່ນີ້ເພື່ອຄວາມລຶກລັບ. ເຈົ້າຕ້ອງການເສັ້ນທາງທີ່ຊັດເຈນສຳລັບ ວິທີການກາຍເປັນນັກພັດທະນາ AI ໂດຍບໍ່ຕ້ອງຈົມຢູ່ໃນແຖບທີ່ບໍ່ມີຂອບເຂດ, ແກງຄຳສັບສະເພາະ, ຫຼື ການວິເຄາະທີ່ບໍ່ເປັນອຳມະພາດ. ດີ. ຄູ່ມືນີ້ໃຫ້ແຜນທີ່ທັກສະ, ເຄື່ອງມືທີ່ສຳຄັນແທ້ໆ, ໂຄງການທີ່ໄດ້ຮັບການໂທກັບຄືນ, ແລະ ນິໄສທີ່ແຍກການສ້ອມແປງອອກຈາກການຂົນສົ່ງ. ມາເລີ່ມສ້າງກັນເລີຍ.

ບົດຄວາມທີ່ທ່ານອາດຈະຢາກອ່ານຫຼັງຈາກບົດຄວາມນີ້:

🔗 ວິທີການເລີ່ມຕົ້ນບໍລິສັດ AI
ຄູ່ມືແນະນຳແບບເທື່ອລະຂັ້ນຕອນໃນການສ້າງ, ການສະໜອງທຶນ ແລະ ການເປີດຕົວບໍລິສັດ startup AI ຂອງທ່ານ.

🔗 ວິທີການສ້າງ AI ໃນຄອມພິວເຕີຂອງທ່ານ
ຮຽນຮູ້ການສ້າງ, ຝຶກອົບຮົມ ແລະ ນຳໃຊ້ຮູບແບບ AI ໃນທ້ອງຖິ່ນໄດ້ຢ່າງງ່າຍດາຍ.

🔗 ວິທີການສ້າງຮູບແບບ AI
ການແບ່ງແຍກຢ່າງຄົບຖ້ວນຂອງການສ້າງແບບຈຳລອງ AI ຕັ້ງແຕ່ແນວຄວາມຄິດຈົນເຖິງການນຳໃຊ້.

🔗 AI ທີ່ເປັນສັນຍາລັກແມ່ນຫຍັງ
ສຳຫຼວດວິທີການເຮັດວຽກຂອງ AI ແບບສັນຍາລັກ ແລະ ເປັນຫຍັງມັນຍັງມີຄວາມສຳຄັນຈົນເຖິງທຸກມື້ນີ້.


ສິ່ງທີ່ເຮັດໃຫ້ນັກພັດທະນາ AI ທີ່ດີເລີດ✅

ນັກພັດທະນາ AI ທີ່ດີບໍ່ແມ່ນຄົນທີ່ຈື່ຈຳທຸກໆຕົວເພີ່ມປະສິດທິພາບ. ແຕ່ແມ່ນຄົນທີ່ສາມາດແກ້ໄຂບັນຫາທີ່ບໍ່ຊັດເຈນ, ວາງກອບມັນ , ເຊື່ອມຕໍ່ຂໍ້ມູນ ແລະ ແບບຈຳລອງເຂົ້າກັນ, ສົ່ງສິ່ງທີ່ເຮັດວຽກໄດ້, ວັດແທກມັນຢ່າງຊື່ສັດ, ແລະ ເຮັດຊ້ຳໆໂດຍບໍ່ມີບັນຫາ. ຕົວຢ່າງບາງຢ່າງ:

  • ຄວາມສະດວກສະບາຍກັບວົງຈອນທັງໝົດ: ຂໍ້ມູນ → ຮູບແບບ → ການປະເມີນຜົນ → ການນຳໃຊ້ → ຕິດຕາມກວດກາ.

  • ມີອະຄະຕິໃນການທົດລອງຢ່າງວ່ອງໄວຫຼາຍກວ່າທິດສະດີທີ່ບໍລິສຸດ... ດ້ວຍທິດສະດີທີ່ພຽງພໍທີ່ຈະຫຼີກລ່ຽງກັບດັກທີ່ຊັດເຈນ.

  • ຜົນງານທີ່ພິສູດວ່າທ່ານສາມາດສົ່ງຜົນໄດ້ຮັບ, ບໍ່ພຽງແຕ່ປື້ມບັນທຶກເທົ່ານັ້ນ.

  • ແນວຄິດທີ່ມີຄວາມຮັບຜິດຊອບກ່ຽວກັບຄວາມສ່ຽງ, ຄວາມເປັນສ່ວນຕົວ, ແລະ ຄວາມຍຸຕິທຳ - ບໍ່ແມ່ນການປະຕິບັດຕົວຈິງ, ແຕ່ເປັນການປະຕິບັດໄດ້ຈິງ. ໂຄງສ້າງພື້ນຖານຂອງອຸດສາຫະກຳເຊັ່ນ: ຂອບການຄຸ້ມຄອງຄວາມສ່ຽງ AI ຂອງ NIST ແລະ ຫຼັກການ AI ຂອງ OECD ຊ່ວຍໃຫ້ທ່ານເວົ້າພາສາດຽວກັນກັບຜູ້ທົບທວນ ແລະ ຜູ້ມີສ່ວນຮ່ວມ. [1][2]

ຄຳສາລະພາບເລັກນ້ອຍ: ບາງຄັ້ງເຈົ້າອາດຈະສົ່ງຕົວແບບໜຶ່ງໄປໃຫ້ ແລະ ຫຼັງຈາກນັ້ນກໍ່ຮູ້ວ່າສິ່ງສຳຄັນທີ່ສຸດແມ່ນໄຊຊະນະ. ຄວາມຖ່ອມຕົວນັ້ນ - ແປກປະຫຼາດ - ເປັນພະລັງວິເສດ.

ບົດຄວາມສັ້ນໆ: ທີມງານໄດ້ສ້າງຕົວຈັດປະເພດທີ່ທັນສະໄໝສຳລັບການຄັດແຍກການສະໜັບສະໜູນ; ກົດລະບຽບຄຳຫລັກພື້ນຖານໄດ້ເອົາຊະນະມັນໃນເວລາຕອບສະໜອງຄັ້ງທຳອິດ. ພວກເຂົາຮັກສາກົດລະບຽບ, ໃຊ້ຮູບແບບສຳລັບກໍລະນີຂອບ, ແລະສົ່ງມອບທັງສອງຢ່າງ. ເວດມົນໜ້ອຍລົງ, ຜົນໄດ້ຮັບຫຼາຍຂຶ້ນ.


ແຜນທີ່ເສັ້ນທາງສຳລັບວິທີການກາຍເປັນນັກພັດທະນາ AI 🗺️

ນີ້ແມ່ນເສັ້ນທາງທີ່ຊ້ຳໆ ແລະ ບໍ່ຊ້ຳກັນ. ວົນຊ້ຳອີກສອງສາມເທື່ອເມື່ອທ່ານເລື່ອນລະດັບ:

  1. ຄວາມຄ່ອງແຄ້ວໃນການຂຽນໂປຣແກຣມ ໃນ Python ບວກກັບ DS libs ຫຼັກ: NumPy, pandas, scikit-learn. ອ່ານຄູ່ມືຢ່າງເປັນທາງການແບບອ່ານຜ່ານໆ ແລະ ຈາກນັ້ນສ້າງສະຄຣິບນ້ອຍໆຈົນກວ່ານິ້ວມືຂອງທ່ານຈະຮູ້. ຄູ່ມືຜູ້ໃຊ້ ເປັນສອງແບບປຶ້ມແບບຮຽນທີ່ໃຊ້ໄດ້ຈິງຢ່າງໜ້າປະຫຼາດໃຈ. [3]

  2. ພື້ນຖານ ML ຜ່ານຫຼັກສູດທີ່ມີໂຄງສ້າງ: ຮູບແບບເສັ້ນຊື່, ການເຮັດໃຫ້ເປັນລະບຽບ, ການກວດສອບຄວາມຖືກຕ້ອງຂ້າມ, ຕົວຊີ້ວັດຕ່າງໆ. ບັນທຶກການບັນຍາຍແບບຄລາສສິກ ແລະ ຫຼັກສູດການປະຕິບັດຕົວຈິງປະສົມປະສານກັນໄດ້ດີ.

  3. ເຄື່ອງມືການຮຽນຮູ້ເລິກ : ເລືອກ PyTorch ຫຼື TensorFlow ແລະຮຽນຮູ້ພຽງພໍທີ່ຈະຝຶກອົບຮົມ, ບັນທຶກ ແລະ ໂຫຼດຮູບແບບຕ່າງໆ; ຈັດການຊຸດຂໍ້ມູນ; ແລະ ແກ້ໄຂຂໍ້ຜິດພາດຮູບຮ່າງທົ່ວໄປ. ເລີ່ມຕົ້ນດ້ວຍ ບົດແນະນຳ PyTorch ຖ້າທ່ານມັກ "ລະຫັດກ່ອນ." [4]

  4. ໂຄງການທີ່ຈັດສົ່ງຕົວຈິງ : ແພັກເກດດ້ວຍ Docker, ຕິດຕາມການແລ່ນ (ເຖິງແມ່ນວ່າບັນທຶກ CSV ກໍ່ບໍ່ມີຫຍັງດີກວ່າ), ແລະ ນຳໃຊ້ API ຂະໜາດນ້ອຍທີ່ສຸດ. ຮຽນຮູ້ Kubernetes ເມື່ອທ່ານພັດທະນາເກີນກວ່າການນຳໃຊ້ກ່ອງດຽວ; Docker ກ່ອນ. [5]

  5. ຊັ້ນ AI ທີ່ມີຄວາມຮັບຜິດຊອບ : ຮັບຮອງເອົາບັນຊີກວດສອບຄວາມສ່ຽງທີ່ມີນ້ຳໜັກເບົາທີ່ໄດ້ຮັບແຮງບັນດານໃຈຈາກ NIST/OECD (ຄວາມຖືກຕ້ອງ, ຄວາມໜ້າເຊື່ອຖື, ຄວາມໂປ່ງໃສ, ຄວາມຍຸຕິທຳ). ມັນເຮັດໃຫ້ການສົນທະນາເປັນຮູບປະທຳ ແລະ ການກວດສອບເປັນຕາເບື່ອ (ໃນທາງທີ່ດີ). [1][2]

  6. ຊ່ຽວຊານດ້ານນີ້ໜ້ອຍໜຶ່ງ : NLP ກັບ Transformers, ວິໄສທັດກັບການສົນທະນາ/ViTs ທີ່ທັນສະໄໝ, ຜູ້ແນະນຳ, ຫຼື ແອັບ ແລະ ຕົວແທນ LLM. ເລືອກຊ່ອງທາງໜຶ່ງ, ສ້າງໂຄງການຂະໜາດນ້ອຍສອງໂຄງການ, ຈາກນັ້ນຂະຫຍາຍສາຂາ.

ເຈົ້າຈະກັບຄືນໄປເຮັດຂັ້ນຕອນທີ 2–6 ຕະຫຼອດໄປ. ແທ້ໆແລ້ວ, ນັ້ນແມ່ນໜ້າທີ່.


ຊຸດທັກສະທີ່ເຈົ້າຈະໃຊ້ຕົວຈິງໃນແຕ່ລະມື້ 🧰

  • Python + Data wrangling : ການແບ່ງ array, joins, groupbys, vectorization. ຖ້າທ່ານສາມາດເຮັດໃຫ້ໝີແພນດ້າເຕັ້ນໄດ້, ການຝຶກອົບຮົມຈະງ່າຍຂຶ້ນ ແລະ ການປະເມີນຜົນກໍ່ສະອາດກວ່າ.

  • Core ML : ການແບ່ງການທົດສອບລະຫວ່າງການຝຶກອົບຮົມ, ການຫຼີກລ່ຽງການຮົ່ວໄຫຼ, ການຮູ້ໜັງສືຕົວຊີ້ວັດ. ຄູ່ມື Scikit-learn ແມ່ນໜຶ່ງໃນບົດເລື່ອງທີ່ດີທີ່ສຸດຢ່າງງຽບໆ. [3]

  • ກອບ DL : ເລືອກອັນໜຶ່ງ, ເຮັດໃຫ້ການເຮັດວຽກແບບ end-to-end, ຈາກນັ້ນເບິ່ງອີກອັນໜຶ່ງໃນພາຍຫຼັງ. ເອກະສານຂອງ PyTorch ເຮັດໃຫ້ຮູບແບບທາງຈິດໃຈຊັດເຈນ. [4]

  • ສຸຂະອະນາໄມໃນການທົດລອງ : ການແລ່ນຕາມເສັ້ນທາງ, ພາລາມິເຕີ, ແລະ ສິ່ງປະດິດ. ອະນາຄົດ-ເຈົ້າກຽດຊັງໂບຮານຄະດີ.

  • ການຈັດລຽງ ແລະ ການຈັດການ : Docker ເພື່ອຈັດແພັກເກດ stack ຂອງທ່ານ; Kubernetes ເມື່ອທ່ານຕ້ອງການການສຳເນົາ, ການຂະຫຍາຍອັດຕະໂນມັດ, ແລະ ການອັບເດດແບບມ້ວນ. ເລີ່ມຕົ້ນທີ່ນີ້. [5]

  • ພື້ນຖານຂອງ GPU : ຮູ້ວ່າເວລາໃດຄວນເຊົ່າ, ຂະໜາດຂອງ batch ມີຜົນກະທົບຕໍ່ throughput ແນວໃດ, ແລະເປັນຫຍັງບາງ opers ຈຶ່ງຖືກຜູກມັດດ້ວຍໜ່ວຍຄວາມຈຳ.

  • AI ທີ່ມີຄວາມຮັບຜິດຊອບ : ບັນທຶກແຫຼ່ງຂໍ້ມູນ, ປະເມີນຄວາມສ່ຽງ, ແລະວາງແຜນການຫຼຸດຜ່ອນຜົນກະທົບໂດຍໃຊ້ຄຸນສົມບັດທີ່ຊັດເຈນ (ຄວາມຖືກຕ້ອງ, ຄວາມໜ້າເຊື່ອຖື, ຄວາມໂປ່ງໃສ, ຄວາມຍຸຕິທຳ). [1]


ຫຼັກສູດເລີ່ມຕົ້ນ: ລິ້ງບໍ່ຫຼາຍປານໃດທີ່ເກີນນ້ຳໜັກຂອງມັນ 🔗

  • ພື້ນຖານ ML : ຊຸດບັນທຶກທີ່ເນັ້ນທິດສະດີຫຼາຍ + ຫຼັກສູດປະຕິບັດຕົວຈິງ. ຈັບຄູ່ພວກມັນກັບການຝຶກຝົນໃນ Scikit-learn. [3]

  • Frameworks : ບົດແນະນຳ PyTorch (ຫຼື ຄູ່ມື TensorFlow ຖ້າທ່ານມັກ Keras). [4]

  • ສິ່ງຈຳເປັນດ້ານວິທະຍາສາດຂໍ້ມູນ ຄູ່ມືຜູ້ໃຊ້ ຂອງ scikit-learn ເພື່ອນຳໃຊ້ຕົວຊີ້ວັດ, ທໍ່ສົ່ງຂໍ້ມູນ ແລະ ການປະເມີນຜົນພາຍໃນ. [3]

  • ການຂົນສົ່ງ ເລີ່ມຕົ້ນ ຂອງ Docker ສະນັ້ນ "ເຮັດວຽກຢູ່ໃນເຄື່ອງຂອງຂ້ອຍ" ຈຶ່ງກາຍເປັນ "ເຮັດວຽກໄດ້ທຸກບ່ອນ." [5]

ບຸກມາກສິ່ງເຫຼົ່ານີ້. ເມື່ອຕິດຂັດ, ໃຫ້ອ່ານໜ້າໜຶ່ງ, ລອງສິ່ງໜຶ່ງ, ແລະ ເຮັດຊ້ຳອີກ.


ສາມໂຄງການພອດໂຟລິໂອທີ່ໄດ້ຮັບການສຳພາດ📁

  1. ການຕອບຄຳຖາມທີ່ເພີ່ມຂຶ້ນໂດຍການດຶງຂໍ້ມູນຄືນໃນຊຸດຂໍ້ມູນຂອງທ່ານເອງ

    • ຂູດ/ນຳເຂົ້າພື້ນຖານຄວາມຮູ້ແບບ niche, ສ້າງການຝັງ + ການດຶງຂໍ້ມູນຄືນ, ເພີ່ມ UI ທີ່ມີນ້ຳໜັກເບົາ.

    • ຕິດຕາມຄວາມໜ่วงເວລາ, ຄວາມຖືກຕ້ອງໃນຊຸດຖາມ-ຕອບທີ່ຖືກຍົກເລີກ, ແລະ ຄຳຕິຊົມຂອງຜູ້ໃຊ້.

    • ລວມເອົາພາກສ່ວນ “ກໍລະນີຄວາມລົ້ມເຫຼວ” ສັ້ນໆ.

  2. ຮູບແບບວິໄສທັດທີ່ມີຂໍ້ຈຳກັດໃນການນຳໃຊ້ຕົວຈິງ

    • ຝຶກຕົວຈັດປະເພດ ຫຼື ເຄື່ອງກວດຈັບ, ໃຫ້ບໍລິການຜ່ານ FastAPI, ເກັບມ້ຽນດ້ວຍ Docker, ຂຽນວິທີການຂະຫຍາຍ. [5]

    • ການກວດຈັບການເລື່ອນຂອງເອກະສານ (ສະຖິຕິປະຊາກອນແບບງ່າຍໆກ່ຽວກັບຄຸນສົມບັດຕ່າງໆ ເປັນການເລີ່ມຕົ້ນທີ່ດີ).

  3. ການສຶກສາກໍລະນີ AI ທີ່ມີຄວາມຮັບຜິດຊອບ

    • ເລືອກຊຸດຂໍ້ມູນສາທາລະນະທີ່ມີຄຸນສົມບັດທີ່ລະອຽດອ່ອນ. ເຮັດການຂຽນ metrics-and-mitigations ທີ່ສອດຄ່ອງກັບຄຸນສົມບັດ NIST (ຄວາມຖືກຕ້ອງ, ຄວາມໜ້າເຊື່ອຖື, ຄວາມຍຸຕິທຳ). [1]

ແຕ່ລະໂຄງການຕ້ອງການ: README 1 ໜ້າ, ແຜນວາດ, ສະຄຣິບທີ່ສາມາດສຳເນົາໄດ້, ແລະ changelog ຂະໜາດນ້ອຍ. ເພີ່ມ emoji ແບບພິເສດເພາະວ່າມະນຸດກໍ່ອ່ານສິ່ງເຫຼົ່ານີ້ຄືກັນ 🙂


MLOps, ການນຳໃຊ້, ແລະ ສ່ວນທີ່ບໍ່ມີໃຜສອນເຈົ້າ 🚢

ການຂົນສົ່ງແມ່ນທັກສະ. ການໄຫຼວຽນໜ້ອຍທີ່ສຸດ:

  • ເປັນຄອນເທນເນີ ດ້ວຍ Docker ສະນັ້ນ dev ≈ prod. ເລີ່ມຕົ້ນດ້ວຍເອກະສານເລີ່ມຕົ້ນຢ່າງເປັນທາງການ; ຍ້າຍໄປທີ່ Compose ສຳລັບການຕັ້ງຄ່າຫຼາຍບໍລິການ. [5]

  • ຕິດຕາມການທົດລອງ (ແມ່ນແຕ່ຢູ່ໃນທ້ອງຖິ່ນ). ພາລາມິເຕີ, ຕົວຊີ້ວັດ, ສິ່ງປະດິດ ແລະ ແທັກ "ຜູ້ຊະນະ" ເຮັດໃຫ້ການກຳຈັດມີຄວາມຊື່ສັດ ແລະ ການຮ່ວມມືເປັນໄປໄດ້.

  • ປະສານງານ ກັບ Kubernetes ເມື່ອທ່ານຕ້ອງການການຂະຫຍາຍ ຫຼື ການແຍກ. ຮຽນຮູ້ການນຳໃຊ້, ການບໍລິການ ແລະ ການຕັ້ງຄ່າການປະກາດກ່ອນ; ຕ້ານທານຄວາມຢາກທີ່ຈະໂກນໜວດ.

  • ເວລາເຮັດວຽກຂອງຄລາວ : Colab ສຳລັບການສ້າງຕົ້ນແບບ; ແພລດຟອມທີ່ມີການຈັດການ (SageMaker/Azure ML/Vertex) ເມື່ອທ່ານຜ່ານແອັບເຄື່ອງຫຼິ້ນ.

  • ຄວາມຮູ້ດ້ານ GPU : ທ່ານບໍ່ຈຳເປັນຕ້ອງຂຽນ CUDA kernels; ທ່ານຈຳເປັນຕ້ອງຮັບຮູ້ວ່າເວລາໃດທີ່ dataloader ເປັນຈຸດຄ້າງຂອງທ່ານ.

ຄຳປຽບທຽບທີ່ມີຂໍ້ບົກຜ່ອງນ້ອຍໆ: ລອງຄິດເຖິງ MLOps ຄືກັບອາຫານເຈ - ໃຫ້ມັນກິນດ້ວຍລະບົບອັດຕະໂນມັດ ແລະ ການຕິດຕາມກວດກາ, ຖ້າບໍ່ດັ່ງນັ້ນມັນຈະມີກິ່ນເໝັນ.


AI ທີ່ມີຄວາມຮັບຜິດຊອບແມ່ນຄູນ້ຳແຂ່ງຂັນຂອງເຈົ້າ 🛡️

ທີມງານຕ່າງໆຢູ່ພາຍໃຕ້ຄວາມກົດດັນທີ່ຕ້ອງພິສູດຄວາມໜ້າເຊື່ອຖື. ຖ້າທ່ານສາມາດສົນທະນາຢ່າງເປັນຮູບປະທຳກ່ຽວກັບຄວາມສ່ຽງ, ເອກະສານ ແລະ ການຄຸ້ມຄອງ, ທ່ານຈະກາຍເປັນບຸກຄົນທີ່ຜູ້ຄົນຕ້ອງການຢູ່ໃນຫ້ອງ.

  • ໃຊ້ຂອບການເຮັດວຽກທີ່ໄດ້ສ້າງຕັ້ງຂຶ້ນແລ້ວ : ວາງແຜນຂໍ້ກຳນົດຕ່າງໆໃຫ້ກັບຄຸນສົມບັດຂອງ NIST (ຄວາມຖືກຕ້ອງ, ຄວາມໜ້າເຊື່ອຖື, ຄວາມໂປ່ງໃສ, ຄວາມຍຸຕິທຳ), ຈາກນັ້ນປ່ຽນພວກມັນໃຫ້ເປັນລາຍການກວດສອບ ແລະ ເງື່ອນໄຂການຍອມຮັບໃນ PRs. [1]

  • ຍຶດໝັ້ນຫຼັກການຂອງທ່ານ : ຫຼັກການ AI ຂອງ OECD ເນັ້ນໜັກເຖິງສິດທິມະນຸດ ແລະ ຄຸນຄ່າປະຊາທິປະໄຕ - ມີປະໂຫຍດຫຼາຍເມື່ອປຶກສາຫາລືກ່ຽວກັບການແລກປ່ຽນ. [2]

  • ຈັນຍາບັນວິຊາຊີບ : ການຮັບຮູ້ສັ້ນໆກ່ຽວກັບລະຫັດຈັນຍາບັນໃນເອກະສານອອກແບບມັກຈະເປັນຄວາມແຕກຕ່າງລະຫວ່າງ “ພວກເຮົາຄິດກ່ຽວກັບມັນ” ແລະ “ພວກເຮົາໄດ້ເຮັດມັນຕາມໃຈ.”

ນີ້ບໍ່ແມ່ນຂັ້ນຕອນທີ່ເຂັ້ມງວດ. ມັນເປັນຝີມື.


ຊ່ຽວຊານໜ້ອຍໜຶ່ງ: ເລືອກເລນ ແລະ ຮຽນຮູ້ເຄື່ອງມືຂອງມັນ 🛣️

  • LLMs ແລະ NLP : ຂໍ້ຜິດພາດຂອງການໃຫ້ໂທເຄັນ, ປ່ອງຢ້ຽມບໍລິບົດ, RAG, ການປະເມີນຜົນນອກເໜືອຈາກ BLEU. ເລີ່ມຕົ້ນດ້ວຍທໍ່ສົ່ງຂໍ້ມູນລະດັບສູງ, ຈາກນັ້ນປັບແຕ່ງ.

  • ວິໄສທັດ : ການເພີ່ມຂໍ້ມູນ, ການຮັກສາສຸຂະອະນາໄມຂອງປ້າຍກຳກັບ, ແລະ ການນຳໃຊ້ໄປຍັງອຸປະກອນຂອບບ່ອນທີ່ຄວາມໜ่วงເວລາເປັນສິ່ງສຳຄັນ.

  • ຜູ້ແນະນຳ : ຄວາມແຕກຕ່າງຂອງຄຳຕິຊົມໂດຍປະນິປະນອມ, ຍຸດທະສາດການເລີ່ມຕົ້ນແບບເຢັນໆ, ແລະ KPI ທຸລະກິດທີ່ບໍ່ກົງກັບ RMSE.

  • ຕົວແທນ ແລະ ການໃຊ້ເຄື່ອງມື : ການເອີ້ນຟັງຊັນ, ການຖອດລະຫັດທີ່ຈຳກັດ, ແລະ ຮາວປ້ອງກັນຄວາມປອດໄພ.

ແທ້ຈິງແລ້ວ, ໃຫ້ເລືອກໂດເມນທີ່ເຮັດໃຫ້ເຈົ້າຢາກຮູ້ຢາກເຫັນໃນຕອນເຊົ້າວັນອາທິດ.


ຕາຕະລາງປຽບທຽບ: ເສັ້ນທາງສຳລັບວິທີການກາຍເປັນນັກພັດທະນາ AI 📊

ເສັ້ນທາງ / ເຄື່ອງມື ດີທີ່ສຸດສຳລັບ ຄວາມຮູ້ສຶກກ່ຽວກັບຄ່າໃຊ້ຈ່າຍ ເປັນຫຍັງມັນຈຶ່ງເຮັດວຽກ - ແລະເປັນເລື່ອງແປກ
ການຮຽນດ້ວຍຕົນເອງ + ການຝຶກຝົນຮຽນຮູ້ ຜູ້ຮຽນທີ່ຂັບເຄື່ອນດ້ວຍຕົນເອງ ແບບອິດສະຫຼະ ພື້ນຖານທີ່ແຂງແກ່ນບວກກັບ API ທີ່ໃຊ້ໄດ້ຈິງໃນ scikit-learn; ເຈົ້າຈະຮຽນຮູ້ພື້ນຖານຫຼາຍເກີນໄປ (ເປັນສິ່ງທີ່ດີ). [3]
ບົດແນະນຳການໃຊ້ PyTorch ຜູ້ທີ່ຮຽນຮູ້ໂດຍການຂຽນໂປຣແກຣມ ຟຣີ ເຮັດໃຫ້ທ່ານຝຶກໄດ້ໄວ; tensors + autograd mental model ຄລິກໄວ. [4]
ຫຼັກການພື້ນຖານຂອງ Docker ຜູ້ຮັບເໝົາກໍ່ສ້າງທີ່ວາງແຜນທີ່ຈະສົ່ງສິນຄ້າ ຟຣີ ສະພາບແວດລ້ອມທີ່ສາມາດຜະລິດຄືນໃໝ່ໄດ້ ແລະ ສາມາດພົກພາໄດ້ງ່າຍ ຈະຊ່ວຍໃຫ້ທ່ານມີສະຕິດີໃນເດືອນທີສອງ; ຂຽນພາຍຫຼັງ. [5]
ຫຼັກສູດ + ໂຄງການວົງວຽນ ຜູ້ທີ່ມີວິໄສທັດ ແລະ ປະຕິບັດຕົວຈິງ ຟຣີ ບົດຮຽນສັ້ນໆ + ບົດຮຽນຕົວຈິງ 1–2 ຄັ້ງ ດີກວ່າວິດີໂອແບບ passive 20 ຊົ່ວໂມງ.
ແພລດຟອມ ML ທີ່ມີການຈັດການ ຜູ້ປະຕິບັດທີ່ມີເວລາຈຳກັດ ແຕກຕ່າງກັນ ແລກປ່ຽນ $ ເພື່ອຄວາມລຽບງ່າຍດ້ານພື້ນຖານ; ດີຫຼາຍເມື່ອທ່ານເກີນກວ່າແອັບເຄື່ອງຫຼິ້ນ.

ແມ່ນແລ້ວ, ໄລຍະຫ່າງບໍ່ສະເໝີກັນໜ້ອຍໜຶ່ງ. ຕາຕະລາງຕົວຈິງບໍ່ຄ່ອຍສົມບູນແບບ.


ວົງວຽນການສຶກສາທີ່ຕິດຢູ່ແທ້ໆ 🔁

  • ຮອບວຽນສອງຊົ່ວໂມງ : ອ່ານເອກະສານ 20 ນາທີ, ຂຽນລະຫັດ 80 ນາທີ, ແລະ ຂຽນສິ່ງທີ່ເສຍຫາຍ 20 ນາທີ.

  • ການຂຽນໜ້າດຽວ : ຫຼັງຈາກແຕ່ລະໂຄງການຂະໜາດນ້ອຍ, ໃຫ້ອະທິບາຍການວາງກອບບັນຫາ, ຂໍ້ມູນພື້ນຖານ, ຕົວຊີ້ວັດ, ແລະ ຮູບແບບຄວາມລົ້ມເຫຼວ.

  • ຂໍ້ຈຳກັດໂດຍເຈດຕະນາ : ຝຶກອົບຮົມພຽງແຕ່ໃນ CPU, ຫຼືບໍ່ມີ libs ພາຍນອກສຳລັບການປະມວນຜົນກ່ອນ, ຫຼືງົບປະມານ 200 ແຖວຢ່າງແນ່ນອນ. ຂໍ້ຈຳກັດກໍ່ໃຫ້ເກີດຄວາມຄິດສ້າງສັນ, ບາງຢ່າງ.

  • ການແລ່ນເຈ້ຍ : ປະຕິບັດພຽງແຕ່ການສູນເສຍ ຫຼື ຕົວໂຫຼດຂໍ້ມູນ. ເຈົ້າບໍ່ຕ້ອງການ SOTA ເພື່ອຮຽນຮູ້ຫຼາຍຢ່າງ.

ຖ້າໂຟກັສຫຼົ້ມເຫຼວ, ມັນເປັນເລື່ອງປົກກະຕິ. ທຸກຄົນຈະສັ່ນຄອນ. ຍ່າງໄປຍ່າງມາ, ກັບມາ, ສົ່ງສິ່ງຂອງນ້ອຍໆ.


ການກຽມຕົວສຳພາດ, ຍົກເວັ້ນການສະແດງລະຄອນ 🎯

  • ຜົນງານກ່ອນ : repos ທີ່ແທ້ຈິງດີກວ່າ slide decks. ນຳໃຊ້ຢ່າງໜ້ອຍໜຶ່ງຕົວຢ່າງຂະໜາດນ້ອຍ.

  • ອະທິບາຍການແລກປ່ຽນ : ຈົ່ງກຽມພ້ອມທີ່ຈະອະທິບາຍທາງເລືອກຕົວຊີ້ວັດ ແລະ ວິທີທີ່ທ່ານຈະແກ້ໄຂຄວາມລົ້ມເຫຼວ.

  • ການຄິດແບບລະບົບ : ແຕ້ມຮູບຂໍ້ມູນ → ຮູບແບບ → API → ແຜນວາດຕິດຕາມກວດກາ ແລະ ບັນຍາຍມັນ.

  • AI ທີ່ມີຄວາມຮັບຜິດຊອບ : ຮັກສາລາຍການກວດສອບງ່າຍໆໃຫ້ສອດຄ່ອງກັບ NIST AI RMF - ມັນສະແດງເຖິງຄວາມເປັນຜູ້ໃຫຍ່, ບໍ່ແມ່ນຄຳສັບທີ່ນິຍົມ. [1]

  • ຄວາມຄ່ອງແຄ້ວຂອງຂອບການເຮັດວຽກ : ເລືອກຂອບການເຮັດວຽກໜຶ່ງ ແລະ ລະວັງມັນໃຫ້ດີ. ເອກະສານທາງການແມ່ນຍຸດຕິທຳໃນການສຳພາດ. [4]


ປຶ້ມແຕ່ງອາຫານນ້ອຍໆ: ໂຄງການທຳອິດຂອງເຈົ້າທີ່ຄົບວົງຈອນໃນທ້າຍອາທິດ 🍳

  1. ຂໍ້ມູນ : ເລືອກຊຸດຂໍ້ມູນທີ່ສະອາດ.

  2. ພື້ນຖານ : ຮູບແບບ scikit-learn ພ້ອມດ້ວຍການກວດສອບຄວາມຖືກຕ້ອງຂ້າມ; ບັນທຶກຕົວຊີ້ວັດພື້ນຖານ. [3]

  3. DL ຜ່ານ : ໜ້າວຽກດຽວກັນໃນ PyTorch ຫຼື TensorFlow; ປຽບທຽບໝາກໂປມກັບໝາກໂປມ. [4]

  4. ການຕິດຕາມ : ການດຳເນີນການບັນທຶກ (ເຖິງແມ່ນວ່າ CSV ງ່າຍໆ + ປະທັບເວລາ). ແທັກຜູ້ຊະນະ.

  5. ໃຫ້ບໍລິການ : ຫໍ່ການຄາດຄະເນໃນເສັ້ນທາງ FastAPI, dockerize, ດໍາເນີນການໃນທ້ອງຖິ່ນ. [5]

  6. ພິຈາລະນາຄືນ : ຕົວຊີ້ວັດໃດທີ່ສຳຄັນສຳລັບຜູ້ໃຊ້, ມີຄວາມສ່ຽງຫຍັງແດ່, ແລະ ສິ່ງທີ່ທ່ານຈະຕິດຕາມຫຼັງຈາກການເປີດຕົວ - ຢືມເງື່ອນໄຂຈາກ NIST AI RMF ເພື່ອຮັກສາມັນໃຫ້ຊັດເຈນ. [1]

ອັນນີ້ສົມບູນແບບບໍ? ບໍ່. ມັນດີກ່ວາການລໍຖ້າຫຼັກສູດທີ່ສົມບູນແບບບໍ? ແນ່ນອນ.


ອຸປະສັກທົ່ວໄປທີ່ທ່ານສາມາດຫຼີກລ່ຽງໄດ້ແຕ່ຫົວທີ ⚠️

  • ການປັບການຮຽນຮູ້ຂອງເຈົ້າໃຫ້ເຂົ້າກັບບົດຮຽນສອນຫຼາຍເກີນໄປ : ເລີ່ມຕົ້ນໄດ້ດີ, ແຕ່ຄວນປ່ຽນໄປຄິດເຖິງບັນຫາກ່ອນໄວໆນີ້.

  • ການຂ້າມການອອກແບບການປະເມີນຜົນ : ກຳນົດຄວາມສຳເລັດກ່ອນການຝຶກອົບຮົມ. ປະຢັດເວລາຫຼາຍຊົ່ວໂມງ.

  • ການບໍ່ສົນໃຈສັນຍາຂໍ້ມູນ : ການເລື່ອນຂອງໂຄງຮ່າງທຳລາຍລະບົບຫຼາຍກວ່າທີ່ຮູບແບບເຮັດ.

  • ຄວາມຢ້ານກົວຂອງການນຳໃຊ້ : Docker ເປັນມິດກວ່າທີ່ມັນເບິ່ງຄືວ່າ. ເລີ່ມຕົ້ນຈາກສິ່ງເລັກໆນ້ອຍໆ; ຍອມຮັບວ່າການສ້າງຄັ້ງທຳອິດຈະຫຍຸ້ງຍາກ. [5]

  • ຈັນຍາບັນຍັງຄົງຢູ່ : ໃສ່ມັນໃນພາຍຫຼັງ ແລະ ມັນຈະກາຍເປັນວຽກທີ່ຕ້ອງປະຕິບັດຕາມ. ເຮັດໃຫ້ມັນກາຍເປັນການອອກແບບ - ເບົາກວ່າ, ດີກວ່າ. [1][2]


TL;DR 🧡

ຖ້າທ່ານຈື່ໄດ້ສິ່ງໜຶ່ງ: ວິທີການກາຍເປັນນັກພັດທະນາ AI ບໍ່ແມ່ນກ່ຽວກັບການສະສົມທິດສະດີ ຫຼື ການໄລ່ຕາມຮູບແບບທີ່ເຫຼື້ອມເປັນເງົາ. ມັນກ່ຽວກັບການແກ້ໄຂບັນຫາທີ່ແທ້ຈິງຊ້ຳແລ້ວຊ້ຳອີກດ້ວຍວົງຈອນທີ່ແໜ້ນໜາ ແລະ ແນວຄິດທີ່ມີຄວາມຮັບຜິດຊອບ. ຮຽນຮູ້ຊຸດຂໍ້ມູນ, ເລືອກເຟຣມເວີກ DL ໜຶ່ງອັນ, ສົ່ງສິ່ງນ້ອຍໆດ້ວຍ Docker, ຕິດຕາມສິ່ງທີ່ທ່ານເຮັດ, ແລະ ຍຶດໝັ້ນທາງເລືອກຂອງທ່ານໃສ່ກັບຄຳແນະນຳທີ່ເຄົາລົບນັບຖືເຊັ່ນ NIST ແລະ OECD. ສ້າງໂຄງການນ້ອຍໆທີ່ໜ້າຮັກສາມໂຄງການ ແລະ ເວົ້າກ່ຽວກັບພວກມັນຄືກັບເພື່ອນຮ່ວມທີມ, ບໍ່ແມ່ນນັກວິເສດ. ນັ້ນແມ່ນມັນ - ສ່ວນຫຼາຍແມ່ນ.

ແລະແມ່ນແລ້ວ, ເວົ້າປະໂຫຍກນີ້ອອກມາດັງໆຖ້າມັນຊ່ວຍໄດ້: ຂ້ອຍຮູ້ວິທີທີ່ຈະກາຍເປັນນັກພັດທະນາ AI . ຈາກນັ້ນໄປພິສູດມັນດ້ວຍການຝຶກຝົນສ້າງຕົນເອງເປັນເວລາໜຶ່ງຊົ່ວໂມງໃນມື້ນີ້.


ເອກະສານອ້າງອີງ

[1] NIST. ຂອບການຄຸ້ມຄອງຄວາມສ່ຽງດ້ານປັນຍາປະດິດ (AI RMF 1.0) . (PDF) - ລິ້ງ
[2] OECD. ຫຼັກການ AI ຂອງ OECD - ພາບລວມ - ລິ້ງ
[3] scikit-learn. ຄູ່ມືຜູ້ໃຊ້ (ໝັ້ນຄົງ) - ລິ້ງ
4] PyTorch. ບົດແນະນຳ (ຮຽນຮູ້ພື້ນຖານ, ແລະອື່ນໆ) - ລິ້ງ
[5] Docker. ເລີ່ມຕົ້ນ - ລິ້ງ


ຊອກຫາ AI ລ່າສຸດໄດ້ທີ່ຮ້ານ AI Assistant ຢ່າງເປັນທາງການ

ກ່ຽວກັບພວກເຮົາ

ກັບໄປທີ່ບລັອກ