ການຮຽນຮູ້ AI ສາມາດຮູ້ສຶກຄືກັບການກ້າວເຂົ້າໄປໃນຫໍສະໝຸດຍັກໃຫຍ່ບ່ອນທີ່ປຶ້ມທຸກຫົວຮ້ອງວ່າ "ເລີ່ມຕົ້ນທີ່ນີ້." ເຄິ່ງໜຶ່ງຂອງຊັ້ນວາງຂຽນວ່າ "ຄະນິດສາດ," ເຊິ່ງມັນ... ຫຍາບຄາຍເລັກນ້ອຍ 😅
ຂໍ້ດີ: ເຈົ້າບໍ່ຈຳເປັນຕ້ອງຮູ້ທຸກຢ່າງເພື່ອສ້າງສິ່ງທີ່ເປັນປະໂຫຍດ. ເຈົ້າຕ້ອງການເສັ້ນທາງທີ່ມີເຫດຜົນ, ຊັບພະຍາກອນທີ່ໜ້າເຊື່ອຖືໄດ້ສອງສາມຢ່າງ, ແລະ ຄວາມເຕັມໃຈທີ່ຈະສັບສົນໄປຊົ່ວໄລຍະໜຶ່ງ (ຄວາມສັບສົນແມ່ນຄ່າທຳນຽມເຂົ້າ).
ບົດຄວາມທີ່ເຈົ້າອາດຈະມັກອ່ານຫຼັງຈາກອັນນີ້:
🔗 AI ກວດຈັບຄວາມຜິດປົກກະຕິໄດ້ແນວໃດ
ອະທິບາຍວິທີການກວດຫາຄວາມຜິດປົກກະຕິໂດຍໃຊ້ການຮຽນຮູ້ຂອງເຄື່ອງຈັກ ແລະ ສະຖິຕິ.
🔗 ເປັນຫຍັງ AI ຈຶ່ງບໍ່ດີຕໍ່ສັງຄົມ
ກວດກາຄວາມສ່ຽງດ້ານຈັນຍາບັນ, ສັງຄົມ ແລະ ເສດຖະກິດຂອງປັນຍາປະດິດ.
🔗 AI ໃຊ້ນໍ້າຫຼາຍປານໃດ
ແຍກຜົນກະທົບຕໍ່ການໃຊ້ພະລັງງານຂອງ AI ແລະ ການໃຊ້ນ້ຳທີ່ເຊື່ອງໄວ້.
🔗 ຊຸດຂໍ້ມູນ AI ແມ່ນຫຍັງ
ກຳນົດຊຸດຂໍ້ມູນ, ການຕິດສະຫຼາກ ແລະ ບົດບາດຂອງພວກມັນໃນການຝຶກອົບຮົມ AI.
ຄຳວ່າ "AI" ຕົວຈິງແລ້ວໝາຍຄວາມວ່າແນວໃດໃນຊີວິດປະຈຳວັນ 🤷♀️
ຜູ້ຄົນເວົ້າວ່າ “AI” ແລະ ໝາຍເຖິງສິ່ງທີ່ແຕກຕ່າງກັນສອງສາມຢ່າງ:
-
ການຮຽນຮູ້ຂອງເຄື່ອງຈັກ (ML) – ຮູບແບບຮຽນຮູ້ຮູບແບບຈາກຂໍ້ມູນເພື່ອເຊື່ອມໂຍງຂໍ້ມູນເຂົ້າກັບຜົນຜະລິດ (ເຊັ່ນ: ການກວດຈັບສະແປມ, ການຄາດຄະເນລາຄາ). [1]
-
ການຮຽນຮູ້ເລິກ (DL) - ກຸ່ມຍ່ອຍຂອງ ML ໂດຍໃຊ້ເຄືອຂ່າຍປະສາດໃນລະດັບໃຫຍ່ (ວິໄສທັດ, ການເວົ້າ, ຮູບແບບພາສາຂະໜາດໃຫຍ່). [2]
-
AI ທີ່ສ້າງສັນ - ຮູບແບບທີ່ຜະລິດຂໍ້ຄວາມ, ຮູບພາບ, ລະຫັດ, ສຽງ (chatbots, copilots, ເຄື່ອງມືເນື້ອຫາ). [2]
-
ການຮຽນຮູ້ແບບເສີມສ້າງ - ການຮຽນຮູ້ໂດຍການທົດລອງ ແລະ ລາງວັນ (ຕົວແທນເກມ, ຫຸ່ນຍົນ). [1]
ເຈົ້າບໍ່ຈຳເປັນຕ້ອງເລືອກຢ່າງສົມບູນແບບໃນຕອນເລີ່ມຕົ້ນ. ພຽງແຕ່ຢ່າປະຕິບັດຕໍ່ AI ຄືກັບພິພິທະພັນ. ມັນຄ້າຍຄືກັບເຮືອນຄົວຫຼາຍກວ່າ - ເຈົ້າຮຽນຮູ້ໄດ້ໄວຂຶ້ນໂດຍການປຸງແຕ່ງອາຫານ. ບາງຄັ້ງເຈົ້າກໍ່ປີ້ງເຂົ້າຈີ່. 🍞🔥
ເລື່ອງເລັກໆນ້ອຍໆ: ທີມງານຂະໜາດນ້ອຍໄດ້ສົ່ງຮູບແບບການ churn ທີ່ "ດີເລີດ"... ຈົນກວ່າພວກເຂົາຈະສັງເກດເຫັນ ID ທີ່ຄືກັນໃນການຝຶກອົບຮົມ ແລະ ການທົດສອບ. ການຮົ່ວໄຫຼແບບຄລາສສິກ. pipeline ງ່າຍໆ + ການແບ່ງແຍກທີ່ສະອາດໄດ້ປ່ຽນ 0.99 ທີ່ໜ້າສົງໄສໃຫ້ເປັນຄະແນນທີ່ໜ້າເຊື່ອຖື (ຕໍ່າກວ່າ!) ແລະ ເປັນຮູບແບບທີ່ລວມເຂົ້າກັນໄດ້ແທ້ໆ. [3]
ສິ່ງທີ່ເຮັດໃຫ້ແຜນການ “ວິທີການຮຽນຮູ້ AI” ທີ່ດີ ✅
ແຜນການທີ່ດີມີລັກສະນະບາງຢ່າງທີ່ຟັງແລ້ວໜ້າເບື່ອແຕ່ຊ່ວຍປະຢັດເງິນໄດ້ຫຼາຍເດືອນ:
-
ສ້າງໃນຂະນະທີ່ເຈົ້າຮຽນຮູ້ (ໂຄງການນ້ອຍໆແຕ່ຫົວທີ, ໂຄງການໃຫຍ່ກວ່າພາຍຫຼັງ).
-
ຮຽນຮູ້ຄະນິດສາດຂັ້ນຕ່ຳທີ່ຕ້ອງການ , ຈາກນັ້ນກັບຄືນໄປຫາຄວາມເລິກ.
-
ອະທິບາຍສິ່ງທີ່ເຈົ້າໄດ້ເຮັດ (ເຮັດວຽກຂອງເຈົ້າແບບບໍ່ຄິດຫຍັງເລີຍ; ມັນປິ່ນປົວຄວາມຄິດທີ່ມົວໆ).
-
ຍຶດຕິດກັບ “core stack” ອັນດຽວໄລຍະໜຶ່ງ (Python + Jupyter + scikit-learn → ຈາກນັ້ນ PyTorch).
-
ວັດແທກຄວາມຄືບໜ້າດ້ວຍຜົນຜະລິດ , ບໍ່ແມ່ນຊົ່ວໂມງທີ່ເບິ່ງ.
ຖ້າແຜນການຂອງເຈົ້າມີພຽງແຕ່ວິດີໂອ ແລະ ບັນທຶກເທົ່ານັ້ນ, ມັນຄ້າຍຄືກັບການພະຍາຍາມລອຍນໍ້າໂດຍການອ່ານກ່ຽວກັບນໍ້າ.
ເລືອກເລນຂອງເຈົ້າ (ດຽວນີ້) - ສາມເສັ້ນທາງທີ່ໃຊ້ກັນທົ່ວໄປ 🚦
ເຈົ້າສາມາດຮຽນຮູ້ AI ໃນ “ຮູບຮ່າງ” ທີ່ແຕກຕ່າງກັນ. ນີ້ແມ່ນສາມຢ່າງທີ່ເຮັດວຽກໄດ້:
1) ເສັ້ນທາງການກໍ່ສ້າງທີ່ໃຊ້ໄດ້ຈິງ 🛠️
ດີທີ່ສຸດຖ້າທ່ານຕ້ອງການໄຊຊະນະໄວ ແລະ ແຮງຈູງໃຈ.
ຈຸດສຸມ: ຊຸດຂໍ້ມູນ, ຮູບແບບການຝຶກອົບຮົມ, ການສາທິດການຂົນສົ່ງ.
ຊັບພະຍາກອນເລີ່ມຕົ້ນ: ຫຼັກສູດ ML Crash ຂອງ Google, Kaggle Learn, fast.ai (ລິ້ງໃນເອກະສານອ້າງອີງ ແລະ ຊັບພະຍາກອນຂ້າງລຸ່ມນີ້).
2) ພື້ນຖານ - ເສັ້ນທາງທຳອິດ 📚
ດີທີ່ສຸດຖ້າທ່ານມັກຄວາມຊັດເຈນ ແລະ ທິດສະດີ.
ຈຸດສຸມ: ການຖົດຖອຍ, ອະຄະຕິ-ຄວາມແປປ່ວນ, ການຄິດແບບຄວາມເປັນໄປໄດ້, ການເພີ່ມປະສິດທິພາບ.
ແຫຼ່ງຂໍ້ມູນ: ເອກະສານ Stanford CS229, MIT Intro to Deep Learning. [1][2]
3) ເສັ້ນທາງຂອງນັກພັດທະນາແອັບ Gen-AI ✨
ດີທີ່ສຸດຖ້າທ່ານຕ້ອງການສ້າງຜູ້ຊ່ວຍ, ການຄົ້ນຫາ, ຂັ້ນຕອນການເຮັດວຽກ, ສິ່ງຂອງ "ຕົວແທນ".
ຈຸດສຸມ: ການກະຕຸ້ນ, ການດຶງຂໍ້ມູນ, ການປະເມີນຜົນ, ການໃຊ້ເຄື່ອງມື, ພື້ນຖານຄວາມປອດໄພ, ການນຳໃຊ້.
ເອກະສານທີ່ຄວນເກັບໄວ້ໃກ້ໆ: ເອກະສານແພລດຟອມ (APIs), ຫຼັກສູດ HF (ເຄື່ອງມື).
ເຈົ້າສາມາດປ່ຽນເລນໄດ້ພາຍຫຼັງ. ການສະຕາດລົດແມ່ນສ່ວນທີ່ຍາກ.

ຕາຕະລາງປຽບທຽບ - ວິທີທີ່ດີທີ່ສຸດໃນການຮຽນຮູ້ (ດ້ວຍຄວາມແປກປະຫຼາດທີ່ຊື່ສັດ) 📋
| ເຄື່ອງມື / ຫຼັກສູດ | ຜູ້ຊົມ | ລາຄາ | ເປັນຫຍັງມັນຈຶ່ງໃຊ້ໄດ້ (ສະຫຼຸບໂດຍຫຍໍ້) |
|---|---|---|---|
| ຫຼັກສູດການຮຽນຮູ້ຂອງເຄື່ອງຈັກ Google ແບບເລັ່ງລັດ | ຜູ້ເລີ່ມຕົ້ນ | ຟຣີ | ພາບ + ການລົງມືປະຕິບັດຕົວຈິງ; ຫຼີກລ່ຽງຄວາມສັບສົນຫຼາຍເກີນໄປ |
| Kaggle Learn (Intro + Intermediate ML) | ຜູ້ເລີ່ມຕົ້ນທີ່ມັກການຝຶກຊ້ອມ | ຟຣີ | ບົດຮຽນສັ້ນໆ + ການຝຶກຊ້ອມທັນທີ |
| ການຮຽນຮູ້ເລິກເຊິ່ງແບບປະຕິບັດໄດ້ຂອງ fast.ai | ຜູ້ສ້າງທີ່ມີລະຫັດບາງຢ່າງ | ຟຣີ | ເຈົ້າຝຶກນາງແບບຕົວຈິງແຕ່ຫົວທີ - ຄືທັນທີ 😅 |
| ຄວາມຊ່ຽວຊານດ້ານ DeepLearning.AI ML | ຜູ້ຮຽນທີ່ມີໂຄງສ້າງ | ຈ່າຍແລ້ວ | ຄວາມຄືບໜ້າທີ່ຊັດເຈນຜ່ານແນວຄວາມຄິດຫຼັກຂອງ ML |
| ລາຍລະອຽດການຮຽນຮູ້ເລິກ DeepLearning.AI | ພື້ນຖານ ML ແລ້ວ | ຈ່າຍແລ້ວ | ຄວາມເລິກທີ່ແຂງແກ່ນໃນເຄືອຂ່າຍປະສາດ + ຂັ້ນຕອນການເຮັດວຽກ |
| ບັນທຶກ Stanford CS229 | ຂັບເຄື່ອນດ້ວຍທິດສະດີ | ຟຣີ | ພື້ນຖານທີ່ຈິງຈັງ (“ເປັນຫຍັງສິ່ງນີ້ຈຶ່ງເຮັດວຽກ”) |
| ຄູ່ມືຜູ້ໃຊ້ scikit-learn | ຜູ້ປະຕິບັດ ML | ຟຣີ | ຊຸດເຄື່ອງມືຄລາສສິກສຳລັບຕາຕະລາງ/ເສັ້ນຖານ |
| ບົດແນະນຳການໃຊ້ PyTorch | ຜູ້ສ້າງການຮຽນຮູ້ເລິກ | ຟຣີ | ເສັ້ນທາງທີ່ສະອາດຈາກ tensors → ວົງຈອນການຝຶກອົບຮົມ [4] |
| Hugging Face LLM ຫຼັກສູດ | ຜູ້ສ້າງ NLP + LLM | ຟຣີ | ຂະບວນການເຮັດວຽກ LLM ທີ່ໃຊ້ໄດ້ຈິງ + ເຄື່ອງມືລະບົບນິເວດ |
| NIST AI ຂອບການຄຸ້ມຄອງຄວາມສ່ຽງ | ໃຜກໍຕາມທີ່ໃຊ້ AI | ຟຣີ | ໂຄງສ້າງຄວາມສ່ຽງ/ການຄຸ້ມຄອງທີ່ງ່າຍດາຍ ແລະ ນຳໃຊ້ໄດ້ [5] |
ໝາຍເຫດນ້ອຍໆ: “ລາຄາ” ທາງອອນລາຍແມ່ນແປກ. ບາງຢ່າງແມ່ນບໍ່ເສຍຄ່າແຕ່ຕ້ອງເສຍຄ່າໃຊ້ຈ່າຍ… ເຊິ່ງບາງຄັ້ງກໍ່ຮ້າຍແຮງກວ່ານັ້ນ.
ຊຸດທັກສະຫຼັກທີ່ເຈົ້າຕ້ອງການແທ້ໆ (ແລະ ຕາມລຳດັບ) 🧩
ຖ້າເປົ້າໝາຍຂອງເຈົ້າແມ່ນ ວິທີການຮຽນຮູ້ AI ໂດຍບໍ່ຕ້ອງຈົມນ້ຳ, ໃຫ້ຕັ້ງເປົ້າໝາຍຕາມລຳດັບນີ້:
-
ພື້ນຖານ Python
-
ຟັງຊັນ, ລາຍຊື່/ຄຳສັ່ງ, ຄລາສເບົາ, ການອ່ານໄຟລ໌.
-
ນິໄສທີ່ຕ້ອງມີ: ຂຽນບົດນ້ອຍໆ, ບໍ່ພຽງແຕ່ຂຽນປື້ມບັນທຶກເທົ່ານັ້ນ.
-
ການຈັດການຂໍ້ມູນ
-
ການຄິດແບບ NumPy, ພື້ນຖານຂອງໝີແພນດາ, ແລະ ການວາງແຜນ.
-
ເຈົ້າຈະໃຊ້ເວລາຫຼາຍຢູ່ທີ່ນີ້. ບໍ່ແມ່ນເລື່ອງທີ່ໜ້າສົນໃຈ, ແຕ່ມັນແມ່ນວຽກ.
-
ML ແບບຄລາສສິກ (ມະຫາອຳນາດທີ່ຖືກປະເມີນຄ່າຕໍ່າ)
-
ການແຍກຂອງລົດໄຟ/ການທົດສອບ, ການຮົ່ວໄຫຼ, ການພໍດີເກີນໄປ.
-
ການຖົດຖອຍເສັ້ນຊື່/ໂລຈິສຕິກ, ຕົ້ນໄມ້, ປ່າໄມ້ແບບສຸ່ມ, ການເພີ່ມຄວາມຊັນ.
-
ຕົວຊີ້ວັດ: ຄວາມຖືກຕ້ອງ, ຄວາມແມ່ນຍຳ/ການລະນຶກເຖິງ, ROC-AUC, MAE/RMSE - ຮູ້ວ່າ ເມື່ອໃດ . [3]
-
ການຮຽນຮູ້ເລິກ
-
ເທັນເຊີ, ເກຣດຽນ/ເບກຫຼັງ (ທາງດ້ານແນວຄິດ), ວົງວຽນການຝຶກອົບຮົມ.
-
CNN ສຳລັບຮູບພາບ, ຕົວແປງສັນຍານສຳລັບຂໍ້ຄວາມ (ໃນທີ່ສຸດ).
-
ພື້ນຖານ PyTorch ຈຳນວນໜຶ່ງແບບ end-to-end ມີປະໂຫຍດຫຼາຍ. [4]
-
ຂະບວນການເຮັດວຽກ AI + LLM ທີ່ສ້າງສັນ
-
ການໃຊ້ໂທເຄັນ, ການຝັງ, ການສ້າງແບບເພີ່ມເຕີມໃນການດຶງຂໍ້ມູນຄືນ, ການປະເມີນຜົນ.
-
ການປັບແຕ່ງລະອຽດ vs. ການກະຕຸ້ນ (ແລະເມື່ອທ່ານຕ້ອງການທັງສອງຢ່າງ).
ແຜນການແບບເທື່ອລະຂັ້ນຕອນທີ່ທ່ານສາມາດປະຕິບັດຕາມໄດ້ 🗺️
ໄລຍະ A - ເຮັດໃຫ້ຮູບແບບທຳອິດຂອງທ່ານເຮັດວຽກໄດ້ (ໄວ) ⚡
ເປົ້າໝາຍ: ຝຶກອົບຮົມບາງສິ່ງບາງຢ່າງ, ວັດແທກມັນ, ປັບປຸງມັນ.
-
ເຮັດການແນະນຳແບບກະທັດຮັດ (ເຊັ່ນ: ຫຼັກສູດ ML Crash Course), ຈາກນັ້ນເຮັດຫຼັກສູດຈຸລະພາກແບບປະຕິບັດຕົວຈິງ (ເຊັ່ນ: ການແນະນຳ Kaggle).
-
ແນວຄວາມຄິດຂອງໂຄງການ: ຄາດຄະເນລາຄາເຮືອນ, ການຍົກເລີກຂອງລູກຄ້າ, ຫຼື ຄວາມສ່ຽງດ້ານສິນເຊື່ອໃນຊຸດຂໍ້ມູນສາທາລະນະ.
ບັນຊີກວດສອບ "ໄຊຊະນະ" ຂະໜາດນ້ອຍ:
-
ທ່ານສາມາດໂຫຼດຂໍ້ມູນໄດ້.
-
ທ່ານສາມາດຝຶກອົບຮົມຮູບແບບພື້ນຖານໄດ້.
-
ທ່ານສາມາດອະທິບາຍການ overfitting ໃນພາສາທໍາມະດາ.
ໄລຍະ B - ຄຸ້ນເຄີຍກັບການຝຶກ ML ຕົວຈິງ 🔧
ເປົ້າໝາຍ: ຢຸດການຕົກຕະລຶງກັບຮູບແບບຄວາມລົ້ມເຫຼວທົ່ວໄປ.
-
ເຮັດວຽກຜ່ານຫົວຂໍ້ ML ລະດັບປານກາງ: ຄ່າທີ່ຂາດຫາຍໄປ, ການຮົ່ວໄຫຼ, ທໍ່ສົ່ງ, CV.
-
ອ່ານບາງພາກສ່ວນຄູ່ມືຜູ້ໃຊ້ scikit-learn ແລະ ດໍາເນີນການຕົວຈິງ. [3]
-
ແນວຄວາມຄິດຂອງໂຄງການ: ທໍ່ສົ່ງແບບ end-to-end ແບບງ່າຍໆພ້ອມດ້ວຍຮູບແບບທີ່ບັນທຶກໄວ້ + ບົດລາຍງານການປະເມີນຜົນ.
ໄລຍະ C - ການຮຽນຮູ້ຢ່າງເລິກເຊິ່ງທີ່ບໍ່ຮູ້ສຶກຄືກັບເວດມົນ 🧙♂️
ເປົ້າໝາຍ: ຝຶກອົບຮົມເຄືອຂ່າຍປະສາດ ແລະ ເຂົ້າໃຈວົງຈອນການຝຶກອົບຮົມ.
-
ເຮັດເສັ້ນທາງ “ຮຽນຮູ້ພື້ນຖານ” ຂອງ PyTorch (tensors → datasets/dataloaders → training/eval → saving). [4]
-
ຖ້າທ່ານຕ້ອງການຄວາມໄວ ແລະ ຄວາມຮູ້ສຶກທີ່ໃຊ້ໄດ້ຈິງ, ທ່ານສາມາດຈັບຄູ່ກັບ fast.ai ໄດ້ຕາມຄວາມຕ້ອງການ.
-
ແນວຄວາມຄິດໂຄງການ: ຕົວຈັດປະເພດຮູບພາບ, ຮູບແບບຄວາມຮູ້ສຶກ, ຫຼື ການປັບແຕ່ງຕົວແປງຂະໜາດນ້ອຍ.
ໄລຍະ D – ແອັບ AI ທີ່ສ້າງສັນທີ່ໃຊ້ງານໄດ້ຈິງ ✨
ເປົ້າໝາຍ: ສ້າງບາງສິ່ງບາງຢ່າງທີ່ຜູ້ຄົນໃຊ້.
-
ປະຕິບັດຕາມຫຼັກສູດ LLM ແບບປະຕິບັດຕົວຈິງ + ການເລີ່ມຕົ້ນແບບດ່ວນຂອງຜູ້ຂາຍເພື່ອເຊື່ອມຕໍ່ການຝັງ, ການດຶງຂໍ້ມູນຄືນ ແລະ ການສ້າງລຸ້ນທີ່ປອດໄພ.
-
ແນວຄວາມຄິດຂອງໂຄງການ: ບອດຖາມ-ຕອບໃນ ຂອງທ່ານ (chunk → embed → retrieve → answer ພ້ອມກັບການອ້າງອີງ), ຫຼື ຜູ້ຊ່ວຍສະໜັບສະໜູນລູກຄ້າທີ່ມີການໂທຫາເຄື່ອງມື.
ສ່ວນ "ຄະນິດສາດ" - ຮຽນມັນຄືກັບເຄື່ອງປຸງ, ບໍ່ແມ່ນອາຫານທັງໝົດ 🧂
ຄະນິດສາດມີຄວາມສຳຄັນ, ແຕ່ເວລາມີຄວາມສຳຄັນຫຼາຍກວ່າ.
ຄະນິດສາດຂັ້ນຕ່ຳສຸດທີ່ສາມາດເຮັດໄດ້ເພື່ອເລີ່ມຕົ້ນ:
-
ພຶດຊະຄະນິດເສັ້ນຊື່: ເວັກເຕີ, ແມັດຕຣິກ, ຜົນຄູນຈຸດ (ຄວາມຮູ້ສຶກສຳລັບການຝັງ). [2]
-
ແຄລຄູລັສ: ອະນຸພັນຂອງສະຕິປັນຍາ (ຄວາມຊັນ → ການປ່ຽນແປງ). [1]
-
ຄວາມເປັນໄປໄດ້: ການແຈກຢາຍ, ຄວາມຄາດຫວັງ, ແນວຄິດພື້ນຖານຂອງ Bayes. [1]
ຖ້າທ່ານຕ້ອງການກະດູກສັນຫຼັງທີ່ເປັນທາງການຫຼາຍຂຶ້ນໃນພາຍຫຼັງ, ໃຫ້ເຂົ້າໄປເບິ່ງບັນທຶກ CS229 ສຳລັບພື້ນຖານ ແລະ ການຮຽນຮູ້ຢ່າງເລິກເຊິ່ງຂອງ MIT ສຳລັບຫົວຂໍ້ທີ່ທັນສະໄໝ. [1][2]
ໂຄງການທີ່ເຮັດໃຫ້ເຈົ້າເບິ່ງຄືວ່າເຈົ້າຮູ້ວ່າເຈົ້າກຳລັງເຮັດຫຍັງຢູ່ 😄
ຖ້າທ່ານສ້າງພຽງແຕ່ຕົວຈັດປະເພດໃນຊຸດຂໍ້ມູນຂອງຫຼິ້ນ, ທ່ານຈະຮູ້ສຶກວ່າຕິດຂັດ. ລອງໃຊ້ໂຄງການທີ່ຄ້າຍຄືກັບວຽກງານຕົວຈິງ:
-
ໂຄງການ ML ແບບພື້ນຖານກ່ອນ (scikit-learn): ຂໍ້ມູນສະອາດ → ພື້ນຖານທີ່ເຂັ້ມແຂງ → ການວິເຄາະຄວາມຜິດພາດ. [3]
-
ແອັບດຶງຂໍ້ມູນ LLM +: ingest docs → chunk → embed → retrieve → ສ້າງຄຳຕອບດ້ວຍການອ້າງອີງ.
-
ແຜງຄວບຄຸມຂະໜາດນ້ອຍສຳລັບຕິດຕາມກວດກາຮູບແບບ: ຂໍ້ມູນບັນທຶກການເຂົ້າ/ອອກ; ຕິດຕາມສັນຍານແບບດຣິບ (ເຖິງແມ່ນວ່າສະຖິຕິງ່າຍໆກໍ່ຊ່ວຍໄດ້).
-
ການກວດສອບ AI ຂະໜາດນ້ອຍທີ່ມີຄວາມຮັບຜິດຊອບ: ບັນທຶກຄວາມສ່ຽງ, ກໍລະນີທີ່ສຳຄັນ, ຜົນກະທົບຂອງຄວາມລົ້ມເຫຼວ; ໃຊ້ຂອບການເຮັດວຽກທີ່ມີນ້ຳໜັກເບົາ. [5]
ການນຳໃຊ້ທີ່ມີຄວາມຮັບຜິດຊອບ ແລະ ໃຊ້ໄດ້ຈິງ (ແມ່ນແລ້ວ, ແມ່ນແຕ່ສຳລັບຜູ້ກໍ່ສ້າງດ່ຽວ) 🧯
ການກວດສອບຄວາມເປັນຈິງ: ການສາທິດທີ່ໜ້າປະທັບໃຈແມ່ນງ່າຍ; ລະບົບທີ່ໜ້າເຊື່ອຖືແມ່ນບໍ່ແມ່ນ.
-
ຮັກສາ README ແບບ “ບັດຮູບແບບ” ສັ້ນໆ: ແຫຼ່ງຂໍ້ມູນ, ຕົວຊີ້ວັດ, ຂີດຈຳກັດທີ່ຮູ້ຈັກ, ຈັງຫວະການອັບເດດ.
-
ຕື່ມການປ້ອງກັນພື້ນຖານ (ຂໍ້ຈຳກັດອັດຕາ, ການກວດສອບການປ້ອນຂໍ້ມູນ, ການຕິດຕາມກວດກາການລ່ວງລະເມີດ).
-
ສຳລັບສິ່ງໃດກໍ່ຕາມທີ່ຜູ້ໃຊ້ປະເຊີນ ຫຼື ເປັນຜົນສະທ້ອນ, ໃຫ້ໃຊ້ ທີ່ອີງໃສ່ຄວາມສ່ຽງ : ລະບຸອັນຕະລາຍ, ທົດສອບກໍລະນີຂອບ, ແລະ ບັນທຶກການຫຼຸດຜ່ອນຜົນກະທົບ. NIST AI RMF ຖືກສ້າງຂຶ້ນມາເພື່ອສິ່ງນີ້ໂດຍສະເພາະ. [5]
ອຸປະສັກທົ່ວໄປ (ເພື່ອໃຫ້ທ່ານສາມາດຫຼີກລ່ຽງພວກມັນໄດ້) 🧨
-
ການຂ້າມບົດຮຽນແບບໂດດໆ - “ພຽງແຕ່ອີກຫຼັກສູດດຽວ” ກາຍເປັນບຸກຄະລິກກະພາບທັງໝົດຂອງເຈົ້າ.
-
ເລີ່ມຕົ້ນດ້ວຍຫົວຂໍ້ທີ່ຍາກທີ່ສຸດ - ໝໍ້ແປງໄຟຟ້າແມ່ນເຢັນ, ແຕ່ພື້ນຖານຈ່າຍຄ່າເຊົ່າ.
-
ການບໍ່ສົນໃຈການປະເມີນຜົນ - ຄວາມຖືກຕ້ອງພຽງຢ່າງດຽວສາມາດເປັນຄວາມຈິງໄດ້. ໃຊ້ຕົວຊີ້ວັດທີ່ເໝາະສົມກັບວຽກ. [3]
-
ຢ່າຂຽນສິ່ງຕ່າງໆລົງ - ໃຫ້ຈົດບັນທຶກສັ້ນໆ: ສິ່ງທີ່ລົ້ມເຫຼວ, ສິ່ງທີ່ປ່ຽນແປງ, ສິ່ງທີ່ດີຂຶ້ນ.
-
ບໍ່ຕ້ອງມີການຝຶກຊ້ອມການນຳໃຊ້ - ແມ່ນແຕ່ການຫໍ່ແອັບງ່າຍໆກໍສອນໄດ້ຫຼາຍຢ່າງ.
-
ຫຼີກລ່ຽງການຄິດເຖິງຄວາມສ່ຽງ - ຂຽນຂໍ້ສັງເກດສອງຂໍ້ກ່ຽວກັບອັນຕະລາຍທີ່ອາດເກີດຂຶ້ນກ່ອນທີ່ທ່ານຈະສົ່ງສິນຄ້າ. [5]
ຄຳເຕືອນສຸດທ້າຍ - ຍາວເກີນໄປ, ຂ້ອຍບໍ່ໄດ້ອ່ານມັນ 😌
ຖ້າທ່ານກຳລັງຖາມວ່າ ວິທີການຮຽນຮູ້ AI , ນີ້ແມ່ນສູດທີ່ງ່າຍທີ່ສຸດທີ່ຈະຊະນະ:
-
ເລີ່ມຕົ້ນດ້ວຍ ພື້ນຖານ ML ຕົວຈິງ (ການແນະນຳແບບກະທັດຮັດ + ການຝຶກຊ້ອມແບບ Kaggle).
-
ໃຊ້ scikit-learn ເພື່ອຮຽນຮູ້ຂະບວນການເຮັດວຽກ ແລະ ຕົວຊີ້ວັດ ML ທີ່ແທ້ຈິງ. [3]
-
ຍ້າຍໄປ PyTorch ສຳລັບການຮຽນຮູ້ຢ່າງເລິກເຊິ່ງ ແລະ ການຝຶກອົບຮົມຮອບວຽນ. [4]
-
ເພີ່ມ ທັກສະ LLM ດ້ວຍຫຼັກສູດປະຕິບັດຕົວຈິງ ແລະ ການເລີ່ມຕົ້ນ API ຢ່າງວ່ອງໄວ.
-
ສ້າງ ໂຄງການ 3–5 ໂຄງການ ທີ່ສະແດງໃຫ້ເຫັນ: ການກະກຽມຂໍ້ມູນ, ການສ້າງແບບຈຳລອງ, ການປະເມີນຜົນ, ແລະ ການຫຸ້ມຫໍ່ "ຜະລິດຕະພັນ" ແບບງ່າຍໆ.
-
ໃຫ້ປະຕິບັດຕໍ່ ຄວາມສ່ຽງ/ການຄຸ້ມຄອງ ເປັນສ່ວນໜຶ່ງຂອງ “ສິ່ງທີ່ເຮັດແລ້ວ”, ບໍ່ແມ່ນສິ່ງເພີ່ມເຕີມທີ່ເປັນທາງເລືອກ. [5]
ແລະແມ່ນແລ້ວ, ບາງຄັ້ງເຈົ້າຈະຮູ້ສຶກຫຼົງທາງ. ນັ້ນເປັນເລື່ອງປົກກະຕິ. AI ແມ່ນຄືກັບການສອນເຄື່ອງປີ້ງເຂົ້າຈີ່ໃຫ້ອ່ານ - ມັນໜ້າປະທັບໃຈເມື່ອມັນເຮັດວຽກ, ແຕ່ໜ້າຢ້ານເລັກນ້ອຍເມື່ອມັນບໍ່ໄດ້ຜົນ, ແລະມັນຕ້ອງໃຊ້ການເຮັດຊ້ຳຫຼາຍກວ່າທີ່ທຸກຄົນຍອມຮັບ 😵💫
ເອກະສານອ້າງອີງ
[1] ບັນທຶກການບັນຍາຍຂອງ Stanford CS229. (ຫຼັກການພື້ນຖານ ML ຫຼັກ, ການຮຽນຮູ້ພາຍໃຕ້ການຊີ້ນຳ, ການວາງກອບຄວາມເປັນໄປໄດ້).
https://cs229.stanford.edu/main_notes.pdf
[2] MIT 6.S191: ການແນະນຳການຮຽນຮູ້ຢ່າງເລິກເຊິ່ງ. (ພາບລວມຂອງການຮຽນຮູ້ຢ່າງເລິກເຊິ່ງ, ຫົວຂໍ້ທີ່ທັນສະໄໝລວມທັງ LLMs).
https://introtodeeplearning.com/
[3] scikit-learn: ການປະເມີນຮູບແບບ ແລະ ຕົວຊີ້ວັດຕ່າງໆ. (ຄວາມແມ່ນຍຳ, ຄວາມແມ່ນຍຳ/ການລະນຶກເຖິງ, ROC-AUC, ແລະອື່ນໆ).
https://scikit-learn.org/stable/modules/model_evaluation.html
[4] ບົດແນະນຳ PyTorch – ຮຽນຮູ້ພື້ນຖານ. (Tensors, datasets/dataloaders, training/eval loops).
https://docs.pytorch.org/tutorials/beginner/basics/intro.html
[5] ຂອບການຄຸ້ມຄອງຄວາມສ່ຽງດ້ານ AI ຂອງ NIST (AI RMF 1.0). (ຄຳແນະນຳກ່ຽວກັບ AI ທີ່ອີງໃສ່ຄວາມສ່ຽງ ແລະ ໜ້າເຊື່ອຖື).
https://nvlpubs.nist.gov/nistpubs/ai/nist.ai.100-1.pdf
ຊັບພະຍາກອນເພີ່ມເຕີມ (ສາມາດຄລິກໄດ້)
-
ຫຼັກສູດການຮຽນຮູ້ເຄື່ອງຈັກ Google Crash: ອ່ານຕື່ມ
-
Kaggle Learn – ການແນະນຳກ່ຽວກັບ ML: ອ່ານຕື່ມ
-
Kaggle Learn – ML ລະດັບກາງ: ອ່ານຕື່ມ
-
fast.ai – ການຮຽນຮູ້ເລິກເຊິ່ງແບບປະຕິບັດໄດ້ຈິງສຳລັບນັກຂຽນໂປຣແກຣມ: ອ່ານຕື່ມ
-
DeepLearning.AI – ຄວາມຊ່ຽວຊານດ້ານການຮຽນຮູ້ຂອງເຄື່ອງຈັກ: ອ່ານຕື່ມ
-
DeepLearning.AI – ຄວາມຊ່ຽວຊານດ້ານການຮຽນຮູ້ເລິກ: ອ່ານຕື່ມ
-
scikit-learn ການເລີ່ມຕົ້ນ: ອ່ານຕື່ມ
-
ບົດແນະນຳ PyTorch (ດັດຊະນີ): ອ່ານຕື່ມ
-
ຫຼັກສູດ Hugging Face LLM (ການແນະນຳ): ອ່ານຕື່ມ
-
OpenAI API – ການເລີ່ມຕົ້ນແບບດ່ວນສຳລັບນັກພັດທະນາ: ອ່ານຕື່ມ
-
OpenAI API – ແນວຄວາມຄິດ: ອ່ານຕື່ມ
-
ໜ້າພາບລວມຂອງ NIST AI RMF: ອ່ານຕື່ມ