ວິທີການຮຽນຮູ້ AI?

ວິທີການຮຽນຮູ້ AI?

ການຮຽນຮູ້ AI ສາມາດຮູ້ສຶກຄືກັບການກ້າວເຂົ້າໄປໃນຫໍສະໝຸດຍັກໃຫຍ່ບ່ອນທີ່ປຶ້ມທຸກຫົວຮ້ອງວ່າ "ເລີ່ມຕົ້ນທີ່ນີ້." ເຄິ່ງໜຶ່ງຂອງຊັ້ນວາງຂຽນວ່າ "ຄະນິດສາດ," ເຊິ່ງມັນ... ຫຍາບຄາຍເລັກນ້ອຍ 😅

ຂໍ້ດີ: ເຈົ້າບໍ່ຈຳເປັນຕ້ອງຮູ້ທຸກຢ່າງເພື່ອສ້າງສິ່ງທີ່ເປັນປະໂຫຍດ. ເຈົ້າຕ້ອງການເສັ້ນທາງທີ່ມີເຫດຜົນ, ຊັບພະຍາກອນທີ່ໜ້າເຊື່ອຖືໄດ້ສອງສາມຢ່າງ, ແລະ ຄວາມເຕັມໃຈທີ່ຈະສັບສົນໄປຊົ່ວໄລຍະໜຶ່ງ (ຄວາມສັບສົນແມ່ນຄ່າທຳນຽມເຂົ້າ).

ບົດຄວາມທີ່ເຈົ້າອາດຈະມັກອ່ານຫຼັງຈາກອັນນີ້:

🔗 AI ກວດຈັບຄວາມຜິດປົກກະຕິໄດ້ແນວໃດ
ອະທິບາຍວິທີການກວດຫາຄວາມຜິດປົກກະຕິໂດຍໃຊ້ການຮຽນຮູ້ຂອງເຄື່ອງຈັກ ແລະ ສະຖິຕິ.

🔗 ເປັນຫຍັງ AI ຈຶ່ງບໍ່ດີຕໍ່ສັງຄົມ
ກວດກາຄວາມສ່ຽງດ້ານຈັນຍາບັນ, ສັງຄົມ ແລະ ເສດຖະກິດຂອງປັນຍາປະດິດ.

🔗 AI ໃຊ້ນໍ້າຫຼາຍປານໃດ
ແຍກຜົນກະທົບຕໍ່ການໃຊ້ພະລັງງານຂອງ AI ແລະ ການໃຊ້ນ້ຳທີ່ເຊື່ອງໄວ້.

🔗 ຊຸດຂໍ້ມູນ AI ​​ແມ່ນຫຍັງ
ກຳນົດຊຸດຂໍ້ມູນ, ການຕິດສະຫຼາກ ແລະ ບົດບາດຂອງພວກມັນໃນການຝຶກອົບຮົມ AI.


ຄຳວ່າ "AI" ຕົວຈິງແລ້ວໝາຍຄວາມວ່າແນວໃດໃນຊີວິດປະຈຳວັນ 🤷‍♀️

ຜູ້ຄົນເວົ້າວ່າ “AI” ແລະ ໝາຍເຖິງສິ່ງທີ່ແຕກຕ່າງກັນສອງສາມຢ່າງ:

  • ການຮຽນຮູ້ຂອງເຄື່ອງຈັກ (ML) – ຮູບແບບຮຽນຮູ້ຮູບແບບຈາກຂໍ້ມູນເພື່ອເຊື່ອມໂຍງຂໍ້ມູນເຂົ້າກັບຜົນຜະລິດ (ເຊັ່ນ: ການກວດຈັບສະແປມ, ການຄາດຄະເນລາຄາ). [1]

  • ການຮຽນຮູ້ເລິກ (DL) - ກຸ່ມຍ່ອຍຂອງ ML ໂດຍໃຊ້ເຄືອຂ່າຍປະສາດໃນລະດັບໃຫຍ່ (ວິໄສທັດ, ການເວົ້າ, ຮູບແບບພາສາຂະໜາດໃຫຍ່). [2]

  • AI ທີ່ສ້າງສັນ - ຮູບແບບທີ່ຜະລິດຂໍ້ຄວາມ, ຮູບພາບ, ລະຫັດ, ສຽງ (chatbots, copilots, ເຄື່ອງມືເນື້ອຫາ). [2]

  • ການຮຽນຮູ້ແບບເສີມສ້າງ - ການຮຽນຮູ້ໂດຍການທົດລອງ ແລະ ລາງວັນ (ຕົວແທນເກມ, ຫຸ່ນຍົນ). [1]

ເຈົ້າບໍ່ຈຳເປັນຕ້ອງເລືອກຢ່າງສົມບູນແບບໃນຕອນເລີ່ມຕົ້ນ. ພຽງແຕ່ຢ່າປະຕິບັດຕໍ່ AI ຄືກັບພິພິທະພັນ. ມັນຄ້າຍຄືກັບເຮືອນຄົວຫຼາຍກວ່າ - ເຈົ້າຮຽນຮູ້ໄດ້ໄວຂຶ້ນໂດຍການປຸງແຕ່ງອາຫານ. ບາງຄັ້ງເຈົ້າກໍ່ປີ້ງເຂົ້າຈີ່. 🍞🔥

ເລື່ອງເລັກໆນ້ອຍໆ: ທີມງານຂະໜາດນ້ອຍໄດ້ສົ່ງຮູບແບບການ churn ທີ່ "ດີເລີດ"... ຈົນກວ່າພວກເຂົາຈະສັງເກດເຫັນ ID ທີ່ຄືກັນໃນການຝຶກອົບຮົມ ແລະ ການທົດສອບ. ການຮົ່ວໄຫຼແບບຄລາສສິກ. pipeline ງ່າຍໆ + ການແບ່ງແຍກທີ່ສະອາດໄດ້ປ່ຽນ 0.99 ທີ່ໜ້າສົງໄສໃຫ້ເປັນຄະແນນທີ່ໜ້າເຊື່ອຖື (ຕໍ່າກວ່າ!) ແລະ ເປັນຮູບແບບທີ່ລວມເຂົ້າກັນໄດ້ແທ້ໆ. [3]


ສິ່ງທີ່ເຮັດໃຫ້ແຜນການ “ວິທີການຮຽນຮູ້ AI” ທີ່ດີ ✅

ແຜນການທີ່ດີມີລັກສະນະບາງຢ່າງທີ່ຟັງແລ້ວໜ້າເບື່ອແຕ່ຊ່ວຍປະຢັດເງິນໄດ້ຫຼາຍເດືອນ:

  • ສ້າງໃນຂະນະທີ່ເຈົ້າຮຽນຮູ້ (ໂຄງການນ້ອຍໆແຕ່ຫົວທີ, ໂຄງການໃຫຍ່ກວ່າພາຍຫຼັງ).

  • ຮຽນຮູ້ຄະນິດສາດຂັ້ນຕ່ຳທີ່ຕ້ອງການ , ຈາກນັ້ນກັບຄືນໄປຫາຄວາມເລິກ.

  • ອະທິບາຍສິ່ງທີ່ເຈົ້າໄດ້ເຮັດ (ເຮັດວຽກຂອງເຈົ້າແບບບໍ່ຄິດຫຍັງເລີຍ; ມັນປິ່ນປົວຄວາມຄິດທີ່ມົວໆ).

  • ຍຶດຕິດກັບ “core stack” ອັນດຽວໄລຍະໜຶ່ງ (Python + Jupyter + scikit-learn → ຈາກນັ້ນ PyTorch).

  • ວັດແທກຄວາມຄືບໜ້າດ້ວຍຜົນຜະລິດ , ບໍ່ແມ່ນຊົ່ວໂມງທີ່ເບິ່ງ.

ຖ້າແຜນການຂອງເຈົ້າມີພຽງແຕ່ວິດີໂອ ແລະ ບັນທຶກເທົ່ານັ້ນ, ມັນຄ້າຍຄືກັບການພະຍາຍາມລອຍນໍ້າໂດຍການອ່ານກ່ຽວກັບນໍ້າ.


ເລືອກເລນຂອງເຈົ້າ (ດຽວນີ້) - ສາມເສັ້ນທາງທີ່ໃຊ້ກັນທົ່ວໄປ 🚦

ເຈົ້າສາມາດຮຽນຮູ້ AI ໃນ “ຮູບຮ່າງ” ທີ່ແຕກຕ່າງກັນ. ນີ້ແມ່ນສາມຢ່າງທີ່ເຮັດວຽກໄດ້:

1) ເສັ້ນທາງການກໍ່ສ້າງທີ່ໃຊ້ໄດ້ຈິງ 🛠️

ດີທີ່ສຸດຖ້າທ່ານຕ້ອງການໄຊຊະນະໄວ ແລະ ແຮງຈູງໃຈ.
​​ຈຸດສຸມ: ຊຸດຂໍ້ມູນ, ຮູບແບບການຝຶກອົບຮົມ, ການສາທິດການຂົນສົ່ງ.
ຊັບພະຍາກອນເລີ່ມຕົ້ນ: ຫຼັກສູດ ML Crash ຂອງ Google, Kaggle Learn, fast.ai (ລິ້ງໃນເອກະສານອ້າງອີງ ແລະ ຊັບພະຍາກອນຂ້າງລຸ່ມນີ້).

2) ພື້ນຖານ - ເສັ້ນທາງທຳອິດ 📚

ດີທີ່ສຸດຖ້າທ່ານມັກຄວາມຊັດເຈນ ແລະ ທິດສະດີ.
ຈຸດສຸມ: ການຖົດຖອຍ, ອະຄະຕິ-ຄວາມແປປ່ວນ, ການຄິດແບບຄວາມເປັນໄປໄດ້, ການເພີ່ມປະສິດທິພາບ.
ແຫຼ່ງຂໍ້ມູນ: ເອກະສານ Stanford CS229, MIT Intro to Deep Learning. [1][2]

3) ເສັ້ນທາງຂອງນັກພັດທະນາແອັບ Gen-AI ✨

ດີທີ່ສຸດຖ້າທ່ານຕ້ອງການສ້າງຜູ້ຊ່ວຍ, ການຄົ້ນຫາ, ຂັ້ນຕອນການເຮັດວຽກ, ສິ່ງຂອງ "ຕົວແທນ".
ຈຸດສຸມ: ການກະຕຸ້ນ, ການດຶງຂໍ້ມູນ, ການປະເມີນຜົນ, ການໃຊ້ເຄື່ອງມື, ພື້ນຖານຄວາມປອດໄພ, ການນຳໃຊ້.
ເອກະສານທີ່ຄວນເກັບໄວ້ໃກ້ໆ: ເອກະສານແພລດຟອມ (APIs), ຫຼັກສູດ HF (ເຄື່ອງມື).

ເຈົ້າສາມາດປ່ຽນເລນໄດ້ພາຍຫຼັງ. ການສະຕາດລົດແມ່ນສ່ວນທີ່ຍາກ.

 

ວິທີການຮຽນຮູ້ການສຶກສາ AI

ຕາຕະລາງປຽບທຽບ - ວິທີທີ່ດີທີ່ສຸດໃນການຮຽນຮູ້ (ດ້ວຍຄວາມແປກປະຫຼາດທີ່ຊື່ສັດ) 📋

ເຄື່ອງມື / ຫຼັກສູດ ຜູ້ຊົມ ລາຄາ ເປັນຫຍັງມັນຈຶ່ງໃຊ້ໄດ້ (ສະຫຼຸບໂດຍຫຍໍ້)
ຫຼັກສູດການຮຽນຮູ້ຂອງເຄື່ອງຈັກ Google ແບບເລັ່ງລັດ ຜູ້ເລີ່ມຕົ້ນ ຟຣີ ພາບ + ການລົງມືປະຕິບັດຕົວຈິງ; ຫຼີກລ່ຽງຄວາມສັບສົນຫຼາຍເກີນໄປ
Kaggle Learn (Intro + Intermediate ML) ຜູ້ເລີ່ມຕົ້ນທີ່ມັກການຝຶກຊ້ອມ ຟຣີ ບົດຮຽນສັ້ນໆ + ການຝຶກຊ້ອມທັນທີ
ການຮຽນຮູ້ເລິກເຊິ່ງແບບປະຕິບັດໄດ້ຂອງ fast.ai ຜູ້ສ້າງທີ່ມີລະຫັດບາງຢ່າງ ຟຣີ ເຈົ້າຝຶກນາງແບບຕົວຈິງແຕ່ຫົວທີ - ຄືທັນທີ 😅
ຄວາມຊ່ຽວຊານດ້ານ DeepLearning.AI ML ຜູ້ຮຽນທີ່ມີໂຄງສ້າງ ຈ່າຍແລ້ວ ຄວາມຄືບໜ້າທີ່ຊັດເຈນຜ່ານແນວຄວາມຄິດຫຼັກຂອງ ML
ລາຍລະອຽດການຮຽນຮູ້ເລິກ DeepLearning.AI ພື້ນຖານ ML ແລ້ວ ຈ່າຍແລ້ວ ຄວາມເລິກທີ່ແຂງແກ່ນໃນເຄືອຂ່າຍປະສາດ + ຂັ້ນຕອນການເຮັດວຽກ
ບັນທຶກ Stanford CS229 ຂັບເຄື່ອນດ້ວຍທິດສະດີ ຟຣີ ພື້ນຖານທີ່ຈິງຈັງ (“ເປັນຫຍັງສິ່ງນີ້ຈຶ່ງເຮັດວຽກ”)
ຄູ່ມືຜູ້ໃຊ້ scikit-learn ຜູ້ປະຕິບັດ ML ຟຣີ ຊຸດເຄື່ອງມືຄລາສສິກສຳລັບຕາຕະລາງ/ເສັ້ນຖານ
ບົດແນະນຳການໃຊ້ PyTorch ຜູ້ສ້າງການຮຽນຮູ້ເລິກ ຟຣີ ເສັ້ນທາງທີ່ສະອາດຈາກ tensors → ວົງຈອນການຝຶກອົບຮົມ [4]
Hugging Face LLM ຫຼັກສູດ ຜູ້ສ້າງ NLP + LLM ຟຣີ ຂະບວນການເຮັດວຽກ LLM ທີ່ໃຊ້ໄດ້ຈິງ + ເຄື່ອງມືລະບົບນິເວດ
NIST AI ຂອບການຄຸ້ມຄອງຄວາມສ່ຽງ ໃຜກໍຕາມທີ່ໃຊ້ AI ຟຣີ ໂຄງສ້າງຄວາມສ່ຽງ/ການຄຸ້ມຄອງທີ່ງ່າຍດາຍ ແລະ ນຳໃຊ້ໄດ້ [5]

ໝາຍເຫດນ້ອຍໆ: “ລາຄາ” ທາງອອນລາຍແມ່ນແປກ. ບາງຢ່າງແມ່ນບໍ່ເສຍຄ່າແຕ່ຕ້ອງເສຍຄ່າໃຊ້ຈ່າຍ… ເຊິ່ງບາງຄັ້ງກໍ່ຮ້າຍແຮງກວ່ານັ້ນ.


ຊຸດທັກສະຫຼັກທີ່ເຈົ້າຕ້ອງການແທ້ໆ (ແລະ ຕາມລຳດັບ) 🧩

ຖ້າເປົ້າໝາຍຂອງເຈົ້າແມ່ນ ວິທີການຮຽນຮູ້ AI ໂດຍບໍ່ຕ້ອງຈົມນ້ຳ, ໃຫ້ຕັ້ງເປົ້າໝາຍຕາມລຳດັບນີ້:

  1. ພື້ນຖານ Python

  • ຟັງຊັນ, ລາຍຊື່/ຄຳສັ່ງ, ຄລາສເບົາ, ການອ່ານໄຟລ໌.

  • ນິໄສທີ່ຕ້ອງມີ: ຂຽນບົດນ້ອຍໆ, ບໍ່ພຽງແຕ່ຂຽນປື້ມບັນທຶກເທົ່ານັ້ນ.

  1. ການຈັດການຂໍ້ມູນ

  • ການຄິດແບບ NumPy, ພື້ນຖານຂອງໝີແພນດາ, ແລະ ການວາງແຜນ.

  • ເຈົ້າຈະໃຊ້ເວລາຫຼາຍຢູ່ທີ່ນີ້. ບໍ່ແມ່ນເລື່ອງທີ່ໜ້າສົນໃຈ, ແຕ່ມັນແມ່ນວຽກ.

  1. ML ແບບຄລາສສິກ (ມະຫາອຳນາດທີ່ຖືກປະເມີນຄ່າຕໍ່າ)

  • ການແຍກຂອງລົດໄຟ/ການທົດສອບ, ການຮົ່ວໄຫຼ, ການພໍດີເກີນໄປ.

  • ການຖົດຖອຍເສັ້ນຊື່/ໂລຈິສຕິກ, ຕົ້ນໄມ້, ປ່າໄມ້ແບບສຸ່ມ, ການເພີ່ມຄວາມຊັນ.

  • ຕົວຊີ້ວັດ: ຄວາມຖືກຕ້ອງ, ຄວາມແມ່ນຍຳ/ການລະນຶກເຖິງ, ROC-AUC, MAE/RMSE - ຮູ້ວ່າ ເມື່ອໃດ . [3]

  1. ການຮຽນຮູ້ເລິກ

  • ເທັນເຊີ, ເກຣດຽນ/ເບກຫຼັງ (ທາງດ້ານແນວຄິດ), ວົງວຽນການຝຶກອົບຮົມ.

  • CNN ສຳລັບຮູບພາບ, ຕົວແປງສັນຍານສຳລັບຂໍ້ຄວາມ (ໃນທີ່ສຸດ).

  • ພື້ນຖານ PyTorch ຈຳນວນໜຶ່ງແບບ end-to-end ມີປະໂຫຍດຫຼາຍ. [4]

  1. ຂະບວນການເຮັດວຽກ AI + LLM ທີ່ສ້າງສັນ

  • ການໃຊ້ໂທເຄັນ, ການຝັງ, ການສ້າງແບບເພີ່ມເຕີມໃນການດຶງຂໍ້ມູນຄືນ, ການປະເມີນຜົນ.

  • ການປັບແຕ່ງລະອຽດ vs. ການກະຕຸ້ນ (ແລະເມື່ອທ່ານຕ້ອງການທັງສອງຢ່າງ).


ແຜນການແບບເທື່ອລະຂັ້ນຕອນທີ່ທ່ານສາມາດປະຕິບັດຕາມໄດ້ 🗺️

ໄລຍະ A - ເຮັດໃຫ້ຮູບແບບທຳອິດຂອງທ່ານເຮັດວຽກໄດ້ (ໄວ) ⚡

ເປົ້າໝາຍ: ຝຶກອົບຮົມບາງສິ່ງບາງຢ່າງ, ວັດແທກມັນ, ປັບປຸງມັນ.

  • ເຮັດການແນະນຳແບບກະທັດຮັດ (ເຊັ່ນ: ຫຼັກສູດ ML Crash Course), ຈາກນັ້ນເຮັດຫຼັກສູດຈຸລະພາກແບບປະຕິບັດຕົວຈິງ (ເຊັ່ນ: ການແນະນຳ Kaggle).

  • ແນວຄວາມຄິດຂອງໂຄງການ: ຄາດຄະເນລາຄາເຮືອນ, ການຍົກເລີກຂອງລູກຄ້າ, ຫຼື ຄວາມສ່ຽງດ້ານສິນເຊື່ອໃນຊຸດຂໍ້ມູນສາທາລະນະ.

ບັນຊີກວດສອບ "ໄຊຊະນະ" ຂະໜາດນ້ອຍ:

  • ທ່ານສາມາດໂຫຼດຂໍ້ມູນໄດ້.

  • ທ່ານສາມາດຝຶກອົບຮົມຮູບແບບພື້ນຖານໄດ້.

  • ທ່ານສາມາດອະທິບາຍການ overfitting ໃນພາສາທໍາມະດາ.

ໄລຍະ B - ຄຸ້ນເຄີຍກັບການຝຶກ ML ຕົວຈິງ 🔧

ເປົ້າໝາຍ: ຢຸດການຕົກຕະລຶງກັບຮູບແບບຄວາມລົ້ມເຫຼວທົ່ວໄປ.

  • ເຮັດວຽກຜ່ານຫົວຂໍ້ ML ລະດັບປານກາງ: ຄ່າທີ່ຂາດຫາຍໄປ, ການຮົ່ວໄຫຼ, ທໍ່ສົ່ງ, CV.

  • ອ່ານບາງພາກສ່ວນຄູ່ມືຜູ້ໃຊ້ scikit-learn ແລະ ດໍາເນີນການຕົວຈິງ. [3]

  • ແນວຄວາມຄິດຂອງໂຄງການ: ທໍ່ສົ່ງແບບ end-to-end ແບບງ່າຍໆພ້ອມດ້ວຍຮູບແບບທີ່ບັນທຶກໄວ້ + ບົດລາຍງານການປະເມີນຜົນ.

ໄລຍະ C - ການຮຽນຮູ້ຢ່າງເລິກເຊິ່ງທີ່ບໍ່ຮູ້ສຶກຄືກັບເວດມົນ 🧙‍♂️

ເປົ້າໝາຍ: ຝຶກອົບຮົມເຄືອຂ່າຍປະສາດ ແລະ ເຂົ້າໃຈວົງຈອນການຝຶກອົບຮົມ.

  • ເຮັດເສັ້ນທາງ “ຮຽນຮູ້ພື້ນຖານ” ຂອງ PyTorch (tensors → datasets/dataloaders → training/eval → saving). [4]

  • ຖ້າທ່ານຕ້ອງການຄວາມໄວ ແລະ ຄວາມຮູ້ສຶກທີ່ໃຊ້ໄດ້ຈິງ, ທ່ານສາມາດຈັບຄູ່ກັບ fast.ai ໄດ້ຕາມຄວາມຕ້ອງການ.

  • ແນວຄວາມຄິດໂຄງການ: ຕົວຈັດປະເພດຮູບພາບ, ຮູບແບບຄວາມຮູ້ສຶກ, ຫຼື ການປັບແຕ່ງຕົວແປງຂະໜາດນ້ອຍ.

ໄລຍະ D – ແອັບ AI ທີ່ສ້າງສັນທີ່ໃຊ້ງານໄດ້ຈິງ ✨

ເປົ້າໝາຍ: ສ້າງບາງສິ່ງບາງຢ່າງທີ່ຜູ້ຄົນໃຊ້.

  • ປະຕິບັດຕາມຫຼັກສູດ LLM ແບບປະຕິບັດຕົວຈິງ + ການເລີ່ມຕົ້ນແບບດ່ວນຂອງຜູ້ຂາຍເພື່ອເຊື່ອມຕໍ່ການຝັງ, ການດຶງຂໍ້ມູນຄືນ ແລະ ການສ້າງລຸ້ນທີ່ປອດໄພ.

  • ແນວຄວາມຄິດຂອງໂຄງການ: ບອດຖາມ-ຕອບໃນ ຂອງທ່ານ (chunk → embed → retrieve → answer ພ້ອມກັບການອ້າງອີງ), ຫຼື ຜູ້ຊ່ວຍສະໜັບສະໜູນລູກຄ້າທີ່ມີການໂທຫາເຄື່ອງມື.


ສ່ວນ "ຄະນິດສາດ" - ຮຽນມັນຄືກັບເຄື່ອງປຸງ, ບໍ່ແມ່ນອາຫານທັງໝົດ 🧂

ຄະນິດສາດມີຄວາມສຳຄັນ, ແຕ່ເວລາມີຄວາມສຳຄັນຫຼາຍກວ່າ.

ຄະນິດສາດຂັ້ນຕ່ຳສຸດທີ່ສາມາດເຮັດໄດ້ເພື່ອເລີ່ມຕົ້ນ:

  • ພຶດຊະຄະນິດເສັ້ນຊື່: ເວັກເຕີ, ແມັດຕຣິກ, ຜົນຄູນຈຸດ (ຄວາມຮູ້ສຶກສຳລັບການຝັງ). [2]

  • ແຄລຄູລັສ: ອະນຸພັນຂອງສະຕິປັນຍາ (ຄວາມຊັນ → ການປ່ຽນແປງ). [1]

  • ຄວາມເປັນໄປໄດ້: ການແຈກຢາຍ, ຄວາມຄາດຫວັງ, ແນວຄິດພື້ນຖານຂອງ Bayes. [1]

ຖ້າທ່ານຕ້ອງການກະດູກສັນຫຼັງທີ່ເປັນທາງການຫຼາຍຂຶ້ນໃນພາຍຫຼັງ, ໃຫ້ເຂົ້າໄປເບິ່ງບັນທຶກ CS229 ສຳລັບພື້ນຖານ ແລະ ການຮຽນຮູ້ຢ່າງເລິກເຊິ່ງຂອງ MIT ສຳລັບຫົວຂໍ້ທີ່ທັນສະໄໝ. [1][2]


ໂຄງການທີ່ເຮັດໃຫ້ເຈົ້າເບິ່ງຄືວ່າເຈົ້າຮູ້ວ່າເຈົ້າກຳລັງເຮັດຫຍັງຢູ່ 😄

ຖ້າທ່ານສ້າງພຽງແຕ່ຕົວຈັດປະເພດໃນຊຸດຂໍ້ມູນຂອງຫຼິ້ນ, ທ່ານຈະຮູ້ສຶກວ່າຕິດຂັດ. ລອງໃຊ້ໂຄງການທີ່ຄ້າຍຄືກັບວຽກງານຕົວຈິງ:

  • ໂຄງການ ML ແບບພື້ນຖານກ່ອນ (scikit-learn): ຂໍ້ມູນສະອາດ → ພື້ນຖານທີ່ເຂັ້ມແຂງ → ການວິເຄາະຄວາມຜິດພາດ. [3]

  • ແອັບດຶງຂໍ້ມູນ LLM +: ingest docs → chunk → embed → retrieve → ສ້າງຄຳຕອບດ້ວຍການອ້າງອີງ.

  • ແຜງຄວບຄຸມຂະໜາດນ້ອຍສຳລັບຕິດຕາມກວດກາຮູບແບບ: ຂໍ້ມູນບັນທຶກການເຂົ້າ/ອອກ; ຕິດຕາມສັນຍານແບບດຣິບ (ເຖິງແມ່ນວ່າສະຖິຕິງ່າຍໆກໍ່ຊ່ວຍໄດ້).

  • ການກວດສອບ AI ຂະໜາດນ້ອຍທີ່ມີຄວາມຮັບຜິດຊອບ: ບັນທຶກຄວາມສ່ຽງ, ກໍລະນີທີ່ສຳຄັນ, ຜົນກະທົບຂອງຄວາມລົ້ມເຫຼວ; ໃຊ້ຂອບການເຮັດວຽກທີ່ມີນ້ຳໜັກເບົາ. [5]


ການນຳໃຊ້ທີ່ມີຄວາມຮັບຜິດຊອບ ແລະ ໃຊ້ໄດ້ຈິງ (ແມ່ນແລ້ວ, ແມ່ນແຕ່ສຳລັບຜູ້ກໍ່ສ້າງດ່ຽວ) 🧯

ການກວດສອບຄວາມເປັນຈິງ: ການສາທິດທີ່ໜ້າປະທັບໃຈແມ່ນງ່າຍ; ລະບົບທີ່ໜ້າເຊື່ອຖືແມ່ນບໍ່ແມ່ນ.

  • ຮັກສາ README ແບບ “ບັດຮູບແບບ” ສັ້ນໆ: ແຫຼ່ງຂໍ້ມູນ, ຕົວຊີ້ວັດ, ຂີດຈຳກັດທີ່ຮູ້ຈັກ, ຈັງຫວະການອັບເດດ.

  • ຕື່ມການປ້ອງກັນພື້ນຖານ (ຂໍ້ຈຳກັດອັດຕາ, ການກວດສອບການປ້ອນຂໍ້ມູນ, ການຕິດຕາມກວດກາການລ່ວງລະເມີດ).

  • ສຳລັບສິ່ງໃດກໍ່ຕາມທີ່ຜູ້ໃຊ້ປະເຊີນ ​​ຫຼື ເປັນຜົນສະທ້ອນ, ໃຫ້ໃຊ້ ທີ່ອີງໃສ່ຄວາມສ່ຽງ : ລະບຸອັນຕະລາຍ, ທົດສອບກໍລະນີຂອບ, ແລະ ບັນທຶກການຫຼຸດຜ່ອນຜົນກະທົບ. NIST AI RMF ຖືກສ້າງຂຶ້ນມາເພື່ອສິ່ງນີ້ໂດຍສະເພາະ. [5]


ອຸປະສັກທົ່ວໄປ (ເພື່ອໃຫ້ທ່ານສາມາດຫຼີກລ່ຽງພວກມັນໄດ້) 🧨

  • ການຂ້າມບົດຮຽນແບບໂດດໆ - “ພຽງແຕ່ອີກຫຼັກສູດດຽວ” ກາຍເປັນບຸກຄະລິກກະພາບທັງໝົດຂອງເຈົ້າ.

  • ເລີ່ມຕົ້ນດ້ວຍຫົວຂໍ້ທີ່ຍາກທີ່ສຸດ - ໝໍ້ແປງໄຟຟ້າແມ່ນເຢັນ, ແຕ່ພື້ນຖານຈ່າຍຄ່າເຊົ່າ.

  • ການບໍ່ສົນໃຈການປະເມີນຜົນ - ຄວາມຖືກຕ້ອງພຽງຢ່າງດຽວສາມາດເປັນຄວາມຈິງໄດ້. ໃຊ້ຕົວຊີ້ວັດທີ່ເໝາະສົມກັບວຽກ. [3]

  • ຢ່າຂຽນສິ່ງຕ່າງໆລົງ - ໃຫ້ຈົດບັນທຶກສັ້ນໆ: ສິ່ງທີ່ລົ້ມເຫຼວ, ສິ່ງທີ່ປ່ຽນແປງ, ສິ່ງທີ່ດີຂຶ້ນ.

  • ບໍ່ຕ້ອງມີການຝຶກຊ້ອມການນຳໃຊ້ - ແມ່ນແຕ່ການຫໍ່ແອັບງ່າຍໆກໍສອນໄດ້ຫຼາຍຢ່າງ.

  • ຫຼີກລ່ຽງການຄິດເຖິງຄວາມສ່ຽງ - ຂຽນຂໍ້ສັງເກດສອງຂໍ້ກ່ຽວກັບອັນຕະລາຍທີ່ອາດເກີດຂຶ້ນກ່ອນທີ່ທ່ານຈະສົ່ງສິນຄ້າ. [5]


ຄຳເຕືອນສຸດທ້າຍ - ຍາວເກີນໄປ, ຂ້ອຍບໍ່ໄດ້ອ່ານມັນ 😌

ຖ້າທ່ານກຳລັງຖາມວ່າ ວິທີການຮຽນຮູ້ AI , ນີ້ແມ່ນສູດທີ່ງ່າຍທີ່ສຸດທີ່ຈະຊະນະ:

  • ເລີ່ມຕົ້ນດ້ວຍ ພື້ນຖານ ML ຕົວຈິງ (ການແນະນຳແບບກະທັດຮັດ + ການຝຶກຊ້ອມແບບ Kaggle).

  • ໃຊ້ scikit-learn ເພື່ອຮຽນຮູ້ຂະບວນການເຮັດວຽກ ແລະ ຕົວຊີ້ວັດ ML ທີ່ແທ້ຈິງ. [3]

  • ຍ້າຍໄປ PyTorch ສຳລັບການຮຽນຮູ້ຢ່າງເລິກເຊິ່ງ ແລະ ການຝຶກອົບຮົມຮອບວຽນ. [4]

  • ເພີ່ມ ທັກສະ LLM ດ້ວຍຫຼັກສູດປະຕິບັດຕົວຈິງ ແລະ ການເລີ່ມຕົ້ນ API ຢ່າງວ່ອງໄວ.

  • ສ້າງ ໂຄງການ 3–5 ໂຄງການ ທີ່ສະແດງໃຫ້ເຫັນ: ການກະກຽມຂໍ້ມູນ, ການສ້າງແບບຈຳລອງ, ການປະເມີນຜົນ, ແລະ ການຫຸ້ມຫໍ່ "ຜະລິດຕະພັນ" ແບບງ່າຍໆ.

  • ໃຫ້ປະຕິບັດຕໍ່ ຄວາມສ່ຽງ/ການຄຸ້ມຄອງ ເປັນສ່ວນໜຶ່ງຂອງ “ສິ່ງທີ່ເຮັດແລ້ວ”, ບໍ່ແມ່ນສິ່ງເພີ່ມເຕີມທີ່ເປັນທາງເລືອກ. [5]

ແລະແມ່ນແລ້ວ, ບາງຄັ້ງເຈົ້າຈະຮູ້ສຶກຫຼົງທາງ. ນັ້ນເປັນເລື່ອງປົກກະຕິ. AI ແມ່ນຄືກັບການສອນເຄື່ອງປີ້ງເຂົ້າຈີ່ໃຫ້ອ່ານ - ມັນໜ້າປະທັບໃຈເມື່ອມັນເຮັດວຽກ, ແຕ່ໜ້າຢ້ານເລັກນ້ອຍເມື່ອມັນບໍ່ໄດ້ຜົນ, ແລະມັນຕ້ອງໃຊ້ການເຮັດຊ້ຳຫຼາຍກວ່າທີ່ທຸກຄົນຍອມຮັບ 😵💫


ເອກະສານອ້າງອີງ

[1] ບັນທຶກການບັນຍາຍຂອງ Stanford CS229. (ຫຼັກການພື້ນຖານ ML ຫຼັກ, ການຮຽນຮູ້ພາຍໃຕ້ການຊີ້ນຳ, ການວາງກອບຄວາມເປັນໄປໄດ້).
https://cs229.stanford.edu/main_notes.pdf

[2] MIT 6.S191: ການແນະນຳການຮຽນຮູ້ຢ່າງເລິກເຊິ່ງ. (ພາບລວມຂອງການຮຽນຮູ້ຢ່າງເລິກເຊິ່ງ, ຫົວຂໍ້ທີ່ທັນສະໄໝລວມທັງ LLMs).
https://introtodeeplearning.com/

[3] scikit-learn: ການປະເມີນຮູບແບບ ແລະ ຕົວຊີ້ວັດຕ່າງໆ. (ຄວາມແມ່ນຍຳ, ຄວາມແມ່ນຍຳ/ການລະນຶກເຖິງ, ROC-AUC, ແລະອື່ນໆ).
https://scikit-learn.org/stable/modules/model_evaluation.html

[4] ບົດແນະນຳ PyTorch – ຮຽນຮູ້ພື້ນຖານ. (Tensors, datasets/dataloaders, training/eval loops).
https://docs.pytorch.org/tutorials/beginner/basics/intro.html

[5] ຂອບການຄຸ້ມຄອງຄວາມສ່ຽງດ້ານ AI ຂອງ NIST (AI RMF 1.0). (ຄຳແນະນຳກ່ຽວກັບ AI ທີ່ອີງໃສ່ຄວາມສ່ຽງ ແລະ ໜ້າເຊື່ອຖື).
https://nvlpubs.nist.gov/nistpubs/ai/nist.ai.100-1.pdf


ຊັບພະຍາກອນເພີ່ມເຕີມ (ສາມາດຄລິກໄດ້)

ຊອກຫາ AI ຫຼ້າສຸດຢູ່ທີ່ຮ້ານຜູ້ຊ່ວຍ AI ຢ່າງເປັນທາງການ

ກ່ຽວກັບພວກເຮົາ

ກັບໄປທີ່ blog