ວິທີການຮຽນຮູ້ AI?

ການຮຽນຮູ້ AI ສາມາດຮູ້ສຶກຄືກັບການກ້າວເຂົ້າໄປໃນຫໍສະໝຸດຍັກໃຫຍ່ບ່ອນທີ່ປຶ້ມທຸກຫົວຮ້ອງວ່າ "ເລີ່ມຕົ້ນທີ່ນີ້." ເຄິ່ງໜຶ່ງຂອງຊັ້ນວາງຂຽນວ່າ "ຄະນິດສາດ," ເຊິ່ງມັນ... ຫຍາບຄາຍເລັກນ້ອຍ 😅

ຂໍ້ດີ: ເຈົ້າບໍ່ຈຳເປັນຕ້ອງຮູ້ທຸກຢ່າງເພື່ອສ້າງສິ່ງທີ່ເປັນປະໂຫຍດ. ເຈົ້າຕ້ອງການເສັ້ນທາງທີ່ມີເຫດຜົນ, ຊັບພະຍາກອນທີ່ໜ້າເຊື່ອຖືໄດ້ສອງສາມຢ່າງ, ແລະ ຄວາມເຕັມໃຈທີ່ຈະສັບສົນໄປຊົ່ວໄລຍະໜຶ່ງ (ຄວາມສັບສົນແມ່ນຄ່າທຳນຽມເຂົ້າ).

ບົດຄວາມທີ່ເຈົ້າອາດຈະມັກອ່ານຫຼັງຈາກອັນນີ້:

🔗 AI ກວດຈັບຄວາມຜິດປົກກະຕິໄດ້ແນວໃດ
ອະທິບາຍວິທີການກວດຫາຄວາມຜິດປົກກະຕິໂດຍໃຊ້ການຮຽນຮູ້ຂອງເຄື່ອງຈັກ ແລະ ສະຖິຕິ.

🔗 ເປັນຫຍັງ AI ຈຶ່ງບໍ່ດີຕໍ່ສັງຄົມ
ກວດກາຄວາມສ່ຽງດ້ານຈັນຍາບັນ, ສັງຄົມ ແລະ ເສດຖະກິດຂອງປັນຍາປະດິດ.

🔗 AI ໃຊ້ນໍ້າຫຼາຍປານໃດ
ແຍກຜົນກະທົບຕໍ່ການໃຊ້ພະລັງງານຂອງ AI ແລະ ການໃຊ້ນ້ຳທີ່ເຊື່ອງໄວ້.

🔗 ຊຸດຂໍ້ມູນ AI ແມ່ນຫຍັງ
ກຳນົດຊຸດຂໍ້ມູນ, ການຕິດສະຫຼາກ ແລະ ບົດບາດຂອງພວກມັນໃນການຝຶກອົບຮົມ AI.

ຄຳວ່າ "AI" ຕົວຈິງແລ້ວໝາຍຄວາມວ່າແນວໃດໃນຊີວິດປະຈຳວັນ 🤷‍♀️

ຜູ້ຄົນເວົ້າວ່າ “AI” ແລະ ໝາຍເຖິງສິ່ງທີ່ແຕກຕ່າງກັນສອງສາມຢ່າງ:

ການຮຽນຮູ້ຂອງເຄື່ອງຈັກ (ML) – ຮູບແບບຮຽນຮູ້ຮູບແບບຈາກຂໍ້ມູນເພື່ອເຊື່ອມໂຍງຂໍ້ມູນເຂົ້າກັບຜົນຜະລິດ (ເຊັ່ນ: ການກວດຈັບສະແປມ, ການຄາດຄະເນລາຄາ). [1]
ການຮຽນຮູ້ເລິກ (DL) - ກຸ່ມຍ່ອຍຂອງ ML ໂດຍໃຊ້ເຄືອຂ່າຍປະສາດໃນລະດັບໃຫຍ່ (ວິໄສທັດ, ການເວົ້າ, ຮູບແບບພາສາຂະໜາດໃຫຍ່). [2]
AI ທີ່ສ້າງສັນ - ຮູບແບບທີ່ຜະລິດຂໍ້ຄວາມ, ຮູບພາບ, ລະຫັດ, ສຽງ (chatbots, copilots, ເຄື່ອງມືເນື້ອຫາ). [2]
ການຮຽນຮູ້ແບບເສີມສ້າງ - ການຮຽນຮູ້ໂດຍການທົດລອງ ແລະ ລາງວັນ (ຕົວແທນເກມ, ຫຸ່ນຍົນ). [1]

ເຈົ້າບໍ່ຈຳເປັນຕ້ອງເລືອກຢ່າງສົມບູນແບບໃນຕອນເລີ່ມຕົ້ນ. ພຽງແຕ່ຢ່າປະຕິບັດຕໍ່ AI ຄືກັບພິພິທະພັນ. ມັນຄ້າຍຄືກັບເຮືອນຄົວຫຼາຍກວ່າ - ເຈົ້າຮຽນຮູ້ໄດ້ໄວຂຶ້ນໂດຍການປຸງແຕ່ງອາຫານ. ບາງຄັ້ງເຈົ້າກໍ່ປີ້ງເຂົ້າຈີ່. 🍞🔥

ເລື່ອງເລັກໆນ້ອຍໆ: ທີມງານຂະໜາດນ້ອຍໄດ້ສົ່ງຮູບແບບການ churn ທີ່ "ດີເລີດ"... ຈົນກວ່າພວກເຂົາຈະສັງເກດເຫັນ ID ທີ່ຄືກັນໃນການຝຶກອົບຮົມ ແລະ ການທົດສອບ. ການຮົ່ວໄຫຼແບບຄລາສສິກ. pipeline ງ່າຍໆ + ການແບ່ງແຍກທີ່ສະອາດໄດ້ປ່ຽນ 0.99 ທີ່ໜ້າສົງໄສໃຫ້ເປັນຄະແນນທີ່ໜ້າເຊື່ອຖື (ຕໍ່າກວ່າ!) ແລະ ເປັນຮູບແບບທີ່ລວມເຂົ້າກັນໄດ້ແທ້ໆ. [3]

ສິ່ງທີ່ເຮັດໃຫ້ແຜນການ “ວິທີການຮຽນຮູ້ AI” ທີ່ດີ ✅

ແຜນການທີ່ດີມີລັກສະນະບາງຢ່າງທີ່ຟັງແລ້ວໜ້າເບື່ອແຕ່ຊ່ວຍປະຢັດເງິນໄດ້ຫຼາຍເດືອນ:

ສ້າງໃນຂະນະທີ່ເຈົ້າຮຽນຮູ້ (ໂຄງການນ້ອຍໆແຕ່ຫົວທີ, ໂຄງການໃຫຍ່ກວ່າພາຍຫຼັງ).
ຮຽນຮູ້ຄະນິດສາດຂັ້ນຕ່ຳທີ່ຕ້ອງການ , ຈາກນັ້ນກັບຄືນໄປຫາຄວາມເລິກ.
ອະທິບາຍສິ່ງທີ່ເຈົ້າໄດ້ເຮັດ (ເຮັດວຽກຂອງເຈົ້າແບບບໍ່ຄິດຫຍັງເລີຍ; ມັນປິ່ນປົວຄວາມຄິດທີ່ມົວໆ).
ຍຶດຕິດກັບ “core stack” ອັນດຽວໄລຍະໜຶ່ງ (Python + Jupyter + scikit-learn → ຈາກນັ້ນ PyTorch).
ວັດແທກຄວາມຄືບໜ້າດ້ວຍຜົນຜະລິດ , ບໍ່ແມ່ນຊົ່ວໂມງທີ່ເບິ່ງ.

ຖ້າແຜນການຂອງເຈົ້າມີພຽງແຕ່ວິດີໂອ ແລະ ບັນທຶກເທົ່ານັ້ນ, ມັນຄ້າຍຄືກັບການພະຍາຍາມລອຍນໍ້າໂດຍການອ່ານກ່ຽວກັບນໍ້າ.

ເລືອກເລນຂອງເຈົ້າ (ດຽວນີ້) - ສາມເສັ້ນທາງທີ່ໃຊ້ກັນທົ່ວໄປ 🚦

ເຈົ້າສາມາດຮຽນຮູ້ AI ໃນ “ຮູບຮ່າງ” ທີ່ແຕກຕ່າງກັນ. ນີ້ແມ່ນສາມຢ່າງທີ່ເຮັດວຽກໄດ້:

1) ເສັ້ນທາງການກໍ່ສ້າງທີ່ໃຊ້ໄດ້ຈິງ 🛠️

ດີທີ່ສຸດຖ້າທ່ານຕ້ອງການໄຊຊະນະໄວ ແລະ ແຮງຈູງໃຈ.
ຈຸດສຸມ: ຊຸດຂໍ້ມູນ, ຮູບແບບການຝຶກອົບຮົມ, ການສາທິດການຂົນສົ່ງ.
ຊັບພະຍາກອນເລີ່ມຕົ້ນ: ຫຼັກສູດ ML Crash ຂອງ Google, Kaggle Learn, fast.ai (ລິ້ງໃນເອກະສານອ້າງອີງ ແລະ ຊັບພະຍາກອນຂ້າງລຸ່ມນີ້).

2) ພື້ນຖານ - ເສັ້ນທາງທຳອິດ 📚

ດີທີ່ສຸດຖ້າທ່ານມັກຄວາມຊັດເຈນ ແລະ ທິດສະດີ.
ຈຸດສຸມ: ການຖົດຖອຍ, ອະຄະຕິ-ຄວາມແປປ່ວນ, ການຄິດແບບຄວາມເປັນໄປໄດ້, ການເພີ່ມປະສິດທິພາບ.
ແຫຼ່ງຂໍ້ມູນ: ເອກະສານ Stanford CS229, MIT Intro to Deep Learning. [1][2]

3) ເສັ້ນທາງຂອງນັກພັດທະນາແອັບ Gen-AI ✨

ດີທີ່ສຸດຖ້າທ່ານຕ້ອງການສ້າງຜູ້ຊ່ວຍ, ການຄົ້ນຫາ, ຂັ້ນຕອນການເຮັດວຽກ, ສິ່ງຂອງ "ຕົວແທນ".
ຈຸດສຸມ: ການກະຕຸ້ນ, ການດຶງຂໍ້ມູນ, ການປະເມີນຜົນ, ການໃຊ້ເຄື່ອງມື, ພື້ນຖານຄວາມປອດໄພ, ການນຳໃຊ້.
ເອກະສານທີ່ຄວນເກັບໄວ້ໃກ້ໆ: ເອກະສານແພລດຟອມ (APIs), ຫຼັກສູດ HF (ເຄື່ອງມື).

ເຈົ້າສາມາດປ່ຽນເລນໄດ້ພາຍຫຼັງ. ການສະຕາດລົດແມ່ນສ່ວນທີ່ຍາກ.

ຕາຕະລາງປຽບທຽບ - ວິທີທີ່ດີທີ່ສຸດໃນການຮຽນຮູ້ (ດ້ວຍຄວາມແປກປະຫຼາດທີ່ຊື່ສັດ) 📋

ເຄື່ອງມື / ຫຼັກສູດ	ຜູ້ຊົມ	ລາຄາ	ເປັນຫຍັງມັນຈຶ່ງໃຊ້ໄດ້ (ສະຫຼຸບໂດຍຫຍໍ້)
ຫຼັກສູດການຮຽນຮູ້ຂອງເຄື່ອງຈັກ Google ແບບເລັ່ງລັດ	ຜູ້ເລີ່ມຕົ້ນ	ຟຣີ	ພາບ + ການລົງມືປະຕິບັດຕົວຈິງ; ຫຼີກລ່ຽງຄວາມສັບສົນຫຼາຍເກີນໄປ
Kaggle Learn (Intro + Intermediate ML)	ຜູ້ເລີ່ມຕົ້ນທີ່ມັກການຝຶກຊ້ອມ	ຟຣີ	ບົດຮຽນສັ້ນໆ + ການຝຶກຊ້ອມທັນທີ
ການຮຽນຮູ້ເລິກເຊິ່ງແບບປະຕິບັດໄດ້ຂອງ fast.ai	ຜູ້ສ້າງທີ່ມີລະຫັດບາງຢ່າງ	ຟຣີ	ເຈົ້າຝຶກນາງແບບຕົວຈິງແຕ່ຫົວທີ - ຄືທັນທີ 😅
ຄວາມຊ່ຽວຊານດ້ານ DeepLearning.AI ML	ຜູ້ຮຽນທີ່ມີໂຄງສ້າງ	ຈ່າຍແລ້ວ	ຄວາມຄືບໜ້າທີ່ຊັດເຈນຜ່ານແນວຄວາມຄິດຫຼັກຂອງ ML
ລາຍລະອຽດການຮຽນຮູ້ເລິກ DeepLearning.AI	ພື້ນຖານ ML ແລ້ວ	ຈ່າຍແລ້ວ	ຄວາມເລິກທີ່ແຂງແກ່ນໃນເຄືອຂ່າຍປະສາດ + ຂັ້ນຕອນການເຮັດວຽກ
ບັນທຶກ Stanford CS229	ຂັບເຄື່ອນດ້ວຍທິດສະດີ	ຟຣີ	ພື້ນຖານທີ່ຈິງຈັງ (“ເປັນຫຍັງສິ່ງນີ້ຈຶ່ງເຮັດວຽກ”)
ຄູ່ມືຜູ້ໃຊ້ scikit-learn	ຜູ້ປະຕິບັດ ML	ຟຣີ	ຊຸດເຄື່ອງມືຄລາສສິກສຳລັບຕາຕະລາງ/ເສັ້ນຖານ
ບົດແນະນຳການໃຊ້ PyTorch	ຜູ້ສ້າງການຮຽນຮູ້ເລິກ	ຟຣີ	ເສັ້ນທາງທີ່ສະອາດຈາກ tensors → ວົງຈອນການຝຶກອົບຮົມ [4]
Hugging Face LLM ຫຼັກສູດ	ຜູ້ສ້າງ NLP + LLM	ຟຣີ	ຂະບວນການເຮັດວຽກ LLM ທີ່ໃຊ້ໄດ້ຈິງ + ເຄື່ອງມືລະບົບນິເວດ
NIST AI ຂອບການຄຸ້ມຄອງຄວາມສ່ຽງ	ໃຜກໍຕາມທີ່ໃຊ້ AI	ຟຣີ	ໂຄງສ້າງຄວາມສ່ຽງ/ການຄຸ້ມຄອງທີ່ງ່າຍດາຍ ແລະ ນຳໃຊ້ໄດ້ [5]

ໝາຍເຫດນ້ອຍໆ: “ລາຄາ” ທາງອອນລາຍແມ່ນແປກ. ບາງຢ່າງແມ່ນບໍ່ເສຍຄ່າແຕ່ຕ້ອງເສຍຄ່າໃຊ້ຈ່າຍ… ເຊິ່ງບາງຄັ້ງກໍ່ຮ້າຍແຮງກວ່ານັ້ນ.

ຊຸດທັກສະຫຼັກທີ່ເຈົ້າຕ້ອງການແທ້ໆ (ແລະ ຕາມລຳດັບ) 🧩

ຖ້າເປົ້າໝາຍຂອງເຈົ້າແມ່ນ ວິທີການຮຽນຮູ້ AI ໂດຍບໍ່ຕ້ອງຈົມນ້ຳ, ໃຫ້ຕັ້ງເປົ້າໝາຍຕາມລຳດັບນີ້:

ພື້ນຖານ Python

ຟັງຊັນ, ລາຍຊື່/ຄຳສັ່ງ, ຄລາສເບົາ, ການອ່ານໄຟລ໌.
ນິໄສທີ່ຕ້ອງມີ: ຂຽນບົດນ້ອຍໆ, ບໍ່ພຽງແຕ່ຂຽນປື້ມບັນທຶກເທົ່ານັ້ນ.

ການຈັດການຂໍ້ມູນ

ການຄິດແບບ NumPy, ພື້ນຖານຂອງໝີແພນດາ, ແລະ ການວາງແຜນ.
ເຈົ້າຈະໃຊ້ເວລາຫຼາຍຢູ່ທີ່ນີ້. ບໍ່ແມ່ນເລື່ອງທີ່ໜ້າສົນໃຈ, ແຕ່ມັນແມ່ນວຽກ.

ML ແບບຄລາສສິກ (ມະຫາອຳນາດທີ່ຖືກປະເມີນຄ່າຕໍ່າ)

ການແຍກຂອງລົດໄຟ/ການທົດສອບ, ການຮົ່ວໄຫຼ, ການພໍດີເກີນໄປ.
ການຖົດຖອຍເສັ້ນຊື່/ໂລຈິສຕິກ, ຕົ້ນໄມ້, ປ່າໄມ້ແບບສຸ່ມ, ການເພີ່ມຄວາມຊັນ.
ຕົວຊີ້ວັດ: ຄວາມຖືກຕ້ອງ, ຄວາມແມ່ນຍຳ/ການລະນຶກເຖິງ, ROC-AUC, MAE/RMSE - ຮູ້ວ່າ ເມື່ອໃດ . [3]

ການຮຽນຮູ້ເລິກ

ເທັນເຊີ, ເກຣດຽນ/ເບກຫຼັງ (ທາງດ້ານແນວຄິດ), ວົງວຽນການຝຶກອົບຮົມ.
CNN ສຳລັບຮູບພາບ, ຕົວແປງສັນຍານສຳລັບຂໍ້ຄວາມ (ໃນທີ່ສຸດ).
ພື້ນຖານ PyTorch ຈຳນວນໜຶ່ງແບບ end-to-end ມີປະໂຫຍດຫຼາຍ. [4]

ຂະບວນການເຮັດວຽກ AI + LLM ທີ່ສ້າງສັນ

ການໃຊ້ໂທເຄັນ, ການຝັງ, ການສ້າງແບບເພີ່ມເຕີມໃນການດຶງຂໍ້ມູນຄືນ, ການປະເມີນຜົນ.
ການປັບແຕ່ງລະອຽດ vs. ການກະຕຸ້ນ (ແລະເມື່ອທ່ານຕ້ອງການທັງສອງຢ່າງ).

ແຜນການແບບເທື່ອລະຂັ້ນຕອນທີ່ທ່ານສາມາດປະຕິບັດຕາມໄດ້ 🗺️

ໄລຍະ A - ເຮັດໃຫ້ຮູບແບບທຳອິດຂອງທ່ານເຮັດວຽກໄດ້ (ໄວ) ⚡

ເປົ້າໝາຍ: ຝຶກອົບຮົມບາງສິ່ງບາງຢ່າງ, ວັດແທກມັນ, ປັບປຸງມັນ.

ເຮັດການແນະນຳແບບກະທັດຮັດ (ເຊັ່ນ: ຫຼັກສູດ ML Crash Course), ຈາກນັ້ນເຮັດຫຼັກສູດຈຸລະພາກແບບປະຕິບັດຕົວຈິງ (ເຊັ່ນ: ການແນະນຳ Kaggle).
ແນວຄວາມຄິດຂອງໂຄງການ: ຄາດຄະເນລາຄາເຮືອນ, ການຍົກເລີກຂອງລູກຄ້າ, ຫຼື ຄວາມສ່ຽງດ້ານສິນເຊື່ອໃນຊຸດຂໍ້ມູນສາທາລະນະ.

ບັນຊີກວດສອບ "ໄຊຊະນະ" ຂະໜາດນ້ອຍ:

ທ່ານສາມາດໂຫຼດຂໍ້ມູນໄດ້.
ທ່ານສາມາດຝຶກອົບຮົມຮູບແບບພື້ນຖານໄດ້.
ທ່ານສາມາດອະທິບາຍການ overfitting ໃນພາສາທໍາມະດາ.

ໄລຍະ B - ຄຸ້ນເຄີຍກັບການຝຶກ ML ຕົວຈິງ 🔧

ເປົ້າໝາຍ: ຢຸດການຕົກຕະລຶງກັບຮູບແບບຄວາມລົ້ມເຫຼວທົ່ວໄປ.

ເຮັດວຽກຜ່ານຫົວຂໍ້ ML ລະດັບປານກາງ: ຄ່າທີ່ຂາດຫາຍໄປ, ການຮົ່ວໄຫຼ, ທໍ່ສົ່ງ, CV.
ອ່ານບາງພາກສ່ວນຄູ່ມືຜູ້ໃຊ້ scikit-learn ແລະ ດໍາເນີນການຕົວຈິງ. [3]
ແນວຄວາມຄິດຂອງໂຄງການ: ທໍ່ສົ່ງແບບ end-to-end ແບບງ່າຍໆພ້ອມດ້ວຍຮູບແບບທີ່ບັນທຶກໄວ້ + ບົດລາຍງານການປະເມີນຜົນ.

ໄລຍະ C - ການຮຽນຮູ້ຢ່າງເລິກເຊິ່ງທີ່ບໍ່ຮູ້ສຶກຄືກັບເວດມົນ 🧙‍♂️

ເປົ້າໝາຍ: ຝຶກອົບຮົມເຄືອຂ່າຍປະສາດ ແລະ ເຂົ້າໃຈວົງຈອນການຝຶກອົບຮົມ.

ເຮັດເສັ້ນທາງ “ຮຽນຮູ້ພື້ນຖານ” ຂອງ PyTorch (tensors → datasets/dataloaders → training/eval → saving). [4]
ຖ້າທ່ານຕ້ອງການຄວາມໄວ ແລະ ຄວາມຮູ້ສຶກທີ່ໃຊ້ໄດ້ຈິງ, ທ່ານສາມາດຈັບຄູ່ກັບ fast.ai ໄດ້ຕາມຄວາມຕ້ອງການ.
ແນວຄວາມຄິດໂຄງການ: ຕົວຈັດປະເພດຮູບພາບ, ຮູບແບບຄວາມຮູ້ສຶກ, ຫຼື ການປັບແຕ່ງຕົວແປງຂະໜາດນ້ອຍ.

ໄລຍະ D – ແອັບ AI ທີ່ສ້າງສັນທີ່ໃຊ້ງານໄດ້ຈິງ ✨

ເປົ້າໝາຍ: ສ້າງບາງສິ່ງບາງຢ່າງທີ່ຜູ້ຄົນໃຊ້.

ປະຕິບັດຕາມຫຼັກສູດ LLM ແບບປະຕິບັດຕົວຈິງ + ການເລີ່ມຕົ້ນແບບດ່ວນຂອງຜູ້ຂາຍເພື່ອເຊື່ອມຕໍ່ການຝັງ, ການດຶງຂໍ້ມູນຄືນ ແລະ ການສ້າງລຸ້ນທີ່ປອດໄພ.
ແນວຄວາມຄິດຂອງໂຄງການ: ບອດຖາມ-ຕອບໃນ ຂອງທ່ານ (chunk → embed → retrieve → answer ພ້ອມກັບການອ້າງອີງ), ຫຼື ຜູ້ຊ່ວຍສະໜັບສະໜູນລູກຄ້າທີ່ມີການໂທຫາເຄື່ອງມື.

ສ່ວນ "ຄະນິດສາດ" - ຮຽນມັນຄືກັບເຄື່ອງປຸງ, ບໍ່ແມ່ນອາຫານທັງໝົດ 🧂

ຄະນິດສາດມີຄວາມສຳຄັນ, ແຕ່ເວລາມີຄວາມສຳຄັນຫຼາຍກວ່າ.

ຄະນິດສາດຂັ້ນຕ່ຳສຸດທີ່ສາມາດເຮັດໄດ້ເພື່ອເລີ່ມຕົ້ນ:

ພຶດຊະຄະນິດເສັ້ນຊື່: ເວັກເຕີ, ແມັດຕຣິກ, ຜົນຄູນຈຸດ (ຄວາມຮູ້ສຶກສຳລັບການຝັງ). [2]
ແຄລຄູລັສ: ອະນຸພັນຂອງສະຕິປັນຍາ (ຄວາມຊັນ → ການປ່ຽນແປງ). [1]
ຄວາມເປັນໄປໄດ້: ການແຈກຢາຍ, ຄວາມຄາດຫວັງ, ແນວຄິດພື້ນຖານຂອງ Bayes. [1]

ຖ້າທ່ານຕ້ອງການກະດູກສັນຫຼັງທີ່ເປັນທາງການຫຼາຍຂຶ້ນໃນພາຍຫຼັງ, ໃຫ້ເຂົ້າໄປເບິ່ງບັນທຶກ CS229 ສຳລັບພື້ນຖານ ແລະ ການຮຽນຮູ້ຢ່າງເລິກເຊິ່ງຂອງ MIT ສຳລັບຫົວຂໍ້ທີ່ທັນສະໄໝ. [1][2]

ໂຄງການທີ່ເຮັດໃຫ້ເຈົ້າເບິ່ງຄືວ່າເຈົ້າຮູ້ວ່າເຈົ້າກຳລັງເຮັດຫຍັງຢູ່ 😄

ຖ້າທ່ານສ້າງພຽງແຕ່ຕົວຈັດປະເພດໃນຊຸດຂໍ້ມູນຂອງຫຼິ້ນ, ທ່ານຈະຮູ້ສຶກວ່າຕິດຂັດ. ລອງໃຊ້ໂຄງການທີ່ຄ້າຍຄືກັບວຽກງານຕົວຈິງ:

ໂຄງການ ML ແບບພື້ນຖານກ່ອນ (scikit-learn): ຂໍ້ມູນສະອາດ → ພື້ນຖານທີ່ເຂັ້ມແຂງ → ການວິເຄາະຄວາມຜິດພາດ. [3]
ແອັບດຶງຂໍ້ມູນ LLM +: ingest docs → chunk → embed → retrieve → ສ້າງຄຳຕອບດ້ວຍການອ້າງອີງ.
ແຜງຄວບຄຸມຂະໜາດນ້ອຍສຳລັບຕິດຕາມກວດກາຮູບແບບ: ຂໍ້ມູນບັນທຶກການເຂົ້າ/ອອກ; ຕິດຕາມສັນຍານແບບດຣິບ (ເຖິງແມ່ນວ່າສະຖິຕິງ່າຍໆກໍ່ຊ່ວຍໄດ້).
ການກວດສອບ AI ຂະໜາດນ້ອຍທີ່ມີຄວາມຮັບຜິດຊອບ: ບັນທຶກຄວາມສ່ຽງ, ກໍລະນີທີ່ສຳຄັນ, ຜົນກະທົບຂອງຄວາມລົ້ມເຫຼວ; ໃຊ້ຂອບການເຮັດວຽກທີ່ມີນ້ຳໜັກເບົາ. [5]

ການນຳໃຊ້ທີ່ມີຄວາມຮັບຜິດຊອບ ແລະ ໃຊ້ໄດ້ຈິງ (ແມ່ນແລ້ວ, ແມ່ນແຕ່ສຳລັບຜູ້ກໍ່ສ້າງດ່ຽວ) 🧯

ການກວດສອບຄວາມເປັນຈິງ: ການສາທິດທີ່ໜ້າປະທັບໃຈແມ່ນງ່າຍ; ລະບົບທີ່ໜ້າເຊື່ອຖືແມ່ນບໍ່ແມ່ນ.

ຮັກສາ README ແບບ “ບັດຮູບແບບ” ສັ້ນໆ: ແຫຼ່ງຂໍ້ມູນ, ຕົວຊີ້ວັດ, ຂີດຈຳກັດທີ່ຮູ້ຈັກ, ຈັງຫວະການອັບເດດ.
ຕື່ມການປ້ອງກັນພື້ນຖານ (ຂໍ້ຈຳກັດອັດຕາ, ການກວດສອບການປ້ອນຂໍ້ມູນ, ການຕິດຕາມກວດກາການລ່ວງລະເມີດ).
ສຳລັບສິ່ງໃດກໍ່ຕາມທີ່ຜູ້ໃຊ້ປະເຊີນ ຫຼື ເປັນຜົນສະທ້ອນ, ໃຫ້ໃຊ້ ທີ່ອີງໃສ່ຄວາມສ່ຽງ : ລະບຸອັນຕະລາຍ, ທົດສອບກໍລະນີຂອບ, ແລະ ບັນທຶກການຫຼຸດຜ່ອນຜົນກະທົບ. NIST AI RMF ຖືກສ້າງຂຶ້ນມາເພື່ອສິ່ງນີ້ໂດຍສະເພາະ. [5]

ອຸປະສັກທົ່ວໄປ (ເພື່ອໃຫ້ທ່ານສາມາດຫຼີກລ່ຽງພວກມັນໄດ້) 🧨

ການຂ້າມບົດຮຽນແບບໂດດໆ - “ພຽງແຕ່ອີກຫຼັກສູດດຽວ” ກາຍເປັນບຸກຄະລິກກະພາບທັງໝົດຂອງເຈົ້າ.
ເລີ່ມຕົ້ນດ້ວຍຫົວຂໍ້ທີ່ຍາກທີ່ສຸດ - ໝໍ້ແປງໄຟຟ້າແມ່ນເຢັນ, ແຕ່ພື້ນຖານຈ່າຍຄ່າເຊົ່າ.
ການບໍ່ສົນໃຈການປະເມີນຜົນ - ຄວາມຖືກຕ້ອງພຽງຢ່າງດຽວສາມາດເປັນຄວາມຈິງໄດ້. ໃຊ້ຕົວຊີ້ວັດທີ່ເໝາະສົມກັບວຽກ. [3]
ຢ່າຂຽນສິ່ງຕ່າງໆລົງ - ໃຫ້ຈົດບັນທຶກສັ້ນໆ: ສິ່ງທີ່ລົ້ມເຫຼວ, ສິ່ງທີ່ປ່ຽນແປງ, ສິ່ງທີ່ດີຂຶ້ນ.
ບໍ່ຕ້ອງມີການຝຶກຊ້ອມການນຳໃຊ້ - ແມ່ນແຕ່ການຫໍ່ແອັບງ່າຍໆກໍສອນໄດ້ຫຼາຍຢ່າງ.
ຫຼີກລ່ຽງການຄິດເຖິງຄວາມສ່ຽງ - ຂຽນຂໍ້ສັງເກດສອງຂໍ້ກ່ຽວກັບອັນຕະລາຍທີ່ອາດເກີດຂຶ້ນກ່ອນທີ່ທ່ານຈະສົ່ງສິນຄ້າ. [5]

ຄຳເຕືອນສຸດທ້າຍ - ຍາວເກີນໄປ, ຂ້ອຍບໍ່ໄດ້ອ່ານມັນ 😌

ຖ້າທ່ານກຳລັງຖາມວ່າ ວິທີການຮຽນຮູ້ AI , ນີ້ແມ່ນສູດທີ່ງ່າຍທີ່ສຸດທີ່ຈະຊະນະ:

ເລີ່ມຕົ້ນດ້ວຍ ພື້ນຖານ ML ຕົວຈິງ (ການແນະນຳແບບກະທັດຮັດ + ການຝຶກຊ້ອມແບບ Kaggle).
ໃຊ້ scikit-learn ເພື່ອຮຽນຮູ້ຂະບວນການເຮັດວຽກ ແລະ ຕົວຊີ້ວັດ ML ທີ່ແທ້ຈິງ. [3]
ຍ້າຍໄປ PyTorch ສຳລັບການຮຽນຮູ້ຢ່າງເລິກເຊິ່ງ ແລະ ການຝຶກອົບຮົມຮອບວຽນ. [4]
ເພີ່ມ ທັກສະ LLM ດ້ວຍຫຼັກສູດປະຕິບັດຕົວຈິງ ແລະ ການເລີ່ມຕົ້ນ API ຢ່າງວ່ອງໄວ.
ສ້າງ ໂຄງການ 3–5 ໂຄງການ ທີ່ສະແດງໃຫ້ເຫັນ: ການກະກຽມຂໍ້ມູນ, ການສ້າງແບບຈຳລອງ, ການປະເມີນຜົນ, ແລະ ການຫຸ້ມຫໍ່ "ຜະລິດຕະພັນ" ແບບງ່າຍໆ.
ໃຫ້ປະຕິບັດຕໍ່ ຄວາມສ່ຽງ/ການຄຸ້ມຄອງ ເປັນສ່ວນໜຶ່ງຂອງ “ສິ່ງທີ່ເຮັດແລ້ວ”, ບໍ່ແມ່ນສິ່ງເພີ່ມເຕີມທີ່ເປັນທາງເລືອກ. [5]

ແລະແມ່ນແລ້ວ, ບາງຄັ້ງເຈົ້າຈະຮູ້ສຶກຫຼົງທາງ. ນັ້ນເປັນເລື່ອງປົກກະຕິ. AI ແມ່ນຄືກັບການສອນເຄື່ອງປີ້ງເຂົ້າຈີ່ໃຫ້ອ່ານ - ມັນໜ້າປະທັບໃຈເມື່ອມັນເຮັດວຽກ, ແຕ່ໜ້າຢ້ານເລັກນ້ອຍເມື່ອມັນບໍ່ໄດ້ຜົນ, ແລະມັນຕ້ອງໃຊ້ການເຮັດຊ້ຳຫຼາຍກວ່າທີ່ທຸກຄົນຍອມຮັບ 😵💫

ເອກະສານອ້າງອີງ

[1] ບັນທຶກການບັນຍາຍຂອງ Stanford CS229. (ຫຼັກການພື້ນຖານ ML ຫຼັກ, ການຮຽນຮູ້ພາຍໃຕ້ການຊີ້ນຳ, ການວາງກອບຄວາມເປັນໄປໄດ້).
https://cs229.stanford.edu/main_notes.pdf

[2] MIT 6.S191: ການແນະນຳການຮຽນຮູ້ຢ່າງເລິກເຊິ່ງ. (ພາບລວມຂອງການຮຽນຮູ້ຢ່າງເລິກເຊິ່ງ, ຫົວຂໍ້ທີ່ທັນສະໄໝລວມທັງ LLMs).
https://introtodeeplearning.com/

[3] scikit-learn: ການປະເມີນຮູບແບບ ແລະ ຕົວຊີ້ວັດຕ່າງໆ. (ຄວາມແມ່ນຍຳ, ຄວາມແມ່ນຍຳ/ການລະນຶກເຖິງ, ROC-AUC, ແລະອື່ນໆ).
https://scikit-learn.org/stable/modules/model_evaluation.html

[4] ບົດແນະນຳ PyTorch – ຮຽນຮູ້ພື້ນຖານ. (Tensors, datasets/dataloaders, training/eval loops).
https://docs.pytorch.org/tutorials/beginner/basics/intro.html

[5] ຂອບການຄຸ້ມຄອງຄວາມສ່ຽງດ້ານ AI ຂອງ NIST (AI RMF 1.0). (ຄຳແນະນຳກ່ຽວກັບ AI ທີ່ອີງໃສ່ຄວາມສ່ຽງ ແລະ ໜ້າເຊື່ອຖື).
https://nvlpubs.nist.gov/nistpubs/ai/nist.ai.100-1.pdf

ຊັບພະຍາກອນເພີ່ມເຕີມ (ສາມາດຄລິກໄດ້)

ຫຼັກສູດການຮຽນຮູ້ເຄື່ອງຈັກ Google Crash: ອ່ານຕື່ມ
Kaggle Learn – ການແນະນຳກ່ຽວກັບ ML: ອ່ານຕື່ມ
Kaggle Learn – ML ລະດັບກາງ: ອ່ານຕື່ມ
fast.ai – ການຮຽນຮູ້ເລິກເຊິ່ງແບບປະຕິບັດໄດ້ຈິງສຳລັບນັກຂຽນໂປຣແກຣມ: ອ່ານຕື່ມ
DeepLearning.AI – ຄວາມຊ່ຽວຊານດ້ານການຮຽນຮູ້ຂອງເຄື່ອງຈັກ: ອ່ານຕື່ມ
DeepLearning.AI – ຄວາມຊ່ຽວຊານດ້ານການຮຽນຮູ້ເລິກ: ອ່ານຕື່ມ
scikit-learn ການເລີ່ມຕົ້ນ: ອ່ານຕື່ມ
ບົດແນະນຳ PyTorch (ດັດຊະນີ): ອ່ານຕື່ມ
ຫຼັກສູດ Hugging Face LLM (ການແນະນຳ): ອ່ານຕື່ມ
OpenAI API – ການເລີ່ມຕົ້ນແບບດ່ວນສຳລັບນັກພັດທະນາ: ອ່ານຕື່ມ
OpenAI API – ແນວຄວາມຄິດ: ອ່ານຕື່ມ
ໜ້າພາບລວມຂອງ NIST AI RMF: ອ່ານຕື່ມ

ຊອກຫາ AI ຫຼ້າສຸດຢູ່ທີ່ຮ້ານຜູ້ຊ່ວຍ AI ຢ່າງເປັນທາງການ

ກ່ຽວກັບພວກເຮົາ

ກັບໄປທີ່ blog

ປະເທດ/ພາກພື້ນ