AI ຮຽນຮູ້ໄດ້ແນວໃດ?, ຄູ່ມືນີ້ເປີດເຜີຍແນວຄວາມຄິດທີ່ໃຫຍ່ຫຼວງໃນພາສາທີ່ເຂົ້າໃຈງ່າຍ - ດ້ວຍຕົວຢ່າງ, ເສັ້ນທາງອ້ອມນ້ອຍໆ, ແລະການປຽບທຽບທີ່ບໍ່ສົມບູນແບບບາງຢ່າງທີ່ຍັງຊ່ວຍໄດ້. ໄປເລີ່ມກັນເລີຍ. 🙂
ບົດຄວາມທີ່ເຈົ້າອາດຈະມັກອ່ານຫຼັງຈາກນີ້:
🔗 AI ແບບຄາດເດົາແມ່ນຫຍັງ
ຮູບແບບການຄາດຄະເນຄາດຄະເນຜົນໄດ້ຮັບໂດຍໃຊ້ຂໍ້ມູນປະຫວັດສາດແລະເວລາຈິງ.
🔗 ອຸດສາຫະກໍາໃດທີ່ AI ຈະລົບກວນ
ພາກສ່ວນທີ່ອາດຈະປ່ຽນແປງຫຼາຍທີ່ສຸດໂດຍອັດຕະໂນມັດ, ການວິເຄາະ, ແລະຕົວແທນ.
🔗 GPT ຫຍໍ້ມາຈາກຫຍັງ
ຄໍາອະທິບາຍທີ່ຊັດເຈນຂອງຕົວຫຍໍ້ GPT ແລະຕົ້ນກໍາເນີດ.
🔗 ທັກສະ AI ແມ່ນຫຍັງ?
ຄວາມສາມາດຫຼັກໃນການກໍ່ສ້າງ, ນຳໃຊ້ ແລະຄຸ້ມຄອງລະບົບ AI.
ດັ່ງນັ້ນ, ມັນເຮັດແນວໃດ? ✅
ເມື່ອຄົນຖາມວ່າ AI ຮຽນຮູ້ແນວໃດ?, ເຂົາເຈົ້າມັກຈະຫມາຍຄວາມວ່າ: ຮູບແບບຈະເປັນປະໂຫຍດແນວໃດແທນທີ່ຈະເປັນພຽງແຕ່ຂອງຫຼິ້ນຄະນິດສາດ fancy. ຄໍາຕອບແມ່ນສູດ:
-
ຈຸດປະສົງທີ່ຊັດເຈນ - ຟັງຊັນການສູນເສຍທີ່ກຳນົດຄວາມໝາຍຂອງຄຳວ່າ "ດີ". [1]
-
ຂໍ້ມູນຄຸນນະພາບ - ແຕກຕ່າງກັນ, ສະອາດ, ແລະທີ່ກ່ຽວຂ້ອງ. ປະລິມານຊ່ວຍ; ແນວພັນຈະຊ່ວຍໃຫ້ຫຼາຍ. [1]
-
ການເພີ່ມປະສິດທິພາບທີ່ຄົງທີ່ - ການສືບເຊື້ອສາຍ gradient ທີ່ມີເຄັດລັບເພື່ອຫຼີກເວັ້ນການ wobbling ຈາກຫນ້າຜາ. [1], [2]
-
Generalization - ຄວາມສໍາເລັດກ່ຽວກັບຂໍ້ມູນໃຫມ່, ບໍ່ພຽງແຕ່ຊຸດການຝຶກອົບຮົມ. [1]
-
loops ຄໍາເຫັນ - ການປະເມີນຜົນ, ການວິເຄາະຄວາມຜິດພາດ, ແລະການຊ້ໍາ. [2], [3]
-
ຄວາມປອດໄພ ແລະ ຄວາມໜ້າເຊື່ອຖື - ຮົ້ວກັ້ນ, ການທົດສອບ, ແລະ ເອກະສານຕ່າງໆ ເພື່ອບໍ່ໃຫ້ມັນວຸ້ນວາຍ. [4]
ສໍາລັບພື້ນຖານທີ່ເຂົ້າໃກ້ໄດ້, ຂໍ້ຄວາມການຮຽນຮູ້ແບບເລິກເຊິ່ງຄລາສສິກ, ບັນທຶກຫຼັກສູດທີ່ເປັນມິດກັບສາຍຕາ, ແລະຫຼັກສູດການລົ້ມລົງຂອງມືໄດ້ກວມເອົາສິ່ງທີ່ສໍາຄັນໂດຍບໍ່ມີການເຮັດໃຫ້ເຈົ້າຈົມລົງໃນສັນຍາລັກ. [1]–[3]
AI ຮຽນຮູ້ແນວໃດ? ຄໍາຕອບສັ້ນໃນພາສາອັງກິດທໍາມະດາ ✍️
ຮູບແບບ AI ເລີ່ມຕົ້ນດ້ວຍຄ່າພາລາມິເຕີແບບສຸ່ມ. ມັນເຮັດການຄາດຄະເນ. ເຈົ້າໃຫ້ຄະແນນການຄາດຄະເນນັ້ນດ້ວຍການ ສູນເສຍ. ຈາກນັ້ນເຈົ້າກະຕຸ້ນພາລາມິເຕີເຫຼົ່ານັ້ນເພື່ອຫຼຸດຜ່ອນການສູນເສຍໂດຍໃຊ້ ການເລື່ອນສີ. ເຮັດຊ້ຳວົງຈອນນີ້ໃນຫຼາຍໆຕົວຢ່າງຈົນກວ່າຮູບແບບຈະຢຸດການປັບປຸງ (ຫຼືເຈົ້າໝົດອາຫານວ່າງ). ນັ້ນແມ່ນວົງຈອນການຝຶກອົບຮົມພາຍໃນລົມຫາຍໃຈດຽວ. [1], [2]
ຖ້າທ່ານຕ້ອງການຄວາມແມ່ນຍໍາຫຼາຍ, ເບິ່ງພາກສ່ວນກ່ຽວກັບການສືບເຊື້ອສາຍ gradient ແລະ backpropagation ຂ້າງລຸ່ມນີ້. ສໍາລັບພື້ນຖານທີ່ໄວ, ຍ່ອຍໄດ້, ການບັນຍາຍສັ້ນ ແລະຫ້ອງທົດລອງແມ່ນມີຢູ່ຢ່າງກວ້າງຂວາງ. [2], [3]
ພື້ນຖານ: ຂໍ້ມູນ, ຈຸດປະສົງ, ການເພີ່ມປະສິດທິພາບ 🧩
-
ຂໍ້ມູນ: ຂໍ້ມູນທີ່ປ້ອນເຂົ້າ (x) ແລະ ເປົ້າໝາຍ (y). ຂໍ້ມູນທີ່ກວ້າງຂວາງ ແລະ ສະອາດກວ່າ, ໂອກາດທີ່ເຈົ້າຈະສະຫຼຸບຂໍ້ມູນໄດ້ກໍ່ຍິ່ງດີ. ການຄັດເລືອກຂໍ້ມູນບໍ່ແມ່ນເລື່ອງທີ່ໜ້າສົນໃຈ, ແຕ່ມັນແມ່ນວິລະຊົນທີ່ບໍ່ຄ່ອຍມີໃຜຮູ້ຈັກ. [1]
-
ຮູບແບບ: ຟັງຊັນ (f_\theta(x)) ທີ່ມີພາລາມິເຕີ (\theta). ເຄືອຂ່າຍປະສາດແມ່ນການຊ້ອນກັນຂອງໜ່ວຍງ່າຍໆທີ່ລວມເຂົ້າກັນໃນລັກສະນະທີ່ສັບສົນ - ດິນຈີ່ Lego, ແຕ່ອ່ອນກວ່າ. [1]
-
ຈຸດປະສົງ: ການສູນເສຍ (L(f_\theta(x), y)) ທີ່ວັດແທກຄວາມຜິດພາດ. ຕົວຢ່າງ: ຫມາຍຄວາມວ່າຄວາມຜິດພາດສີ່ຫຼ່ຽມ (regression) ແລະ cross-entropy (ການຈັດປະເພດ). [1]
-
ການເພີ່ມປະສິດທິພາບ: ໃຊ້ (stochastic) descent gradient ເພື່ອປັບປຸງພາລາມິເຕີ: (\theta \leftarrow \theta - \eta \nabla_\theta L). ອັດຕາການຮຽນຮູ້ (\eta): ໃຫຍ່ເກີນໄປແລະທ່ານ bounce ປະມານ; ນ້ອຍເກີນໄປ ແລະເຈົ້ານອນຫຼັບຕະຫຼອດໄປ. [2]
ສໍາລັບການແນະນໍາທີ່ສະອາດກ່ຽວກັບຫນ້າທີ່ສູນເສຍແລະການເພີ່ມປະສິດທິພາບ, ບັນທຶກຄລາສສິກກ່ຽວກັບເຄັດລັບການຝຶກອົບຮົມແລະ pitfalls ແມ່ນ skim ທີ່ຍິ່ງໃຫຍ່. [2]
ການຮຽນຮູ້ແບບຄວບຄຸມ: ຮຽນຮູ້ຈາກຕົວຢ່າງທີ່ມີປ້າຍຊື່ 🎯
ແນວຄວາມຄິດ: ສະແດງຄູ່ຕົວແບບຂອງການປ້ອນຂໍ້ມູນ ແລະຄໍາຕອບທີ່ຖືກຕ້ອງ. ຕົວແບບຮຽນຮູ້ການສ້າງແຜນທີ່ (x \rightarrow y).
-
ວຽກງານທົ່ວໄປ: ການຈັດປະເພດຮູບພາບ, ການວິເຄາະຄວາມຮູ້ສຶກ, ການຄາດຄະເນຕາຕະລາງ, ການຮັບຮູ້ສຽງເວົ້າ.
-
ການສູນເສຍທົ່ວໄປ: cross-entropy ສໍາລັບການຈັດປະເພດ, ຫມາຍຄວາມຜິດສອງຮຽບຮ້ອຍສໍາລັບການ regression. [1]
-
Pitfalls: ສຽງປ້າຍຊື່, ຄວາມບໍ່ສົມດຸນຂອງຫ້ອງຮຽນ, ຂໍ້ມູນຮົ່ວໄຫຼ.
-
ການແກ້ໄຂ: ການເກັບກໍາຂໍ້ມູນທີ່ແຕກຕ່າງກັນ, ການສູນເສຍທີ່ເຂັ້ມແຂງ, ການເກັບກໍາຂໍ້ມູນທີ່ຫຼາກຫຼາຍ. [1], [2]
ອີງຕາມມາດຕະການທົດສະວັດຂອງມາດຕະຖານແລະການປະຕິບັດການຜະລິດ, ການຄວບຄຸມການຮຽນຮູ້ຍັງຄົງເປັນ workhorse ເພາະວ່າຜົນໄດ້ຮັບແມ່ນຄາດຄະເນແລະການວັດແທກແມ່ນກົງໄປກົງມາ. [1], [3]
ການຮຽນຮູ້ແບບບໍ່ມີການຄວບຄຸມ ແລະ ຄວບຄຸມຕົນເອງ: ຮຽນຮູ້ໂຄງສ້າງຂອງຂໍ້ມູນ 🔍
Unsupervised ຮຽນຮູ້ຮູບແບບທີ່ບໍ່ມີປ້າຍກຳກັບ.
-
ການຈັດກຸ່ມ: ຈັດກຸ່ມຈຸດທີ່ຄ້າຍຄືກັນ - ຄ່າສະເລ່ຍ k ແມ່ນງ່າຍດາຍ ແລະ ເປັນປະໂຫຍດຢ່າງໜ້າປະຫລາດໃຈ.
-
ການຫຼຸດຜ່ອນມິຕິ: ບີບອັດຂໍ້ມູນໄປສູ່ທິດທາງທີ່ສຳຄັນ - PCA ແມ່ນເຄື່ອງມືປະຕູທາງເຂົ້າ.
-
ການສ້າງແບບຈໍາລອງຄວາມຫນາແຫນ້ນ / ການຜະລິດ: ຮຽນຮູ້ການແຈກຢາຍຂໍ້ມູນຂອງມັນເອງ. [1]
ການເບິ່ງແຍງຕົນເອງ ແມ່ນເຄື່ອງຈັກທີ່ທັນສະໄຫມ: ແບບຈໍາລອງສ້າງການຊີ້ນໍາຂອງຕົນເອງ (ການຄາດເດົາແບບປິດບັງ, ການຮຽນຮູ້ກົງກັນຂ້າມ), ຊ່ວຍໃຫ້ທ່ານສາມາດຝຶກຝົນໃນມະຫາສະຫມຸດຂອງຂໍ້ມູນທີ່ບໍ່ມີປ້າຍຊື່ແລະປັບລະອຽດຕໍ່ມາ. [1]
ການຮຽນຮູ້ເສີມ: ຮຽນຮູ້ໂດຍການເຮັດ ແລະຮັບຄໍາຕິຊົມ 🕹️
ຕົວ ແທນ ພົວພັນກັບ ສະພາບແວດລ້ອມ, ໄດ້ຮັບ ລາງວັນ, ແລະຮຽນຮູ້ ນະໂຍບາຍ ທີ່ໃຫ້ລາງວັນສູງສຸດໃນໄລຍະຍາວ.
-
ຊິ້ນສ່ວນຫຼັກ: ລັດ, ການປະຕິບັດ, ລາງວັນ, ນະໂຍບາຍ, ຫນ້າທີ່ມູນຄ່າ.
-
ອັລກໍຣິທຶມ: ການຮຽນຮູ້ແບບ Q, ການຫັນປ່ຽນນະໂຍບາຍ, ຜູ້ກະທຳ-ນັກວິຈານ.
-
ການຂຸດຄົ້ນທຽບກັບການຂູດຮີດ: ລອງສິ່ງໃໝ່ໆ ຫຼືໃຊ້ຄືນສິ່ງທີ່ໄດ້ຜົນ.
-
ການມອບໝາຍສິນເຊື່ອ: ການກະທຳໃດເຮັດໃຫ້ເກີດຜົນອັນໃດ?
ຄໍາຕິຊົມຂອງມະນຸດສາມາດນໍາພາການຝຶກອົບຮົມໃນເວລາທີ່ລາງວັນແມ່ນລັງເລ - ການຈັດອັນດັບຫຼືຄວາມມັກຊ່ວຍສ້າງພຶດຕິກໍາໂດຍບໍ່ມີການຂຽນລະຫັດດ້ວຍມືຂອງລາງວັນທີ່ສົມບູນແບບ. [5]
ການຮຽນຮູ້ທີ່ເລິກເຊິ່ງ, ດ້ານຫຼັງ, ແລະ ການສືບເຊື້ອສາຍແບບເລື່ອນຊັ້ນ - ຫົວໃຈທີ່ເຕັ້ນແຮງ 🫀
ຕາຫນ່າງ neural ແມ່ນອົງປະກອບຂອງຫນ້າທີ່ງ່າຍດາຍ. ເພື່ອຮຽນຮູ້, ພວກເຂົາອີງໃສ່ ການຂະຫຍາຍພັນຄືນ:
-
Forward pass: ຄິດໄລ່ການຄາດເດົາຈາກການປ້ອນຂໍ້ມູນ.
-
ການສູນເສຍ: ການວັດແທກຄວາມຜິດພາດລະຫວ່າງການຄາດຄະເນແລະເປົ້າຫມາຍ.
-
Backward pass: ໃຊ້ກົດລະບຽບລະບົບຕ່ອງໂສ້ເພື່ອຄິດໄລ່ gradients ຂອງການສູນເສຍ wrt ແຕ່ລະພາລາມິເຕີ.
-
ອັບເດດ: nudge ພາຣາມິເຕີຕໍ່ກັບການ gradient ໂດຍໃຊ້ຕົວເພີ່ມປະສິດທິພາບ.
ຕົວແປເຊັ່ນ: momentum, RMProp, ແລະ Adam ເຮັດໃຫ້ການຝຶກອົບຮົມມີອາລົມໜ້ອຍລົງ. ວິທີການປົກກະຕິເຊັ່ນ: ການລຸດອອກ, ການຫຼຸດນໍ້າໜັກ, ແລະ ການຢຸດໄວ ຊ່ວຍໃຫ້ຕົວແບບທົ່ວໄປແທນທີ່ຈະຈື່ຈໍາ. [1], [2]
ໝໍ້ແປງ ແລະ ຄວາມໃສ່ໃຈ: ເປັນຫຍັງເຄື່ອງແບບທັນສະໄໝຈຶ່ງຮູ້ສຶກສະຫຼາດ🧠✨
ໝໍ້ແປງປ່ຽນແທນການຕິດຕັ້ງແບບຊ້ຳໆຫຼາຍຢ່າງໃນພາສາ ແລະວິໄສທັດ. ເຄັດລັບຫຼັກແມ່ນ ການໃສ່ໃຈຕົນເອງ, ເຊິ່ງເຮັດໃຫ້ຕົວແບບໃດໜຶ່ງສາມາດຊັ່ງນໍ້າໜັກພາກສ່ວນຕ່າງໆຂອງວັດສະດຸປ້ອນຂອງມັນ ຂຶ້ນກັບບໍລິບົດ. ການເຂົ້າລະຫັດຕໍາແຫນ່ງຈັດການຄໍາສັ່ງ, ແລະ ການໃສ່ໃຈຫຼາຍຫົວ ເຮັດໃຫ້ຕົວແບບສຸມໃສ່ຄວາມສໍາພັນທີ່ແຕກຕ່າງກັນໃນເວລາດຽວກັນ. ການຂະຫຍາຍຂໍ້ມູນທີ່ມີຄວາມຫຼາກຫຼາຍຫຼາຍຂຶ້ນ, ຕົວກໍານົດການເພີ່ມເຕີມ, ການຝຶກອົບຮົມທີ່ຍາວກວ່າ - ມັກຈະຊ່ວຍ, ມີຜົນຕອບແທນຫຼຸດລົງແລະຄ່າໃຊ້ຈ່າຍທີ່ເພີ່ມຂຶ້ນ. [1], [2]
ການເຮັດໃຫ້ທົ່ວໄປ, ພໍດີ, ແລະການເຕັ້ນແບບອະຄະຕິ-ການຜັນແປ 🩰
ຕົວແບບສາມາດ ace ທີ່ກໍານົດໄວ້ການຝຶກອົບຮົມແລະຍັງ flop ໃນໂລກທີ່ແທ້ຈິງ.
-
Overfitting: ຈື່ສຽງລົບກວນ. ຄວາມຜິດພາດການຝຶກອົບຮົມຫຼຸດລົງ, ການທົດສອບຄວາມຜິດພາດຂຶ້ນ.
-
underfitting: ງ່າຍດາຍເກີນໄປ; ພາດສັນຍານ.
-
ການແລກປ່ຽນຄວາມລຳອຽງ-ຄວາມແປປ່ວນ: ຄວາມຊັບຊ້ອນຊ່ວຍຫຼຸດຜ່ອນຄວາມລຳອຽງແຕ່ສາມາດເພີ່ມຄວາມແປປ່ວນໄດ້.
ວິທີການທົ່ວໄປທີ່ດີກວ່າ:
-
ຂໍ້ມູນທີ່ມີຄວາມຫຼາກຫຼາຍຫຼາຍ - ແຫຼ່ງທີ່ແຕກຕ່າງກັນ, ໂດເມນ, ແລະກໍລະນີແຂບ.
-
Regularization - dropout, ການຫຼຸດລົງນ້ໍາ, ການເພີ່ມຂໍ້ມູນ.
-
ການກວດສອບທີ່ຖືກຕ້ອງ - ຊຸດການທົດສອບທີ່ສະອາດ, ການກວດສອບຂໍ້ມູນຂະຫນາດນ້ອຍ.
-
ການຕິດຕາມ drift - ການແຜ່ກະຈາຍຂໍ້ມູນຂອງທ່ານຈະປ່ຽນແປງຕາມເວລາ.
ການປະຕິບັດການຮັບຮູ້ຄວາມສ່ຽງເຮັດໃຫ້ສິ່ງເຫຼົ່ານີ້ເປັນກິດຈະກໍາວົງຈອນຊີວິດ - ການຄຸ້ມຄອງ, ການສ້າງແຜນທີ່, ການວັດແທກ, ແລະການຄຸ້ມຄອງ - ບໍ່ແມ່ນລາຍການກວດສອບຫນຶ່ງ. [4]
Metrics ທີ່ສໍາຄັນ: ເຮັດແນວໃດພວກເຮົາຮູ້ວ່າການຮຽນຮູ້ເກີດຂຶ້ນ 📈
-
ການຈັດປະເພດ: ຄວາມຖືກຕ້ອງ, ຄວາມແມ່ນຍຳ, ການລະນຶກເຖິງ, F1, ROC AUC. ຂໍ້ມູນທີ່ບໍ່ສົມດຸນຮຽກຮ້ອງໃຫ້ມີເສັ້ນໂຄ້ງຄວາມແມ່ນຍຳ-ການລະນຶກເຖິງ. [3]
-
Regression: MSE, MAE, (R^2). [1]
-
ອັນດັບ/ການດຶງຂໍ້ມູນ: MAP, NDCG, recall@K. [1]
-
ຮູບແບບການຜະລິດ: ຄວາມສັບສົນ (ພາສາ), BLEU/ROUGE/CIDEr (ຂໍ້ຄວາມ), ຄະແນນທີ່ອີງໃສ່ CLIP (ຫຼາຍຮູບແບບ), ແລະການປະເມີນຄວາມສໍາຄັນຂອງມະນຸດ. [1], [3]
ເລືອກຕົວວັດແທກທີ່ສອດຄ່ອງກັບຜົນກະທົບຂອງຜູ້ໃຊ້. ຄວາມຜິດພາດພຽງເລັກໆນ້ອຍໆໃນຄວາມຖືກຕ້ອງອາດບໍ່ກ່ຽວຂ້ອງກັນ ຖ້າຜົນບວກທີ່ບໍ່ຖືກຕ້ອງແມ່ນຄ່າໃຊ້ຈ່າຍທີ່ແທ້ຈິງ. [3]
ຂັ້ນຕອນການເຮັດວຽກຂອງການຝຶກອົບຮົມໃນໂລກຄວາມເປັນຈິງ: ແຜນທີ່ງ່າຍດາຍ 🛠️
-
ກອບບັນຫາ - ກໍານົດວັດສະດຸປ້ອນ, ຜົນໄດ້ຮັບ, ຂໍ້ຈໍາກັດ, ແລະເງື່ອນໄຂຄວາມສໍາເລັດ.
-
ທໍ່ຂໍ້ມູນ - ການລວບລວມ, ການຕິດສະຫຼາກ, ການເຮັດຄວາມສະອາດ, ການແຍກ, ການຂະຫຍາຍ.
-
ພື້ນຖານ - ເລີ່ມຕົ້ນງ່າຍດາຍ; ເສັ້ນຊື່ ຫຼື ພື້ນຖານຕົ້ນໄມ້ມີການແຂ່ງຂັນທີ່ໜ້າຕົກໃຈ.
-
ການສ້າງແບບຈໍາລອງ - ທົດລອງສອງສາມຄອບຄົວ: ຕົ້ນໄມ້ທີ່ເພີ່ມລະດັບ gradient (ຕາຕະລາງ), CNNs (ຮູບພາບ), ການຫັນເປັນ (ຂໍ້ຄວາມ).
-
ການຝຶກອົບຮົມ - ຕາຕະລາງ, ຍຸດທະສາດການຮຽນຮູ້ອັດຕາ, ດ່ານ, ຄວາມແມ່ນຍໍາປະສົມຖ້າຈໍາເປັນ.
-
ການປະເມີນຜົນ - ablations ແລະການວິເຄາະຄວາມຜິດພາດ. ເບິ່ງຄວາມຜິດພາດ, ບໍ່ພຽງແຕ່ສະເລ່ຍ.
-
ການປະຕິບັດ - inference pipeline, ການຕິດຕາມ, ການຕັດໄມ້, ແຜນ rollback.
-
Iterate - ຂໍ້ມູນທີ່ດີກວ່າ, ການປັບລະອຽດ, ຫຼືການປັບປຸງສະຖາປັດຕະຍະກໍາ.
ກໍລະນີນ້ອຍ: ໂຄງການຈັດປະເພດອີເມວເລີ່ມຕົ້ນດ້ວຍເສັ້ນຊື່ແບບງ່າຍໆ, ຈາກນັ້ນໄດ້ປັບແຕ່ງຕົວແປງໄຟຟ້າທີ່ໄດ້ຮັບການຝຶກອົບຮົມລ່ວງໜ້າ. ຜົນສຳເລັດທີ່ໃຫຍ່ທີ່ສຸດບໍ່ແມ່ນຮູບແບບ - ມັນແມ່ນການເຮັດໃຫ້ການຕິດສະຫຼາກມີຄວາມເຂັ້ມງວດຂຶ້ນ ແລະ ເພີ່ມໝວດໝູ່ "ຂອບ" ທີ່ບໍ່ຄ່ອຍເປັນຕົວແທນ. ເມື່ອສິ່ງເຫຼົ່ານັ້ນຖືກຄອບຄຸມແລ້ວ, ການກວດສອບຄວາມຖືກຕ້ອງ F1 ໃນທີ່ສຸດກໍ່ໄດ້ຕິດຕາມປະສິດທິພາບໃນໂລກຕົວຈິງ. (ຕົວຕົນໃນອະນາຄົດຂອງເຈົ້າ: ຂອບໃຈຫຼາຍ.)
ຄຸນະພາບຂອງຂໍ້ມູນ, ການຕິດສະຫຼາກ, ແລະສິນລະປະທີ່ລະອຽດອ່ອນຂອງການບໍ່ຕົວະຕົວເອງ🧼
ຂີ້ເຫຍື້ອໃນ, ເສຍໃຈອອກ. ຂໍ້ແນະນຳການຕິດສະຫຼາກຄວນສອດຄ່ອງ, ສາມາດວັດແທກໄດ້ ແລະ ທົບທວນຄືນ. ຂໍ້ຕົກລົງລະຫວ່າງຜູ້ອະທິບາຍເລື່ອງສຳຄັນ.
-
ຂຽນ rubrics ກັບຕົວຢ່າງ, ກໍລະນີມຸມ, ແລະ tie-breakers.
-
ກວດສອບຊຸດຂໍ້ມູນສໍາລັບການຊ້ໍາກັນແລະໃກ້ຈະຊ້ໍາກັນ.
-
ຕິດຕາມການພິສູດ - ບ່ອນທີ່ແຕ່ລະຕົວຢ່າງມາຈາກແລະເປັນຫຍັງມັນໄດ້ຖືກລວມເຂົ້າ.
-
ວັດແທກການຄຸ້ມຄອງຂໍ້ມູນຕໍ່ກັບສະຖານະການຂອງຜູ້ໃຊ້ທີ່ແທ້ຈິງ, ບໍ່ພຽງແຕ່ເປັນມາດຕະຖານທີ່ກະທັດຮັດ.
ສິ່ງເຫຼົ່ານີ້ເໝາະສົມກັບກອບການຮັບປະກັນ ແລະການຄຸ້ມຄອງທີ່ກວ້າງກວ່າທີ່ເຈົ້າສາມາດປະຕິບັດຕົວຈິງໄດ້. [4]
ຖ່າຍທອດການຮຽນຮູ້, ການປັບລະອຽດ, ແລະອະແດັບເຕີ - ໃຊ້ການຍົກໜັກຄືນໃໝ່ ♻️
ຮູບແບບທີ່ຝຶກຝົນໄດ້ຮຽນຮູ້ການເປັນຕົວແທນທົ່ວໄປ; ການປັບແຕ່ງປັບພວກມັນໃຫ້ເຂົ້າກັບວຽກຂອງເຈົ້າດ້ວຍຂໍ້ມູນໜ້ອຍລົງ.
-
ການສະກັດເອົາຄຸນສົມບັດ: ແຊ່ກະດູກສັນຫຼັງ, ຝຶກອົບຮົມຫົວຂະຫນາດນ້ອຍ.
-
ການປັບລະອຽດເຕັມຮູບແບບ: ອັບເດດພາລາມິເຕີທັງໝົດສໍາລັບຄວາມອາດສາມາດສູງສຸດ.
-
ວິທີການປະສິດທິພາບພາຣາມິເຕີ: ອະແດບເຕີ, ການປັບປຸງລະດັບຕ່ໍາແບບ LoRA - ດີໃນເວລາທີ່ຄອມພິວເຕີເຄັ່ງຄັດ.
-
ການປັບຕົວໂດເມນ: ຈັດວາງການຝັງຢູ່ທົ່ວໂດເມນ; ການປ່ຽນແປງຂະຫນາດນ້ອຍ, ຜົນປະໂຫຍດອັນໃຫຍ່ຫຼວງ. [1], [2]
ຮູບແບບການນໍາໃຊ້ຄືນໃຫມ່ນີ້ແມ່ນເຫດຜົນທີ່ວ່າໂຄງການທີ່ທັນສະໄຫມສາມາດເຄື່ອນຍ້າຍໄດ້ໄວໂດຍບໍ່ມີງົບປະມານທີ່ກ້າຫານ.
ຄວາມປອດໄພ, ຄວາມຫນ້າເຊື່ອຖື, ແລະການຈັດລຽງລໍາດັບ - bits ທີ່ບໍ່ແມ່ນທາງເລືອກ 🧯
ການຮຽນຮູ້ບໍ່ພຽງແຕ່ກ່ຽວກັບຄວາມຖືກຕ້ອງ. ທ່ານຍັງຕ້ອງການຕົວແບບທີ່ແຂງແຮງ, ຍຸຕິທໍາ, ແລະສອດຄ່ອງກັບການນໍາໃຊ້ທີ່ຕັ້ງໃຈ.
-
ຄວາມແຂງແກ່ນຂອງສັດຕູ: ການລົບກວນຂະໜາດນ້ອຍສາມາດຫຼອກລວງຕົວແບບໄດ້.
-
ຄວາມລຳອຽງ ແລະ ຄວາມຍຸຕິທຳ: ວັດແທກການປະຕິບັດກຸ່ມຍ່ອຍ, ບໍ່ພຽງແຕ່ຄ່າສະເລ່ຍລວມເທົ່ານັ້ນ.
-
ຄວາມສາມາດແປຄວາມໝາຍ: ການສະແດງໃຫ້ເຫັນຄຸນສົມບັດແລະການສອບສວນຊ່ວຍໃຫ້ທ່ານເຫັນ ວ່າເປັນຫຍັງ.
-
ມະນຸດຢູ່ໃນວົງຈອນ: ເສັ້ນທາງກ້າວໄປສູ່ການຕັດສິນໃຈທີ່ບໍ່ຊັດເຈນ ຫຼືມີຜົນກະທົບສູງ. [4], [5]
ການຮຽນຮູ້ທີ່ອີງໃສ່ຄວາມມັກເປັນວິທີທາງປະຕິບັດອັນໜຶ່ງທີ່ຈະລວມເອົາການຕັດສິນຂອງມະນຸດເມື່ອເປົ້າໝາຍບໍ່ເປັນລະບຽບ. [5]
FAQs ໃນຫນຶ່ງນາທີ - ໄຟຢ່າງໄວວາ ⚡
-
ດັ່ງນັ້ນ, ແທ້, AI ຮຽນຮູ້ແນວໃດ? ໂດຍຜ່ານການເພີ່ມປະສິດທິພາບຊໍ້າຄືນຕໍ່ກັບການສູນເສຍ, ໂດຍມີ gradients ນໍາພາຕົວກໍານົດການໄປສູ່ການຄາດຄະເນທີ່ດີກວ່າ. [1], [2]
-
ຂໍ້ມູນເພີ່ມເຕີມສະເຫມີຊ່ວຍບໍ? ປົກກະຕິແລ້ວ, ຈົນກ່ວາການຫຼຸດລົງກັບຄືນມາ. ແນວພັນມັກຈະຕີປະລິມານດິບ. [1]
-
ຈະເປັນແນວໃດຖ້າປ້າຍຊື່ສັບສົນ? ໃຊ້ວິທີການທີ່ມີສຽງລົບກວນ, rubrics ທີ່ດີກວ່າ, ແລະພິຈາລະນາ pretraining ຕົນເອງຄວບຄຸມ. [1]
-
ເປັນຫຍັງໝໍ້ແປງຈຶ່ງຄອບງຳ? ລະດັບຄວາມສົນໃຈໄດ້ດີແລະເກັບກໍາຄວາມເພິ່ງພາອາໄສໃນໄລຍະຍາວ; ເຄື່ອງມືແມ່ນແກ່ແລ້ວ. [1], [2]
-
ຂ້ອຍຈະຮູ້ໄດ້ແນວໃດວ່າຂ້ອຍຝຶກອົບຮົມສຳເລັດແລ້ວ? ການສູນເສຍການກວດສອບຄົງທີ່, ຕົວຊີ້ວັດຄົງທີ່, ແລະຂໍ້ມູນໃໝ່ຈະປະຕິບັດຕາມທີ່ຄາດໄວ້ - ຫຼັງຈາກນັ້ນຕິດຕາມການເລື່ອນລອຍ. [3], [4]
ຕາຕະລາງປຽບທຽບ - ເຄື່ອງມືທີ່ເຈົ້າສາມາດນຳໃຊ້ໄດ້ຈິງໃນມື້ນີ້🧰
ແປກປະຫຼາດເລັກນ້ອຍກ່ຽວກັບຈຸດປະສົງ. ລາຄາແມ່ນສໍາລັບຫ້ອງສະຫມຸດຫຼັກ - ການຝຶກອົບຮົມໃນລະດັບມີຄ່າໃຊ້ຈ່າຍ infra, ແນ່ນອນ.
| ເຄື່ອງມື | ດີທີ່ສຸດສຳລັບ | ລາຄາ | ເປັນຫຍັງມັນເຮັດວຽກໄດ້ດີ |
|---|---|---|---|
| PyTorch | ນັກຄົ້ນຄວ້າ, ຜູ້ກໍ່ສ້າງ | ຟຣີ - ເປີດ src | ກຣາຟແບບໄດນາມິກ, ລະບົບນິເວດທີ່ເຂັ້ມແຂງ, ການສອນທີ່ດີ. |
| TensorFlow | ທີມງານຜະລິດ | ຟຣີ - ເປີດ src | ການໃຫ້ບໍລິການແກ່ຜູ້ໃຫຍ່, TF Lite ສໍາລັບມືຖື; ຊຸມຊົນໃຫຍ່. |
| ຮຽນຮູ້ Scikit | ຂໍ້ມູນຕາຕະລາງ, ພື້ນຖານ | ຟຣີ | API ສະອາດ, ໄວທີ່ຈະເຮັດຊ້ຳ, ເອກະສານທີ່ດີ. |
| ເຄຣາສ | ຕົວແບບດ່ວນ | ຟຣີ | API ລະດັບສູງຫຼາຍກວ່າ TF, ຊັ້ນຂໍ້ມູນທີ່ສາມາດອ່ານໄດ້. |
| JAX | ຜູ້ໃຊ້ພະລັງງານ, ການຄົ້ນຄວ້າ | ຟຣີ | ອັດຕະໂນມັດ vectorization, ຄວາມໄວ XLA, vibes ຄະນິດສາດ elegant. |
| ກອດຕົວຫັນໜ້າ | NLP, ວິໄສທັດ, ສຽງ | ຟຣີ | ຮູບແບບທີ່ຝຶກມາກ່ອນ, ການປັບແຕ່ງແບບງ່າຍດາຍ, ສູນກາງທີ່ດີ. |
| ຟ້າຜ່າ | ຂະບວນການຝຶກອົບຮົມ | ແກນຟຣີ | ໂຄງສ້າງ, ການຕັດໄມ້, ແບດເຕີຣີຫຼາຍ GPU ລວມ. |
| XGBoost | ຕາຕະລາງການແຂ່ງຂັນ | ຟຣີ | ພື້ນຖານທີ່ເຂັ້ມແຂງ, ມັກຈະຊະນະຂໍ້ມູນທີ່ມີໂຄງສ້າງ. |
| ນ້ຳໜັກ ແລະ ອະຄະຕິ | ການທົດລອງຕິດຕາມ | ຊັ້ນຮຽນຟຣີ | Reproducibility, ປຽບທຽບການແລ່ນ, ການຮຽນຮູ້ທີ່ໄວກວ່າ loops. |
ເອກະສານອະນຸຍາດເພື່ອເລີ່ມຕົ້ນດ້ວຍ: PyTorch, TensorFlow, ແລະຄູ່ມືຜູ້ໃຊ້ scikit-learn ທີ່ສະອາດ. (ເລືອກອັນໜຶ່ງ, ສ້າງອັນນ້ອຍໆ, ເຮັດຊ້ຳ.)
ການດໍານ້ໍາເລິກ: ຄໍາແນະນໍາພາກປະຕິບັດທີ່ຊ່ວຍປະຢັດເວລາທີ່ແທ້ຈິງ 🧭
-
ຕາຕະລາງອັດຕາການຮຽນຮູ້: ການເສື່ອມໂຊມຂອງ cosine ຫຼືຫນຶ່ງຮອບສາມາດສະຖຽນລະພາບການຝຶກອົບຮົມ.
-
ຂະໜາດກຸ່ມ: ໃຫຍ່ກວ່າບໍ່ແມ່ນສະເໝີໄປທີ່ດີກວ່າ - ເບິ່ງຕົວຊີ້ວັດການກວດສອບຄວາມຖືກຕ້ອງ, ບໍ່ພຽງແຕ່ປະລິມານວຽກເທົ່ານັ້ນ.
-
ນ້ໍາຫນັກ init: ມາດຕະຖານທີ່ທັນສະໄຫມແມ່ນດີ; ຖ້າຫາກວ່າການຝຶກອົບຮົມຢຸດເຊົາການ, ຢ້ຽມຢາມໃນເບື້ອງຕົ້ນຫຼືເຮັດໃຫ້ຂັ້ນຕອນຕົ້ນເປັນປົກກະຕິ.
-
Normalization: batch norm ຫຼື layer norm ສາມາດເຮັດໃຫ້ການເພີ່ມປະສິດທິພາບທີ່ລຽບງ່າຍ.
-
ການເພີ່ມຂໍ້ມູນ: flips / ການປູກພືດ / ສີ jitter ສໍາລັບຮູບພາບ; ການສວມໜ້າກາກ/ໂທເຄັນສຳລັບຂໍ້ຄວາມ.
-
ການວິເຄາະຄວາມຜິດພາດ: ຄວາມຜິດພາດຂອງກຸ່ມໂດຍການເປັນຕົວສອຍຫນຶ່ງແຂບສາມາດລາກທຸກສິ່ງທຸກຢ່າງລົງ.
-
Repro: ຕັ້ງແກ່ນ, ບັນທຶກ hyperparams, ບັນທຶກຈຸດກວດກາ. ໃນອະນາຄົດເຈົ້າຈະຮູ້ບຸນຄຸນ, ຂ້ອຍສັນຍາ. [2], [3]
ໃນເວລາທີ່ສົງໃສ, retrace ພື້ນຖານ. ພື້ນຖານຍັງຄົງເປັນເຂັມທິດ. [1], [2]
ຄຳປຽບທຽບນ້ອຍໆທີ່ເກືອບຈະໃຊ້ໄດ້🪴
ການຝຶກອົບຮົມແບບຈໍາລອງແມ່ນຄ້າຍຄືກັບການຫົດນໍ້າຕົ້ນໄມ້ດ້ວຍຫົວທີ່ແປກປະຫຼາດ. ໜອງນ້ຳຫຼາຍໂພດ. ໄພແຫ້ງແລ້ງໜ້ອຍເກີນໄປ. cadence ທີ່ຖືກຕ້ອງ, ມີແສງແດດຈາກຂໍ້ມູນທີ່ດີແລະສານອາຫານຈາກຈຸດປະສົງທີ່ສະອາດ, ແລະທ່ານໄດ້ຮັບການຂະຫຍາຍຕົວ. ແມ່ນແລ້ວ, ເນີຍແຂງເລັກນ້ອຍ, ແຕ່ມັນຕິດຢູ່.
AI ຮຽນຮູ້ແນວໃດ? ເອົາມາລວມກັນ 🧾
ຮູບແບບເລີ່ມຕົ້ນແບບສຸ່ມ. ໂດຍຜ່ານການປັບປຸງແບບ gradient, ນໍາພາໂດຍການສູນເສຍ, ມັນຈັດລໍາດັບພາລາມິເຕີຂອງມັນກັບຮູບແບບໃນຂໍ້ມູນ. ການເປັນຕົວແທນອອກມາທີ່ເຮັດໃຫ້ການຄາດເດົາໄດ້ງ່າຍ. ການປະເມີນຜົນບອກໃຫ້ທ່ານຮູ້ວ່າການຮຽນຮູ້ແມ່ນແທ້ຈິງ, ບໍ່ແມ່ນອຸບັດຕິເຫດ. ແລະ iteration-with guardrails for safety-turns a demo into a dependable system. ນັ້ນແມ່ນເລື່ອງທັງຫມົດ, ມີ vibes ລຶກລັບຫນ້ອຍກ່ວາມັນທໍາອິດທີ່ເບິ່ງຄືວ່າ. [1]–[4]
ຂໍ້ສັງເກດສຸດທ້າຍ - ດົນເກີນໄປ, ບໍ່ໄດ້ອ່ານ🎁
-
AI ຮຽນຮູ້ແນວໃດ? ໂດຍການຫຼຸດການສູນເສຍທີ່ມີ gradients ຫຼາຍກວ່າຕົວຢ່າງຈໍານວນຫລາຍ. [1], [2]
-
ຂໍ້ມູນທີ່ດີ, ຈຸດປະສົງທີ່ຈະແຈ້ງ, ແລະການປັບປຸງທີ່ຫມັ້ນຄົງເຮັດໃຫ້ການຮຽນຮູ້. [1]–[3]
-
Generalization ຊະນະການຈົດຈຳ-ສະເໝີ. [1]
-
ຄວາມປອດໄພ, ການປະເມີນຜົນ, ແລະການຊ້ໍາຄືນເຮັດໃຫ້ຄວາມຄິດສະຫລາດເປັນຜະລິດຕະພັນທີ່ເຊື່ອຖືໄດ້. [3], [4]
-
ເລີ່ມຕົ້ນງ່າຍດາຍ, ວັດແທກໄດ້ດີ, ແລະປັບປຸງໂດຍການແກ້ໄຂຂໍ້ມູນກ່ອນທີ່ທ່ານຈະແລ່ນສະຖາປັດຕະຍະກໍາ exotic. [2], [3]
ເອກະສານອ້າງອີງ
-
Goodfellow, Bengio, Courville - ການຮຽນຮູ້ເລິກເຊິ່ງ (ຂໍ້ຄວາມອອນໄລນ໌ຟຣີ). ເຊື່ອມຕໍ່
-
Stanford CS231n - ເຄືອຂ່າຍປະສາດແບບປະສົມປະສານສຳລັບການຮັບຮູ້ພາບ (ບັນທຶກຫຼັກສູດ ແລະ ວຽກມອບໝາຍ). ລິ້ງ
-
Google - ຫຼັກສູດການຂັດຂ້ອງຂອງການຮຽນຮູ້ເຄື່ອງຈັກ: ການວັດແທກການຈັດປະເພດ (ຄວາມຖືກຕ້ອງ, ຄວາມຊັດເຈນ, ການເອີ້ນຄືນ, ROC/AUC). ເຊື່ອມຕໍ່
-
NIST - AI Risk Management Framework (AI RMF 1.0). ເຊື່ອມຕໍ່
-
OpenAI - ການຮຽນຮູ້ຈາກຄວາມມັກຂອງມະນຸດ (ພາບລວມຂອງການຝຶກອົບຮົມໂດຍອີງໃສ່ຄວາມມັກ). ເຊື່ອມຕໍ່