ເຄືອຂ່າຍປະສາດຟັງແລ້ວລຶກລັບຈົນກວ່າມັນຈະບໍ່ມີ. ຖ້າທ່ານເຄີຍສົງໄສວ່າ ເຄືອຂ່າຍປະສາດໃນ AI ແມ່ນຫຍັງ? ແລະ ບໍ່ວ່າມັນເປັນພຽງຄະນິດສາດທີ່ມີໝວກທີ່ງົດງາມ, ທ່ານຢູ່ໃນສະຖານທີ່ທີ່ຖືກຕ້ອງແລ້ວ. ພວກເຮົາຈະເຮັດໃຫ້ມັນເປັນປະໂຫຍດ, ໂຮຍອ້ອມໄປດ້ວຍເສັ້ນທາງອ້ອມນ້ອຍໆ, ແລະ ແມ່ນແລ້ວ - ອີໂມຈິສອງສາມອັນ. ທ່ານຈະຮູ້ວ່າລະບົບເຫຼົ່ານີ້ແມ່ນຫຍັງ, ເປັນຫຍັງພວກມັນຈຶ່ງເຮັດວຽກ, ບ່ອນທີ່ພວກມັນລົ້ມເຫຼວ, ແລະວິທີການເວົ້າກ່ຽວກັບພວກມັນໂດຍບໍ່ຕ້ອງໂບກມື.
ບົດຄວາມທີ່ທ່ານອາດຈະຢາກອ່ານຫຼັງຈາກບົດຄວາມນີ້:
🔗 ຄວາມລຳອຽງຂອງ AI ແມ່ນຫຍັງ
ຄວາມເຂົ້າໃຈຄວາມລໍາອຽງໃນລະບົບ AI ແລະຍຸດທະສາດເພື່ອຮັບປະກັນຄວາມຍຸຕິທໍາ.
🔗 AI ແບບຄາດເດົາແມ່ນຫຍັງ
ວິທີການທີ່ AI ຄາດຄະເນໃຊ້ຮູບແບບເພື່ອຄາດຄະເນຜົນໄດ້ຮັບໃນອະນາຄົດ.
🔗 ຄູຝຶກ AI ແມ່ນຫຍັງ
ຂຸດຄົ້ນພາລະບົດບາດແລະຄວາມຮັບຜິດຊອບຂອງຜູ້ຊ່ຽວຊານທີ່ຝຶກອົບຮົມ AI.
🔗 ວິໄສທັດຄອມພິວເຕີໃນ AI ແມ່ນຫຍັງ
AI ຕີຄວາມໝາຍ ແລະວິເຄາະຂໍ້ມູນພາບຜ່ານວິໄສທັດຂອງຄອມພິວເຕີແນວໃດ.
Neural Network ໃນ AI ແມ່ນຫຍັງ? ຄຳຕອບ 10 ວິນາທີ ⏱️
ເຄືອຂ່າຍປະສາດແມ່ນການຊ້ອນກັນຂອງຫົວໜ່ວຍການຄິດໄລ່ງ່າຍໆທີ່ເອີ້ນວ່າ ເຊວປະສາດ ເຊິ່ງສົ່ງຕໍ່ຕົວເລກໄປຂ້າງໜ້າ, ປັບຈຸດແຂງຂອງການເຊື່ອມຕໍ່ຂອງພວກມັນໃນລະຫວ່າງການຝຶກອົບຮົມ, ແລະ ຄ່ອຍໆຮຽນຮູ້ຮູບແບບໃນຂໍ້ມູນ. ເມື່ອທ່ານໄດ້ຍິນຄຳ ວ່າ deep learning, ໂດຍປົກກະຕິແລ້ວນັ້ນໝາຍເຖິງເຄືອຂ່າຍປະສາດທີ່ມີຊັ້ນຫຼາຍຊັ້ນທີ່ຊ້ອນກັນ, ຮຽນຮູ້ຄຸນສົມບັດໂດຍອັດຕະໂນມັດແທນທີ່ຈະໃຫ້ທ່ານຂຽນລະຫັດພວກມັນດ້ວຍມື. ເວົ້າອີກຢ່າງໜຶ່ງ: ຊິ້ນສ່ວນຄະນິດສາດຂະໜາດນ້ອຍຈຳນວນຫຼາຍ, ຈັດລຽງຢ່າງສະຫຼາດ, ໄດ້ຮັບການຝຶກອົບຮົມກ່ຽວກັບຂໍ້ມູນຈົນກວ່າພວກມັນຈະເປັນປະໂຫຍດ [1].
ສິ່ງທີ່ເຮັດໃຫ້ Neural Network ມີປະໂຫຍດ? ✅
-
ພະລັງງານການເປັນຕົວແທນ: ດ້ວຍສະຖາປັດຕະຍະກໍາແລະຂະຫນາດທີ່ເຫມາະສົມ, ເຄືອຂ່າຍສາມາດປະມານການທໍາງານທີ່ສັບສົນທໍາມະຊາດ (ເບິ່ງທິດສະດີການປະມານທົ່ວໄປ) [4].
-
ການຮຽນຮູ້ຈາກຈຸດຈົບ: ແທນທີ່ຈະເປັນລັກສະນະວິສະວະກໍາດ້ວຍມື, ຮູບແບບຄົ້ນພົບພວກມັນ [1].
-
ການລວມຕົວ: ເຄືອຂ່າຍທີ່ມີລະບຽບເປັນຢ່າງດີບໍ່ພຽງແຕ່ຈື່ຈຳເທົ່ານັ້ນ - ແຕ່ມັນຍັງເຮັດວຽກກ່ຽວກັບຂໍ້ມູນໃໝ່ທີ່ເບິ່ງບໍ່ເຫັນ [1].
-
ຄວາມສາມາດໃນການຂະຫຍາຍ: ຊຸດຂໍ້ມູນທີ່ໃຫຍ່ກວ່າບວກກັບຮູບແບບທີ່ໃຫຍ່ກວ່າມັກຈະປັບປຸງຜົນໄດ້ຮັບໃຫ້ດີຂຶ້ນ... ຈົນເຖິງຂໍ້ຈຳກັດຕົວຈິງເຊັ່ນ: ການຄຳນວນ ແລະ ຄຸນນະພາບຂໍ້ມູນ [1].
-
ຄວາມສາມາດໃນການໂອນຍ້າຍ: ຄຸນສົມບັດທີ່ໄດ້ຮຽນຮູ້ໃນວຽກງານໜຶ່ງສາມາດຊ່ວຍໃຫ້ອີກວຽກໜຶ່ງໄດ້ (ການຖ່າຍທອດການຮຽນຮູ້ ແລະ ການປັບແຕ່ງລະອຽດ) [1].
ໝາຍເຫດພາກສະໜາມຂະໜາດນ້ອຍ (ຕົວຢ່າງສະຖານະການ): ທີມງານຈັດປະເພດຜະລິດຕະພັນຂະໜາດນ້ອຍໄດ້ແລກປ່ຽນຄຸນສົມບັດທີ່ສ້າງຂຶ້ນດ້ວຍມືສຳລັບ CNN ຂະໜາດກະທັດຮັດ, ເພີ່ມການເພີ່ມເຕີມງ່າຍໆ (ການພິກ/ຕັດ), ແລະ ເບິ່ງຄວາມຜິດພາດໃນການກວດສອບຫຼຸດລົງ - ບໍ່ແມ່ນຍ້ອນວ່າເຄືອຂ່າຍແມ່ນ "ມະຫັດສະຈັນ", ແຕ່ຍ້ອນວ່າມັນໄດ້ຮຽນຮູ້ຄຸນສົມບັດທີ່ເປັນປະໂຫຍດຫຼາຍຂຶ້ນໂດຍກົງຈາກພິກເຊວ.
"ເຄືອຂ່າຍ Neural Network ໃນ AI ແມ່ນຫຍັງ?" ໃນພາສາອັງກິດທຳມະດາ, ພ້ອມກັບຄຳປຽບທຽບ 🍞
ຮູບພາບເສັ້ນເບເກີຣີ. ສ່ວນປະກອບເຂົ້າໄປໃນ, ຄົນງານປັບສູດ, ນັກທົດສອບລົດຊາດຈົ່ມ, ແລະທີມງານປັບປຸງສູດອີກເທື່ອຫນຶ່ງ. ໃນເຄືອຂ່າຍ, ວັດສະດຸປ້ອນເຂົ້າໄຫຼຜ່ານຊັ້ນຂໍ້ມູນ, ຟັງຊັນການສູນເສຍຈະຈັດລໍາດັບຜົນໄດ້ຮັບ, ແລະ gradients nudge ນ້ໍາຫນັກເພື່ອເຮັດໃຫ້ດີກວ່າໃນຄັ້ງຕໍ່ໄປ. ບໍ່ສົມບູນແບບເປັນການປຽບທຽບ - ເຂົ້າຈີ່ບໍ່ແຕກຕ່າງກັນ - ແຕ່ມັນຕິດ [1].
ຮ່າງກາຍຂອງລະບົບປະສາດ 🧩
-
Neurons: ເຄື່ອງຄິດໄລ່ຂະຫນາດນ້ອຍນໍາໃຊ້ຜົນລວມນ້ໍາຫນັກແລະການທໍາງານຂອງການກະຕຸ້ນ.
-
ນ້ຳໜັກ ແລະ ອະຄະຕິ: ປຸ່ມປັບໄດ້ທີ່ກຳນົດວິທີການລວມສັນຍານເຂົ້າກັນ.
-
Layers: ຊັ້ນປ້ອນຂໍ້ມູນໄດ້ຮັບຂໍ້ມູນ, ຊັ້ນທີ່ເຊື່ອງໄວ້ປ່ຽນມັນ, ຊັ້ນຜົນຜະລິດເຮັດໃຫ້ການຄາດຄະເນ.
-
ຟັງຊັນການເປີດໃຊ້ງານ: ການບິດແບບບໍ່ມີເສັ້ນເຊັ່ນ ReLU, sigmoid, tanh, ແລະ softmax ເຮັດໃຫ້ການຮຽນຮູ້ມີຄວາມຍືດຫຍຸ່ນ.
-
ຟັງຊັນການສູນເສຍ: ຄະແນນຂອງການຄາດຄະເນທີ່ຜິດພາດ (cross-entropy ສໍາລັບການຈັດປະເພດ, MSE ສໍາລັບ regression).
-
Optimizer: Algorithms ເຊັ່ນ SGD ຫຼື Adam ໃຊ້ gradients ເພື່ອປັບປຸງນ້ໍາຫນັກ.
-
Regularization: ເຕັກນິກເຊັ່ນ: ການຫຼຸດລົງຫຼືການທໍາລາຍນ້ໍາຫນັກເພື່ອຮັກສາຕົວແບບຈາກການ overfitting.
ຖ້າທ່ານຕ້ອງການການປິ່ນປົວຢ່າງເປັນທາງການ (ແຕ່ຍັງສາມາດອ່ານໄດ້), ປຶ້ມແບບ ຮຽນແບບເລິກ ໄດ້ກວມເອົາຢ່າງເຕັມທີ່: ພື້ນຖານຄະນິດສາດ, ການເພີ່ມປະສິດທິພາບແລະການເພີ່ມປະສິດທິພາບທົ່ວໄປ [1].
ຟັງຊັນການເປີດໃຊ້, ໄລຍະສັ້ນໆແຕ່ມີປະໂຫຍດ ⚡
-
ReLU: Zero for negatives, linear for positives. ງ່າຍດາຍ, ໄວ, ປະສິດທິຜົນ.
-
Sigmoid: Squashes ຄ່າລະຫວ່າງ 0 ແລະ 1 - ມີປະໂຫຍດແຕ່ສາມາດອີ່ມຕົວໄດ້.
-
Tanh: ຄ້າຍຄື sigmoid ແຕ່ symmetric ປະມານສູນ.
-
Softmax: ປ່ຽນຄະແນນດິບໃຫ້ເປັນຄວາມເປັນໄປໄດ້ໃນທົ່ວຫ້ອງຮຽນ.
ທ່ານບໍ່ ຈຳ ເປັນຕ້ອງຈື່ທຸກຮູບຮ່າງຂອງເສັ້ນໂຄ້ງ - ພຽງແຕ່ຮູ້ການຊື້ຂາຍແລະຄ່າເລີ່ມຕົ້ນທົ່ວໄປ [1, 2].
ການຮຽນຮູ້ເກີດຂຶ້ນຈິງແນວໃດ: backprop, ແຕ່ບໍ່ຫນ້າຢ້ານ 🔁
-
Forward pass: ຂໍ້ມູນໄຫຼເຂົ້າກັນເປັນຊັ້ນໆເພື່ອຜະລິດການຄາດເດົາ.
-
ການສູນເສຍຄອມພິວເຕີ້: ປຽບທຽບການຄາດຄະເນກັບຄວາມຈິງ.
-
Backpropagation: ຄິດໄລ່ gradients ຂອງການສູນເສຍທີ່ກ່ຽວຂ້ອງກັບແຕ່ລະນ້ໍາຫນັກໂດຍໃຊ້ລະບົບຕ່ອງໂສ້.
-
ອັບເດດ: Optimizer ປ່ຽນແປງນ້ຳໜັກໜ້ອຍໜຶ່ງ.
-
Repeat: ຫຼາຍຍຸກ. ຕົວແບບຄ່ອຍໆຮຽນຮູ້.
ສໍາລັບຄວາມເຂົ້າໃຈໃນມືທີ່ມີຮູບພາບແລະຄໍາອະທິບາຍທີ່ຢູ່ຕິດກັນ, ເບິ່ງບັນທຶກ CS231n ຄລາສສິກກ່ຽວກັບ backprop ແລະການເພີ່ມປະສິດທິພາບ [2].
ຄອບຄົວທີ່ສໍາຄັນຂອງເຄືອຂ່າຍ neural, ໃນ glance 🏡
-
ເຄືອຂ່າຍ Feedforward (MLPs): ປະເພດທີ່ງ່າຍດາຍທີ່ສຸດ. ຂໍ້ມູນພຽງແຕ່ກ້າວໄປຂ້າງຫນ້າ.
-
Convolutional Neural Networks (CNNs): ດີເລີດສຳລັບຮູບພາບຍ້ອນຕົວກອງທາງກວ້າງຂອງພື້ນທີ່ກວດພົບຂອບ, ໂຄງສ້າງ, ຮູບຮ່າງ [2].
-
ເຄືອຂ່າຍປະສາດທີ່ເກີດຂຶ້ນຊ້ຳໆ (RNNs) ແລະ ການປ່ຽນແປງ: ສ້າງຂຶ້ນສຳລັບລຳດັບເຊັ່ນ: ຂໍ້ຄວາມ ຫຼື ຊຸດເວລາໂດຍການຮັກສາຄວາມເປັນລະບຽບຮຽບຮ້ອຍ [1].
-
Transformers: ໃຊ້ຄວາມສົນໃຈໃນການສ້າງແບບຈໍາລອງຄວາມສໍາພັນໃນທົ່ວຕໍາແຫນ່ງໃນລໍາດັບທັງຫມົດໃນເວລາດຽວກັນ; ເດັ່ນໃນພາສາ ແລະຫຼາຍກວ່າ [3].
-
Graph Neural Networks (GNNs): ປະຕິບັດການຢູ່ໃນ nodes ແລະຂອບຂອງກາຟ - ເປັນປະໂຫຍດສໍາລັບໂມເລກຸນ, ເຄືອຂ່າຍສັງຄົມ, ຄໍາແນະນໍາ [1].
-
ຕົວເຂົ້າລະຫັດອັດຕະໂນມັດ ແລະ VAE: ຮຽນຮູ້ການນຳສະເໜີທີ່ຖືກບີບອັດ ແລະ ສ້າງການປ່ຽນແປງຕ່າງໆ [1].
-
ຮູບແບບການຜະລິດ: ຈາກ GANs ໄປຫາແບບຈໍາລອງການແຜ່ກະຈາຍ, ໃຊ້ສໍາລັບຮູບພາບ, ສຽງ, ເຖິງແມ່ນວ່າລະຫັດ [1].
ບັນທຶກ CS231n ແມ່ນເປັນມິດກັບ CNN ໂດຍສະເພາະ, ໃນຂະນະທີ່ກະດາດ Transformer ເປັນແຫຼ່ງຕົ້ນຕໍສໍາລັບຮູບແບບທີ່ອີງໃສ່ຄວາມສົນໃຈ [2, 3].
ຕາຕະລາງປຽບທຽບ: ປະເພດເຄືອຂ່າຍ neural ທົ່ວໄປ, ພວກເຂົາແມ່ນໃຜ, ຄ່າໃຊ້ຈ່າຍ vibes, ແລະເປັນຫຍັງພວກມັນເຮັດວຽກ 📊
| ເຄື່ອງມື / ປະເພດ | ຜູ້ຊົມ | ລາຄາປະມານ | ເປັນຫຍັງມັນຈຶ່ງໃຊ້ໄດ້ |
|---|---|---|---|
| Feedforward (MLP) | ຜູ້ເລີ່ມຕົ້ນ, ນັກວິເຄາະ | ຕ່ຳ-ກາງ | ງ່າຍດາຍ, ປ່ຽນແປງໄດ້, ພື້ນຖານທີ່ເໝາະສົມ |
| CNN | ທີມງານວິໄສທັດ | ປານກາງ | ຮູບແບບທ້ອງຖິ່ນ + ການແບ່ງປັນພາລາມິເຕີ |
| RNN / LSTM / GRU | ຄົນຕາມລໍາດັບ | ປານກາງ | ຄວາມຊົງຈໍາຊົ່ວຄາວ-ish… ບັນທຶກຄໍາສັ່ງ |
| ໝໍ້ແປງ | NLP, multimodal | ປານກາງ-ສູງ | ຄວາມສົນໃຈສຸມໃສ່ການພົວພັນທີ່ກ່ຽວຂ້ອງ |
| GNN | ນັກວິທະຍາສາດ, recsys | ປານກາງ | ຂໍ້ຄວາມຜ່ານກາຟສະແດງໃຫ້ເຫັນໂຄງສ້າງ |
| Autoencoder / VAE | ນັກຄົ້ນຄວ້າ | ຕ່ຳ-ກາງ | ຮຽນຮູ້ການບີບອັດຕົວແທນ |
| GAN / ການແຜ່ກະຈາຍ | ຫ້ອງທົດລອງສ້າງສັນ | ປານກາງ-ສູງ | ກົນອຸບາຍ ຫຼື ຊໍ້າຊາກ ປະຕິເສດ magic |
ຫມາຍເຫດ: ລາຄາແມ່ນກ່ຽວກັບຄອມພິວເຕີ້ແລະເວລາ; ໄລຍະທາງຂອງທ່ານແຕກຕ່າງກັນ. ເຊລ ຫຼື ສອງຫ້ອງແມ່ນເຈດຕະນາລົມກັນຢ່າງຕັ້ງໃຈ.
"ເຄືອຂ່າຍ Neural Network ໃນ AI ແມ່ນຫຍັງ?" ທຽບກັບ ML algorithms ຄລາສສິກ ⚖️
-
ວິສະວະກໍາຄຸນສົມບັດ: ຄລາສິກ ML ມັກຈະອີງໃສ່ຄຸນສົມບັດຄູ່ມື. ຕາຫນ່າງ Neural ຮຽນຮູ້ລັກສະນະອັດຕະໂນມັດ - ໄຊຊະນະໃຫຍ່ສໍາລັບຂໍ້ມູນສະລັບສັບຊ້ອນ [1].
-
ຄວາມອຶດຢາກຂໍ້ມູນ: ເຄືອຂ່າຍມັກຈະສ່ອງແສງດ້ວຍຂໍ້ມູນຫຼາຍຂຶ້ນ; ຂໍ້ມູນຂະຫນາດນ້ອຍອາດຈະມັກແບບທີ່ງ່າຍດາຍ [1].
-
ການຄິດໄລ່: ເຄືອຂ່າຍມັກຕົວເລັ່ງຄວາມໄວເຊັ່ນ GPUs [1].
-
ເພດານການປະຕິບັດ: ສໍາລັບຂໍ້ມູນທີ່ບໍ່ມີໂຄງສ້າງ (ຮູບພາບ, ສຽງ, ຂໍ້ຄວາມ), ຕາຫນ່າງເລິກມີແນວໂນ້ມທີ່ຈະຄອບງໍາ [1, 2].
ຂັ້ນຕອນການຝຶກຊ້ອມທີ່ປະຕິບັດຕົວຈິງ 🛠️
-
ກໍານົດຈຸດປະສົງ: ການຈັດປະເພດ, regression, ການຈັດອັນດັບ, ການຜະລິດ - ເລືອກເອົາການສູນເສຍທີ່ກົງກັນ.
-
ຂໍ້ມູນຂັດແຍ່ງ: ແບ່ງອອກເປັນການຝຶກອົບຮົມ / validation / ການທົດສອບ. ເຮັດໃຫ້ຄຸນສົມບັດປົກກະຕິ. ຫ້ອງຮຽນການດຸ່ນດ່ຽງ. ສໍາລັບຮູບພາບ, ພິຈາລະນາການຂະຫຍາຍເຊັ່ນ: flips, ການປູກພືດ, ສິ່ງລົບກວນຂະຫນາດນ້ອຍ.
-
ທາງເລືອກສະຖາປັດຕະຍະກໍາ: ເລີ່ມຕົ້ນງ່າຍດາຍ. ເພີ່ມຄວາມອາດສາມາດພຽງແຕ່ເມື່ອຈໍາເປັນ.
-
ການຝຶກອົບຮົມ: batch ຂໍ້ມູນ. ສົ່ງຕໍ່. ຄິດໄລ່ການສູນເສຍ. Backprop. ອັບເດດ. ບັນທຶກການວັດແທກ.
-
Regularize: Dropout, ຫຼຸດນ້ຳໜັກ, ຢຸດໄວ.
-
ການປະເມີນ: ໃຊ້ຊຸດການຢືນຢັນສຳລັບ hyperparameters. ຖືຊຸດທົດສອບສໍາລັບການກວດສອບຄັ້ງສຸດທ້າຍ.
-
ເຮືອຢ່າງລະມັດລະວັງ: ຕິດຕາມການລອຍ, ກວດເບິ່ງຄວາມລໍາອຽງ, ວາງແຜນການກັບຄືນ.
ສໍາລັບການສອນແບບຮຽນຈົບແບບລະຫັດກັບທິດສະດີແຂງ, ປື້ມແບບຮຽນເປີດແລະບັນທຶກ CS231n ແມ່ນສະມໍທີ່ເຊື່ອຖືໄດ້ [1, 2].
Overfitting, ໂດຍທົ່ວໄປ, ແລະ gremlins ອື່ນໆ 👀
-
Overfitting: ແບບຈໍາລອງການຈື່ຈໍາ quirks ການຝຶກອົບຮົມ. ແກ້ໄຂດ້ວຍຂໍ້ມູນເພີ່ມເຕີມ, ການເຮັດໃຫ້ເປັນປົກກະຕິທີ່ເຂັ້ມແຂງ, ຫຼືສະຖາປັດຕະຍະກໍາທີ່ງ່າຍດາຍກວ່າ.
-
Underfitting: ຕົວແບບແມ່ນງ່າຍດາຍເກີນໄປຫຼືການຝຶກອົບຮົມຂີ້ອາຍເກີນໄປ. ເພີ່ມຄວາມອາດສາມາດຫຼືການຝຶກອົບຮົມຕໍ່ໄປອີກແລ້ວ.
-
ຂໍ້ມູນຮົ່ວໄຫລ: ຂໍ້ມູນຈາກຊຸດທົດສອບ sneaks ເຂົ້າໄປໃນການຝຶກອົບຮົມ. ສາມຄັ້ງກວດສອບການແບ່ງປັນຂອງທ່ານ.
-
ການວັດແທກທີ່ບໍ່ດີ: ຮູບແບບທີ່ມີຄວາມໝັ້ນໃຈແຕ່ຜິດພາດແມ່ນເປັນອັນຕະລາຍ. ພິຈາລະນາການວັດແທກ ຫຼື ການໃຫ້ນ້ຳໜັກການສູນເສຍທີ່ແຕກຕ່າງກັນ.
-
ການປ່ຽນແປງການແຜ່ກະຈາຍ: ຂໍ້ມູນໃນໂລກທີ່ແທ້ຈິງຍ້າຍ. ຕິດຕາມແລະປັບຕົວ.
ສໍາລັບທິດສະດີທີ່ຢູ່ເບື້ອງຫລັງໂດຍທົ່ວໄປແລະປົກກະຕິ, ອີງໃສ່ການອ້າງອິງມາດຕະຖານ [1, 2].
ຄວາມປອດໄພ, ຄວາມສາມາດຕີຄວາມຫມາຍ, ແລະການນໍາໃຊ້ທີ່ມີຄວາມຮັບຜິດຊອບ 🧭
ເຄືອຂ່າຍປະສາດສາມາດຕັດສິນໃຈທີ່ມີຄວາມສ່ຽງສູງໄດ້. ມັນບໍ່ພຽງພໍທີ່ພວກມັນຈະເຮັດວຽກໄດ້ດີໃນກະດານຈັດອັນດັບ. ທ່ານຕ້ອງການຂັ້ນຕອນການຄຸ້ມຄອງ, ການວັດແທກ ແລະ ການຫຼຸດຜ່ອນຄວາມສ່ຽງຕະຫຼອດວົງຈອນຊີວິດ. ຂອບການຄຸ້ມຄອງຄວາມສ່ຽງ AI ຂອງ NIST ກຳນົດໜ້າທີ່ປະຕິບັດໄດ້ - ປົກຄອງ, ສ້າງແຜນທີ່, ວັດແທກ, ຄຸ້ມຄອງ - ເພື່ອຊ່ວຍໃຫ້ທີມງານປະສົມປະສານການຄຸ້ມຄອງຄວາມສ່ຽງເຂົ້າໃນການອອກແບບ ແລະ ການນຳໃຊ້ [5].
ການກະຕຸ້ນໄວບາງອັນ:
-
ການກວດສອບຄວາມລຳອຽງ: ປະເມີນໃນທົ່ວພາກສ່ວນປະຊາກອນຕາມຄວາມເໝາະສົມ ແລະ ຖືກຕ້ອງຕາມກົດໝາຍ.
-
ການຕີຄວາມໝາຍ: ໃຊ້ເຕັກນິກຕ່າງໆເຊັ່ນ: ຄວາມໂດດເດັ່ນ ຫຼື ການລະບຸຄຸນລັກສະນະຕ່າງໆ. ພວກມັນບໍ່ສົມບູນແບບ, ແຕ່ມີປະໂຫຍດ.
-
ການຕິດຕາມກວດກາ: ຕັ້ງການແຈ້ງເຕືອນສໍາລັບການຫຼຸດລົງ metric ຢ່າງກະທັນຫັນຫຼືຂໍ້ມູນພຽງເລັກນ້ອຍ.
-
ການຄວບຄຸມຂອງມະນຸດ: ຮັກສາມະນຸດຢູ່ໃນວົງການສໍາລັບການຕັດສິນໃຈທີ່ມີຜົນກະທົບ. ບໍ່ມີວິລະຊົນ, ພຽງແຕ່ອະນາໄມ.
ຄຳຖາມທີ່ມັກຖາມເລື້ອຍໆ 🙋
ເຄືອຂ່າຍ neural ເປັນພື້ນຖານຂອງສະຫມອງບໍ?
ໄດ້ຮັບການດົນໃຈຈາກສະຫມອງ, ແມ່ນແລ້ວ - ແຕ່ງ່າຍດາຍ. Neurons ໃນເຄືອຂ່າຍແມ່ນຫນ້າທີ່ຄະນິດສາດ; neurons ຊີວະສາດແມ່ນຈຸລັງທີ່ມີຊີວິດທີ່ມີການເຄື່ອນໄຫວທີ່ສັບສົນ. vibes ທີ່ຄ້າຍຄືກັນ, ຟີຊິກທີ່ແຕກຕ່າງກັນຫຼາຍ [1].
ຂ້ອຍຕ້ອງການຊັ້ນໃດ?
ເລີ່ມຕົ້ນຂະຫນາດນ້ອຍ. ຖ້າເຈົ້າບໍ່ພໍດີ, ໃຫ້ເພີ່ມຄວາມກວ້າງ ຫຼື ຄວາມເລິກ. ຖ້າເຈົ້າພໍດີ, ປັບປົກກະຕິ ຫຼືຫຼຸດຄວາມອາດສາມາດ. ບໍ່ມີຕົວເລກ magic; ມີພຽງແຕ່ເສັ້ນໂຄ້ງຄວາມຖືກຕ້ອງແລະຄວາມອົດທົນ [1].
ຂ້ອຍຕ້ອງການ GPU ສະເໝີບໍ?
ບໍ່ສະເຫມີ. ຮູບແບບຂະຫນາດນ້ອຍກ່ຽວກັບຂໍ້ມູນເລັກນ້ອຍສາມາດຝຶກອົບຮົມໃນ CPU ໄດ້, ແຕ່ສໍາລັບຮູບພາບ, ຕົວແບບຂໍ້ຄວາມຂະຫນາດໃຫຍ່, ຫຼືຊຸດຂໍ້ມູນໃຫຍ່, ຕົວເລັ່ງຄວາມໄວປະຫຍັດເວລາຫຼາຍ [1].
ເປັນຫຍັງຜູ້ຄົນເວົ້າວ່າຄວາມສົນໃຈແມ່ນມີອໍານາດ?
ເນື່ອງຈາກວ່າຄວາມສົນໃຈເຮັດໃຫ້ຕົວແບບສຸມໃສ່ພາກສ່ວນທີ່ກ່ຽວຂ້ອງທີ່ສຸດຂອງວັດສະດຸປ້ອນໂດຍບໍ່ມີການຍ່າງຢ່າງເຂັ້ມງວດ. ມັນຈັບເອົາການພົວພັນທົ່ວໂລກ, ເຊິ່ງເປັນເລື່ອງໃຫຍ່ສໍາລັບວຽກງານພາສາແລະ multimodal [3].
ແມ່ນ "ເຄືອຂ່າຍ Neural ໃນ AI ແມ່ນຫຍັງ?" ແຕກຕ່າງຈາກ "ການຮຽນຮູ້ເລິກແມ່ນຫຍັງ"?
ການຮຽນຮູ້ເລິກແມ່ນວິທີການທີ່ກວ້າງກວ່າທີ່ໃຊ້ເຄືອຂ່າຍ neural ເລິກ. ດັ່ງນັ້ນການຖາມວ່າ Neural Network ໃນ AI ແມ່ນຫຍັງ? ແມ່ນຄ້າຍຄືຖາມກ່ຽວກັບລັກສະນະຕົ້ນຕໍ; ການຮຽນຮູ້ເລິກແມ່ນຮູບເງົາທັງຫມົດ [1].
ຄໍາແນະນໍາການປະຕິບັດ, ຄວາມຄິດເຫັນເລັກນ້ອຍ 💡
-
ຕ້ອງການ ພື້ນຖານທີ່ງ່າຍດາຍ ກ່ອນ. ເຖິງແມ່ນວ່າ perceptron multilayer ຂະຫນາດນ້ອຍສາມາດບອກທ່ານວ່າຂໍ້ມູນສາມາດຮຽນຮູ້ໄດ້.
-
ຂອງທ່ານ ທໍ່ສົ່ງຂໍ້ມູນ. ຖ້າທ່ານບໍ່ສາມາດເປີດໃຊ້ມັນໄດ້ຄືນໃໝ່, ທ່ານກໍ່ບໍ່ສາມາດໄວ້ວາງໃຈມັນໄດ້.
-
ອັດຕາການຮຽນຮູ້ ສຳຄັນກວ່າທີ່ເຈົ້າຄິດ. ລອງກຳນົດເວລາ. ການອົບອຸ່ນສາມາດຊ່ວຍໄດ້.
-
ການຊື້ຂາຍຂະໜາດຊຸດ . ຊຸດທີ່ໃຫຍ່ກວ່າຈະຮັກສາຄວາມຄົງທີ່ຂອງ gradients ແຕ່ໂດຍທົ່ວໄປອາດຈະແຕກຕ່າງກັນ.
-
ເມື່ອສັບສົນ, ໃຫ້ວາງ ເສັ້ນໂຄ້ງການສູນເສຍ ແລະ ມາດຕະຖານນ້ຳໜັກ. ເຈົ້າຈະແປກໃຈວ່າຄຳຕອບຢູ່ໃນແຜນວາດເລື້ອຍໆປານໃດ.
-
ສົມມຸດຕິຖານເອກະສານ. ອະນາຄົດ - ເຈົ້າລືມສິ່ງຕ່າງໆ - ໄວ [1, 2].
Deep-dive dive dive: ບົດບາດຂອງຂໍ້ມູນ, ຫຼືວ່າເປັນຫຍັງຂີ້ເຫຍື້ອໃນຍັງຫມາຍຄວາມວ່າຂີ້ເຫຍື້ອອອກ 🗑️➡️✨
ເຄືອຂ່າຍ neural ບໍ່ໄດ້ແກ້ໄຂຂໍ້ບົກພ່ອງຢ່າງມະຫັດສະຈັນ. ປ້າຍຊື່ທີ່ບິດເບືອນ, ຄວາມຜິດພາດຂອງຄໍາບັນຍາຍ, ຫຼືການເກັບຕົວຢ່າງແຄບຈະສະທ້ອນອອກມາຈາກຕົວແບບ. ຄຸ້ມຄອງ, ກວດສອບ, ແລະຂະຫຍາຍ. ແລະຖ້າທ່ານບໍ່ແນ່ໃຈວ່າທ່ານຕ້ອງການຂໍ້ມູນເພີ່ມເຕີມຫຼືຮູບແບບທີ່ດີກວ່າ, ຄໍາຕອບມັກຈະເປັນເລື່ອງທີ່ຫນ້າລໍາຄານ: ທັງສອງ - ແຕ່ເລີ່ມຕົ້ນດ້ວຍຄຸນນະພາບຂໍ້ມູນ [1].
"ເຄືອຂ່າຍ Neural Network ໃນ AI ແມ່ນຫຍັງ?" - ຄໍານິຍາມສັ້ນທີ່ທ່ານສາມາດນໍາໃຊ້ຄືນ🧾
-
ເຄືອຂ່າຍ neural ເປັນຕົວປະມານການທໍາງານຂອງຊັ້ນທີ່ຮຽນຮູ້ຮູບແບບທີ່ຊັບຊ້ອນໂດຍການປັບນ້ໍາຫນັກໂດຍໃຊ້ສັນຍານ gradient [1, 2].
-
ມັນເປັນລະບົບທີ່ປ່ຽນການນໍາເຂົ້າເປັນຜົນຜະລິດໂດຍຜ່ານຂັ້ນຕອນບໍ່ແມ່ນເສັ້ນຕໍ່ເນື່ອງ, ການຝຶກອົບຮົມເພື່ອຫຼຸດຜ່ອນການສູນເສຍ [1].
-
ມັນເປັນວິທີການສ້າງແບບຈໍາລອງແບບຍືດຫຍຸ່ນ, ຫິວໂຫຍທີ່ຈະເລີນເຕີບໂຕໃນວັດສະດຸປ້ອນທີ່ບໍ່ມີໂຄງສ້າງເຊັ່ນ: ຮູບພາບ, ຂໍ້ຄວາມ, ແລະສຽງ [1, 2, 3].
ຍາວເກີນໄປ, ບໍ່ໄດ້ອ່ານແລະຂໍ້ສັງເກດສຸດທ້າຍ 🎯
ຖ້າມີຄົນຖາມເຈົ້າ ວ່າ ເຄືອຂ່າຍປະສາດໃນ AI ແມ່ນຫຍັງ? ນີ້ແມ່ນຄຳອະທິບາຍສັ້ນໆ: ເຄືອຂ່າຍປະສາດແມ່ນການຊ້ອນກັນຂອງໜ່ວຍງ່າຍໆທີ່ປ່ຽນຂໍ້ມູນເທື່ອລະຂັ້ນຕອນ, ຮຽນຮູ້ການປ່ຽນໂດຍການຫຼຸດຜ່ອນການສູນເສຍ ແລະ ປະຕິບັດຕາມການປ່ຽນແປງ. ພວກມັນມີປະສິດທິພາບເພາະວ່າພວກມັນຂະຫຍາຍຂະໜາດ, ຮຽນຮູ້ຄຸນສົມບັດໂດຍອັດຕະໂນມັດ, ແລະ ສາມາດເປັນຕົວແທນຂອງໜ້າທີ່ທີ່ສັບສົນຫຼາຍ [1, 4]. ພວກມັນມີຄວາມສ່ຽງຖ້າເຈົ້າບໍ່ສົນໃຈຄຸນນະພາບຂໍ້ມູນ, ການຄຸ້ມຄອງ, ຫຼື ການຕິດຕາມກວດກາ [5]. ແລະ ພວກມັນບໍ່ແມ່ນເວດມົນ. ພຽງແຕ່ຄະນິດສາດ, ການຄຳນວນ, ແລະ ວິສະວະກຳທີ່ດີ - ດ້ວຍຄວາມມັກເລັກນ້ອຍ.
ການອ່ານເພີ່ມເຕີມ, ເລືອກຢ່າງລະມັດລະວັງ (ສ່ວນທີ່ບໍ່ໄດ້ອ້າງອີງ)
-
ບັນທຶກ Stanford CS231n - ສາມາດເຂົ້າຫາໄດ້ ແລະປະຕິບັດໄດ້: https://cs231n.github.io/
-
DeepLearningBook.org - ອ້າງອິງ canonical: https://www.deeplearningbook.org/
-
NIST AI Risk Management Framework - ຄຳແນະນຳ AI ທີ່ມີຄວາມຮັບຜິດຊອບ: https://www.nist.gov/itl/ai-risk-management-framework
-
“ຄວາມສົນໃຈຄືສິ່ງດຽວທີ່ເຈົ້າຕ້ອງການ” - ເອກະສານ Transformer: https://arxiv.org/abs/1706.03762
ເອກະສານອ້າງອີງ
[1] Goodfellow, I., Bengio, Y., & Courville, A. ການຮຽນຮູ້ເລິກ. MIT Press. ສະບັບອອນໄລນ໌ຟຣີ: ອ່ານຕື່ມ
[2] ສະແຕນຟອດ CS231n. Convolutional Neural Networks ສໍາລັບ Visual Recognition (ບັນທຶກຫຼັກສູດ): ອ່ານເພີ່ມເຕີມ
[3] Vaswani, A., Shazeer, N., Parmar, N., et al. (2017). ເອົາໃຈໃສ່ແມ່ນທັງຫມົດທີ່ທ່ານຕ້ອງການ. NeurIPS. arXiv: ອ່ານເພີ່ມເຕີມ
[4] Cybenko, G. (1989). ການປະມານໂດຍການຊ້ອນກັນຂອງຟັງຊັນ sigmoidal. ຄະນິດສາດຂອງການຄວບຄຸມ, ສັນຍານ ແລະ ລະບົບ, 2, 303–314. Springer: ອ່ານຕື່ມ
[5] NIST. ຂອບການຄຸ້ມຄອງຄວາມສ່ຽງ AI (AI RMF): ອ່ານເພີ່ມເຕີມ