ເຄືອຂ່າຍປະສາດໃນ AI ແມ່ນຫຍັງ?

ເຄືອຂ່າຍປະສາດໃນ AI ແມ່ນຫຍັງ?

ເຄືອຂ່າຍປະສາດຟັງແລ້ວລຶກລັບຈົນກວ່າມັນຈະບໍ່ມີ. ຖ້າທ່ານເຄີຍສົງໄສວ່າ ເຄືອຂ່າຍປະສາດໃນ AI ແມ່ນຫຍັງ? ແລະ ບໍ່ວ່າມັນເປັນພຽງຄະນິດສາດທີ່ມີໝວກທີ່ງົດງາມ, ທ່ານຢູ່ໃນສະຖານທີ່ທີ່ຖືກຕ້ອງແລ້ວ. ພວກເຮົາຈະເຮັດໃຫ້ມັນເປັນປະໂຫຍດ, ໂຮຍອ້ອມໄປດ້ວຍເສັ້ນທາງອ້ອມນ້ອຍໆ, ແລະ ແມ່ນແລ້ວ - ອີໂມຈິສອງສາມອັນ. ທ່ານຈະຮູ້ວ່າລະບົບເຫຼົ່ານີ້ແມ່ນຫຍັງ, ເປັນຫຍັງພວກມັນຈຶ່ງເຮັດວຽກ, ບ່ອນທີ່ພວກມັນລົ້ມເຫຼວ, ແລະວິທີການເວົ້າກ່ຽວກັບພວກມັນໂດຍບໍ່ຕ້ອງໂບກມື.

ບົດຄວາມທີ່ທ່ານອາດຈະຢາກອ່ານຫຼັງຈາກບົດຄວາມນີ້:

🔗 ຄວາມລຳອຽງຂອງ AI ແມ່ນຫຍັງ
ຄວາມເຂົ້າໃຈຄວາມລໍາອຽງໃນລະບົບ AI ແລະຍຸດທະສາດເພື່ອຮັບປະກັນຄວາມຍຸຕິທໍາ.

🔗 AI ແບບຄາດເດົາແມ່ນຫຍັງ
ວິທີການທີ່ AI ຄາດຄະເນໃຊ້ຮູບແບບເພື່ອຄາດຄະເນຜົນໄດ້ຮັບໃນອະນາຄົດ.

🔗 ຄູຝຶກ AI ແມ່ນຫຍັງ
ຂຸດຄົ້ນພາລະບົດບາດແລະຄວາມຮັບຜິດຊອບຂອງຜູ້ຊ່ຽວຊານທີ່ຝຶກອົບຮົມ AI.

🔗 ວິໄສທັດຄອມພິວເຕີໃນ AI ແມ່ນຫຍັງ
AI ຕີຄວາມໝາຍ ແລະວິເຄາະຂໍ້ມູນພາບຜ່ານວິໄສທັດຂອງຄອມພິວເຕີແນວໃດ.


Neural Network ໃນ AI ແມ່ນຫຍັງ? ຄຳຕອບ 10 ວິນາທີ ⏱️

ເຄືອຂ່າຍປະສາດແມ່ນການຊ້ອນກັນຂອງຫົວໜ່ວຍການຄິດໄລ່ງ່າຍໆທີ່ເອີ້ນວ່າ ເຊວປະສາດ ເຊິ່ງສົ່ງຕໍ່ຕົວເລກໄປຂ້າງໜ້າ, ປັບຈຸດແຂງຂອງການເຊື່ອມຕໍ່ຂອງພວກມັນໃນລະຫວ່າງການຝຶກອົບຮົມ, ແລະ ຄ່ອຍໆຮຽນຮູ້ຮູບແບບໃນຂໍ້ມູນ. ເມື່ອທ່ານໄດ້ຍິນຄຳ ວ່າ deep learning, ໂດຍປົກກະຕິແລ້ວນັ້ນໝາຍເຖິງເຄືອຂ່າຍປະສາດທີ່ມີຊັ້ນຫຼາຍຊັ້ນທີ່ຊ້ອນກັນ, ຮຽນຮູ້ຄຸນສົມບັດໂດຍອັດຕະໂນມັດແທນທີ່ຈະໃຫ້ທ່ານຂຽນລະຫັດພວກມັນດ້ວຍມື. ເວົ້າອີກຢ່າງໜຶ່ງ: ຊິ້ນສ່ວນຄະນິດສາດຂະໜາດນ້ອຍຈຳນວນຫຼາຍ, ຈັດລຽງຢ່າງສະຫຼາດ, ໄດ້ຮັບການຝຶກອົບຮົມກ່ຽວກັບຂໍ້ມູນຈົນກວ່າພວກມັນຈະເປັນປະໂຫຍດ [1].


ສິ່ງທີ່ເຮັດໃຫ້ Neural Network ມີປະໂຫຍດ? ✅

  • ພະລັງງານການເປັນຕົວແທນ: ດ້ວຍສະຖາປັດຕະຍະກໍາແລະຂະຫນາດທີ່ເຫມາະສົມ, ເຄືອຂ່າຍສາມາດປະມານການທໍາງານທີ່ສັບສົນທໍາມະຊາດ (ເບິ່ງທິດສະດີການປະມານທົ່ວໄປ) [4].

  • ການຮຽນຮູ້ຈາກຈຸດຈົບ: ແທນທີ່ຈະເປັນລັກສະນະວິສະວະກໍາດ້ວຍມື, ຮູບແບບຄົ້ນພົບພວກມັນ [1].

  • ການລວມຕົວ: ເຄືອຂ່າຍທີ່ມີລະບຽບເປັນຢ່າງດີບໍ່ພຽງແຕ່ຈື່ຈຳເທົ່ານັ້ນ - ແຕ່ມັນຍັງເຮັດວຽກກ່ຽວກັບຂໍ້ມູນໃໝ່ທີ່ເບິ່ງບໍ່ເຫັນ [1].

  • ຄວາມສາມາດໃນການຂະຫຍາຍ: ຊຸດຂໍ້ມູນທີ່ໃຫຍ່ກວ່າບວກກັບຮູບແບບທີ່ໃຫຍ່ກວ່າມັກຈະປັບປຸງຜົນໄດ້ຮັບໃຫ້ດີຂຶ້ນ... ຈົນເຖິງຂໍ້ຈຳກັດຕົວຈິງເຊັ່ນ: ການຄຳນວນ ແລະ ຄຸນນະພາບຂໍ້ມູນ [1].

  • ຄວາມສາມາດໃນການໂອນຍ້າຍ: ຄຸນສົມບັດທີ່ໄດ້ຮຽນຮູ້ໃນວຽກງານໜຶ່ງສາມາດຊ່ວຍໃຫ້ອີກວຽກໜຶ່ງໄດ້ (ການຖ່າຍທອດການຮຽນຮູ້ ແລະ ການປັບແຕ່ງລະອຽດ) [1].

ໝາຍເຫດພາກສະໜາມຂະໜາດນ້ອຍ (ຕົວຢ່າງສະຖານະການ): ທີມງານຈັດປະເພດຜະລິດຕະພັນຂະໜາດນ້ອຍໄດ້ແລກປ່ຽນຄຸນສົມບັດທີ່ສ້າງຂຶ້ນດ້ວຍມືສຳລັບ CNN ຂະໜາດກະທັດຮັດ, ເພີ່ມການເພີ່ມເຕີມງ່າຍໆ (ການພິກ/ຕັດ), ແລະ ເບິ່ງຄວາມຜິດພາດໃນການກວດສອບຫຼຸດລົງ - ບໍ່ແມ່ນຍ້ອນວ່າເຄືອຂ່າຍແມ່ນ "ມະຫັດສະຈັນ", ແຕ່ຍ້ອນວ່າມັນໄດ້ຮຽນຮູ້ຄຸນສົມບັດທີ່ເປັນປະໂຫຍດຫຼາຍຂຶ້ນໂດຍກົງຈາກພິກເຊວ.


"ເຄືອຂ່າຍ Neural Network ໃນ AI ແມ່ນຫຍັງ?" ໃນພາສາອັງກິດທຳມະດາ, ພ້ອມກັບຄຳປຽບທຽບ 🍞

ຮູບພາບເສັ້ນເບເກີຣີ. ສ່ວນປະກອບເຂົ້າໄປໃນ, ຄົນງານປັບສູດ, ນັກທົດສອບລົດຊາດຈົ່ມ, ແລະທີມງານປັບປຸງສູດອີກເທື່ອຫນຶ່ງ. ໃນເຄືອຂ່າຍ, ວັດສະດຸປ້ອນເຂົ້າໄຫຼຜ່ານຊັ້ນຂໍ້ມູນ, ຟັງຊັນການສູນເສຍຈະຈັດລໍາດັບຜົນໄດ້ຮັບ, ແລະ gradients nudge ນ້ໍາຫນັກເພື່ອເຮັດໃຫ້ດີກວ່າໃນຄັ້ງຕໍ່ໄປ. ບໍ່ສົມບູນແບບເປັນການປຽບທຽບ - ເຂົ້າຈີ່ບໍ່ແຕກຕ່າງກັນ - ແຕ່ມັນຕິດ [1].


ຮ່າງກາຍຂອງລະບົບປະສາດ 🧩

  • Neurons: ເຄື່ອງ​ຄິດ​ໄລ່​ຂະ​ຫນາດ​ນ້ອຍ​ນໍາ​ໃຊ້​ຜົນ​ລວມ​ນ​້​ໍາ​ຫນັກ​ແລະ​ການ​ທໍາ​ງານ​ຂອງ​ການ​ກະ​ຕຸ້ນ​.

  • ນ້ຳໜັກ ແລະ ອະຄະຕິ: ປຸ່ມປັບໄດ້ທີ່ກຳນົດວິທີການລວມສັນຍານເຂົ້າກັນ.

  • Layers: ຊັ້ນປ້ອນຂໍ້ມູນໄດ້ຮັບຂໍ້ມູນ, ຊັ້ນທີ່ເຊື່ອງໄວ້ປ່ຽນມັນ, ຊັ້ນຜົນຜະລິດເຮັດໃຫ້ການຄາດຄະເນ.

  • ຟັງຊັນການເປີດໃຊ້ງານ: ການບິດແບບບໍ່ມີເສັ້ນເຊັ່ນ ReLU, sigmoid, tanh, ແລະ softmax ເຮັດໃຫ້ການຮຽນຮູ້ມີຄວາມຍືດຫຍຸ່ນ.

  • ຟັງຊັນການສູນເສຍ: ຄະແນນຂອງການຄາດຄະເນທີ່ຜິດພາດ (cross-entropy ສໍາລັບການຈັດປະເພດ, MSE ສໍາລັບ regression).

  • Optimizer: Algorithms ເຊັ່ນ SGD ຫຼື Adam ໃຊ້ gradients ເພື່ອປັບປຸງນ້ໍາຫນັກ.

  • Regularization: ເຕັກນິກເຊັ່ນ: ການຫຼຸດລົງຫຼືການທໍາລາຍນ້ໍາຫນັກເພື່ອຮັກສາຕົວແບບຈາກການ overfitting.

ຖ້າທ່ານຕ້ອງການການປິ່ນປົວຢ່າງເປັນທາງການ (ແຕ່ຍັງສາມາດອ່ານໄດ້), ປຶ້ມແບບ ຮຽນແບບເລິກ ໄດ້ກວມເອົາຢ່າງເຕັມທີ່: ພື້ນຖານຄະນິດສາດ, ການເພີ່ມປະສິດທິພາບແລະການເພີ່ມປະສິດທິພາບທົ່ວໄປ [1].


ຟັງຊັນການເປີດໃຊ້, ໄລຍະສັ້ນໆແຕ່ມີປະໂຫຍດ ⚡

  • ReLU: Zero for negatives, linear for positives. ງ່າຍ​ດາຍ​, ໄວ​, ປະ​ສິດ​ທິ​ຜົນ​.

  • Sigmoid: Squashes ຄ່າລະຫວ່າງ 0 ແລະ 1 - ມີປະໂຫຍດແຕ່ສາມາດອີ່ມຕົວໄດ້.

  • Tanh: ຄ້າຍຄື sigmoid ແຕ່ symmetric ປະມານສູນ.

  • Softmax: ປ່ຽນຄະແນນດິບໃຫ້ເປັນຄວາມເປັນໄປໄດ້ໃນທົ່ວຫ້ອງຮຽນ.

ທ່ານບໍ່ ຈຳ ເປັນຕ້ອງຈື່ທຸກຮູບຮ່າງຂອງເສັ້ນໂຄ້ງ - ພຽງແຕ່ຮູ້ການຊື້ຂາຍແລະຄ່າເລີ່ມຕົ້ນທົ່ວໄປ [1, 2].


ການຮຽນຮູ້ເກີດຂຶ້ນຈິງແນວໃດ: backprop, ແຕ່ບໍ່ຫນ້າຢ້ານ 🔁

  1. Forward pass: ຂໍ້ມູນໄຫຼເຂົ້າກັນເປັນຊັ້ນໆເພື່ອຜະລິດການຄາດເດົາ.

  2. ການສູນເສຍຄອມພິວເຕີ້: ປຽບທຽບການຄາດຄະເນກັບຄວາມຈິງ.

  3. Backpropagation: ຄິດໄລ່ gradients ຂອງການສູນເສຍທີ່ກ່ຽວຂ້ອງກັບແຕ່ລະນ້ໍາຫນັກໂດຍໃຊ້ລະບົບຕ່ອງໂສ້.

  4. ອັບເດດ: Optimizer ປ່ຽນແປງນ້ຳໜັກໜ້ອຍໜຶ່ງ.

  5. Repeat: ຫຼາຍຍຸກ. ຕົວແບບຄ່ອຍໆຮຽນຮູ້.

ສໍາລັບຄວາມເຂົ້າໃຈໃນມືທີ່ມີຮູບພາບແລະຄໍາອະທິບາຍທີ່ຢູ່ຕິດກັນ, ເບິ່ງບັນທຶກ CS231n ຄລາສສິກກ່ຽວກັບ backprop ແລະການເພີ່ມປະສິດທິພາບ [2].


ຄອບຄົວທີ່ສໍາຄັນຂອງເຄືອຂ່າຍ neural, ໃນ glance 🏡

  • ເຄືອຂ່າຍ Feedforward (MLPs): ປະເພດທີ່ງ່າຍດາຍທີ່ສຸດ. ຂໍ້ມູນພຽງແຕ່ກ້າວໄປຂ້າງຫນ້າ.

  • Convolutional Neural Networks (CNNs): ດີເລີດສຳລັບຮູບພາບຍ້ອນຕົວກອງທາງກວ້າງຂອງພື້ນທີ່ກວດພົບຂອບ, ໂຄງສ້າງ, ຮູບຮ່າງ [2].

  • ເຄືອຂ່າຍປະສາດທີ່ເກີດຂຶ້ນຊ້ຳໆ (RNNs) ແລະ ການປ່ຽນແປງ: ສ້າງຂຶ້ນສຳລັບລຳດັບເຊັ່ນ: ຂໍ້ຄວາມ ຫຼື ຊຸດເວລາໂດຍການຮັກສາຄວາມເປັນລະບຽບຮຽບຮ້ອຍ [1].

  • Transformers: ໃຊ້ຄວາມສົນໃຈໃນການສ້າງແບບຈໍາລອງຄວາມສໍາພັນໃນທົ່ວຕໍາແຫນ່ງໃນລໍາດັບທັງຫມົດໃນເວລາດຽວກັນ; ເດັ່ນໃນພາສາ ແລະຫຼາຍກວ່າ [3].

  • Graph Neural Networks (GNNs): ປະຕິບັດການຢູ່ໃນ nodes ແລະຂອບຂອງກາຟ - ເປັນປະໂຫຍດສໍາລັບໂມເລກຸນ, ເຄືອຂ່າຍສັງຄົມ, ຄໍາແນະນໍາ [1].

  • ຕົວເຂົ້າລະຫັດອັດຕະໂນມັດ ແລະ VAE: ຮຽນຮູ້ການນຳສະເໜີທີ່ຖືກບີບອັດ ແລະ ສ້າງການປ່ຽນແປງຕ່າງໆ [1].

  • ຮູບແບບການຜະລິດ: ຈາກ GANs ໄປຫາແບບຈໍາລອງການແຜ່ກະຈາຍ, ໃຊ້ສໍາລັບຮູບພາບ, ສຽງ, ເຖິງແມ່ນວ່າລະຫັດ [1].

ບັນທຶກ CS231n ແມ່ນເປັນມິດກັບ CNN ໂດຍສະເພາະ, ໃນຂະນະທີ່ກະດາດ Transformer ເປັນແຫຼ່ງຕົ້ນຕໍສໍາລັບຮູບແບບທີ່ອີງໃສ່ຄວາມສົນໃຈ [2, 3].


ຕາຕະລາງປຽບທຽບ: ປະເພດເຄືອຂ່າຍ neural ທົ່ວໄປ, ພວກເຂົາແມ່ນໃຜ, ຄ່າໃຊ້ຈ່າຍ vibes, ແລະເປັນຫຍັງພວກມັນເຮັດວຽກ 📊

ເຄື່ອງມື / ປະເພດ ຜູ້ຊົມ ລາຄາປະມານ ເປັນຫຍັງມັນຈຶ່ງໃຊ້ໄດ້
Feedforward (MLP) ຜູ້ເລີ່ມຕົ້ນ, ນັກວິເຄາະ ຕ່ຳ-ກາງ ງ່າຍດາຍ, ປ່ຽນແປງໄດ້, ພື້ນຖານທີ່ເໝາະສົມ
CNN ທີມງານວິໄສທັດ ປານກາງ ຮູບແບບທ້ອງຖິ່ນ + ການແບ່ງປັນພາລາມິເຕີ
RNN / LSTM / GRU ຄົນຕາມລໍາດັບ ປານກາງ ຄວາມຊົງຈໍາຊົ່ວຄາວ-ish… ບັນທຶກຄໍາສັ່ງ
ໝໍ້ແປງ NLP, multimodal ປານກາງ-ສູງ ຄວາມສົນໃຈສຸມໃສ່ການພົວພັນທີ່ກ່ຽວຂ້ອງ
GNN ນັກວິທະຍາສາດ, recsys ປານກາງ ຂໍ້ຄວາມຜ່ານກາຟສະແດງໃຫ້ເຫັນໂຄງສ້າງ
Autoencoder / VAE ນັກຄົ້ນຄວ້າ ຕ່ຳ-ກາງ ຮຽນຮູ້ການບີບອັດຕົວແທນ
GAN / ການແຜ່ກະຈາຍ ຫ້ອງທົດລອງສ້າງສັນ ປານກາງ-ສູງ ກົນອຸບາຍ ຫຼື ຊໍ້າຊາກ ປະຕິເສດ magic

ຫມາຍເຫດ: ລາຄາແມ່ນກ່ຽວກັບຄອມພິວເຕີ້ແລະເວລາ; ໄລຍະທາງຂອງທ່ານແຕກຕ່າງກັນ. ເຊລ ຫຼື ສອງຫ້ອງແມ່ນເຈດຕະນາລົມກັນຢ່າງຕັ້ງໃຈ.


"ເຄືອຂ່າຍ Neural Network ໃນ AI ແມ່ນຫຍັງ?" ທຽບກັບ ML algorithms ຄລາສສິກ ⚖️

  • ວິສະວະກໍາຄຸນສົມບັດ: ຄລາສິກ ML ມັກຈະອີງໃສ່ຄຸນສົມບັດຄູ່ມື. ຕາຫນ່າງ Neural ຮຽນຮູ້ລັກສະນະອັດຕະໂນມັດ - ໄຊຊະນະໃຫຍ່ສໍາລັບຂໍ້ມູນສະລັບສັບຊ້ອນ [1].

  • ຄວາມອຶດຢາກຂໍ້ມູນ: ເຄືອຂ່າຍມັກຈະສ່ອງແສງດ້ວຍຂໍ້ມູນຫຼາຍຂຶ້ນ; ຂໍ້​ມູນ​ຂະ​ຫນາດ​ນ້ອຍ​ອາດ​ຈະ​ມັກ​ແບບ​ທີ່​ງ່າຍ​ດາຍ [1​]​.

  • ການຄິດໄລ່: ເຄືອຂ່າຍມັກຕົວເລັ່ງຄວາມໄວເຊັ່ນ GPUs [1].

  • ເພດານການປະຕິບັດ: ສໍາລັບຂໍ້ມູນທີ່ບໍ່ມີໂຄງສ້າງ (ຮູບພາບ, ສຽງ, ຂໍ້ຄວາມ), ຕາຫນ່າງເລິກມີແນວໂນ້ມທີ່ຈະຄອບງໍາ [1, 2].


ຂັ້ນຕອນການຝຶກຊ້ອມທີ່ປະຕິບັດຕົວຈິງ 🛠️

  1. ກໍາ​ນົດ​ຈຸດ​ປະ​ສົງ​: ການ​ຈັດ​ປະ​ເພດ​, regression​, ການ​ຈັດ​ອັນ​ດັບ​, ການ​ຜະ​ລິດ - ເລືອກ​ເອົາ​ການ​ສູນ​ເສຍ​ທີ່​ກົງ​ກັນ​.

  2. ຂໍ້​ມູນ​ຂັດ​ແຍ່ງ​: ແບ່ງ​ອອກ​ເປັນ​ການ​ຝຶກ​ອົບ​ຮົມ / validation / ການ​ທົດ​ສອບ​. ເຮັດໃຫ້ຄຸນສົມບັດປົກກະຕິ. ຫ້ອງຮຽນການດຸ່ນດ່ຽງ. ສໍາລັບຮູບພາບ, ພິຈາລະນາການຂະຫຍາຍເຊັ່ນ: flips, ການປູກພືດ, ສິ່ງລົບກວນຂະຫນາດນ້ອຍ.

  3. ທາງເລືອກສະຖາປັດຕະຍະກໍາ: ເລີ່ມຕົ້ນງ່າຍດາຍ. ເພີ່ມຄວາມອາດສາມາດພຽງແຕ່ເມື່ອຈໍາເປັນ.

  4. ການຝຶກອົບຮົມ: batch ຂໍ້ມູນ. ສົ່ງຕໍ່. ຄິດໄລ່ການສູນເສຍ. Backprop. ອັບເດດ. ບັນທຶກການວັດແທກ.

  5. Regularize: Dropout, ຫຼຸດນ້ຳໜັກ, ຢຸດໄວ.

  6. ການປະເມີນ: ໃຊ້ຊຸດການຢືນຢັນສຳລັບ hyperparameters. ຖືຊຸດທົດສອບສໍາລັບການກວດສອບຄັ້ງສຸດທ້າຍ.

  7. ເຮືອຢ່າງລະມັດລະວັງ: ຕິດຕາມການລອຍ, ກວດເບິ່ງຄວາມລໍາອຽງ, ວາງແຜນການກັບຄືນ.

ສໍາລັບການສອນແບບຮຽນຈົບແບບລະຫັດກັບທິດສະດີແຂງ, ປື້ມແບບຮຽນເປີດແລະບັນທຶກ CS231n ແມ່ນສະມໍທີ່ເຊື່ອຖືໄດ້ [1, 2].


Overfitting, ໂດຍທົ່ວໄປ, ແລະ gremlins ອື່ນໆ 👀

  • Overfitting: ແບບຈໍາລອງການຈື່ຈໍາ quirks ການຝຶກອົບຮົມ. ແກ້ໄຂດ້ວຍຂໍ້ມູນເພີ່ມເຕີມ, ການເຮັດໃຫ້ເປັນປົກກະຕິທີ່ເຂັ້ມແຂງ, ຫຼືສະຖາປັດຕະຍະກໍາທີ່ງ່າຍດາຍກວ່າ.

  • Underfitting: ຕົວແບບແມ່ນງ່າຍດາຍເກີນໄປຫຼືການຝຶກອົບຮົມຂີ້ອາຍເກີນໄປ. ເພີ່ມຄວາມອາດສາມາດຫຼືການຝຶກອົບຮົມຕໍ່ໄປອີກແລ້ວ.

  • ຂໍ້​ມູນ​ຮົ່ວ​ໄຫລ: ຂໍ້​ມູນ​ຈາກ​ຊຸດ​ທົດ​ສອບ sneaks ເຂົ້າ​ໄປ​ໃນ​ການ​ຝຶກ​ອົບ​ຮົມ​. ສາມ​ຄັ້ງ​ກວດ​ສອບ​ການ​ແບ່ງ​ປັນ​ຂອງ​ທ່ານ​.

  • ການວັດແທກທີ່ບໍ່ດີ: ຮູບແບບທີ່ມີຄວາມໝັ້ນໃຈແຕ່ຜິດພາດແມ່ນເປັນອັນຕະລາຍ. ພິຈາລະນາການວັດແທກ ຫຼື ການໃຫ້ນ້ຳໜັກການສູນເສຍທີ່ແຕກຕ່າງກັນ.

  • ການ​ປ່ຽນ​ແປງ​ການ​ແຜ່​ກະ​ຈາຍ​: ຂໍ້​ມູນ​ໃນ​ໂລກ​ທີ່​ແທ້​ຈິງ​ຍ້າຍ​. ຕິດຕາມແລະປັບຕົວ.

ສໍາລັບທິດສະດີທີ່ຢູ່ເບື້ອງຫລັງໂດຍທົ່ວໄປແລະປົກກະຕິ, ອີງໃສ່ການອ້າງອິງມາດຕະຖານ [1, 2].


ຄວາມ​ປອດ​ໄພ, ຄວາມ​ສາ​ມາດ​ຕີ​ຄວາມ​ຫມາຍ, ແລະ​ການ​ນໍາ​ໃຊ້​ທີ່​ມີ​ຄວາມ​ຮັບ​ຜິດ​ຊອບ 🧭

ເຄືອຂ່າຍປະສາດສາມາດຕັດສິນໃຈທີ່ມີຄວາມສ່ຽງສູງໄດ້. ມັນບໍ່ພຽງພໍທີ່ພວກມັນຈະເຮັດວຽກໄດ້ດີໃນກະດານຈັດອັນດັບ. ທ່ານຕ້ອງການຂັ້ນຕອນການຄຸ້ມຄອງ, ການວັດແທກ ແລະ ການຫຼຸດຜ່ອນຄວາມສ່ຽງຕະຫຼອດວົງຈອນຊີວິດ. ຂອບການຄຸ້ມຄອງຄວາມສ່ຽງ AI ຂອງ NIST ກຳນົດໜ້າທີ່ປະຕິບັດໄດ້ - ປົກຄອງ, ສ້າງແຜນທີ່, ວັດແທກ, ຄຸ້ມຄອງ - ເພື່ອຊ່ວຍໃຫ້ທີມງານປະສົມປະສານການຄຸ້ມຄອງຄວາມສ່ຽງເຂົ້າໃນການອອກແບບ ແລະ ການນຳໃຊ້ [5].

ການກະຕຸ້ນໄວບາງອັນ:

  • ການກວດສອບຄວາມລຳອຽງ: ປະເມີນໃນທົ່ວພາກສ່ວນປະຊາກອນຕາມຄວາມເໝາະສົມ ແລະ ຖືກຕ້ອງຕາມກົດໝາຍ.

  • ການຕີຄວາມໝາຍ: ໃຊ້ເຕັກນິກຕ່າງໆເຊັ່ນ: ຄວາມໂດດເດັ່ນ ຫຼື ການລະບຸຄຸນລັກສະນະຕ່າງໆ. ພວກມັນບໍ່ສົມບູນແບບ, ແຕ່ມີປະໂຫຍດ.

  • ການ​ຕິດ​ຕາມ​ກວດ​ກາ: ຕັ້ງ​ການ​ແຈ້ງ​ເຕືອນ​ສໍາ​ລັບ​ການ​ຫຼຸດ​ລົງ metric ຢ່າງ​ກະ​ທັນ​ຫັນ​ຫຼື​ຂໍ້​ມູນ​ພຽງ​ເລັກ​ນ້ອຍ​.

  • ການຄວບຄຸມຂອງມະນຸດ: ຮັກສາມະນຸດຢູ່ໃນວົງການສໍາລັບການຕັດສິນໃຈທີ່ມີຜົນກະທົບ. ບໍ່ມີວິລະຊົນ, ພຽງແຕ່ອະນາໄມ.


ຄຳຖາມທີ່ມັກຖາມເລື້ອຍໆ 🙋

ເຄືອຂ່າຍ neural ເປັນພື້ນຖານຂອງສະຫມອງບໍ?

ໄດ້ຮັບການດົນໃຈຈາກສະຫມອງ, ແມ່ນແລ້ວ - ແຕ່ງ່າຍດາຍ. Neurons ໃນເຄືອຂ່າຍແມ່ນຫນ້າທີ່ຄະນິດສາດ; neurons ຊີວະສາດແມ່ນຈຸລັງທີ່ມີຊີວິດທີ່ມີການເຄື່ອນໄຫວທີ່ສັບສົນ. vibes ທີ່ຄ້າຍຄືກັນ, ຟີຊິກທີ່ແຕກຕ່າງກັນຫຼາຍ [1].

ຂ້ອຍຕ້ອງການຊັ້ນໃດ?

ເລີ່ມຕົ້ນຂະຫນາດນ້ອຍ. ຖ້າເຈົ້າບໍ່ພໍດີ, ໃຫ້ເພີ່ມຄວາມກວ້າງ ຫຼື ຄວາມເລິກ. ຖ້າເຈົ້າພໍດີ, ປັບປົກກະຕິ ຫຼືຫຼຸດຄວາມອາດສາມາດ. ບໍ່ມີຕົວເລກ magic; ມີພຽງແຕ່ເສັ້ນໂຄ້ງຄວາມຖືກຕ້ອງແລະຄວາມອົດທົນ [1].

ຂ້ອຍຕ້ອງການ GPU ສະເໝີບໍ?

ບໍ່ສະເຫມີ. ຮູບແບບຂະຫນາດນ້ອຍກ່ຽວກັບຂໍ້ມູນເລັກນ້ອຍສາມາດຝຶກອົບຮົມໃນ CPU ໄດ້, ແຕ່ສໍາລັບຮູບພາບ, ຕົວແບບຂໍ້ຄວາມຂະຫນາດໃຫຍ່, ຫຼືຊຸດຂໍ້ມູນໃຫຍ່, ຕົວເລັ່ງຄວາມໄວປະຫຍັດເວລາຫຼາຍ [1].

ເປັນຫຍັງຜູ້ຄົນເວົ້າວ່າຄວາມສົນໃຈແມ່ນມີອໍານາດ?

ເນື່ອງຈາກວ່າຄວາມສົນໃຈເຮັດໃຫ້ຕົວແບບສຸມໃສ່ພາກສ່ວນທີ່ກ່ຽວຂ້ອງທີ່ສຸດຂອງວັດສະດຸປ້ອນໂດຍບໍ່ມີການຍ່າງຢ່າງເຂັ້ມງວດ. ມັນຈັບເອົາການພົວພັນທົ່ວໂລກ, ເຊິ່ງເປັນເລື່ອງໃຫຍ່ສໍາລັບວຽກງານພາສາແລະ multimodal [3].

ແມ່ນ "ເຄືອຂ່າຍ Neural ໃນ AI ແມ່ນຫຍັງ?" ແຕກຕ່າງຈາກ "ການຮຽນຮູ້ເລິກແມ່ນຫຍັງ"?

ການຮຽນຮູ້ເລິກແມ່ນວິທີການທີ່ກວ້າງກວ່າທີ່ໃຊ້ເຄືອຂ່າຍ neural ເລິກ. ດັ່ງນັ້ນການຖາມວ່າ Neural Network ໃນ AI ແມ່ນຫຍັງ? ແມ່ນຄ້າຍຄືຖາມກ່ຽວກັບລັກສະນະຕົ້ນຕໍ; ການຮຽນຮູ້ເລິກແມ່ນຮູບເງົາທັງຫມົດ [1].


ຄໍາແນະນໍາການປະຕິບັດ, ຄວາມຄິດເຫັນເລັກນ້ອຍ 💡

  • ຕ້ອງການ ພື້ນຖານທີ່ງ່າຍດາຍ ກ່ອນ. ເຖິງແມ່ນວ່າ perceptron multilayer ຂະຫນາດນ້ອຍສາມາດບອກທ່ານວ່າຂໍ້ມູນສາມາດຮຽນຮູ້ໄດ້.

  • ຂອງທ່ານ ທໍ່ສົ່ງຂໍ້ມູນ. ຖ້າທ່ານບໍ່ສາມາດເປີດໃຊ້ມັນໄດ້ຄືນໃໝ່, ທ່ານກໍ່ບໍ່ສາມາດໄວ້ວາງໃຈມັນໄດ້.

  • ອັດຕາການຮຽນຮູ້ ສຳຄັນກວ່າທີ່ເຈົ້າຄິດ. ລອງກຳນົດເວລາ. ການອົບອຸ່ນສາມາດຊ່ວຍໄດ້.

  • ການຊື້ຂາຍຂະໜາດຊຸດ . ຊຸດທີ່ໃຫຍ່ກວ່າຈະຮັກສາຄວາມຄົງທີ່ຂອງ gradients ແຕ່ໂດຍທົ່ວໄປອາດຈະແຕກຕ່າງກັນ.

  • ເມື່ອສັບສົນ, ໃຫ້ວາງ ເສັ້ນໂຄ້ງການສູນເສຍ ແລະ ມາດຕະຖານນ້ຳໜັກ. ເຈົ້າຈະແປກໃຈວ່າຄຳຕອບຢູ່ໃນແຜນວາດເລື້ອຍໆປານໃດ.

  • ສົມມຸດຕິຖານເອກະສານ. ອະນາຄົດ - ເຈົ້າລືມສິ່ງຕ່າງໆ - ໄວ [1, 2].


Deep-dive dive dive: ບົດບາດຂອງຂໍ້ມູນ, ຫຼືວ່າເປັນຫຍັງຂີ້ເຫຍື້ອໃນຍັງຫມາຍຄວາມວ່າຂີ້ເຫຍື້ອອອກ 🗑️➡️✨

ເຄືອຂ່າຍ neural ບໍ່ໄດ້ແກ້ໄຂຂໍ້ບົກພ່ອງຢ່າງມະຫັດສະຈັນ. ປ້າຍຊື່ທີ່ບິດເບືອນ, ຄວາມຜິດພາດຂອງຄໍາບັນຍາຍ, ຫຼືການເກັບຕົວຢ່າງແຄບຈະສະທ້ອນອອກມາຈາກຕົວແບບ. ຄຸ້ມຄອງ, ກວດສອບ, ແລະຂະຫຍາຍ. ແລະຖ້າທ່ານບໍ່ແນ່ໃຈວ່າທ່ານຕ້ອງການຂໍ້ມູນເພີ່ມເຕີມຫຼືຮູບແບບທີ່ດີກວ່າ, ຄໍາຕອບມັກຈະເປັນເລື່ອງທີ່ຫນ້າລໍາຄານ: ທັງສອງ - ແຕ່ເລີ່ມຕົ້ນດ້ວຍຄຸນນະພາບຂໍ້ມູນ [1].


"ເຄືອຂ່າຍ Neural Network ໃນ AI ແມ່ນຫຍັງ?" - ຄໍານິຍາມສັ້ນທີ່ທ່ານສາມາດນໍາໃຊ້ຄືນ🧾

  • ເຄືອຂ່າຍ neural ເປັນຕົວປະມານການທໍາງານຂອງຊັ້ນທີ່ຮຽນຮູ້ຮູບແບບທີ່ຊັບຊ້ອນໂດຍການປັບນ້ໍາຫນັກໂດຍໃຊ້ສັນຍານ gradient [1, 2].

  • ມັນ​ເປັນ​ລະ​ບົບ​ທີ່​ປ່ຽນ​ການ​ນໍາ​ເຂົ້າ​ເປັນ​ຜົນ​ຜະ​ລິດ​ໂດຍ​ຜ່ານ​ຂັ້ນ​ຕອນ​ບໍ່​ແມ່ນ​ເສັ້ນ​ຕໍ່​ເນື່ອງ​, ການ​ຝຶກ​ອົບ​ຮົມ​ເພື່ອ​ຫຼຸດ​ຜ່ອນ​ການ​ສູນ​ເສຍ [1​]​.

  • ມັນເປັນວິທີການສ້າງແບບຈໍາລອງແບບຍືດຫຍຸ່ນ, ຫິວໂຫຍທີ່ຈະເລີນເຕີບໂຕໃນວັດສະດຸປ້ອນທີ່ບໍ່ມີໂຄງສ້າງເຊັ່ນ: ຮູບພາບ, ຂໍ້ຄວາມ, ແລະສຽງ [1, 2, 3].


ຍາວເກີນໄປ, ບໍ່ໄດ້ອ່ານແລະຂໍ້ສັງເກດສຸດທ້າຍ 🎯

ຖ້າມີຄົນຖາມເຈົ້າ ວ່າ ເຄືອຂ່າຍປະສາດໃນ AI ແມ່ນຫຍັງ? ນີ້ແມ່ນຄຳອະທິບາຍສັ້ນໆ: ເຄືອຂ່າຍປະສາດແມ່ນການຊ້ອນກັນຂອງໜ່ວຍງ່າຍໆທີ່ປ່ຽນຂໍ້ມູນເທື່ອລະຂັ້ນຕອນ, ຮຽນຮູ້ການປ່ຽນໂດຍການຫຼຸດຜ່ອນການສູນເສຍ ແລະ ປະຕິບັດຕາມການປ່ຽນແປງ. ພວກມັນມີປະສິດທິພາບເພາະວ່າພວກມັນຂະຫຍາຍຂະໜາດ, ຮຽນຮູ້ຄຸນສົມບັດໂດຍອັດຕະໂນມັດ, ແລະ ສາມາດເປັນຕົວແທນຂອງໜ້າທີ່ທີ່ສັບສົນຫຼາຍ [1, 4]. ພວກມັນມີຄວາມສ່ຽງຖ້າເຈົ້າບໍ່ສົນໃຈຄຸນນະພາບຂໍ້ມູນ, ການຄຸ້ມຄອງ, ຫຼື ການຕິດຕາມກວດກາ [5]. ແລະ ພວກມັນບໍ່ແມ່ນເວດມົນ. ພຽງແຕ່ຄະນິດສາດ, ການຄຳນວນ, ແລະ ວິສະວະກຳທີ່ດີ - ດ້ວຍຄວາມມັກເລັກນ້ອຍ.


ການອ່ານເພີ່ມເຕີມ, ເລືອກຢ່າງລະມັດລະວັງ (ສ່ວນທີ່ບໍ່ໄດ້ອ້າງອີງ)


ເອກະສານອ້າງອີງ

[1] Goodfellow, I., Bengio, Y., & Courville, A. ການຮຽນຮູ້ເລິກ. MIT Press. ສະບັບອອນໄລນ໌ຟຣີ: ອ່ານຕື່ມ

[2] ສະແຕນຟອດ CS231n. Convolutional Neural Networks ສໍາລັບ Visual Recognition (ບັນທຶກຫຼັກສູດ): ອ່ານເພີ່ມເຕີມ

[3] Vaswani, A., Shazeer, N., Parmar, N., et al. (2017). ເອົາ​ໃຈ​ໃສ່​ແມ່ນ​ທັງ​ຫມົດ​ທີ່​ທ່ານ​ຕ້ອງ​ການ​. NeurIPS. arXiv: ອ່ານເພີ່ມເຕີມ

[4] Cybenko, G. (1989). ການປະມານໂດຍການຊ້ອນກັນຂອງຟັງຊັນ sigmoidal. ຄະນິດສາດຂອງການຄວບຄຸມ, ສັນຍານ ແລະ ລະບົບ, 2, 303–314. Springer: ອ່ານຕື່ມ

[5] NIST. ຂອບການຄຸ້ມຄອງຄວາມສ່ຽງ AI (AI RMF): ອ່ານເພີ່ມເຕີມ


ຊອກຫາ AI ລ່າສຸດໄດ້ທີ່ຮ້ານ AI Assistant ຢ່າງເປັນທາງການ

ກ່ຽວກັບພວກເຮົາ

ກັບໄປທີ່ບລັອກ