AI ທີ່ສາມາດອະທິບາຍໄດ້ແມ່ນຫນຶ່ງໃນປະໂຫຍກເຫຼົ່ານັ້ນທີ່ຟັງຢູ່ຄ່ໍາແລະກາຍເປັນສິ່ງສໍາຄັນຢ່າງແທ້ຈິງໃນຂະນະທີ່ algorithm ກະຕຸ້ນການວິນິດໄສທາງການແພດ, ອະນຸມັດເງິນກູ້, ຫຼືທຸງການຂົນສົ່ງ. ຖ້າເຈົ້າເຄີຍຄິດ, ໂອເຄ, ແຕ່ ເປັນຫຍັງ ຕົວແບບຈຶ່ງເຮັດແບບນັ້ນ… ເຈົ້າຢູ່ໃນອານາເຂດຂອງ AI ທີ່ອະທິບາຍໄດ້ແລ້ວ. ໃຫ້ພວກເຮົາຖອດຄວາມຄິດເປັນພາສາທໍາມະດາ - ບໍ່ມີ magic, ພຽງແຕ່ວິທີການ, ການຄ້າ offs, ແລະຄວາມຈິງຍາກຈໍານວນຫນຶ່ງ.
ບົດຄວາມທີ່ທ່ານອາດຈະຢາກອ່ານຫຼັງຈາກບົດຄວາມນີ້:
🔗 ອະຄະຕິ AI ແມ່ນຫຍັງ?
ເຂົ້າໃຈຄວາມລຳອຽງຂອງ AI, ແຫຼ່ງທີ່ມາ, ຜົນກະທົບ ແລະຍຸດທະສາດການຫຼຸດຜ່ອນຄວາມລຳອຽງຂອງມັນ.
🔗 AI ຄາດຄະເນແມ່ນຫຍັງ?
ສຳຫຼວດ AI ທີ່ຄາດເດົາໄດ້, ການນຳໃຊ້ທົ່ວໄປ, ຜົນປະໂຫຍດ ແລະຂໍ້ຈຳກັດໃນພາກປະຕິບັດ.
🔗 AI ຫຸ່ນຍົນມະນຸດແມ່ນຫຍັງ?
ຮຽນຮູ້ວິທີ AI ໃຫ້ພະລັງຫຸ່ນຍົນມະນຸດ, ຄວາມສາມາດ, ຕົວຢ່າງ ແລະສິ່ງທ້າທາຍ.
🔗 ຄູຝຶກ AI ແມ່ນຫຍັງ?
ຄົ້ນພົບສິ່ງທີ່ຄູຝຶກ AI ເຮັດ, ທັກສະທີ່ຕ້ອງການ, ແລະເສັ້ນທາງອາຊີບ.
ສິ່ງທີ່ອະທິບາຍໄດ້ AI ຫມາຍຄວາມວ່າ
AI ທີ່ສາມາດອະທິບາຍໄດ້ແມ່ນການປະຕິບັດການອອກແບບແລະນໍາໃຊ້ລະບົບ AI ເພື່ອໃຫ້ຜົນໄດ້ຮັບຂອງພວກມັນສາມາດເຂົ້າໃຈໄດ້ໂດຍມະນຸດ - ບຸກຄົນສະເພາະທີ່ໄດ້ຮັບຜົນກະທົບຫຼືຮັບຜິດຊອບຕໍ່ການຕັດສິນໃຈ, ບໍ່ພຽງແຕ່ຕົວຊ່ວຍສ້າງຄະນິດສາດເທົ່ານັ້ນ. NIST ກັ່ນເອົາສິ່ງນີ້ອອກເປັນສີ່ຫຼັກການ: ໃຫ້ ຄໍາອະທິບາຍ , ເຮັດໃຫ້ມັນ ມີຄວາມຫມາຍ ສໍາລັບຜູ້ຊົມ, ຮັບປະກັນ ຄວາມຖືກຕ້ອງຂອງຄໍາອະທິບາຍ (ຊື່ສັດກັບຕົວແບບ), ແລະເຄົາລົບ ການຈໍາກັດຄວາມຮູ້ (ບໍ່ overstate ສິ່ງທີ່ລະບົບການຮູ້) [1].
ດ້ານປະຫວັດສາດສັ້ນໆ: ໂດເມນທີ່ມີຄວາມສໍາຄັນດ້ານຄວາມປອດໄພໄດ້ຊຸກຍູ້ໃນຕົ້ນໆນີ້, ໂດຍມີຈຸດປະສົງສໍາລັບຕົວແບບທີ່ມີຄວາມຖືກຕ້ອງແຕ່ສາມາດຕີຄວາມຫມາຍໄດ້ພຽງພໍທີ່ຈະໄວ້ວາງໃຈ "ໃນວົງຈອນ." ດາວທິດເໜືອບໍ່ໄດ້ປ່ຽນຄຳອະທິບາຍທີ່ໃຊ້ໄດ້ ໂດຍບໍ່ມີ ການປະຕິບັດການຖິ້ມຂີ້ເຫຍື້ອ.
ເປັນຫຍັງການອະທິບາຍ AI ຈຶ່ງສຳຄັນກວ່າທີ່ເຈົ້າຄິດ 💡
-
ຄວາມໄວ້ວາງໃຈແລະການຮັບຮອງເອົາ - ປະຊາຊົນຍອມຮັບລະບົບທີ່ພວກເຂົາສາມາດສອບຖາມ, ຄໍາຖາມ, ແລະແກ້ໄຂ.
-
ຄວາມສ່ຽງ ແລະຄວາມປອດໄພ - ອະທິບາຍຮູບແບບຄວາມລົ້ມເຫຼວຂອງພື້ນຜິວ ກ່ອນທີ່ພວກມັນຈະເຮັດໃຫ້ທ່ານແປກໃຈ.
-
ຄວາມຄາດຫວັງຂອງລະບຽບ - ໃນສະຫະພາບເອີຣົບ, ກົດຫມາຍວ່າດ້ວຍ AI ກໍານົດຫນ້າທີ່ໂປ່ງໃສທີ່ຊັດເຈນ - ເຊັ່ນ: ບອກຄົນໃນເວລາທີ່ພວກເຂົາພົວພັນກັບ AI ໃນບາງສະພາບການແລະການຕິດສະຫລາກ AI ທີ່ສ້າງຫຼືດັດແປງເນື້ອຫາທີ່ເຫມາະສົມ [2].
ໃຫ້ມີຄວາມຊື່ສັດ - gorgeous dashboards ບໍ່ແມ່ນຄໍາອະທິບາຍ. ຄໍາອະທິບາຍທີ່ດີຊ່ວຍໃຫ້ບຸກຄົນຕັດສິນໃຈວ່າຈະເຮັດແນວໃດຕໍ່ໄປ.
ສິ່ງທີ່ເຮັດໃຫ້ AI ອະທິບາຍເປັນປະໂຫຍດ ✅
ເມື່ອທ່ານປະເມີນວິທີການ XAI ໃດ, ໃຫ້ຖາມວ່າ:
-
ຄວາມຊື່ສັດ - ຄໍາອະທິບາຍສະທ້ອນໃຫ້ເຫັນເຖິງພຶດຕິກໍາຂອງຕົວແບບ, ຫຼືພຽງແຕ່ບອກເລື່ອງທີ່ປອບໂຍນ?
-
ປະໂຫຍດສໍາລັບຜູ້ຊົມ - ນັກວິທະຍາສາດຂໍ້ມູນຕ້ອງການ gradients; ແພດຕ້ອງການການຕໍ່ຕ້ານຫຼືກົດລະບຽບ; ລູກຄ້າຕ້ອງການເຫດຜົນຂອງພາສາທໍາມະດາບວກກັບຂັ້ນຕອນຕໍ່ໄປ.
-
ຄວາມໝັ້ນຄົງ - ການປ່ຽນແປງການປ້ອນຂໍ້ມູນນ້ອຍໆບໍ່ຄວນປີ້ນເລື່ອງຈາກ A ຫາ Z.
-
Actionability - ຖ້າຜົນຜະລິດແມ່ນບໍ່ຕ້ອງການ, ສິ່ງທີ່ສາມາດປ່ຽນແປງໄດ້?
-
ຄວາມຊື່ສັດກ່ຽວກັບຄວາມບໍ່ແນ່ນອນ - ຄໍາອະທິບາຍຄວນເປີດເຜີຍຂໍ້ຈໍາກັດ, ບໍ່ແມ່ນການທາສີໃສ່ພວກມັນ.
-
ຄວາມຊັດເຈນຂອງຂອບເຂດ - ນີ້ແມ່ນ ທ້ອງຖິ່ນ ສໍາລັບການຄາດຄະເນຫນຶ່ງຫຼື ທົ່ວໂລກ ກ່ຽວກັບພຶດຕິກໍາຕົວແບບ?
ຖ້າທ່ານຈື່ພຽງແຕ່ສິ່ງຫນຶ່ງ: ຄໍາອະທິບາຍທີ່ເປັນປະໂຫຍດປ່ຽນແປງການຕັດສິນໃຈຂອງໃຜຜູ້ຫນຶ່ງ, ບໍ່ພຽງແຕ່ອາລົມຂອງເຂົາເຈົ້າ.
ແນວຄວາມຄິດຫຼັກທີ່ເຈົ້າຈະໄດ້ຍິນຫຼາຍ🧩
-
Interpretability vs explainability - Interpretability: ຮູບແບບແມ່ນງ່າຍດາຍພຽງພໍທີ່ຈະອ່ານ (ຕົວຢ່າງ, ຕົ້ນໄມ້ຂະຫນາດນ້ອຍ). ການອະທິບາຍ: ເພີ່ມວິທີການຢູ່ເທິງເພື່ອເຮັດໃຫ້ຕົວແບບທີ່ຊັບຊ້ອນສາມາດເຂົ້າໃຈໄດ້.
-
ທ້ອງຖິ່ນ vs ທົ່ວໂລກ - ທ້ອງຖິ່ນອະທິບາຍການຕັດສິນໃຈຫນຶ່ງ; ທົ່ວໂລກສະຫຼຸບພຶດຕິກໍາໂດຍລວມ.
-
Post-hoc vs intrinsic - Post-hoc ອະທິບາຍກ່ອງສີດໍາທີ່ໄດ້ຮັບການຝຶກອົບຮົມ; ພາຍໃນໃຊ້ຕົວແບບທີ່ສາມາດຕີຄວາມໝາຍໄດ້ໂດຍພື້ນຖານແລ້ວ.
ແມ່ນແລ້ວ, ເສັ້ນເຫຼົ່ານີ້ມົວ. ວ່າບໍ່ເປັນຫຍັງ; ພາສາພັດທະນາ; ການລົງທະບຽນຄວາມສ່ຽງຂອງທ່ານບໍ່ໄດ້.
ວິທີການ AI ທີ່ສາມາດອະທິບາຍໄດ້ຍອດນິຍົມ - ການທ່ອງທ່ຽວ 🎡
ນີ້ແມ່ນການທ່ຽວຊົມລົມບ້າຫມູ, ພ້ອມກັບສຽງດົນຕີແນະນຳຂອງຫໍພິພິທະພັນ ແຕ່ສັ້ນກວ່າ.
1) ຄຸນນະສົມບັດເພີ່ມເຕີມ
-
SHAP - ມອບໃຫ້ແຕ່ລະຄຸນສົມບັດປະກອບສ່ວນໃຫ້ກັບການຄາດຄະເນສະເພາະຜ່ານແນວຄວາມຄິດທາງທິດສະດີເກມ. ມັກສໍາລັບຄໍາອະທິບາຍເພີ່ມເຕີມທີ່ຊັດເຈນແລະທັດສະນະທີ່ເປັນເອກະພາບໃນທົ່ວຕົວແບບ [3].
2) ຕົວແບບຕົວແທນທ້ອງຖິ່ນ
-
ປູນຂາວ - ຝຶກອົບຮົມແບບງ່າຍດາຍ, ທ້ອງຖິ່ນປະມານຕົວຢ່າງທີ່ຈະອະທິບາຍ. ສະຫຼຸບສັງລວມທີ່ມະນຸດສາມາດອ່ານໄດ້ໄວ ເຊິ່ງລັກສະນະຕ່າງໆທີ່ສຳຄັນຢູ່ໃກ້ໆ. ທີ່ດີເລີດສໍາລັບການສາທິດ, ເປັນປະໂຫຍດໃນການປະຕິບັດ - ເບິ່ງສະຖຽນລະພາບ [4].
3) ວິທີການທີ່ອີງໃສ່ Gradient ສໍາລັບ nets ເລິກ
-
Integrated Gradients - ຄຸນລັກສະນະຄວາມສໍາຄັນໂດຍການລວມ gradients ຈາກເສັ້ນພື້ນຖານກັບການປ້ອນຂໍ້ມູນ; ມັກໃຊ້ສໍາລັບການເບິ່ງເຫັນແລະຂໍ້ຄວາມ. axioms ທີ່ມີຄວາມຮູ້ສຶກ; ການດູແລທີ່ຈໍາເປັນກັບພື້ນຖານແລະສິ່ງລົບກວນ [1].
4) ຄໍາອະທິບາຍໂດຍອີງໃສ່ຕົວຢ່າງ
-
ກົງກັນຂ້າມ - "ສິ່ງທີ່ມີການປ່ຽນແປງຫນ້ອຍທີ່ສຸດທີ່ຈະເຮັດໃຫ້ຜົນໄດ້ຮັບ?" ທີ່ສົມບູນແບບສໍາລັບການຕັດສິນໃຈເພາະວ່າມັນເປັນທໍາມະຊາດທີ່ປະຕິບັດໄດ້ - X ເພື່ອໃຫ້ໄດ້ຮັບ Y [1].
5) ຕົ້ນແບບ, ກົດລະບຽບ, ແລະການເພິ່ງພາອາໄສບາງສ່ວນ
-
Prototypes ສະແດງຕົວຢ່າງຕົວແທນ; ກົດລະບຽບການຈັບຮູບແບບເຊັ່ນ ວ່າລາຍຮັບ> X ແລະປະຫວັດສາດ = ສະອາດຫຼັງຈາກນັ້ນອະນຸມັດ ; ການເພິ່ງພາອາໄສບາງສ່ວນສະແດງໃຫ້ເຫັນຜົນກະທົບສະເລ່ຍຂອງຄຸນສົມບັດໃນໄລຍະໃດໜຶ່ງ. ແນວຄວາມຄິດທີ່ງ່າຍດາຍ, ມັກຈະປະເມີນຫນ້ອຍລົງ.
6) ສໍາລັບຮູບແບບພາສາ
-
Token/spans attributions, retrieve exemlars, ແລະໂຄງສ້າງສົມເຫດສົມຜົນ. ມີປະໂຫຍດ, ດ້ວຍການເຕືອນໄພປົກກະຕິ: ແຜນທີ່ຄວາມຮ້ອນທີ່ສະອາດບໍ່ຮັບປະກັນການໃຫ້ເຫດຜົນ [5].
ກໍລະນີໄວ (ປະກອບ) ຈາກພາກສະຫນາມ 🧪
ຜູ້ໃຫ້ກູ້ຂະໜາດກາງສົ່ງຮູບແບບການຍົກລະດັບແບບເລື່ອນຊັ້ນສຳລັບການຕັດສິນໃຈສິນເຊື່ອ. SHAP ທ້ອງຖິ່ນ ຊ່ວຍໃຫ້ຕົວແທນອະທິບາຍຜົນໄດ້ຮັບທີ່ບໍ່ດີ ("ໜີ້ສິນຫາລາຍໄດ້ແລະການນໍາໃຊ້ສິນເຊື່ອທີ່ຜ່ານມາແມ່ນຕົວຂັບເຄື່ອນທີ່ສໍາຄັນ.") [3]. ຊັ້ນ ຂໍ້ເທັດຈິງ ແນະນໍາການທົດແທນທີ່ເປັນໄປໄດ້ ("ຫຼຸດຜ່ອນການນໍາໃຊ້ການຫມູນວຽນລົງ ~ 10% ຫຼືເພີ່ມ 1,500 ປອນໃນເງິນຝາກທີ່ຢັ້ງຢືນແລ້ວເພື່ອພິກການຕັດສິນໃຈ.") [1]. ພາຍໃນ, ທີມງານດໍາເນີນ ການທົດສອບແບບສຸ່ມ ກ່ຽວກັບຮູບພາບທີ່ມີຮູບແບບຄວາມເຄັມທີ່ພວກເຂົາໃຊ້ໃນ QA ເພື່ອຮັບປະກັນຈຸດເດັ່ນບໍ່ພຽງແຕ່ເຄື່ອງກວດຈັບຂອບໃນການປອມຕົວ [5]. ຮູບແບບດຽວກັນ, ຄໍາອະທິບາຍທີ່ແຕກຕ່າງກັນສໍາລັບຜູ້ຊົມທີ່ແຕກຕ່າງກັນ - ລູກຄ້າ, ops, ແລະຜູ້ກວດສອບ.
ເລັກນ້ອຍທີ່ງຸ່ມງ່າມ: ຄໍາອະທິບາຍສາມາດເຮັດໃຫ້ເຂົ້າໃຈຜິດ 🙃
ບາງວິທີຄວາມເຂັ້ມຂຸ້ນເບິ່ງຄືວ່າມີຄວາມຫນ້າເຊື່ອຖືເຖິງແມ່ນວ່າພວກເຂົາບໍ່ໄດ້ຜູກມັດກັບຮູບແບບທີ່ໄດ້ຮັບການຝຶກອົບຮົມຫຼືຂໍ້ມູນ. ການກວດສອບສຸຂາພິບານສະແດງໃຫ້ເຫັນວ່າເຕັກນິກບາງຢ່າງສາມາດລົ້ມເຫລວໃນການທົດສອບຂັ້ນພື້ນຖານ, ເຮັດໃຫ້ຄວາມເຂົ້າໃຈທີ່ບໍ່ຖືກຕ້ອງ. ການແປພາສາ: ຮູບພາບທີ່ສວຍງາມສາມາດເປັນລະຄອນທີ່ບໍລິສຸດ. ສ້າງໃນການທົດສອບຄວາມຖືກຕ້ອງສໍາລັບວິທີການອະທິບາຍຂອງທ່ານ [5].
ນອກຈາກນີ້, sparse ≠ຊື່ສັດ. ເຫດຜົນໜຶ່ງປະໂຫຍກອາດຈະເຊື່ອງການໂຕ້ຕອບອັນໃຫຍ່ຫຼວງ. ຄວາມຂັດແຍ້ງເລັກນ້ອຍໃນຄໍາອະທິບາຍສາມາດສົ່ງສັນຍານເຖິງຄວາມບໍ່ແນ່ນອນຂອງຕົວແບບທີ່ແທ້ຈິງ - ຫຼືພຽງແຕ່ສິ່ງລົບກວນ. ໜ້າທີ່ຂອງເຈົ້າຄືບອກວ່າອັນໃດ.
ການປົກຄອງ, ນະໂຍບາຍ, ແລະແຖບທີ່ເພີ່ມຂຶ້ນເພື່ອຄວາມໂປ່ງໃສ 🏛️
ຜູ້ວາງນະໂຍບາຍຄາດຫວັງວ່າຄວາມໂປ່ງໃສໃນບໍລິບົດທີ່ເໝາະສົມ. ຢູ່ໃນສະ ຫະພາບເອີຣົບ , ກົດໝາຍ AI ສະກົດອອກພັນທະຕ່າງໆເຊັ່ນ: ການແຈ້ງໃຫ້ປະຊາຊົນເມື່ອພວກເຂົາພົວພັນກັບ AI ໃນກໍລະນີທີ່ລະບຸ, ແລະການຕິດສະຫຼາກເນື້ອຫາທີ່ສ້າງ ຫຼື ໝູນໃຊ້ຂອງ AI ດ້ວຍແຈ້ງການທີ່ເໝາະສົມ ແລະວິທີການທາງວິຊາການ, ຂຶ້ນກັບຂໍ້ຍົກເວັ້ນ (ຕົວຢ່າງ, ການນຳໃຊ້ຢ່າງຖືກກົດໝາຍ ຫຼື ການສະແດງອອກທີ່ຖືກປົກປ້ອງ) [2]. ໃນດ້ານວິສະວະກໍາ, NIST ໃຫ້ການຊີ້ນໍາທີ່ເນັ້ນໃສ່ຫຼັກການເພື່ອຊ່ວຍໃຫ້ທີມງານອອກແບບຄໍາອະທິບາຍທີ່ຄົນສາມາດນໍາໃຊ້ຕົວຈິງ [1].
ວິທີການເລືອກວິທີການ AI ທີ່ອະທິບາຍໄດ້ - ແຜນທີ່ໄວ🗺️
-
ເລີ່ມຕົ້ນຈາກການຕັດສິນໃຈ - ໃຜຕ້ອງການຄໍາອະທິບາຍ, ແລະການປະຕິບັດອັນໃດ?
-
ຈັບຄູ່ວິທີການກັບຕົວແບບແລະຂະຫນາດກາງ
-
ວິທີການເລື່ອນຊັ້ນສໍາລັບຕາຫນ່າງເລິກໃນວິໄສທັດຫຼື NLP [1].
-
SHAP ຫຼື LIME ສໍາລັບຮູບແບບຕາຕະລາງໃນເວລາທີ່ທ່ານຕ້ອງການຄຸນສົມບັດ [3][4].
-
ຂໍ້ມູນຕ້ານການໂຕ້ແຍ້ງ ແລະການອຸທອນຕໍ່ລູກຄ້າ [1].
-
-
ກໍານົດປະຕູທີ່ມີຄຸນນະພາບ - ການກວດສອບຄວາມຊື່ສັດ, ການທົດສອບຄວາມຫມັ້ນຄົງ, ແລະການທົບທວນຂອງມະນຸດ [5].
-
ແຜນການສໍາລັບຂະຫນາດ - ຄໍາອະທິບາຍຄວນຈະເປັນ loggable, testable, ແລະ auditable.
-
ຂໍ້ຈໍາກັດຂອງເອກະສານ - ບໍ່ມີວິທີການທີ່ສົມບູນແບບ; ຂຽນຮູບແບບຄວາມລົ້ມເຫຼວທີ່ຮູ້ຈັກ.
ເລັກນ້ອຍ - ຖ້າທ່ານບໍ່ສາມາດທົດສອບຄໍາອະທິບາຍແບບດຽວກັນກັບການທົດສອບແບບຈໍາລອງ, ທ່ານອາດຈະບໍ່ມີຄໍາອະທິບາຍ, ພຽງແຕ່ vibes.
ຕາຕະລາງປຽບທຽບ - ຕົວເລືອກ AI ທີ່ສາມາດອະທິບາຍໄດ້ທົ່ວໄປ🧮
ເລັກນ້ອຍ quirky ກ່ຽວກັບຈຸດປະສົງ; ຊີວິດຈິງແມ່ນສັບສົນ.
| ເຄື່ອງມື / ວິທີການ | ຜູ້ຊົມທີ່ດີທີ່ສຸດ | ລາຄາ | ເປັນຫຍັງມັນເຮັດວຽກສໍາລັບພວກເຂົາ |
|---|---|---|---|
| SHAP | ນັກວິທະຍາສາດຂໍ້ມູນ, ຜູ້ກວດສອບ | ຟຣີ/ເປີດ | Additive attributions-consistent, ປຽບທຽບ [3]. |
| ປູນຂາວ | ທີມງານຜະລິດຕະພັນ, ນັກວິເຄາະ | ຟຣີ/ເປີດ | ໄວຕົວແທນທ້ອງຖິ່ນ; ງ່າຍ grok; ບາງຄັ້ງມີສຽງດັງ [4]. |
| ປະສົມປະສານ Gradients | ວິສະວະກອນ ML ໃນຕາຫນ່າງເລິກ | ຟຣີ/ເປີດ | ຄຸນລັກສະນະທີ່ອີງໃສ່ການເລື່ອນຊັ້ນດ້ວຍ axioms sensible [1]. |
| ການຕໍ່ຕ້ານ | ຜູ້ໃຊ້ສຸດທ້າຍ, ການປະຕິບັດຕາມ, ops | ປະສົມ | ຕອບໂດຍກົງສິ່ງທີ່ຕ້ອງປ່ຽນແປງ; ປະຕິບັດໄດ້ຫຼາຍ [1]. |
| ບັນຊີລາຍຊື່ກົດລະບຽບ / ຕົ້ນໄມ້ | ເຈົ້າຂອງຄວາມສ່ຽງ, ຜູ້ຈັດການ | ຟຣີ/ເປີດ | ການຕີຄວາມໝາຍພາຍໃນ; ບົດສະຫຼຸບທົ່ວໂລກ. |
| ການເພິ່ງພາອາໄສບາງສ່ວນ | ຕົວແບບ devs, QA | ຟຣີ/ເປີດ | ເບິ່ງເຫັນຜົນກະທົບສະເລ່ຍໃນທົ່ວຂອບເຂດ. |
| ຕົ້ນແບບ ແລະຕົວຢ່າງ | ນັກອອກແບບ, ນັກທົບທວນ | ຟຣີ/ເປີດ | ຕົວຢ່າງທີ່ຊັດເຈນ, ເປັນມິດກັບມະນຸດ; ທີ່ກ່ຽວຂ້ອງ. |
| ເວທີເຄື່ອງມື | ທີມງານເວທີ, ການປົກຄອງ | ການຄ້າ | ການຕິດຕາມ + ຄໍາອະທິບາຍ + ການກວດສອບຢູ່ໃນສະຖານທີ່ດຽວ. |
ແມ່ນແລ້ວ, ຈຸລັງບໍ່ສະເຫມີກັນ. ນັ້ນຄືຊີວິດ.
ຂັ້ນຕອນການເຮັດວຽກງ່າຍໆສຳລັບ AI ທີ່ອະທິບາຍໄດ້ໃນການຜະລິດ 🛠️
ຂັ້ນຕອນທີ 1 - ກໍານົດຄໍາຖາມ.
ຕັດສິນໃຈວ່າຄວາມຕ້ອງການອັນໃດສຳຄັນທີ່ສຸດ. ຄໍາອະທິບາຍສໍາລັບນັກວິທະຍາສາດຂໍ້ມູນແມ່ນບໍ່ຄືກັນກັບຈົດຫມາຍອຸທອນສໍາລັບລູກຄ້າ.
ຂັ້ນຕອນທີ 2 - ເລືອກວິທີການໂດຍບໍລິບົດ.
-
ຮູບແບບຄວາມສ່ຽງຕາຕະລາງສໍາລັບການກູ້ຢືມ - ເລີ່ມຕົ້ນດ້ວຍ SHAP ສໍາລັບທ້ອງຖິ່ນແລະທົ່ວໂລກ; ເພີ່ມຂໍ້ເທັດຈິງເພື່ອຂໍເອົາ [3][1].
-
Vision classifier - ໃຊ້ Integrated Gradients ຫຼືຄ້າຍຄືກັນ; ເພີ່ມການກວດສຸຂາພິບານເພື່ອຫຼີກລ່ຽງບັນຫາຄວາມເຄັມ [1][5].
ຂັ້ນຕອນທີ 3 - ກວດສອບຄໍາອະທິບາຍ.
ເຮັດການທົດສອບຄວາມສອດຄ່ອງຂອງຄໍາອະທິບາຍ; ລົບກວນວັດສະດຸປ້ອນ; ກວດເບິ່ງວ່າລັກສະນະທີ່ສໍາຄັນກົງກັບຄວາມຮູ້ຂອງໂດເມນ. ຖ້າຄຸນສົມບັດເທິງສຸດຂອງເຈົ້າລອຍໄປຢ່າງດຸເດືອດ ແຕ່ລະການຝຶກຊ້ອມ, ໃຫ້ຢຸດຊົ່ວຄາວ.
ຂັ້ນຕອນທີ 4 - ເຮັດໃຫ້ຄໍາອະທິບາຍສາມາດໃຊ້ໄດ້.
ເຫດຜົນຂອງພາສາທໍາມະດາຄຽງຄູ່ກັບຕາຕະລາງ. ຮວມເອົາການກະທຳທີ່ດີທີ່ສຸດຕໍ່ໄປ. ສະເຫນີການເຊື່ອມຕໍ່ກັບຜົນໄດ້ຮັບທີ່ທ້າທາຍທີ່ເຫມາະສົມ - ນີ້ແມ່ນສິ່ງທີ່ກົດລະບຽບຄວາມໂປ່ງໃສທີ່ມີຈຸດປະສົງເພື່ອສະຫນັບສະຫນູນ [2].
ຂັ້ນຕອນທີ 5 - ຕິດຕາມກວດກາແລະບັນທຶກ.
ຕິດຕາມຄວາມຫມັ້ນຄົງຂອງຄໍາອະທິບາຍໃນໄລຍະເວລາ. ຄໍາອະທິບາຍທີ່ເຂົ້າໃຈຜິດແມ່ນສັນຍານຄວາມສ່ຽງ, ບໍ່ແມ່ນແມງໄມ້ຂອງເຄື່ອງສໍາອາງ.
Deep-dive 1: ການອະທິບາຍທ້ອງຖິ່ນທຽບກັບທົ່ວໂລກໃນພາກປະຕິບັດ 🔍
-
ທ້ອງຖິ່ນ ຊ່ວຍໃຫ້ບຸກຄົນເຂົ້າໃຈວ່າເປັນຫຍັງ ຂອງເຂົາເຈົ້າ ໄດ້ຮັບ ນັ້ນ ສໍາຄັນໃນສະພາບການທີ່ລະອຽດອ່ອນ.
-
Global ຊ່ວຍໃຫ້ທີມງານຂອງທ່ານຮັບປະກັນພຶດຕິກໍາການຮຽນຮູ້ຂອງຕົວແບບສອດຄ່ອງກັບນະໂຍບາຍແລະຄວາມຮູ້ໂດເມນ.
ເຮັດທັງສອງ. ທ່ານອາດຈະເລີ່ມຕົ້ນທ້ອງຖິ່ນສໍາລັບການດໍາເນີນງານການບໍລິການ, ຫຼັງຈາກນັ້ນເພີ່ມການຕິດຕາມທົ່ວໂລກສໍາລັບການທົບທວນຄວາມງຽບສະຫງົບແລະຄວາມຍຸຕິທໍາ.
Deep-dive 2: ຂໍ້ໂຕ້ແຍ້ງສຳລັບການຂໍອຸທອນ ແລະ ການອຸທອນ 🔄
ປະຊາຊົນຕ້ອງການຮູ້ການປ່ຽນແປງຂັ້ນຕ່ໍາເພື່ອໃຫ້ໄດ້ຜົນໄດ້ຮັບທີ່ດີກວ່າ. ຄໍາອະທິບາຍທີ່ກົງກັນຂ້າມເຮັດແນວນັ້ນແທ້ໆ - ປ່ຽນແປງປັດໃຈສະເພາະເຫຼົ່ານີ້ແລະຜົນໄດ້ຮັບຈະປ່ຽນໄປ [1]. ລະມັດລະວັງ: ປອມຕ້ອງເຄົາລົບ ຄວາມເປັນໄປໄດ້ ແລະ ຄວາມຍຸດຕິທໍາ . ການບອກໃຜຜູ້ຫນຶ່ງໃຫ້ປ່ຽນຄຸນລັກສະນະທີ່ບໍ່ປ່ຽນແປງໄດ້ບໍ່ແມ່ນແຜນການ, ມັນເປັນທຸງສີແດງ.
Deep-dive 3: Sanity-checking salaliency 🧪
ຖ້າທ່ານໃຊ້ແຜນທີ່ຄວາມເຂັ້ມຂຸ້ນ ຫຼື gradients, ໃຫ້ດໍາເນີນການກວດສອບສຸຂະພາບ. ບາງເທກນິກຜະລິດແຜນທີ່ທີ່ໃກ້ຄຽງກັນເຖິງແມ່ນວ່າໃນເວລາທີ່ທ່ານ Randomize ຕົວກໍານົດການແບບຈໍາລອງ - ຫມາຍຄວາມວ່າພວກເຂົາອາດຈະເປັນການເນັ້ນໃສ່ຂອບແລະໂຄງສ້າງ, ບໍ່ແມ່ນຫຼັກຖານທີ່ຮຽນຮູ້. ແຜນທີ່ຄວາມຮ້ອນທີ່ສວຍງາມ, ເລື່ອງທີ່ເຂົ້າໃຈຜິດ. ສ້າງການກວດສອບອັດຕະໂນມັດເຂົ້າໄປໃນ CI/CD [5].
FAQ ທີ່ເກີດຂື້ນໃນທຸກໆກອງປະຊຸມ 🤓
ຖາມ: AI ທີ່ສາມາດອະທິບາຍໄດ້ຄືກັນກັບຄວາມຍຸດຕິທໍາບໍ?
A: ບໍ່. ຄໍາອະທິບາຍຊ່ວຍໃຫ້ທ່ານ ເຫັນ ພຶດຕິກໍາ; ຄວາມຍຸຕິທໍາແມ່ນຊັບສິນທີ່ທ່ານຕ້ອງ ທົດສອບແລະບັງຄັບໃຊ້ . ທີ່ກ່ຽວຂ້ອງ, ບໍ່ຄືກັນ.
ຖາມ: ຮູບແບບທີ່ງ່າຍດາຍແມ່ນດີກວ່າບໍ?
A: ບາງຄັ້ງ. ແຕ່ງ່າຍດາຍແລະຜິດແມ່ນຍັງຜິດ. ເລືອກຮູບແບບທີ່ງ່າຍດາຍທີ່ສຸດທີ່ຕອບສະຫນອງຄວາມຕ້ອງການດ້ານການປະຕິບັດແລະການຄຸ້ມຄອງ.
ຖາມ: ຄໍາອະທິບາຍຈະຮົ່ວໄຫລ IP?
A: ພວກເຂົາສາມາດເຮັດໄດ້. Calibrate ລາຍລະອຽດໂດຍຜູ້ຊົມແລະຄວາມສ່ຽງ; ບັນທຶກສິ່ງທີ່ທ່ານເປີດເຜີຍ ແລະເປັນຫຍັງ.
ຖາມ: ພວກເຮົາສາມາດສະແດງຄວາມສໍາຄັນຂອງຄຸນນະສົມບັດແລະໂທຫາມັນສໍາເລັດບໍ?
A: ບໍ່ແມ່ນແທ້ໆ. ແຖບຄວາມສໍາຄັນທີ່ບໍ່ມີສະພາບການຫຼື recourse ແມ່ນການຕົບແຕ່ງ.
ຍາວເກີນໄປ, ບໍ່ໄດ້ອ່ານສະບັບ ແລະຂໍ້ສັງເກດສຸດທ້າຍ 🌯
AI ທີ່ສາມາດອະທິບາຍໄດ້ແມ່ນລະບຽບວິໄນຂອງການເຮັດໃຫ້ພຶດຕິກໍາຕົວແບບເຂົ້າໃຈໄດ້ແລະເປັນປະໂຫຍດຕໍ່ມະນຸດທີ່ອີງໃສ່ມັນ. ຄໍາອະທິບາຍທີ່ດີທີ່ສຸດມີຄວາມຊື່ສັດ, ສະຖຽນລະພາບ, ແລະຜູ້ຊົມທີ່ຊັດເຈນ. ວິທີການເຊັ່ນ: SHAP, LIME, Integrated Gradients, ແລະ counterfactuals ແຕ່ລະຄົນມີຄວາມເຂັ້ມແຂງ - ໃຊ້ພວກມັນຢ່າງຕັ້ງໃຈ, ທົດສອບຢ່າງເຂັ້ມງວດ, ແລະນໍາສະເຫນີໃນພາສາທີ່ຄົນສາມາດປະຕິບັດໄດ້. ແລະຈືຂໍ້ມູນການ, slick ສາຍຕາສາມາດສະແດງລະຄອນ; ຕ້ອງການຫຼັກຖານຄໍາອະທິບາຍຂອງທ່ານສະທ້ອນໃຫ້ເຫັນເຖິງພຶດຕິກໍາທີ່ແທ້ຈິງຂອງຕົວແບບ. ສ້າງຄວາມເຂົ້າໃຈໃນວົງຈອນຊີວິດແບບຈໍາລອງຂອງທ່ານ - ມັນບໍ່ແມ່ນສ່ວນເສີມທີ່ເງົາງາມ, ມັນແມ່ນສ່ວນຫນຶ່ງຂອງວິທີທີ່ເຈົ້າຈັດສົ່ງຢ່າງມີຄວາມຮັບຜິດຊອບ.
ດ້ວຍຄວາມຊື່ສັດ, ມັນຄ້າຍຄືກັບການໃຫ້ຕົວແບບຂອງເຈົ້າເປັນສຽງ. ບາງຄັ້ງມັນ mumbles; ບາງຄັ້ງມັນອະທິບາຍເກີນກວ່າ; ບາງຄັ້ງມັນເວົ້າຢ່າງແນ່ນອນວ່າທ່ານຕ້ອງການໄດ້ຍິນ. ວຽກງານຂອງທ່ານແມ່ນເພື່ອຊ່ວຍໃຫ້ມັນເວົ້າສິ່ງທີ່ຖືກຕ້ອງ, ກັບຄົນທີ່ຖືກຕ້ອງ, ໃນເວລາທີ່ເຫມາະສົມ. ແລະຖິ້ມໃນປ້າຍທີ່ດີຫຼືສອງ. 🎯
ເອກະສານອ້າງອີງ
[1] NIST IR 8312 - ສີ່ຫຼັກການຂອງປັນຍາທຽມທີ່ອະທິບາຍໄດ້ . ສະຖາບັນມາດຕະຖານ ແລະ ເຕັກໂນໂລຊີແຫ່ງຊາດ. ອ່ານເພີ່ມເຕີມ
[2] ກົດລະບຽບ (EU) 2024/1689 - ກົດໝາຍວ່າດ້ວຍປັນຍາປະດິດ (ວາລະສານທາງການ/EUR-Lex) . ອ່ານເພີ່ມເຕີມ
[3] Lundberg & Lee (2017) - "ວິທີການລວມເພື່ອຕີຄວາມຫມາຍແບບຈໍາລອງການຄາດເດົາ." arXiv. ອ່ານເພີ່ມເຕີມ
[4] Ribeiro, Singh & Guestrin (2016) - "ເປັນຫຍັງຂ້ອຍຄວນໄວ້ວາງໃຈເຈົ້າ?" ການອະທິບາຍການຄາດຄະເນຂອງການຈັດປະເພດໃດຫນຶ່ງ. arXiv. ອ່ານເພີ່ມເຕີມ
[5] Adebayo et al. (2018) - "ການກວດສຸຂະພາບສໍາລັບແຜນທີ່ Saliency." NeurIPS (ເຈ້ຍ PDF). ອ່ານເພີ່ມເຕີມ