AI ກວດຈັບຄວາມຜິດປົກກະຕິໄດ້ແນວໃດ?

ການກວດຈັບຄວາມຜິດປົກກະຕິແມ່ນວິລະຊົນທີ່ງຽບສະຫງົບຂອງການດຳເນີນງານຂໍ້ມູນ - ເຄື່ອງກວດຈັບຄວັນທີ່ດັງຂຶ້ນກ່ອນທີ່ສິ່ງຕ່າງໆຈະເກີດໄຟໄໝ້.

ເວົ້າງ່າຍໆ: AI ຮຽນຮູ້ວ່າ "normal-ish" ມີລັກສະນະແນວໃດ, ໃຫ້ ຄະແນນຄວາມຜິດປົກກະຕິ, ແລະຫຼັງຈາກນັ້ນຕັດສິນໃຈວ່າຈະກວດຫາມະນຸດ (ຫຼືບລັອກສິ່ງນັ້ນໂດຍອັດຕະໂນມັດ) ໂດຍອີງໃສ່ ຂອບເຂດ. ບັນຫາແມ່ນວິທີທີ່ເຈົ້າກຳນົດ "normal-ish" ເມື່ອຂໍ້ມູນຂອງທ່ານເປັນໄປຕາມລະດູການ, ສັບສົນ, ລ່ອງລອຍ, ແລະບາງຄັ້ງກໍ່ຕົວະເຈົ້າ. [1]

ບົດຄວາມທີ່ທ່ານອາດຈະຢາກອ່ານຫຼັງຈາກບົດຄວາມນີ້:

🔗 ເປັນຫຍັງ AI ຈຶ່ງເປັນອັນຕະລາຍຕໍ່ສັງຄົມ
ກວດສອບຄວາມສ່ຽງດ້ານຈັນຍາບັນ, ເສດຖະກິດ ແລະ ສັງຄົມຂອງການຮັບຮອງເອົາ AI ຢ່າງກວ້າງຂວາງ.

🔗 ປະລິມານນໍ້າທີ່ລະບົບ AI ໃຊ້ຕົວຈິງ
ອະທິບາຍເຖິງຄວາມເຢັນຂອງສູນຂໍ້ມູນ, ຄວາມຕ້ອງການການຝຶກອົບຮົມ, ແລະຜົນກະທົບຕໍ່ສິ່ງແວດລ້ອມ.

🔗 ຊຸດຂໍ້ມູນ AI ແມ່ນຫຍັງ ແລະ ເປັນຫຍັງມັນຈຶ່ງສຳຄັນ
ກຳນົດຊຸດຂໍ້ມູນ, ການຕິດສະຫຼາກ, ແຫຼ່ງຂໍ້ມູນ ແລະ ບົດບາດຂອງພວກມັນໃນປະສິດທິພາບຂອງຮູບແບບ.

🔗 ວິທີທີ່ AI ຄາດຄະເນແນວໂນ້ມຈາກຂໍ້ມູນທີ່ສັບສົນ
ກວມເອົາການຮັບຮູ້ຮູບແບບ, ຮູບແບບການຮຽນຮູ້ຂອງເຄື່ອງຈັກ ແລະ ການນຳໃຊ້ການຄາດຄະເນໃນໂລກຕົວຈິງ.

"AI ກວດຫາຄວາມຜິດປົກກະຕິໄດ້ແນວໃດ?"

ຄຳຕອບທີ່ດີຄວນເຮັດຫຼາຍກວ່າການລະບຸອັລກໍຣິທຶມ. ມັນຄວນອະທິບາຍກົນໄກ ແລະ ສິ່ງທີ່ພວກມັນມີລັກສະນະເມື່ອເຈົ້ານຳໃຊ້ກັບຂໍ້ມູນທີ່ແທ້ຈິງ ແລະ ບໍ່ສົມບູນແບບ. ຄຳອະທິບາຍທີ່ດີທີ່ສຸດ:

ສະແດງສ່ວນປະກອບພື້ນຖານ: ຄຸນສົມບັດ, ເສັ້ນພື້ນຖານ, ຄະແນນແລະ ຂອບເຂດ. [1]
ປຽບທຽບຄອບຄົວຕົວຈິງ: ໄລຍະທາງ, ຄວາມໜາແໜ້ນ, ຊັ້ນດຽວ, ການໂດດດ່ຽວ, ຄວາມເປັນໄປໄດ້, ການສ້າງຄືນໃໝ່. [1]
ຈັດການກັບຄວາມແປກປະຫຼາດຂອງຊຸດເວລາ: “ປົກກະຕິ” ແມ່ນຂຶ້ນກັບເວລາຂອງມື້, ມື້ຂອງອາທິດ, ການປ່ອຍ ແລະ ວັນພັກ. [1]
ປະຕິບັດຕໍ່ການປະເມີນຜົນຄືກັບຂໍ້ຈຳກັດທີ່ແທ້ຈິງ: ສັນຍານເຕືອນທີ່ບໍ່ຖືກຕ້ອງບໍ່ພຽງແຕ່ເຮັດໃຫ້ລຳຄານເທົ່ານັ້ນ - ແຕ່ມັນຍັງເຜົາຜານຄວາມໄວ້ວາງໃຈອີກດ້ວຍ. [4]
ລວມເອົາການຕີຄວາມ + ມະນຸດໃນວົງຈອນ, ເພາະວ່າ "ມັນແປກ" ບໍ່ແມ່ນສາເຫດຕົ້ນຕໍ. [5]

ກົນໄກຫຼັກ: ພື້ນຖານ, ຄະແນນ, ເກນ 🧠

ລະບົບຄວາມຜິດປົກກະຕິສ່ວນໃຫຍ່ - ບໍ່ວ່າຈະເປັນແບບໃດ ຫຼື ບໍ່ແບບນັ້ນ - ແບ່ງອອກເປັນສາມສ່ວນທີ່ເຄື່ອນທີ່:

1) ການນຳສະເໜີ (ຫຼື ສິ່ງທີ່ຕົວແບບ ເຫັນ)

ສັນຍານດິບບໍ່ຄ່ອຍພຽງພໍ. ເຈົ້າສາມາດ ວິສະວະກຳຄຸນສົມບັດຕ່າງໆ (ສະຖິຕິການມ້ວນ, ອັດຕາສ່ວນ, ການຊັກຊ້າ, deltas ຕາມລະດູການ) ຫຼື ຮຽນຮູ້ການນຳສະເໜີ (ການຝັງ, ພື້ນທີ່ຍ່ອຍ, ການສ້າງຄືນໃໝ່). [1]

2) ການໃຫ້ຄະແນນ (ຫຼື: ມັນ "ແປກ" ແນວໃດ?)

ແນວຄວາມຄິດການໃຫ້ຄະແນນທົ່ວໄປປະກອບມີ:

ອີງຕາມໄລຍະທາງ: ໄກຈາກເພື່ອນບ້ານ = ໜ້າສົງໄສ. [1]
ອີງຕາມຄວາມໜາແໜ້ນ: ຄວາມໜາແໜ້ນໃນທ້ອງຖິ່ນຕໍ່າ = ໜ້າສົງໄສ (LOF ແມ່ນຕົວຢ່າງ). [1]
ຂອບເຂດຂອງຊັ້ນຮຽນດຽວ: ຮຽນຮູ້ “ປົກກະຕິ,” ໝາຍສິ່ງທີ່ຢູ່ນອກ. [1]
ຄວາມເປັນໄປໄດ້: ຄວາມເປັນໄປໄດ້ຕ່ຳພາຍໃຕ້ຮູບແບບທີ່ເໝາະສົມ = ໜ້າສົງໄສ. [1]
ຄວາມຜິດພາດໃນການສ້າງຄືນໃໝ່: ຖ້າຮູບແບບທີ່ໄດ້ຮັບການຝຶກອົບຮົມໃນແບບປົກກະຕິບໍ່ສາມາດສ້າງມັນໄດ້, ມັນອາດຈະປິດແລ້ວ. [1]

3) ຂອບເຂດ (ຫຼື: ເວລາທີ່ຈະສັ່ນລະຄັງ)

ເກນສາມາດຄົງທີ່, ອີງໃສ່ປະລິມານ, ຕໍ່ສ່ວນ, ຫຼື ມີຄວາມອ່ອນໄຫວຕໍ່ຄ່າໃຊ້ຈ່າຍ - ແຕ່ພວກມັນຄວນໄດ້ຮັບ ການປັບທຽບ ກັບງົບປະມານທີ່ແຈ້ງເຕືອນ ແລະ ຄ່າໃຊ້ຈ່າຍຕໍ່ເນື່ອງ, ບໍ່ແມ່ນຄວາມສັ່ນສະເທືອນ. [4]

ລາຍລະອຽດທີ່ໃຊ້ໄດ້ຈິງຢ່າງໜຶ່ງ: ເຄື່ອງກວດຈັບ outlier/novelty ຂອງ scikit-learn ເປີດເຜີຍ ຄະແນນດິບ ແລະ ຫຼັງຈາກນັ້ນນຳໃຊ້ ຂອບເຂດ (ມັກຈະຄວບຄຸມຜ່ານສົມມຸດຕິຖານແບບການປົນເປື້ອນ) ເພື່ອປ່ຽນຄະແນນເປັນການຕັດສິນໃຈ inlier/outlier. [2]

ຄຳນິຍາມສັ້ນໆທີ່ປ້ອງກັນອາການເຈັບໃນພາຍຫຼັງ 🧯

ສອງຄວາມແຕກຕ່າງທີ່ຊ່ວຍທ່ານໃຫ້ພົ້ນຈາກຄວາມຜິດພາດທີ່ລະອຽດອ່ອນ:

ການກວດຈັບຄ່າຜິດປົກກະຕິ: ຂໍ້ມູນການຝຶກອົບຮົມຂອງທ່ານອາດຈະປະກອບມີຄ່າຜິດປົກກະຕິຢູ່ແລ້ວ; ອັລກໍຣິທຶມພະຍາຍາມສ້າງແບບຈຳລອງ "ພາກພື້ນປົກກະຕິທີ່ໜາແໜ້ນ".
ການກວດຫາຄວາມແປກໃໝ່: ຂໍ້ມູນການຝຶກອົບຮົມຖືກສົມມຸດວ່າສະອາດ; ທ່ານກຳລັງຕັດສິນວ່າ ໃໝ່ ເໝາະສົມກັບຮູບແບບປົກກະຕິທີ່ໄດ້ຮຽນຮູ້ຫຼືບໍ່. [2]

ນອກຈາກນີ້: ການກວດຫາຄວາມແປກໃໝ່ມັກຈະຖືກກຳນົດວ່າເປັນ ການຈັດປະເພດຊັ້ນດຽວ - ສ້າງແບບຈຳລອງປົກກະຕິເພາະວ່າຕົວຢ່າງທີ່ຜິດປົກກະຕິແມ່ນຫາຍາກ ຫຼື ບໍ່ໄດ້ກຳນົດໄວ້. [1]

ມ້າເຮັດວຽກທີ່ບໍ່ໄດ້ຮັບການຊີ້ນຳທີ່ທ່ານຈະໃຊ້ແທ້ໆ 🧰

ເມື່ອປ້າຍກຳກັບມີໜ້ອຍ (ເຊິ່ງໂດຍພື້ນຖານແລ້ວແມ່ນສະເໝີ), ເຫຼົ່ານີ້ແມ່ນເຄື່ອງມືທີ່ປາກົດຢູ່ໃນທໍ່ສົ່ງຕົວຈິງ:

ປ່າສະຫງວນ Isolation Forest: ເປັນຄ່າເລີ່ມຕົ້ນທີ່ເຂັ້ມແຂງໃນຫຼາຍໆກໍລະນີຕາຕະລາງ, ຖືກນໍາໃຊ້ຢ່າງກວ້າງຂວາງໃນການປະຕິບັດ ແລະ ຈັດຕັ້ງປະຕິບັດໃນ scikit-learn. [2]
SVM ແບບຊັ້ນດຽວ: ສາມາດມີປະສິດທິພາບແຕ່ມີຄວາມອ່ອນໄຫວຕໍ່ການປັບແຕ່ງ ແລະ ການສົມມຸດຕິຖານ; scikit-learn ຮຽກຮ້ອງຢ່າງຊັດເຈນເຖິງຄວາມຕ້ອງການສຳລັບການປັບແຕ່ງ hyperparameter ຢ່າງລະມັດລະວັງ. [2]
ປັດໄຈທີ່ຜິດປົກກະຕິໃນທ້ອງຖິ່ນ (LOF): ການໃຫ້ຄະແນນໂດຍອີງໃສ່ຄວາມໜາແໜ້ນແບບຄລາສສິກ; ດີຫຼາຍເມື່ອ "ປົກກະຕິ" ບໍ່ແມ່ນ blob ທີ່ສະອາດ. [1]

ທີມງານ gotcha ທີ່ໃຊ້ໄດ້ຈິງຄົ້ນພົບຄືນໃໝ່ທຸກໆອາທິດ: LOF ມີພຶດຕິກຳແຕກຕ່າງກັນໄປຂຶ້ນກັບວ່າທ່ານກຳລັງກວດຫາ outlier ໃນຊຸດການຝຶກອົບຮົມ ທຽບກັບການກວດຫາ novelty ໃນຂໍ້ມູນໃໝ່ - scikit-learn ຍັງຕ້ອງການ novelty=True ເພື່ອໃຫ້ໄດ້ຄະແນນທີ່ເບິ່ງບໍ່ເຫັນຢ່າງປອດໄພ. [2]

ພື້ນຖານທີ່ເຂັ້ມແຂງທີ່ຍັງໃຊ້ໄດ້ເມື່ອຂໍ້ມູນມີຄວາມບໍ່ແນ່ນອນ 🪓

ຖ້າທ່ານຢູ່ໃນໂໝດ "ພວກເຮົາພຽງແຕ່ຕ້ອງການບາງສິ່ງບາງຢ່າງທີ່ບໍ່ໄດ້ພາພວກເຮົາເຂົ້າສູ່ການລືມ", ສະຖິຕິທີ່ແຂງແຮງຈະຖືກປະເມີນຄ່າຕໍ່າເກີນໄປ.

ຄະ ແນນ z ທີ່ຖືກດັດແປງ ໃຊ້ຄ່າ ກາງ ແລະ MAD (ຄ່າຜັນປ່ຽນຢ່າງແທ້ຈິງຂອງຄ່າກາງ) ເພື່ອຫຼຸດຜ່ອນຄວາມອ່ອນໄຫວຕໍ່ຄ່າທີ່ຮຸນແຮງ. ຄູ່ມື EDA ຂອງ NIST ບັນທຶກແບບຟອມຄະແນນ z ທີ່ຖືກດັດແປງ ແລະ ບັນທຶກກົດລະບຽບທົ່ວໄປ “ຄ່າຜິດປົກກະຕິທີ່ມີທ່າແຮງ” ທີ່ນຳໃຊ້ທົ່ວໄປໃນຄ່າຢ່າງແທ້ຈິງສູງກວ່າ 3.5. [3]

ສິ່ງນີ້ຈະບໍ່ແກ້ໄຂບັນຫາຄວາມຜິດປົກກະຕິທຸກຢ່າງ - ແຕ່ມັນມັກຈະເປັນແນວປ້ອງກັນທຳອິດທີ່ເຂັ້ມແຂງ, ໂດຍສະເພາະສຳລັບຕົວຊີ້ວັດທີ່ມີສຽງລົບກວນ ແລະ ການຕິດຕາມກວດກາໃນໄລຍະຕົ້ນໆ. [3]

ຄວາມເປັນຈິງຂອງຊຸດເວລາ: “ປົກກະຕິ” ແມ່ນຂຶ້ນກັບເວລາ ⏱️📈

ຄວາມຜິດປົກກະຕິຂອງອະນຸກົມເວລາແມ່ນຫຍຸ້ງຍາກເພາະວ່າສະພາບການແມ່ນຈຸດປະສົງທັງໝົດ: ອາດຈະຄາດວ່າຈະມີການເພີ່ມຂຶ້ນໃນຕອນທ່ຽງ; ການເພີ່ມຂຶ້ນຄັ້ງດຽວກັນໃນເວລາ 3 ໂມງເຊົ້າອາດໝາຍຄວາມວ່າມີບາງສິ່ງບາງຢ່າງກຳລັງລຸກໄໝ້. ດັ່ງນັ້ນ, ລະບົບປະຕິບັດຫຼາຍຢ່າງຈຶ່ງສ້າງແບບຈຳລອງຄວາມປົກກະຕິໂດຍໃຊ້ ຄຸນສົມບັດທີ່ຮັບຮູ້ເວລາ (ການຊັກຊ້າ, ຈຸດປ່ຽນຕາມລະດູການ, ປ່ອງຢ້ຽມມ້ວນ) ແລະຄວາມແຕກຕ່າງຂອງຄະແນນທຽບກັບຮູບແບບທີ່ຄາດໄວ້. [1]

ຖ້າທ່ານຈື່ໄດ້ພຽງແຕ່ກົດລະບຽບດຽວ: ໃຫ້ແບ່ງສ່ວນເສັ້ນຖານຂອງທ່ານ (ຊົ່ວໂມງ/ມື້/ພາກພື້ນ/ລະດັບການບໍລິການ) ກ່ອນທີ່ທ່ານຈະປະກາດວ່າເຄິ່ງໜຶ່ງຂອງການຈະລາຈອນຂອງທ່ານ “ຜິດປົກກະຕິ.” [1]

ການປະເມີນຜົນ: ກັບດັກເຫດການທີ່ຫາຍາກ 🧪

ການກວດຫາຄວາມຜິດປົກກະຕິມັກຈະເປັນ “ເຂັມໃນກອງເຟືອງ” ເຊິ່ງເຮັດໃຫ້ການປະເມີນຜົນແປກປະຫຼາດ:

ເສັ້ນໂຄ້ງ ROC ສາມາດເບິ່ງຄືວ່າບໍ່ດີປານໃດເມື່ອຄ່າບວກຫາຍາກ.
ມຸມມອງການເອີ້ນຄືນແບບແມ່ນຍຳມັກຈະໃຫ້ຂໍ້ມູນຫຼາຍກວ່າສຳລັບການຕັ້ງຄ່າທີ່ບໍ່ສົມດຸນ ເພາະວ່າພວກມັນສຸມໃສ່ປະສິດທິພາບໃນຊັ້ນຮຽນໃນທາງບວກ. [4]
ໃນດ້ານການດໍາເນີນງານ, ທ່ານຍັງຕ້ອງການ ງົບປະມານການແຈ້ງເຕືອນ: ມະນຸດສາມາດຄັດເລືອກການແຈ້ງເຕືອນໄດ້ຈັກຄັ້ງຕໍ່ຊົ່ວໂມງໂດຍບໍ່ຕ້ອງເຊົາຄຽດແຄ້ນ? [4]

ການທົດສອບຍ້ອນຫຼັງໃນທົ່ວປ່ອງຢ້ຽມທີ່ມ້ວນມາຊ່ວຍໃຫ້ທ່ານຈັບຮູບແບບຄວາມລົ້ມເຫຼວແບບຄລາສສິກ: "ມັນເຮັດວຽກໄດ້ຢ່າງສວຍງາມ... ໃນການແຈກຢາຍຂອງເດືອນແລ້ວນີ້." [1]

ການຕີຄວາມໝາຍ ແລະ ສາເຫດຕົ້ນຕໍ: ສະແດງຜົນງານຂອງເຈົ້າ 🪄

ການແຈ້ງເຕືອນໂດຍບໍ່ມີຄຳອະທິບາຍແມ່ນຄືກັບການໄດ້ຮັບບັດໄປສະນີລຶກລັບ. ມີປະໂຫຍດ, ແຕ່ກໍ່ໜ້າອຸກໃຈ.

ເຄື່ອງມືການຕີຄວາມສາມາດຊ່ວຍໄດ້ໂດຍການຊີ້ບອກວ່າ ລັກສະນະໃດທີ່ປະກອບສ່ວນຫຼາຍທີ່ສຸດ ຕໍ່ຄະແນນຄວາມຜິດປົກກະຕິ, ຫຼືໂດຍການໃຫ້ຄຳອະທິບາຍແບບ "ສິ່ງທີ່ຕ້ອງປ່ຽນແປງເພື່ອໃຫ້ສິ່ງນີ້ເບິ່ງຄືປົກກະຕິ?". ການຮຽນຮູ້ຂອງເຄື່ອງຈັກທີ່ສາມາດຕີຄວາມໄດ້ ແມ່ນຄູ່ມືທີ່ໜັກແໜ້ນ ແລະ ສຳຄັນກ່ຽວກັບວິທີການທົ່ວໄປ (ລວມທັງການອ້າງອີງແບບ SHAP) ແລະ ຂໍ້ຈຳກັດຂອງມັນ. [5]

ເປົ້າໝາຍບໍ່ພຽງແຕ່ເປັນຄວາມສະດວກສະບາຍຂອງຜູ້ມີສ່ວນຮ່ວມເທົ່ານັ້ນ - ແຕ່ມັນແມ່ນການຄັດເລືອກທີ່ໄວຂຶ້ນ ແລະ ເຫດການທີ່ເກີດຂຶ້ນຊ້ຳອີກໜ້ອຍລົງ.

ການນຳໃຊ້, ການດຣິບ, ແລະ ວົງຈອນຄຳຕິຊົມ 🚀

ຮູບແບບບໍ່ໄດ້ອາໄສຢູ່ໃນສະໄລ້. ພວກມັນອາໄສຢູ່ໃນທໍ່ສົ່ງ.

ເລື່ອງລາວທົ່ວໄປກ່ຽວກັບ "ເດືອນທຳອິດໃນການຜະລິດ": ເຄື່ອງກວດຈັບສ່ວນຫຼາຍແມ່ນໝາຍເຖິງການນຳໃຊ້, ວຽກເປັນຊຸດ, ແລະ ຂໍ້ມູນທີ່ຂາດຫາຍໄປ... ເຊິ່ງ ຍັງເປັນປະໂຫຍດ ເພາະມັນບັງຄັບໃຫ້ທ່ານແຍກ "ເຫດການຄຸນນະພາບຂໍ້ມູນ" ອອກຈາກ "ຄວາມຜິດປົກກະຕິທາງທຸລະກິດ".

ໃນການປະຕິບັດ:

ຕິດຕາມກວດກາການເລື່ອນລອຍ ແລະ ຝຶກຊ້ອມ/ປັບຕົວຄືນໃໝ່ ເມື່ອພຶດຕິກຳມີການປ່ຽນແປງ. [1]
ການປ້ອນຂໍ້ມູນຄະແນນບັນທຶກ + ຮຸ່ນຂອງຮູບແບບ ເພື່ອໃຫ້ທ່ານສາມາດສະແດງຄືນວ່າເປັນຫຍັງບາງສິ່ງບາງຢ່າງຈຶ່ງຖືກແບ່ງໜ້າ. [5]
ບັນທຶກຄຳຕິຊົມຂອງມະນຸດ (ການແຈ້ງເຕືອນທີ່ເປັນປະໂຫຍດ ທຽບກັບ ການແຈ້ງເຕືອນທີ່ມີສຽງດັງ) ເພື່ອປັບແຕ່ງຂອບເຂດ ແລະ ສ່ວນຕ່າງໆຕາມການເວລາ. [4]

ມຸມຄວາມປອດໄພ: IDS ແລະ ການວິເຄາະພຶດຕິກຳ 🛡️

ທີມງານຮັກສາຄວາມປອດໄພມັກຈະປະສົມປະສານແນວຄວາມຄິດກ່ຽວກັບຄວາມຜິດປົກກະຕິກັບການກວດຈັບທີ່ອີງໃສ່ກົດລະບຽບ: ເສັ້ນພື້ນຖານສຳລັບ "ພຶດຕິກຳປົກກະຕິຂອງໂຮດ", ບວກກັບລາຍເຊັນ ແລະ ນະໂຍບາຍສຳລັບຮູບແບບທີ່ບໍ່ດີທີ່ຮູ້ຈັກ. SP 800-94 (ສຸດທ້າຍ) ຂອງ NIST ຍັງຄົງເປັນກອບທີ່ຖືກກ່າວເຖິງຢ່າງກວ້າງຂວາງສຳລັບການພິຈາລະນາລະບົບການກວດຈັບ ແລະ ປ້ອງກັນການບຸກລຸກ; ມັນຍັງລະບຸວ່າຮ່າງ "Rev. 1" ປີ 2012 ບໍ່ເຄີຍກາຍເປັນສະບັບສຸດທ້າຍ ແລະ ຕໍ່ມາໄດ້ຖືກຍົກເລີກ. [3]

ການແປ: ໃຊ້ ML ບ່ອນທີ່ມັນຊ່ວຍໄດ້, ແຕ່ຢ່າຖິ້ມກົດລະບຽບທີ່ໜ້າເບື່ອ - ພວກມັນໜ້າເບື່ອເພາະວ່າມັນເຮັດວຽກ.

ຕາຕະລາງປຽບທຽບ: ວິທີການທີ່ນິຍົມໂດຍຫຍໍ້ 📊

ເຄື່ອງມື / ວິທີການ	ດີທີ່ສຸດສຳລັບ	ເປັນຫຍັງມັນຈຶ່ງເຮັດວຽກ (ໃນການປະຕິບັດ)
ຄະແນນ z ທີ່ແຂງແຮງ / ດັດແປງ	ຕົວຊີ້ວັດງ່າຍໆ, ຂໍ້ມູນພື້ນຖານທີ່ວ່ອງໄວ	ຜ່ານໄປຄັ້ງທຳອິດຢ່າງແຂງແຮງເມື່ອເຈົ້າຕ້ອງການ "ດີພໍ" ແລະ ມີສັນຍານເຕືອນທີ່ບໍ່ຖືກຕ້ອງໜ້ອຍລົງ. [3]
ປ່າໂດດດ່ຽວ	ຕາຕະລາງ, ລັກສະນະປະສົມ	ການຈັດຕັ້ງປະຕິບັດຕາມຄ່າເລີ່ມຕົ້ນທີ່ແຂງແກ່ນ ແລະ ນຳໃຊ້ຢ່າງກວ້າງຂວາງໃນການປະຕິບັດຕົວຈິງ. [2]
SVM ຊັ້ນດຽວ	ພາກພື້ນ "ປົກກະຕິ" ກະທັດຮັດ	ການກວດຫາຄວາມແປກໃໝ່ໂດຍອີງໃສ່ຂອບເຂດ; ການປັບແຕ່ງມີຄວາມສຳຄັນຫຼາຍ. [2]
ປັດໄຈ Outlier ທ້ອງຖິ່ນ	ມາດຕະຖານແບບ Manifold	ຄວາມແຕກຕ່າງຂອງຄວາມໜາແໜ້ນທຽບກັບເພື່ອນບ້ານຈັບເອົາຄວາມແປກປະຫຼາດໃນທ້ອງຖິ່ນໄດ້. [1]
ຄວາມຜິດພາດໃນການສ້າງຄືນໃໝ່ (ເຊັ່ນ: ແບບຕົວເຂົ້າລະຫັດອັດຕະໂນມັດ)	ຮູບແບບມິຕິສູງ	ຝຶກຊ້ອມໃນສະພາບປົກກະຕິ; ຄວາມຜິດພາດໃນການກໍ່ສ້າງຄືນໃໝ່ຂະໜາດໃຫຍ່ສາມາດຊີ້ບອກເຖິງຄວາມແຕກຕ່າງໄດ້. [1]

ລະຫັດໂກງ: ເລີ່ມຕົ້ນດ້ວຍເສັ້ນຖານທີ່ແຂງແຮງ + ວິທີການທີ່ບໍ່ໄດ້ຮັບການຊີ້ນຳທີ່ໜ້າເບື່ອ, ຈາກນັ້ນເພີ່ມຄວາມຊັບຊ້ອນພຽງແຕ່ບ່ອນທີ່ມັນຈ່າຍຄ່າເຊົ່າເທົ່ານັ້ນ.

ປຶ້ມຄູ່ມືຂະໜາດນ້ອຍ: ຈາກສູນຫາການແຈ້ງເຕືອນ 🧭

ໃຫ້ຄໍານິຍາມ "ແປກ" ໃນການດໍາເນີນງານ (ຄວາມຊັກຊ້າ, ຄວາມສ່ຽງຕໍ່ການສໍ້ໂກງ, ການສູນເສຍ CPU, ຄວາມສ່ຽງດ້ານສິນຄ້າຄົງຄັງ).
ເລີ່ມຕົ້ນດ້ວຍຂໍ້ມູນພື້ນຖານ (ສະຖິຕິທີ່ເຂັ້ມແຂງ ຫຼື ຂອບເຂດທີ່ແບ່ງສ່ວນ). [3]
ເລືອກຮູບແບບທີ່ບໍ່ໄດ້ຮັບການຊີ້ນຳໜຶ່ງແບບ ເປັນຄັ້ງທຳອິດ (ປ່າແຍກ / LOF / SVM ຊັ້ນດຽວ). [2]
ກຳນົດຂອບເຂດດ້ວຍງົບປະມານທີ່ມີການແຈ້ງເຕືອນ, ແລະ ປະເມີນດ້ວຍແນວຄິດແບບ PR ຖ້າສິ່ງທີ່ດີຫາຍາກ. [4]
ເພີ່ມຄຳອະທິບາຍ + ການບັນທຶກ ເພື່ອໃຫ້ທຸກໆການແຈ້ງເຕືອນສາມາດສ້າງຊ້ຳໄດ້ ແລະ ສາມາດດີບັກໄດ້. [5]
ການທົດສອບກັບຄືນ, ສົ່ງຕໍ່, ຮຽນຮູ້, ປັບປ່ຽນໃໝ່ - ການລະເລີຍເປັນເລື່ອງປົກກະຕິ. [1]

ເຈົ້າສາມາດເຮັດສິ່ງນີ້ໄດ້ຢ່າງແນ່ນອນພາຍໃນໜຶ່ງອາທິດ... ສົມມຸດວ່າເວລາຂອງເຈົ້າບໍ່ໄດ້ຕິດກັນດ້ວຍເທບຕິດ ແລະ ຄວາມຫວັງ. 😅

ໝາຍເຫດສຸດທ້າຍ - ຍາວເກີນໄປ, ຂ້ອຍບໍ່ໄດ້ອ່ານມັນ🧾

AI ກວດຈັບຄວາມຜິດປົກກະຕິໂດຍການຮຽນຮູ້ຮູບພາບທີ່ເປັນປະໂຫຍດຂອງ "ປົກກະຕິ", ການໃຫ້ຄະແນນຄວາມຜິດປົກກະຕິ, ແລະ ການໝາຍສິ່ງທີ່ຂ້າມຂອບເຂດ. ລະບົບທີ່ດີທີ່ສຸດຊະນະບໍ່ແມ່ນໂດຍການເປັນແບບທີ່ສະຫວ່າງ, ແຕ່ໂດຍການຖືກ ປັບທຽບ: ເສັ້ນພື້ນຖານທີ່ແບ່ງສ່ວນ, ງົບປະມານການແຈ້ງເຕືອນ, ຜົນຜະລິດທີ່ສາມາດຕີຄວາມໄດ້, ແລະ ວົງວຽນຄຳຕິຊົມທີ່ປ່ຽນສັນຍານເຕືອນທີ່ມີສຽງດັງໃຫ້ກາຍເປັນສັນຍານທີ່ໜ້າເຊື່ອຖື. [1]

ເອກະສານອ້າງອີງ

Pimentel ແລະ ຄະນະ (2014) - ການທົບທວນຄືນການກວດຈັບຄວາມແປກໃໝ່ (PDF, ມະຫາວິທະຍາໄລ Oxford) ອ່ານຕື່ມ
ເອກະສານ scikit-learn - ການກວດຈັບຄວາມແປກໃໝ່ ແລະ ຄວາມຜິດປົກກະຕິ ອ່ານຕື່ມ
ປື້ມຄູ່ມືອີເລັກໂທຣນິກ NIST/SEMATECH - ການກວດຫາຂໍ້ຜິດພາດ ອ່ານຕື່ມ ແລະ NIST CSRC - SP 800-94 (ສຸດທ້າຍ): ຄູ່ມືກ່ຽວກັບລະບົບການກວດຈັບ ແລະ ປ້ອງກັນການບຸກລຸກ (IDPS) ອ່ານຕື່ມ
Saito & Rehmsmeier (2015) - ແຜນວາດ Precision-Recall ໃຫ້ຂໍ້ມູນຫຼາຍກວ່າແຜນວາດ ROC ເມື່ອປະເມີນຕົວຈັດປະເພດໄບນາຣີໃນຊຸດຂໍ້ມູນທີ່ບໍ່ສົມດຸນ (PLOS ONE) ອ່ານຕື່ມ
Molnar - ການຮຽນຮູ້ຂອງເຄື່ອງຈັກທີ່ສາມາດຕີຄວາມໝາຍໄດ້ (ປຶ້ມເວັບ) ອ່ານຕື່ມ

ຊອກຫາ AI ລ່າສຸດໄດ້ທີ່ຮ້ານ AI Assistant ຢ່າງເປັນທາງການ

ກ່ຽວກັບພວກເຮົາ

ກັບໄປທີ່ບລັອກ