ຖ້າທ່ານເຄີຍປົດລັອກໂທລະສັບຂອງທ່ານດ້ວຍໃບໜ້າຂອງທ່ານ, ສະແກນໃບຮັບເງິນ, ຫຼື ຈ້ອງເບິ່ງກ້ອງຖ່າຍຮູບຈ່າຍເງິນດ້ວຍຕົນເອງ ແລະ ສົງໄສວ່າມັນກຳລັງຕັດສິນໝາກອາໂວກາໂດຂອງທ່ານຫຼືບໍ່, ທ່ານໄດ້ຖົກຖຽງກັບວິໄສທັດຂອງຄອມພິວເຕີແລ້ວ. ເວົ້າງ່າຍໆ, ວິໄສທັດຂອງຄອມພິວເຕີໃນ AI ແມ່ນວິທີທີ່ເຄື່ອງຈັກຮຽນຮູ້ທີ່ຈະ ເຫັນ ແລະ ເຂົ້າໃຈ ຮູບພາບ ແລະ ວິດີໂອໄດ້ດີພໍທີ່ຈະຕັດສິນໃຈ. ມີປະໂຫຍດບໍ? ແນ່ນອນ. ບາງຄັ້ງກໍ່ໜ້າແປກໃຈບໍ? ແມ່ນແລ້ວຄືກັນ. ແລະ ບາງຄັ້ງກໍ່ໜ້າຢ້ານເລັກນ້ອຍຖ້າພວກເຮົາເວົ້າຕາມຄວາມຈິງ. ໃນທາງທີ່ດີທີ່ສຸດ, ມັນປ່ຽນພິກເຊວທີ່ສັບສົນໃຫ້ກາຍເປັນການກະທຳທີ່ເປັນປະໂຫຍດ. ໃນທາງທີ່ຮ້າຍແຮງທີ່ສຸດ, ມັນຄາດເດົາ ແລະ ສັ່ນ. ລອງຂຸດຄົ້ນເບິ່ງຢ່າງຖືກຕ້ອງ.
ບົດຄວາມທີ່ທ່ານອາດຈະຢາກອ່ານຫຼັງຈາກບົດຄວາມນີ້:
🔗 ອະຄະຕິຂອງ AI ແມ່ນຫຍັງ
ອະຄະຕິເກີດຂຶ້ນໃນລະບົບ AI ແນວໃດ ແລະ ວິທີການກວດຫາ ແລະ ຫຼຸດຜ່ອນມັນ.
🔗 AI ທີ່ຄາດເດົາໄດ້ແມ່ນຫຍັງ
AI ທີ່ຄາດເດົາໄດ້ໃຊ້ຂໍ້ມູນເພື່ອຄາດຄະເນແນວໂນ້ມ ແລະ ຜົນໄດ້ຮັບແນວໃດ.
🔗 ຜູ້ຝຶກອົບຮົມ AI ແມ່ນຫຍັງ?
ຄວາມຮັບຜິດຊອບ, ທັກສະ ແລະ ເຄື່ອງມືທີ່ໃຊ້ໂດຍຜູ້ຊ່ຽວຊານທີ່ຝຶກອົບຮົມ AI.
🔗 Google Vertex AI ແມ່ນຫຍັງ
ພາບລວມຂອງແພລດຟອມ AI ແບບລວມສູນຂອງ Google ສຳລັບການສ້າງ ແລະ ການນຳໃຊ້ຮູບແບບຕ່າງໆ.
Computer Vision ໃນ AI ແມ່ນຫຍັງກັນແທ້? 📸
ວິໄສທັດຄອມພິວເຕີໃນ AI ແມ່ນສາຂາຂອງປັນຍາປະດິດທີ່ສອນຄອມພິວເຕີໃຫ້ຕີຄວາມ ແລະ ເຫດຜົນກ່ຽວກັບຂໍ້ມູນທີ່ເບິ່ງເຫັນ. ມັນເປັນທໍ່ສົ່ງຈາກພິກເຊວດິບໄປສູ່ຄວາມໝາຍທີ່ມີໂຄງສ້າງ: “ນີ້ແມ່ນປ້າຍຢຸດ,” “ນັ້ນແມ່ນຄົນຍ່າງ,” “ຮອຍຕໍ່ມີຂໍ້ບົກຜ່ອງ,” “ຍອດລວມໃບແຈ້ງໜີ້ຢູ່ທີ່ນີ້.” ມັນກວມເອົາວຽກງານຕ່າງໆເຊັ່ນ: ການຈັດປະເພດ, ການກວດຈັບ, ການແບ່ງສ່ວນ, ການຕິດຕາມ, ການປະເມີນຄວາມເລິກ, OCR, ແລະ ອື່ນໆທີ່ຖືກຕັດຕໍ່ເຂົ້າກັນໂດຍຮູບແບບການຮຽນຮູ້ຮູບແບບ. ສາຂາທາງການກວມເອົາເລຂາຄະນິດຄລາສສິກຈົນເຖິງການຮຽນຮູ້ເລິກທີ່ທັນສະໄໝ, ດ້ວຍປຶ້ມຄູ່ມືການປະຕິບັດຕົວຈິງທີ່ທ່ານສາມາດຄັດລອກ ແລະ ປັບແຕ່ງໄດ້. [1]
ເລື່ອງເລັກໆນ້ອຍໆສັ້ນໆ: ລອງນຶກພາບເຖິງສາຍການຫຸ້ມຫໍ່ທີ່ມີກ້ອງຖ່າຍຮູບ 720p ຂະໜາດນ້ອຍ. ເຄື່ອງກວດຈັບນ້ຳໜັກເບົາສາມາດກວດຈັບໄດ້, ແລະເຄື່ອງຕິດຕາມງ່າຍໆຢືນຢັນວ່າພວກມັນຖືກຈັດລຽນກັນເປັນເວລາຫ້າເຟຣມຕິດຕໍ່ກັນກ່ອນທີ່ຈະເປີດຂວດ. ບໍ່ແມ່ນແບບຟຸ່ມເຟືອຍ - ແຕ່ລາຄາຖືກ, ໄວ, ແລະມັນຊ່ວຍຫຼຸດຜ່ອນການເຮັດວຽກຊ້ຳ.
ສິ່ງໃດທີ່ເຮັດໃຫ້ Computer Vision ໃນ AI ມີປະໂຫຍດ? ✅
-
ກະແສສັນຍານສູ່ການກະທຳ : ການປ້ອນຂໍ້ມູນດ້ວຍພາບຈະກາຍເປັນຜົນຜະລິດທີ່ສາມາດປະຕິບັດໄດ້. ແຜງຄວບຄຸມໜ້ອຍລົງ, ການຕັດສິນໃຈຫຼາຍຂຶ້ນ.
-
ການລວມຕົວ : ດ້ວຍຂໍ້ມູນທີ່ຖືກຕ້ອງ, ຮູບແບບໜຶ່ງສາມາດຈັດການກັບຮູບພາບທີ່ຫຼາກຫຼາຍໄດ້. ບາງຄັ້ງກໍ່ບໍ່ດີສົມບູນແບບຢ່າງໜ້າຕົກໃຈ.
-
ການໃຊ້ປະໂຫຍດຈາກຂໍ້ມູນ : ກ້ອງຖ່າຍຮູບມີລາຄາຖືກ ແລະ ຢູ່ທົ່ວທຸກແຫ່ງ. ວິໄສທັດປ່ຽນມະຫາສະໝຸດພິກເຊວໃຫ້ກາຍເປັນຄວາມເຂົ້າໃຈ.
-
ຄວາມໄວ : ຮູບແບບສາມາດປະມວນຜົນເຟຣມໄດ້ໃນເວລາຈິງດ້ວຍຮາດແວທີ່ພໍປະມານ ຫຼື ເກືອບເວລາຈິງ, ຂຶ້ນກັບໜ້າວຽກ ແລະ ຄວາມລະອຽດ.
-
ຄວາມສາມາດໃນການຈັດວາງ : ເຊື່ອມຕໍ່ຂັ້ນຕອນງ່າຍໆເຂົ້າໃນລະບົບທີ່ໜ້າເຊື່ອຖື: ການກວດຈັບ → ການຕິດຕາມ → ການຄວບຄຸມຄຸນນະພາບ.
-
ລະບົບນິເວດ : ເຄື່ອງມື, ຮູບແບບທີ່ໄດ້ຮັບການຝຶກອົບຮົມລ່ວງໜ້າ, ມາດຕະຖານ, ແລະ ການສະໜັບສະໜູນຈາກຊຸມຊົນ - ຕະຫຼາດລະຫັດທີ່ກວ້າງຂວາງແຫ່ງດຽວ.
ເວົ້າແທ້ໆ, ສູດລັບບໍ່ແມ່ນຄວາມລັບ: ຂໍ້ມູນທີ່ດີ, ການປະເມີນຜົນທີ່ມີວິໄນ, ການນຳໃຊ້ຢ່າງລະມັດລະວັງ. ສ່ວນທີ່ເຫຼືອແມ່ນການຝຶກຝົນ... ແລະບາງທີອາດເປັນກາເຟ. ☕
ວິທີ ຂອງ Computer Vision ໃນ AI , ໃນທໍ່ສົ່ງດຽວທີ່ສົມເຫດສົມຜົນ 🧪
-
ການຖ່າຍພາບ ກ້ອງຖ່າຍຮູບ
, ເຄື່ອງສະແກນ, ໂດຣນ, ໂທລະສັບ. ເລືອກປະເພດເຊັນເຊີ, ການຮັບແສງ, ເລນ ແລະ ອັດຕາເຟຣມຢ່າງລະມັດລະວັງ. ຂີ້ເຫຍື້ອເຂົ້າ, ແລະອື່ນໆ. -
ການປະມວນຜົນລ່ວງໜ້າ
ປັບຂະໜາດ, ຕັດ, ປັບສະພາບໃຫ້ເປັນປົກກະຕິ, ຫຼຸດຄວາມມົວ ຫຼື ຫຼຸດສິ່ງລົບກວນ ຖ້າຈຳເປັນ. ບາງຄັ້ງການປັບແຕ່ງຄວາມຄົມຊັດເລັກນ້ອຍກໍ່ເຮັດໃຫ້ພູເຂົາໃຫຍ່ຂຶ້ນ. [4] -
ປ້າຍກຳກັບ ແລະ ຊຸດຂໍ້ມູນ
ກ່ອງທີ່ມີຂອບເຂດ, ຮູບຫຼາຍແຈ, ຈຸດສຳຄັນ, ຂອບເຂດຂໍ້ຄວາມ. ປ້າຍກຳກັບທີ່ສົມດຸນ ແລະ ເປັນຕົວແທນ - ຫຼື ຮູບແບບຂອງທ່ານຮຽນຮູ້ນິໄສທີ່ບໍ່ສົມດຸນ. -
ການສ້າງແບບຈຳລອງ
-
ການຈັດປະເພດ : "ໝວດໝູ່ໃດ?"
-
ການກວດຈັບ : "ວັດຖຸຢູ່ໃສ?"
-
ການແບ່ງສ່ວນ : "ພິກເຊວໃດເປັນຂອງສິ່ງໃດ?"
-
ຈຸດສຳຄັນ ແລະ ທ່າທາງ : “ຂໍ້ຕໍ່ ຫຼື ຈຸດສຳຄັນຢູ່ໃສ?”
-
OCR : “ຂໍ້ຄວາມໃດຢູ່ໃນຮູບພາບ?”
-
ຄວາມເລິກ ແລະ 3D : “ທຸກສິ່ງທຸກຢ່າງຢູ່ໄກປານໃດ?”
ສະຖາປັດຕະຍະກຳແຕກຕ່າງກັນ, ແຕ່ຕາໜ່າງ convolutional ແລະ ຮູບແບບແບບ transformer ຄອບງຳ. [1]
-
-
ການຝຶກຊ້ອມ
ແບ່ງຂໍ້ມູນ, ປັບແຕ່ງ hyperparameters, ເຮັດໃຫ້ເປັນລະບຽບ, ແລະ ເສີມ. ຢຸດກ່ອນທ່ານຈະຈື່ຮູບພື້ນຫຼັງ. -
ການປະເມີນຜົນ
ໃຊ້ຕົວຊີ້ວັດທີ່ເໝາະສົມກັບໜ້າວຽກເຊັ່ນ mAP, IoU, F1, CER/WER ສຳລັບ OCR. ຢ່າເລືອກແບບ cherry-cherry. ປຽບທຽບຢ່າງຍຸດຕິທຳ. [3] -
ການນຳໃຊ້
ສຳລັບເປົ້າໝາຍ: ວຽກແບບ batch ໃນຄລາວ, ການອະນຸມານໃນອຸປະກອນ, ເຊີບເວີຂອບ. ຕິດຕາມກວດກາການເຄື່ອນທີ່. ຝຶກອົບຮົມຄືນໃໝ່ເມື່ອໂລກປ່ຽນແປງ.
ເຄືອຂ່າຍເລິກໄດ້ກະຕຸ້ນການກ້າວກະໂດດດ້ານຄຸນນະພາບເມື່ອຊຸດຂໍ້ມູນ ແລະ ການປະມວນຜົນຂະໜາດໃຫຍ່ບັນລຸເປົ້າໝາຍທີ່ສຳຄັນ. ມາດຕະຖານເຊັ່ນສິ່ງທ້າທາຍ ImageNet ເຮັດໃຫ້ຄວາມຄືບໜ້ານັ້ນເຫັນໄດ້ຊັດເຈນ ແລະ ບໍ່ຢຸດຢັ້ງ. [2]
ໜ້າວຽກຫຼັກທີ່ທ່ານຈະໃຊ້ແທ້ໆ (ແລະເວລາໃດ) 🧩
-
ການຈັດປະເພດຮູບພາບ : ໜຶ່ງປ້າຍຕໍ່ຮູບພາບ. ໃຊ້ສຳລັບຕົວກອງໄວ, ການຄັດເລືອກ, ຫຼື ປະຕູຄຸນນະພາບ.
-
ການກວດຈັບວັດຖຸ : ກ່ອງອ້ອມຮອບສິ່ງຕ່າງໆ. ການປ້ອງກັນການສູນເສຍການຂາຍຍ່ອຍ, ການກວດຈັບພາຫະນະ, ການນັບສັດປ່າ.
-
ການແບ່ງສ່ວນຕົວຢ່າງ : ຮູບຊົງທີ່ຖືກຕ້ອງຕາມພິກເຊວຕໍ່ວັດຖຸ. ຂໍ້ບົກຜ່ອງດ້ານການຜະລິດ, ເຄື່ອງມືຜ່າຕັດ, ເຕັກໂນໂລຊີກະສິກຳ.
-
ການແບ່ງສ່ວນຄວາມໝາຍ : ຊັ້ນຕໍ່ພິກເຊວໂດຍບໍ່ແຍກຕົວຢ່າງ. ທິວທັດຖະໜົນຫົນທາງໃນຕົວເມືອງ, ການປົກຫຸ້ມຂອງທີ່ດິນ.
-
ການກວດຫາຈຸດສຳຄັນ ແລະ ທ່າທາງ : ຂໍ້ຕໍ່, ຈຸດສຳຄັນ, ລັກສະນະໃບໜ້າ. ການວິເຄາະກິລາ, ການອອກແບບຮ່າງກາຍ, AR.
-
ການຕິດຕາມ : ຕິດຕາມວັດຖຸໃນໄລຍະເວລາ. ການຂົນສົ່ງ, ການຈະລາຈອນ, ຄວາມປອດໄພ.
-
OCR ແລະ AI ເອກະສານ : ການສະກັດຂໍ້ຄວາມ ແລະ ການວິເຄາະຮູບແບບ. ໃບແຈ້ງໜີ້, ໃບຮັບເງິນ, ແບບຟອມ.
-
ຄວາມເລິກ ແລະ 3D : ການສ້າງຄືນໃໝ່ຈາກຫຼາຍມຸມມອງ ຫຼື ຕົວຊີ້ບອກທາງດຽວ. ຫຸ່ນຍົນ, AR, ການສ້າງແຜນທີ່.
-
ຄຳບັນຍາຍພາບ : ສະຫຼຸບສາກຕ່າງໆໃນພາສາທຳມະຊາດ. ການເຂົ້າເຖິງ, ການຄົ້ນຫາ.
-
ຮູບແບບວິໄສທັດ-ພາສາ : ການຫາເຫດຜົນຫຼາຍຮູບແບບ, ວິໄສທັດທີ່ເພີ່ມການຄົ້ນຫາຄືນ, ການຮັບປະກັນຄຸນນະພາບທີ່ມີພື້ນຖານ.
ບັນຍາກາດຂອງກໍລະນີນ້ອຍໆ: ໃນຮ້ານຄ້າ, ເຄື່ອງກວດຈັບຈະໝາຍເຖິງຊັ້ນວາງທີ່ຂາດຫາຍໄປ; ຕົວຕິດຕາມປ້ອງກັນການນັບຊ້ຳອີກໃນຂະນະທີ່ພະນັກງານເຕີມສິນຄ້າ; ກົດລະບຽບງ່າຍໆແມ່ນສົ່ງເຟຣມທີ່ມີຄວາມໝັ້ນໃຈຕ່ຳໄປຫາການກວດສອບຂອງມະນຸດ. ມັນເປັນວົງດົນຕີຂະໜາດນ້ອຍທີ່ສ່ວນຫຼາຍແມ່ນຮັກສາຈັງຫວະ.
ຕາຕະລາງປຽບທຽບ: ເຄື່ອງມືເພື່ອຈັດສົ່ງໄດ້ໄວຂຶ້ນ 🧰
ເຈດຕະນາແປກໆເລັກນ້ອຍ. ແມ່ນແລ້ວ, ໄລຍະຫ່າງແມ່ນແປກ - ຂ້ອຍຮູ້.
| ເຄື່ອງມື / ຂອບການເຮັດວຽກ | ດີທີ່ສຸດສຳລັບ | ໃບອະນຸຍາດ/ລາຄາ | ເປັນຫຍັງມັນຈຶ່ງເຮັດວຽກໃນການປະຕິບັດ |
|---|---|---|---|
| OpenCV | ການປະມວນຜົນລ່ວງໜ້າ, CV ແບບຄລາສສິກ, POCs ດ່ວນ | ຟຣີ - ແຫຼ່ງເປີດ | ກ່ອງເຄື່ອງມືຂະໜາດໃຫຍ່, API ທີ່ໝັ້ນຄົງ, ໄດ້ຮັບການທົດສອບການສູ້ຮົບແລ້ວ; ບາງຄັ້ງກໍ່ມີທຸກຢ່າງທີ່ທ່ານຕ້ອງການ. [4] |
| PyTorch | ການຝຶກອົບຮົມທີ່ເປັນມິດກັບການຄົ້ນຄວ້າ | ຟຣີ | ກຣາຟແບບເຄື່ອນໄຫວ, ລະບົບນິເວດຂະໜາດໃຫຍ່, ບົດຮຽນຫຼາຍຢ່າງ. |
| TensorFlow/Keras | ການຜະລິດໃນຂະໜາດໃຫຍ່ | ຟຣີ | ຕົວເລືອກການຮັບໃຊ້ແບບຜູ້ໃຫຍ່, ດີສຳລັບມືຖື ແລະ ຂອບເຊັ່ນກັນ. |
| Ultralytics YOLO | ການກວດຈັບວັດຖຸໄດ້ໄວ | ຟຣີ + ແອດອອນທີ່ຈ່າຍເງິນ | ວົງວຽນການຝຶກຊ້ອມທີ່ງ່າຍ, ຄວາມແມ່ນຍຳຂອງຄວາມໄວໃນການແຂ່ງຂັນ, ມີຄວາມຄິດເຫັນແຕ່ສະດວກສະບາຍ. |
| Detectron2 / ການກວດຈັບ MMDetection | ພື້ນຖານທີ່ເຂັ້ມແຂງ, ການແບ່ງສ່ວນ | ຟຣີ | ຮູບແບບລະດັບອ້າງອີງພ້ອມດ້ວຍຜົນໄດ້ຮັບທີ່ສາມາດຜະລິດຊ້ຳໄດ້. |
| ເວລາແລ່ນ OpenVINO / ONNX | ການເພີ່ມປະສິດທິພາບການອະນຸມານ | ຟຣີ | ບີບຄວາມໜ่วงເວລາ, ນຳໃຊ້ຢ່າງກວ້າງຂວາງໂດຍບໍ່ຕ້ອງຂຽນຄືນໃໝ່. |
| ເທສເຊີແຣັກ | OCR ໃນງົບປະມານ | ຟຣີ | ເຮັດວຽກໄດ້ດີຖ້າເຈົ້າເຮັດຄວາມສະອາດຮູບພາບ... ບາງຄັ້ງເຈົ້າກໍ່ຄວນເຮັດແທ້ໆ. |
ສິ່ງທີ່ຊຸກຍູ້ຄຸນນະພາບໃນ Computer Vision ໃນ AI 🔧
-
ການຄຸ້ມຄອງຂໍ້ມູນ : ການປ່ຽນແປງຂອງແສງ, ມຸມ, ພື້ນຫຼັງ, ຂອບ. ຖ້າມັນສາມາດເກີດຂຶ້ນໄດ້, ໃຫ້ລວມເອົາມັນໄວ້ນຳ.
-
ຄຸນນະພາບຂອງປ້າຍ : ກ່ອງທີ່ບໍ່ສອດຄ່ອງກັນ ຫຼື ຮູບຫຼາຍແຈທີ່ບໍ່ເປັນລະບຽບ ທຳລາຍ mAP. ການຮັບປະກັນຄຸນນະພາບເລັກນ້ອຍຈະຊ່ວຍໄດ້ຫຼາຍ.
-
ການເພີ່ມອັດສະລິຍະ : ຕັດ, ໝຸນ, ສັ່ນສະເທືອນຄວາມສະຫວ່າງ, ເພີ່ມສຽງລົບກວນສັງເຄາະ. ເປັນຈິງ, ບໍ່ແມ່ນຄວາມວຸ້ນວາຍແບບສຸ່ມ.
-
ການປັບແບບຈຳລອງໃຫ້ເໝາະສົມ : ໃຊ້ການກວດຈັບບ່ອນທີ່ຕ້ອງການການກວດຈັບ - ຢ່າບັງຄັບໃຫ້ຕົວຈັດປະເພດຄາດເດົາສະຖານທີ່.
-
ຕົວຊີ້ວັດທີ່ກົງກັບຜົນກະທົບ : ຖ້າຜົນລົບທີ່ບໍ່ຖືກຕ້ອງເຮັດໃຫ້ເຈັບປວດຫຼາຍກວ່າ, ໃຫ້ເພີ່ມປະສິດທິພາບການຈື່ຈຳ. ຖ້າຜົນບວກທີ່ບໍ່ຖືກຕ້ອງເຮັດໃຫ້ເຈັບປວດຫຼາຍກວ່າ, ໃຫ້ມີຄວາມແມ່ນຍຳກ່ອນ.
-
ວົງວຽນການຕອບສະໜອງທີ່ແໜ້ນໜາ : ບັນທຶກຄວາມລົ້ມເຫຼວ, ຕິດປ້າຍໃໝ່, ຝຶກອົບຮົມຄືນໃໝ່. ລ້າງອອກ, ເຮັດຊ້ຳອີກ. ໜ້າເບື່ອເລັກນ້ອຍ - ມີປະສິດທິພາບສູງ.
ສຳລັບການກວດຈັບ/ການແບ່ງສ່ວນ, ມາດຕະຖານຊຸມຊົນແມ່ນ ຄ່າຄວາມແມ່ນຍຳສະເລ່ຍ ທີ່ຄິດໄລ່ຜ່ານຂອບເຂດ IoU - ຫຼື mAP ແບບ COCO . ການຮູ້ວິທີການຄິດໄລ່ IoU ແລະ AP@{0.5:0.95} ຈະຊ່ວຍປ້ອງກັນບໍ່ໃຫ້ການອ້າງສິດໃນກະດານຈັດອັນດັບເຮັດໃຫ້ທ່ານປະຫຼາດໃຈດ້ວຍຕົວເລກທົດສະນິຍົມ. [3]
ກໍລະນີການນຳໃຊ້ໃນໂລກຕົວຈິງທີ່ບໍ່ແມ່ນສົມມຸດຕິຖານ 🌍
-
ຂາຍຍ່ອຍ : ການວິເຄາະຊັ້ນວາງ, ການປ້ອງກັນການສູນເສຍ, ການຕິດຕາມຄິວ, ການປະຕິບັດຕາມແຜນຜັງ.
-
ການຜະລິດ : ການກວດຫາຂໍ້ບົກພ່ອງຂອງພື້ນຜິວ, ການກວດສອບການປະກອບ, ການຊີ້ນຳຂອງຫຸ່ນຍົນ.
-
ການດູແລສຸຂະພາບ : ການຄັດເລືອກຊະນິດຂອງລັງສີວິທະຍາ, ການກວດຫາເຄື່ອງມື, ການແບ່ງສ່ວນຈຸລັງ.
-
ການເຄື່ອນທີ່ : ADAS, ກ້ອງວົງຈອນປິດຈະລາຈອນ, ອັດຕາການເຂົ້າຈອດລົດ, ການຕິດຕາມການເຄື່ອນທີ່ຂອງຈຸນລະພາກ.
-
ກະສິກຳ : ການນັບພືດຜົນ, ການກວດຫາພະຍາດ, ຄວາມພ້ອມໃນການເກັບກ່ຽວ.
-
ການປະກັນໄພ ແລະ ການເງິນ : ການປະເມີນຄວາມເສຍຫາຍ, ການກວດສອບ KYC, ທຸງການສໍ້ໂກງ.
-
ການກໍ່ສ້າງ ແລະ ພະລັງງານ : ການປະຕິບັດຕາມມາດຕະຖານຄວາມປອດໄພ, ການກວດຫາການຮົ່ວໄຫຼ, ການຕິດຕາມກວດກາການກັດກ່ອນ.
-
ເນື້ອຫາ ແລະ ການເຂົ້າເຖິງ : ຄຳບັນຍາຍອັດຕະໂນມັດ, ການກວດສອບ, ການຄົ້ນຫາດ້ວຍຮູບພາບ.
ຮູບແບບທີ່ທ່ານຈະສັງເກດເຫັນ: ປ່ຽນການສະແກນດ້ວຍຕົນເອງດ້ວຍການຄັດເລືອກອັດຕະໂນມັດ, ຈາກນັ້ນຍົກລະດັບໄປສູ່ມະນຸດເມື່ອຄວາມໝັ້ນໃຈຫຼຸດລົງ. ບໍ່ແມ່ນເລື່ອງທີ່ໜ້າສົນໃຈ - ແຕ່ມັນຂະຫຍາຍອອກໄປ.
ຂໍ້ມູນ, ປ້າຍກຳກັບ ແລະ ຕົວຊີ້ວັດທີ່ສຳຄັນ 📊
-
ການຈັດປະເພດ : ຄວາມຖືກຕ້ອງ, F1 ສຳລັບຄວາມບໍ່ສົມດຸນ.
-
ການກວດຫາ : mAP ຂ້າມຂອບເຂດ IoU; ກວດສອບ AP ຕໍ່ຫ້ອງຮຽນ ແລະ ຂະໜາດຂອງຖັງ. [3]
-
ການແບ່ງສ່ວນ : mIoU, Dice; ກວດສອບຄວາມຜິດພາດລະດັບອິນສະແຕນສ໌ນຳ.
-
ການຕິດຕາມ : MOTA, IDF1; ຄຸນນະພາບການລະບຸຕົວຕົນຄືນໃໝ່ແມ່ນວິລະຊົນທີ່ງຽບສະຫງັດ.
-
OCR : ອັດຕາຄວາມຜິດພາດຂອງຕົວອັກສອນ (CER) ແລະ ອັດຕາຄວາມຜິດພາດຂອງຄຳສັບ (WER); ຄວາມລົ້ມເຫຼວຂອງຮູບແບບການຈັດລຽງມັກຈະເປັນສາເຫດຫຼັກ.
-
ໜ້າວຽກການຖົດຖອຍ : ຄວາມເລິກ ຫຼື ທ່າທາງໃຊ້ຄວາມຜິດພາດຢ່າງແທ້ຈິງ/ທຽບເທົ່າ (ມັກຈະຢູ່ໃນສະເກວລັອກ).
ບັນທຶກໂປໂຕຄອນການປະເມີນຜົນຂອງເຈົ້າເພື່ອໃຫ້ຄົນອື່ນສາມາດເຮັດຊ້ຳໄດ້. ມັນບໍ່ໜ້າສົນໃຈ - ແຕ່ມັນເຮັດໃຫ້ເຈົ້າຊື່ສັດ.
ສ້າງ vs ຊື້ - ແລະບ່ອນທີ່ຈະດໍາເນີນການມັນ 🏗️
-
ຄລາວ : ງ່າຍທີ່ສຸດທີ່ຈະເລີ່ມຕົ້ນ, ດີເລີດສຳລັບວຽກງານແບບເປັນກຸ່ມ. ຕິດຕາມຄ່າໃຊ້ຈ່າຍໃນການອອກ.
-
ອຸປະກອນ Edge : ຄວາມໜ່ວງຊ້າຕ່ຳ ແລະ ຄວາມເປັນສ່ວນຕົວທີ່ດີກວ່າ. ທ່ານຈະສົນໃຈກ່ຽວກັບການວັດປະລິມານ, ການຕັດแต่ง ແລະ ຕົວເລັ່ງ.
-
ມືຖືໃນອຸປະກອນ : ດີເລີດເມື່ອມັນພໍດີ. ປັບປຸງຮູບແບບ ແລະ ແບັດເຕີຣີຂອງໂມງໃຫ້ເໝາະສົມ.
-
ໄຮບຣິດ : ຕົວກອງລ່ວງໜ້າຢູ່ແຄມ, ເຮັດວຽກໜັກໃນຄລາວ. ເປັນການປະນີປະນອມທີ່ດີ.
ການຊ້ອນກັນທີ່ໜ້າເຊື່ອຖືໄດ້ຢ່າງໜ້າເບື່ອ: ສ້າງແບບຈຳລອງດ້ວຍ PyTorch, ຝຶກເຄື່ອງກວດຈັບມາດຕະຖານ, ສົ່ງອອກໄປຍັງ ONNX, ເລັ່ງດ້ວຍ OpenVINO/ONNX Runtime, ແລະ ໃຊ້ OpenCV ສຳລັບການປະມວນຜົນກ່ອນ ແລະ ເລຂາຄະນິດ (ການປັບທຽບ, ການແຍກສ່ວນປະກອບ, ຮູບຮ່າງ). [4]
ຄວາມສ່ຽງ, ຈັນຍາບັນ, ແລະ ສ່ວນທີ່ຍາກທີ່ຈະເວົ້າເຖິງ ⚖️
ລະບົບວິໄສທັດສາມາດສືບທອດອະຄະຕິຂອງຊຸດຂໍ້ມູນ ຫຼື ຈຸດບອດໃນການດຳເນີນງານ. ການປະເມີນຜົນເອກະລາດ (ເຊັ່ນ NIST FRVT) ໄດ້ວັດແທກຄວາມແຕກຕ່າງທາງດ້ານປະຊາກອນໃນອັດຕາຄວາມຜິດພາດຂອງການຮັບຮູ້ໃບໜ້າໃນທົ່ວອັລກໍຣິທຶມ ແລະ ເງື່ອນໄຂຕ່າງໆ. ນັ້ນບໍ່ແມ່ນເຫດຜົນທີ່ຈະຕົກໃຈ, ແຕ່ມັນ ເປັນ ເຫດຜົນທີ່ຈະທົດສອບຢ່າງລະມັດລະວັງ, ບັນທຶກຂໍ້ຈຳກັດ, ແລະ ຕິດຕາມກວດກາຢ່າງຕໍ່ເນື່ອງໃນການຜະລິດ. ຖ້າທ່ານນຳໃຊ້ກໍລະນີການນຳໃຊ້ທີ່ກ່ຽວຂ້ອງກັບຕົວຕົນ ຫຼື ຄວາມປອດໄພ, ໃຫ້ລວມເອົາການທົບທວນຂອງມະນຸດ ແລະ ກົນໄກການອຸທອນ. ຄວາມເປັນສ່ວນຕົວ, ການຍິນຍອມ, ແລະ ຄວາມໂປ່ງໃສບໍ່ແມ່ນສິ່ງເພີ່ມເຕີມທີ່ເປັນທາງເລືອກ. [5]
ແຜນທີ່ເລີ່ມຕົ້ນດ່ວນທີ່ທ່ານສາມາດປະຕິບັດຕາມໄດ້ແທ້ໆ 🗺️
-
ກຳນົດການຕັດສິນໃຈ
ລະບົບຄວນດຳເນີນການແນວໃດຫຼັງຈາກເຫັນຮູບພາບ? ສິ່ງນີ້ປ້ອງກັນບໍ່ໃຫ້ທ່ານເພີ່ມປະສິດທິພາບຂອງຕົວຊີ້ວັດຄວາມຫຼົງໄຫຼ. -
ເກັບກຳຊຸດຂໍ້ມູນທີ່ບໍ່ຈຳເປັນ
ເລີ່ມຕົ້ນດ້ວຍຮູບພາບສອງສາມຮ້ອຍຮູບທີ່ສະທ້ອນເຖິງສະພາບແວດລ້ອມຕົວຈິງຂອງທ່ານ. ຕິດສະຫຼາກຢ່າງລະມັດລະວັງ - ເຖິງແມ່ນວ່າມັນເປັນທ່ານ ແລະ ບັນທຶກຕິດສະຕິກເກີສາມອັນກໍຕາມ. -
ເລືອກຮູບແບບພື້ນຖານ
ເລືອກຮູບແບບກະດູກສັນຫຼັງທີ່ລຽບງ່າຍທີ່ມີນໍ້າໜັກທີ່ໄດ້ຮັບການຝຶກອົບຮົມລ່ວງໜ້າ. ຢ່າໄລ່ຕາມສະຖາປັດຕະຍະກຳທີ່ແປກໃໝ່ເທື່ອ. [1] -
ຝຶກອົບຮົມ, ບັນທຶກ, ປະເມີນຜົນ
ຕົວຊີ້ວັດການຕິດຕາມ, ຈຸດສັບສົນ, ແລະຮູບແບບຄວາມລົ້ມເຫຼວ. ຮັກສາປື້ມບັນທຶກຂອງ "ກໍລະນີແປກໆ" - ຫິມະ, ແສງຈ້າ, ການສະທ້ອນ, ຕົວອັກສອນແປກໆ. -
ຮັດແໜ້ນວົງແຫວນ
ເພີ່ມຟີມເນກາຕິບແຂງ, ແກ້ໄຂຄວາມຜິດປົກກະຕິຂອງປ້າຍ, ປັບການເພີ່ມເຕີມ, ແລະ ປັບຄ່າຂອບເຂດຄືນໃໝ່. ການປັບແຕ່ງເລັກນ້ອຍເພີ່ມຂຶ້ນ. [3] -
ນຳໃຊ້ລຸ້ນບາງໆ
ວັດແທກປະລິມານ ແລະ ສົ່ງອອກ. ວັດແທກຄວາມໜ่วงເວລາ/ປະລິມານຜົນຜະລິດໃນສະພາບແວດລ້ອມຕົວຈິງ, ບໍ່ແມ່ນມາດຕະຖານຂອງຫຼິ້ນ. -
ຕິດຕາມກວດກາ ແລະ ເຮັດຊ້ຳ
ການເກັບກຳຂໍ້ຜິດພາດ, ຕິດປ້າຍໃໝ່, ຝຶກອົບຮົມຄືນໃໝ່. ກຳນົດເວລາການປະເມີນຜົນເປັນໄລຍະ ເພື່ອບໍ່ໃຫ້ຮູບແບບຂອງທ່ານກາຍເປັນຟອດຊິວ.
ຄຳແນະນຳຈາກຜູ້ຊ່ຽວຊານ: ໃຫ້ຂຽນຄຳອະທິບາຍສັ້ນໆກ່ຽວກັບທ່າທີທີ່ເພື່ອນຮ່ວມທີມທີ່ເຍາະເຍີ້ຍເຈົ້າທີ່ສຸດຕັ້ງໄວ້. ຖ້າພວກເຂົາບໍ່ສາມາດເຈາະຮູໃສ່ມັນໄດ້, ເຈົ້າອາດຈະພ້ອມແລ້ວ.
ສິ່ງທີ່ຄວນຫຼີກລ່ຽງເປັນປະຈຳທີ່ທ່ານຄວນຫຼີກລ່ຽງ
-
ການຝຶກອົບຮົມກ່ຽວກັບຮູບພາບສະຕູດິໂອທີ່ສະອາດ, ການນຳໃຊ້ໃນໂລກຕົວຈິງດ້ວຍຝົນທີ່ຕົກໃສ່ເລນ.
-
ການເພີ່ມປະສິດທິພາບສຳລັບ mAP ໂດຍລວມເມື່ອທ່ານສົນໃຈຄລາສທີ່ສຳຄັນອັນໜຶ່ງແທ້ໆ. [3]
-
ບໍ່ສົນໃຈຄວາມບໍ່ສົມດຸນຂອງຊັ້ນຮຽນ ແລະ ສົງໄສວ່າເປັນຫຍັງເຫດການທີ່ຫາຍາກຈຶ່ງຫາຍໄປ.
-
ການເພີ່ມຄວາມເຂັ້ມຂຸ້ນຈົນກວ່າຮູບແບບຈະຮຽນຮູ້ສິ່ງປະດິດປອມ.
-
ຂ້າມການປັບທຽບກ້ອງຖ່າຍຮູບ ແລະ ຈາກນັ້ນຕໍ່ສູ້ກັບຄວາມຜິດພາດຂອງມຸມມອງຕະຫຼອດໄປ. [4]
-
ເຊື່ອຕົວເລກກະດານຈັດອັນດັບໂດຍບໍ່ຊໍ້າກັບການຕັ້ງຄ່າການປະເມີນຜົນທີ່ແນ່ນອນ. [2][3]
ແຫຼ່ງຂໍ້ມູນທີ່ຄວນຄ່າແກ່ການບຸກມາກ 🔗
ຖ້າທ່ານມັກເອກະສານຫຼັກ ແລະ ບັນທຶກຫຼັກສູດ, ສິ່ງເຫຼົ່ານີ້ແມ່ນຄຳສຳລັບພື້ນຖານ, ການປະຕິບັດ ແລະ ມາດຕະຖານ. ເບິ່ງ ອ້າງອີງ ສຳລັບລິ້ງຕ່າງໆ: ບັນທຶກ CS231n, ເອກະສານທ້າທາຍ ImageNet, ເອກະສານຊຸດຂໍ້ມູນ/ການປະເມີນຜົນ COCO, ເອກະສານ OpenCV, ແລະ ບົດລາຍງານ NIST FRVT. [1][2][3][4][5]
ຄຳເຕືອນສຸດທ້າຍ - ຫຼືຍາວເກີນໄປ, ບໍ່ໄດ້ອ່ານ 🍃
ວິໄສທັດຄອມພິວເຕີໃນ AI ປ່ຽນພິກເຊວໃຫ້ກາຍເປັນການຕັດສິນໃຈ. ມັນຈະສ່ອງແສງເມື່ອທ່ານຈັບຄູ່ໜ້າວຽກທີ່ຖືກຕ້ອງກັບຂໍ້ມູນທີ່ຖືກຕ້ອງ, ວັດແທກສິ່ງທີ່ຖືກຕ້ອງ, ແລະເຮັດຊ້ຳດ້ວຍລະບຽບວິໄນທີ່ຜິດປົກກະຕິ. ເຄື່ອງມືແມ່ນກວ້າງຂວາງ, ມາດຕະຖານແມ່ນເປີດເຜີຍຕໍ່ສາທາລະນະ, ແລະເສັ້ນທາງຈາກຕົ້ນແບບໄປສູ່ການຜະລິດແມ່ນສັ້ນຢ່າງໜ້າປະຫລາດໃຈຖ້າທ່ານສຸມໃສ່ການຕັດສິນໃຈສຸດທ້າຍ. ກຳນົດປ້າຍຊື່ຂອງທ່ານໃຫ້ຖືກຕ້ອງ, ເລືອກຕົວຊີ້ວັດທີ່ກົງກັບຜົນກະທົບ, ແລະໃຫ້ຕົວແບບເຮັດວຽກໜັກ. ແລະຖ້າຄຳປຽບທຽບຊ່ວຍໄດ້ - ລອງຄິດເບິ່ງມັນຄືກັບການສອນນັກຝຶກງານທີ່ໄວຫຼາຍແຕ່ເປັນຕົວໜັງສືໃຫ້ຊອກຫາສິ່ງທີ່ສຳຄັນ. ທ່ານສະແດງຕົວຢ່າງ, ແກ້ໄຂຄວາມຜິດພາດ, ແລະຄ່ອຍໆໄວ້ວາງໃຈມັນດ້ວຍວຽກທີ່ແທ້ຈິງ. ບໍ່ສົມບູນແບບ, ແຕ່ໃກ້ຄຽງພໍທີ່ຈະປ່ຽນແປງໄດ້. 🌟
ເອກະສານອ້າງອີງ
-
CS231n: ການຮຽນຮູ້ເລິກສຳລັບວິໄສທັດຄອມພິວເຕີ (ບັນທຶກຫຼັກສູດ) - ມະຫາວິທະຍາໄລສະແຕນຟອດ.
ອ່ານຕື່ມ -
ສິ່ງທ້າທາຍການຮັບຮູ້ພາບຂະໜາດໃຫຍ່ຂອງ ImageNet (ເອກະສານ) - Russakovsky ແລະ ຄະນະ
ອ່ານຕື່ມ -
ຊຸດຂໍ້ມູນ ແລະ ການປະເມີນຜົນ COCO - ເວັບໄຊທ໌ທາງການ (ຄຳນິຍາມໜ້າວຽກ ແລະ ສົນທິສັນຍາ mAP/IoU).
ອ່ານຕື່ມ -
ເອກະສານ OpenCV (v4.x) - ໂມດູນສຳລັບການປະມວນຜົນກ່ອນ, ການປັບທຽບ, ຮູບຮ່າງ, ແລະອື່ນໆ.
ອ່ານຕື່ມ -
NIST FRVT ພາກທີ 3: ຜົນກະທົບດ້ານປະຊາກອນ (NISTIR 8280) - ການປະເມີນຜົນເອກະລາດກ່ຽວກັບຄວາມຖືກຕ້ອງຂອງການຮັບຮູ້ໃບໜ້າໃນທົ່ວປະຊາກອນ.
ອ່ານຕື່ມ