Edge AI ຊຸກດັນໃຫ້ຄວາມສະຫຼາດອອກໄປຫາບ່ອນທີ່ຂໍ້ມູນເກີດ. ຟັງແລ້ວເປັນເລື່ອງທີ່ແປກປະຫຼາດ, ແຕ່ແນວຄວາມຄິດຫຼັກແມ່ນງ່າຍດາຍ: ເຮັດແນວຄິດທີ່ຢູ່ຂ້າງເຊັນເຊີເພື່ອໃຫ້ຜົນໄດ້ຮັບປະກົດຂຶ້ນໃນປັດຈຸບັນ, ບໍ່ແມ່ນໃນພາຍຫຼັງ. ທ່ານໄດ້ຮັບຄວາມໄວ, ຄວາມຫນ້າເຊື່ອຖື, ແລະເລື່ອງຄວາມເປັນສ່ວນຕົວທີ່ເຫມາະສົມໂດຍບໍ່ມີການລ້ຽງເດັກຟັງທຸກການຕັດສິນໃຈ. ໃຫ້ unpack it-shortcuts ແລະ side quests ລວມ. 😅
ບົດຄວາມທີ່ທ່ານອາດຈະຢາກອ່ານຫຼັງຈາກບົດຄວາມນີ້:
🔗 AI ທົ່ວໄປແມ່ນຫຍັງ
ຄໍາອະທິບາຍທີ່ຊັດເຈນຂອງ AI ການຜະລິດ, ວິທີການເຮັດວຽກ, ແລະການນໍາໃຊ້ຕົວຈິງ.
🔗 AI ຕົວແທນແມ່ນຫຍັງ
ພາບລວມຂອງ AI ຕົວແທນ, ພຶດຕິກໍາທີ່ປົກຄອງຕົນເອງ, ແລະຮູບແບບການໃຊ້ງານໃນໂລກທີ່ແທ້ຈິງ.
🔗 AI scalability ແມ່ນຫຍັງ
ຮຽນຮູ້ວິທີການປັບຂະຫນາດລະບົບ AI ໄວ້ວາງໃຈ, ປະສິດທິພາບ, ແລະຄ່າໃຊ້ຈ່າຍປະສິດທິຜົນ.
🔗 ໂຄງຮ່າງການຊອບແວສໍາລັບ AI ແມ່ນຫຍັງ
ການແບ່ງໂຄງຮ່າງຂອງຊອບແວ AI, ຜົນປະໂຫຍດທາງສະຖາປັດຕະຍະກໍາ, ແລະພື້ນຖານການປະຕິບັດ.
Edge AI ແມ່ນຫຍັງ? ຄໍານິຍາມໄວ🧭
Edge AI ແມ່ນການປະຕິບັດແບບຈໍາລອງການຮຽນຮູ້ເຄື່ອງຈັກທີ່ໄດ້ຮັບການຝຶກອົບຮົມໂດຍກົງໃນຫຼືຢູ່ໃກ້ກັບອຸປະກອນທີ່ເກັບກໍາຂໍ້ມູນ - ໂທລະສັບ, ກ້ອງຖ່າຍຮູບ, ຫຸ່ນຍົນ, ລົດ, ເຄື່ອງສວມໃສ່, ເຄື່ອງຄວບຄຸມອຸດສາຫະກໍາ, ທ່ານຕັ້ງຊື່ມັນ. ແທນທີ່ຈະສົ່ງຂໍ້ມູນດິບໄປຍັງເຊີບເວີທີ່ຢູ່ໄກເພື່ອການວິເຄາະ, ອຸປະກອນປະມວນຜົນຂໍ້ມູນພາຍໃນທ້ອງຖິ່ນແລະສົ່ງພຽງແຕ່ສະຫຼຸບຫຼືບໍ່ມີຫຍັງເລີຍ. ການເດີນທາງຮອບໜ້ອຍລົງ, ຊ້າໜ້ອຍລົງ, ຄວບຄຸມໄດ້ຫຼາຍຂຶ້ນ. ຖ້າທ່ານຕ້ອງການຜູ້ອະທິບາຍທີ່ສະອາດ, ຜູ້ຂາຍທີ່ເປັນກາງ, ເລີ່ມຕົ້ນທີ່ນີ້. [1]

ສິ່ງທີ່ເຮັດໃຫ້ Edge AI ມີປະໂຫຍດຢ່າງແທ້ຈິງ? 🌟
-
ເວລາ latency ຕ່ຳ - ການຕັດສິນໃຈເກີດຂຶ້ນໃນອຸປະກອນ, ດັ່ງນັ້ນການຕອບສະໜອງຈະຮູ້ສຶກທັນທີສຳລັບວຽກການຮັບຮູ້ເຊັ່ນ: ການກວດຫາວັດຖຸ, ການຈັບຄຳປຸກ ຫຼືການແຈ້ງເຕືອນຄວາມຜິດປົກກະຕິ. [1]
-
ຄວາມເປັນສ່ວນຕົວຕາມທ້ອງຖິ່ນ - ຂໍ້ມູນລະອຽດອ່ອນສາມາດຢູ່ໃນອຸປະກອນ, ການຫຼຸດຜ່ອນການເປີດເຜີຍແລະການຊ່ວຍເຫຼືອໃນການສົນທະນາການຫຼຸດຜ່ອນຂໍ້ມູນ. [1]
-
ການປະຫຍັດແບນວິດ - ສົ່ງຄຸນສົມບັດຫຼືເຫດການແທນທີ່ຈະເປັນກະແສດິບ. [1]
-
ຄວາມຢືດຢຸ່ນ - ເຮັດວຽກໃນລະຫວ່າງການເຊື່ອມຕໍ່ sketch.
-
ການຄວບຄຸມຄ່າໃຊ້ຈ່າຍ - ຮອບວຽນການຄິດໄລ່ຄລາວໜ້ອຍລົງ ແລະ ອັດຕາການລ້າທີ່ຕໍ່າລົງ.
-
ການຮັບຮູ້ສະພາບການ - ອຸປະກອນ "ຮູ້ສຶກ" ສະພາບແວດລ້ອມ ແລະ ປັບຕົວ.
ເລື່ອງຫຍໍ້ທີ່ໄວ: ນັກບິນຂາຍຍ່ອຍໄດ້ແລກປ່ຽນການອັບໂຫລດກ້ອງຖ່າຍຮູບຄົງທີ່ສໍາລັບການຈັດປະເພດບຸກຄົນກັບວັດຖຸໃນອຸປະກອນແລະຊຸກຍູ້ພຽງແຕ່ການນັບຊົ່ວໂມງແລະຄລິບຍົກເວັ້ນ. ຜົນໄດ້ຮັບ: ການແຈ້ງເຕືອນຍ່ອຍ 200 ms ຢູ່ແຂບຊັ້ນວາງແລະ ~90% ຫຼຸດລົງໃນການຈະລາຈອນ uplink- ໂດຍບໍ່ມີການປ່ຽນແປງສັນຍາ WAN ຂອງຮ້ານ. (ວິທີການ: inference ທ້ອງຖິ່ນ, batching ເຫດການ, ຜິດປົກກະຕິເທົ່ານັ້ນ.)
Edge AI vs cloud AI - ຄວາມຄົມຊັດໄວ 🥊
-
ບ່ອນທີ່ຄອມພິວເຕີ້ເກີດຂື້ນ: edge = on-device/near-device; cloud = ສູນຂໍ້ມູນຫ່າງໄກສອກຫຼີກ.
-
ຄວາມໜ่วงເວລາ: ຂອບ ≈ ເວລາຈິງ; ຄລາວມີການເດີນທາງໄປມາ.
-
ການເຄື່ອນໄຫວຂໍ້ມູນ: edge filters/compresses first; cloud ມັກການອັບໂຫລດແບບເຕັມຮູບແບບ.
-
ຄວາມຫນ້າເຊື່ອຖື: edge ດໍາເນີນການ offline; cloud ຕ້ອງການການເຊື່ອມຕໍ່.
-
ການປົກຄອງ: edge ສະຫນັບສະຫນູນການຫຼຸດຜ່ອນຂໍ້ມູນ; cloud ຄວບຄຸມການຄວບຄຸມ. [1]
ມັນບໍ່ແມ່ນຫຼື. ລະບົບອັດສະລິຍະປະສົມປະສານທັງສອງຢ່າງ: ການຕັດສິນໃຈທີ່ໄວໃນທ້ອງຖິ່ນ, ການວິເຄາະທີ່ເລິກເຊິ່ງກວ່າ ແລະການຮຽນຮູ້ຂອງເຮືອເປັນສູນກາງ. ຄໍາຕອບແບບປະສົມແມ່ນຫນ້າເບື່ອ - ແລະຖືກຕ້ອງ.
Edge AI ເຮັດວຽກແນວໃດພາຍໃຕ້ກະເປົ໋າ🧩
-
ເຊັນເຊີ ຈັບສັນຍານດິບ - ກອບສຽງ, pixels ກ້ອງຖ່າຍຮູບ, ທໍ່ IMU, ການຕິດຕາມການສັ່ນສະເທືອນ.
-
ການປະມວນຜົນລ່ວງໜ້າ ຈະປ່ຽນສັນຍານເຫຼົ່ານັ້ນໃຫ້ເປັນຄຸນສົມບັດທີ່ເປັນມິດກັບຕົວແບບ.
-
Inference runtime ປະຕິບັດຮູບແບບທີ່ຫນາແຫນ້ນຢູ່ໃນອຸປະກອນໂດຍໃຊ້ເຄື່ອງເລັ່ງຄວາມໄວເມື່ອມີໃຫ້.
-
Postprocessing ປ່ຽນຜົນອອກມາເປັນເຫດການ, ປ້າຍກຳກັບ, ຫຼືການຄວບຄຸມ.
-
Telemetry ອັບໂຫຼດພຽງແຕ່ສິ່ງທີ່ເປັນປະໂຫຍດເທົ່ານັ້ນ: ສະຫຼຸບ, ຄວາມຜິດປົກກະຕິ, ຫຼື ຄຳຕິຊົມເປັນໄລຍະ.
ເວລາແລ່ນໃນອຸປະກອນທີ່ທ່ານຈະເຫັນໃນທຳມະຊາດລວມມີ LiteRT (ເມື່ອກ່ອນເອີ້ນວ່າ TensorFlow Lite), ONNX Runtimeຂອງ Intel OpenVINO. ລະບົບຕ່ອງໂສ້ເຄື່ອງມືເຫຼົ່ານີ້ບີບອັດປະລິມານການຜະລິດຈາກງົບປະມານພະລັງງານ/ໜ່ວຍຄວາມຈຳທີ່ຈຳກັດດ້ວຍເຄັດລັບຕ່າງໆເຊັ່ນ: quantization ແລະ operator fusion. ຖ້າທ່ານມັກສິ່ງເລັກໆນ້ອຍໆ, ເອກະສານຂອງພວກມັນແມ່ນແຂງແກ່ນ. [3][4]
ບ່ອນທີ່ມັນສະແດງໃຫ້ເຫັນ - ກໍລະນີການນໍາໃຊ້ທີ່ແທ້ຈິງທ່ານສາມາດຊີ້ໄປທີ່ 🧯🚗🏭
-
ວິໄສທັດຢູ່ຂອບ: ກ້ອງກະດິ່ງປະຕູ (ຄົນທຽບກັບສັດລ້ຽງ), ການສະແກນຊັ້ນວາງໃນຮ້ານຂາຍຍ່ອຍ, drones ຈຸດບົກພ່ອງ.
-
ສຽງໃນອຸປະກອນ: wake ຄໍາສັບຕ່າງໆ, dictation, ການກວດພົບຮົ່ວໃນພືດ.
-
IoT ອຸດສາຫະກໍາ: ມໍເຕີແລະປັ໊ມຕິດຕາມຄວາມຜິດປົກກະຕິຂອງການສັ່ນສະເທືອນກ່ອນຄວາມລົ້ມເຫຼວ.
-
ຍານຍົນ: ການຕິດຕາມຜູ້ຂັບຂີ່, ການກວດຫາເສັ້ນທາງ, ການຊ່ວຍຈອດລົດ-ຮອງວິນາທີ ຫຼືແຕກ.
-
ການດູແລສຸຂະພາບ: wearables flag arrhythmias ທ້ອງຖິ່ນ; ສະຫຼຸບສັງລວມໃນພາຍຫຼັງ.
-
ໂທລະສັບສະຫຼາດ: ການປັບປຸງຮູບພາບ, ການກວດຈັບການໂທສະແປມ, ຊ່ວງເວລາ “ໂທລະສັບຂອງຂ້ອຍເຮັດແບບນັ້ນໄດ້ແນວໃດໃນຂະນະທີ່ອອບລາຍ”.
ສໍາລັບຄໍານິຍາມຢ່າງເປັນທາງການ (ແລະ "fog vs edge" cousin talk), ເບິ່ງຮູບແບບແນວຄວາມຄິດ NIST. [2]
ຮາດແວທີ່ເຮັດໃຫ້ມັນງ່ວງ🔌
ສອງສາມເວທີໄດ້ຮັບການກວດສອບຊື່ຫຼາຍ:
-
NVIDIA Jetson - ໂມດູນທີ່ໃຊ້ GPU ສໍາລັບຫຸ່ນຍົນ/ກ້ອງຖ່າຍຮູບ-Swiss-Army-knife vibes ສໍາລັບ AI ຝັງ.
-
Google Edge TPU + LiteRT - inference integer inference ປະສິດທິພາບ ແລະເປັນ runtime streamlined ສໍາລັບໂຄງການພະລັງງານຕ່ໍາສຸດ. [3]
-
Apple Neural Engine (ANE) - ແໜ້ນໃນອຸປະກອນ ML ສໍາລັບ iPhone, iPad, ແລະ Mac; Apple ໄດ້ເຜີຍແຜ່ວຽກງານປະຕິບັດໃນການນໍາໃຊ້ການຫັນເປັນປະສິດທິຜົນໃນ ANE. [5]
-
CPU/iGPU/NPU ຂອງ Intel ທີ່ມີ OpenVINO - “ຂຽນຄັ້ງດຽວ, ນຳໃຊ້ໄດ້ທຸກບ່ອນ” ໃນທົ່ວຮາດແວຂອງ Intel; ການເພີ່ມປະສິດທິພາບທີ່ເປັນປະໂຫຍດຜ່ານໄປ.
-
ONNX Runtime ຢູ່ທົ່ວທຸກແຫ່ງ - ເວລາແລ່ນທີ່ເປັນກາງກັບຜູ້ໃຫ້ບໍລິການປະຕິບັດການສຽບໄດ້ໃນທົ່ວໂທລະສັບ, PCs, ແລະ gateways. [4]
ທ່ານຕ້ອງການພວກມັນທັງໝົດບໍ? ບໍ່ແມ່ນແທ້ໆ. ເລືອກເສັ້ນທາງທີ່ເຂັ້ມແຂງທີ່ ເໝາະ ສົມກັບເຮືອຂອງເຈົ້າແລະຕິດກັບມັນ - ປັ່ນປ່ວນແມ່ນສັດຕູຂອງທີມຝັງ.
ຊອບແວ stack - ການທົວສັ້ນ 🧰
-
ການບີບອັດແບບຈໍາລອງ: quantization (ມັກຈະເປັນ int8), pruning, distillation.
-
ການເລັ່ງລະດັບຕົວປະຕິບັດການ: ແກ່ນແກ່ນຖືກປັບໃສ່ຊິລິໂຄນຂອງເຈົ້າ.
-
ເວລາແລ່ນ: LiteRT, ONNX Runtime, OpenVINO. [3][4]
-
ຜ້າຫໍ່ການນຳໃຊ້: containers/app bundle; ບາງຄັ້ງບໍລິການຈຸລະພາກຢູ່ໃນປະຕູ.
-
MLOps ສຳລັບຂອບ: ການອັບເດດແບບ OTA, A/B rollout, telemetry loops.
-
ການຄວບຄຸມຄວາມເປັນສ່ວນຕົວ ແລະ ຄວາມປອດໄພ: ການເຂົ້າລະຫັດໃນອຸປະກອນ, ການເປີດເຄື່ອງຢ່າງປອດໄພ, ການຢັ້ງຢືນ, ຂອບເຂດ.
Mini-case: ທີມງານກວດກາ drone ໄດ້ກັ່ນເຄື່ອງກວດຫານ້ໍາຫນັກຫນັກເຂົ້າໄປໃນຕົວແບບນັກຮຽນທີ່ມີປະລິມານສໍາລັບ LiteRT, ຫຼັງຈາກນັ້ນໄດ້ປະສົມປະສານ NMS ໃນອຸປະກອນ. ໄລຍະເວລາການບິນປັບປຸງ ~15% ຍ້ອນການແຕ້ມຄອມພິວເຕີ້ຕ່ໍາ; ປະລິມານການອັບໂຫລດຫຼຸດລົງເປັນກອບຂໍ້ຍົກເວັ້ນ. (ວິທີການ: ການເກັບກໍາຊຸດຂໍ້ມູນຢູ່ໃນເວັບໄຊ, ການປັບປະລິມານຫຼັງຈາກການປະລິມານ, ຮູບແບບເງົາ A/B ກ່ອນທີ່ຈະນໍາໃຊ້ຢ່າງເຕັມທີ່.)
ຕາຕະລາງປຽບທຽບ - ຕົວເລືອກ Edge AI ຍອດນິຍົມ🧪
ການສົນທະນາທີ່ແທ້ຈິງ: ຕາຕະລາງນີ້ແມ່ນຄວາມຄິດເຫັນແລະເລັກນ້ອຍ messy - ຄືກັນກັບໂລກທີ່ແທ້ຈິງ.
| ເຄື່ອງມື / ແພລດຟອມ | ຜູ້ຊົມທີ່ດີທີ່ສຸດ | ລາຄາທີ່ຄາດໄວ້ | ເປັນຫຍັງມັນເຮັດວຽກຢູ່ໃນຂອບ |
|---|---|---|---|
| LiteRT (ອະດີດ TFLite) | Android, ຜູ້ຜະລິດ, ຝັງ | $ ຫາ $$ | ເວລາແລ່ນແບບ lean, docs ທີ່ເຂັ້ມແຂງ, ops ມືຖືທໍາອິດ. ເຮັດວຽກອອຟໄລໄດ້ດີ. [3] |
| ເວລາແລ່ນ ONNX | ທີມງານຂ້າມເວທີ | $ | ຮູບແບບທີ່ເປັນກາງ, ຮາດແວ backends pluggable-friendly ໃນອະນາຄົດ. [4] |
| OpenVINO | ການນຳໃຊ້ Intel-centric | $ | ຊຸດເຄື່ອງມືຫນຶ່ງ, ຫຼາຍເປົ້າຫມາຍ Intel; ຜ່ານການເພີ່ມປະສິດທິພາບທີ່ມີປະໂຫຍດ. |
| NVIDIA Jetson | ຫຸ່ນຍົນ, ວິໄສທັດ - ຫນັກ | $$ ຫາ $$$ | ການເລັ່ງ GPU ໃນກ່ອງອາຫານທ່ຽງ; ລະບົບນິເວດກວ້າງ. |
| Apple ANE | ແອັບ iOS/iPadOS/macOS | ຄ່າໃຊ້ຈ່າຍອຸປະກອນ | ການເຊື່ອມໂຍງ HW/SW ແຫນ້ນ; ເອກະສານ ANE ເຮັດວຽກດີ. [5] |
| ຂອບ TPU + LiteRT | ໂຄງການພະລັງງານຕ່ໍາສຸດ | $ | ປະສິດທິພາບ int8 inference ຢູ່ແຂບ; ຂະຫນາດນ້ອຍແຕ່ມີຄວາມສາມາດ. [3] |
ວິທີການເລືອກເສັ້ນທາງ Edge AI - ຕົ້ນໄມ້ການຕັດສິນໃຈຂະຫນາດນ້ອຍ 🌳
-
ຍາກໃນເວລາຈິງຊີວິດຂອງເຈົ້າ? ເລີ່ມຕົ້ນດ້ວຍເຄື່ອງເລັ່ງ + ແບບປະລິມານ.
-
ອຸປະກອນຫຼາຍປະເພດ? ມັກ ONNX Runtime ຫຼື OpenVINO ສໍາລັບການພົກພາ. [4]
-
ຈັດສົ່ງແອັບຯມືຖືບໍ? LiteRT ແມ່ນເສັ້ນທາງຂອງການຕໍ່ຕ້ານຢ່າງຫນ້ອຍ. [3]
-
ຫຸ່ນຍົນ ຫຼື ການວິເຄາະກ້ອງຖ່າຍຮູບ? ການເຮັດວຽກທີ່ເປັນມິດກັບ GPU ຂອງ Jetson ຊ່ວຍປະຢັດເວລາ.
-
ທ່າທາງຄວາມເປັນສ່ວນຕົວທີ່ເຄັ່ງຄັດ? ຮັກສາຂໍ້ມູນຢູ່ໃນທ້ອງຖິ່ນ, ເຂົ້າລະຫັດທີ່ພັກຜ່ອນ, ບັນທຶກການລວບລວມບໍ່ແມ່ນກອບດິບ.
-
ທີມງານນ້ອຍໆ? ຫຼີກເວັ້ນການ toolchains exotic-ເຈາະແມ່ນງາມ.
-
ຕົວແບບຈະປ່ຽນແປງເລື້ອຍໆບໍ? ວາງແຜນ OTA ແລະ telemetry ຈາກມື້ຫນຶ່ງ.
ຄວາມສ່ຽງ, ຂີດຈຳກັດ, ແລະຂໍ້ບົກຜ່ອງທີ່ໜ້າເບື່ອ, ແຕ່ສຳຄັນ🧯
-
ການລອຍຕົວແບບ - ການປ່ຽນແປງສະພາບແວດລ້ອມ; ຕິດຕາມກວດກາການແຜ່ກະຈາຍ, ດໍາເນີນການຮູບແບບເງົາ, ຝຶກຄືນແຕ່ລະໄລຍະ.
-
ເພດານຄອມພີວເຕີ - ໜ່ວຍຄວາມຈຳທີ່ແໜ້ນໜາ/ກຳລັງແຮງແບບຈຳລອງຂະໜາດນ້ອຍ ຫຼື ຄວາມຖືກຕ້ອງທີ່ຜ່ອນຄາຍ.
-
ຄວາມປອດໄພ - ສົມມຸດວ່າການເຂົ້າເຖິງທາງດ້ານຮ່າງກາຍ; ໃຊ້ການໃສ່ເກີບທີ່ປອດໄພ, ເຊັນຊື່ປອມ, ການຢັ້ງຢືນ, ບໍລິການທີ່ມີສິດທິພິເສດໜ້ອຍທີ່ສຸດ.
-
ການຄຸ້ມຄອງຂໍ້ມູນ - ການປະມວນຜົນໃນທ້ອງຖິ່ນຊ່ວຍ, ແຕ່ທ່ານຍັງຕ້ອງການຄວາມຍິນຍອມ, ການຮັກສາໄວ້, ແລະ telemetry ທີ່ມີຂອບເຂດ.
-
Fleet ops - ອຸປະກອນໄປອອຟໄລໃນເວລາທີ່ຮ້າຍແຮງທີ່ສຸດ; ອອກແບບການອັບເດດທີ່ເລື່ອນເວລາແລະການອັບໂຫລດຄືນ.
-
ພອນສະຫວັນປະສົມ - ຝັງ + ML + DevOps ເປັນລູກເຮືອ motley; ລົດໄຟຂ້າມໄວ.
ແຜນທີ່ເສັ້ນທາງປະຕິບັດເພື່ອສົ່ງສິ່ງທີ່ມີປະໂຫຍດ 🗺️
-
ເລືອກກໍລະນີທີ່ໃຊ້ໄດ້ອັນໜຶ່ງ ທີ່ມີການກວດຫາຂໍ້ບົກພ່ອງທີ່ວັດແທກໄດ້ຢູ່ແຖວທີ 3, ປຸກຄຳສັບໃນລຳໂພງອັດສະລິຍະ, ແລະອື່ນໆ.
-
ເກັບກໍາຊຸດຂໍ້ມູນກະທັດຮັດ ທີ່ສະທ້ອນສະພາບແວດລ້ອມເປົ້າຫມາຍ; ໃສ່ສິ່ງລົບກວນເພື່ອໃຫ້ກົງກັບຄວາມເປັນຈິງ.
-
ຕົ້ນແບບໃນຊຸດ dev ໃກ້ກັບຮາດແວການຜະລິດ.
-
ບີບອັດຕົວແບບ ດ້ວຍ quantization / pruning; ວັດແທກການສູນເສຍຄວາມຖືກຕ້ອງຢ່າງຊື່ສັດ. [3]
-
Wrap inference in a clean API with backpressure and watchdogs-ເນື່ອງຈາກວ່າອຸປະກອນວາງສາຍຢູ່ 2 am
-
ການອອກແບບ telemetry ທີ່ເຄົາລົບຄວາມເປັນສ່ວນຕົວ: ສົ່ງການນັບ, histograms, ຄຸນນະສົມບັດສະກັດຂອບ.
-
ຄວາມປອດໄພແຂງ: binary ເຊັນ, boot ທີ່ປອດໄພ, ການບໍລິການຫນ້ອຍທີ່ເປີດ.
-
ແຜນ OTA: rollouts staggered, canaries, rollback ທັນ.
-
ທົດລອງໃຊ້ກ່ອງມຸມທີ່ໜາ ກ່ອນ - ຖ້າມັນລອດຢູ່ທີ່ນັ້ນ, ມັນຈະລອດໄດ້ທຸກບ່ອນ.
-
ຂະຫຍາຍດ້ວຍຄູ່ມືການນຳໃຊ້: ວິທີທີ່ທ່ານຈະເພີ່ມຮູບແບບ, ໝຸນປຸ່ມ, ເກັບຂໍ້ມູນໄວ້ - ດັ່ງນັ້ນໂຄງການທີ 2 ຈຶ່ງບໍ່ແມ່ນຄວາມວຸ້ນວາຍ.
ຄຳຖາມທີ່ຖືກຖາມເລື້ອຍໆ - ຄຳຕອບສັ້ນໆຕໍ່ ກັບ Edge AI ແມ່ນຫຍັງ ❓
Edge AI ພຽງແຕ່ໃຊ້ຮູບແບບຂະໜາດນ້ອຍໃນຄອມພິວເຕີຂະໜາດນ້ອຍບໍ?
ສ່ວນຫຼາຍແລ້ວ, ແມ່ນແລ້ວ - ແຕ່ຂະໜາດບໍ່ແມ່ນເລື່ອງທັງໝົດ. ມັນຍັງກ່ຽວກັບງົບປະມານຄວາມຊັກຊ້າ, ຄຳໝັ້ນສັນຍາດ້ານຄວາມເປັນສ່ວນຕົວ, ແລະ ການຈັດການອຸປະກອນຫຼາຍຢ່າງທີ່ເຮັດວຽກຢູ່ໃນທ້ອງຖິ່ນແຕ່ຮຽນຮູ້ທົ່ວໂລກ. [1]
ຂ້ອຍສາມາດຝຶກຊ້ອມໃນຂອບເຂດດຽວກັນໄດ້ບໍ?
ການຝຶກອົບຮົມ/ການປັບແຕ່ງສ່ວນຕົວໃນອຸປະກອນທີ່ມີນ້ຳໜັກເບົາຍັງມີຢູ່; ການຝຶກອົບຮົມທີ່ໜັກໜ່ວງກວ່າຍັງຄົງດຳເນີນຢູ່ສູນກາງ. ONNX Runtime ບັນທຶກຕົວເລືອກການຝຶກອົບຮົມໃນອຸປະກອນຖ້າທ່ານມັກຄວາມກ້າຫານ. [4]
Edge AI vs fog computing ແມ່ນຫຍັງ?
ໝອກ ແລະ ຂອບແມ່ນພີ່ນ້ອງ. ທັງສອງນໍາເອົາຄອມພິວເຕີ້ເຂົ້າໃກ້ແຫຼ່ງຂໍ້ມູນ, ບາງຄັ້ງຜ່ານປະຕູໃກ້ຄຽງ. ສໍາລັບຄໍານິຍາມແລະສະພາບການທີ່ເປັນທາງການ, ເບິ່ງ NIST. [2]
Edge AI ປັບປຸງຄວາມເປັນສ່ວນຕົວສະເໝີບໍ?
ມັນຊ່ວຍໄດ້ - ແຕ່ມັນບໍ່ແມ່ນເວດມົນ. ເຈົ້າຍັງຕ້ອງການການຫຼຸດຜ່ອນ, ເສັ້ນທາງການອັບເດດທີ່ປອດໄພ, ແລະການບັນທຶກຢ່າງລະມັດລະວັງ. ປະຕິບັດຕໍ່ຄວາມເປັນສ່ວນຕົວຄືກັບນິໄສ, ບໍ່ແມ່ນກ່ອງກາເຄື່ອງໝາຍ.
ການຂຸດຂຸມເລິກທີ່ເຈົ້າອາດຈະອ່ານຕົວຈິງ📚
1) ການເພີ່ມປະສິດທິພາບແບບຈໍາລອງທີ່ບໍ່ທໍາລາຍຄວາມຖືກຕ້ອງ
Quantization ສາມາດ slash ຄວາມຈໍາແລະເລັ່ງ ops, ແຕ່ calibrate ກັບຂໍ້ມູນຕົວແທນຫຼືຕົວແບບອາດຈະ hallucinate ກະຮອກບ່ອນທີ່ມີ cones ການຈະລາຈອນ. ຄູກັ່ນ - ຄູແນະນໍານັກຮຽນນ້ອຍ - ມັກຈະຮັກສາຄວາມຫມາຍ. [3]
2) Edge runtimes inference ໃນພາກປະຕິບັດ
ນາຍພາສາຂອງ LiteRT ແມ່ນເຈດຕະນາຄວາມຈຳຄົງທີ່ໜ້ອຍລົງໃນເວລາແລ່ນ. ONNX Runtime ສຽບໃສ່ເຄື່ອງເລັ່ງທີ່ແຕກຕ່າງກັນຜ່ານຜູ້ໃຫ້ບໍລິການປະຕິບັດ. ທັງບໍ່ແມ່ນລູກປືນເງິນ; ທັງສອງແມ່ນຄ້ອນແຂງ. [3][4]
3) ຄວາມທົນທານໃນທໍາມະຊາດ
ຄວາມຮ້ອນ, ຂີ້ຝຸ່ນ, ພະລັງງານບໍ່ແຕກ, slapdash Wi-Fi: ສ້າງຕົວເຝົ້າລະວັງທີ່ປິດທໍ່ຄືນໃໝ່, ການຕັດສິນໃຈຂອງແຄດ, ແລະຄືນດີເມື່ອເຄືອຂ່າຍກັບຄືນມາ. glamorous ຫນ້ອຍກ່ວາຄວາມສົນໃຈຫົວຫນ້າ - ມີຄວາມສໍາຄັນຫຼາຍ.
ປະໂຫຍກທີ່ເຈົ້າຈະເວົ້າຊ້ຳໃນການປະຊຸມ - Edge AI ແມ່ນຫຍັງ 🗣️
Edge AI ຍ້າຍຄວາມສະຫຼາດເຂົ້າໃກ້ຂໍ້ມູນເພື່ອຕອບສະໜອງຂໍ້ຈຳກັດທາງປະຕິບັດຂອງຄວາມແຝງ, ຄວາມເປັນສ່ວນຕົວ, ແບນວິດ ແລະ ຄວາມໜ້າເຊື່ອຖື. ມະຫັດສະຈັນບໍ່ແມ່ນຊິບດຽວຫຼືກອບ - ມັນເລືອກຢ່າງສະຫລາດວ່າຈະຄິດໄລ່ບ່ອນໃດ.
ຂໍ້ສັງເກດສຸດທ້າຍ - ດົນເກີນໄປ, ຂ້ອຍບໍ່ໄດ້ອ່ານມັນ 🧵
Edge AI ເຮັດວຽກແບບຈຳລອງໃກ້ກັບຂໍ້ມູນ ດັ່ງນັ້ນຜະລິດຕະພັນຈຶ່ງຮູ້ສຶກໄວ, ເປັນສ່ວນຕົວ ແລະ ແຂງແຮງ. ທ່ານຈະປະສົມປະສານການອະນຸມານໃນທ້ອງຖິ່ນກັບການກວດສອບຄລາວເພື່ອສິ່ງທີ່ດີທີ່ສຸດຂອງທັງສອງໂລກ. ເລືອກເວລາເຮັດວຽກທີ່ກົງກັບອຸປະກອນຂອງທ່ານ, ອີງໃສ່ຕົວເລັ່ງຄວາມໄວເມື່ອທ່ານສາມາດເຮັດໄດ້, ຮັກສາແບບຈຳລອງໃຫ້ເປັນລະບຽບດ້ວຍການບີບອັດ, ແລະ ອອກແບບການດຳເນີນງານຂອງກອງຍານພາຫະນະຄືກັບວ່າວຽກຂອງທ່ານແມ່ນຂຶ້ນກັບມັນ - ເພາະວ່າ, ດີ, ມັນອາດຈະ. ຖ້າມີຄົນຖາມວ່າ Edge AI ແມ່ນຫຍັງ, ໃຫ້ເວົ້າວ່າ: ການຕັດສິນໃຈທີ່ສະຫຼາດ, ເຮັດຢູ່ໃນທ້ອງຖິ່ນ, ຕາມເວລາ. ຈາກນັ້ນຍິ້ມ ແລະ ປ່ຽນຫົວຂໍ້ເປັນແບັດເຕີຣີ. 🔋🙂
ເອກະສານອ້າງອີງ
-
IBM - Edge AI ແມ່ນຫຍັງ? (ຄໍານິຍາມ, ຜົນປະໂຫຍດ).
https://www.ibm.com/think/topics/edge-ai -
NIST - SP 500-325: Fog Computing Conceptual Model (ສະພາບທີ່ເປັນທາງການສຳລັບໝອກ/ຂອບ).
https://csrc.nist.gov/pubs/sp/500/325/final -
Google AI Edge - LiteRT (ເມື່ອກ່ອນເອີ້ນວ່າ TensorFlow Lite) (runtime, quantization, migration).
https://ai.google.dev/edge/litert -
ONNX Runtime - On-Device Training (ເວລາແລ່ນແບບພົກພາ + ການຝຶກອົບຮົມໃນອຸປະກອນຂອບ).
https://onnxruntime.ai/docs/get-started/training-on-device.html -
ການຄົ້ນຄວ້າການຮຽນຮູ້ເຄື່ອງຈັກຂອງ Apple - ການນຳໃຊ້ເຄື່ອງຫັນປ່ຽນໃນ Apple Neural Engine (ບັນທຶກປະສິດທິພາບ ANE).
https://machinelearning.apple.com/research/neural-engine-transformers