Edge AI ແມ່ນຫຍັງ?

Edge AI ຊຸກດັນໃຫ້ຄວາມສະຫຼາດອອກໄປຫາບ່ອນທີ່ຂໍ້ມູນເກີດ. ຟັງແລ້ວເປັນເລື່ອງທີ່ແປກປະຫຼາດ, ແຕ່ແນວຄວາມຄິດຫຼັກແມ່ນງ່າຍດາຍ: ເຮັດແນວຄິດທີ່ຢູ່ຂ້າງເຊັນເຊີເພື່ອໃຫ້ຜົນໄດ້ຮັບປະກົດຂຶ້ນໃນປັດຈຸບັນ, ບໍ່ແມ່ນໃນພາຍຫຼັງ. ທ່ານໄດ້ຮັບຄວາມໄວ, ຄວາມຫນ້າເຊື່ອຖື, ແລະເລື່ອງຄວາມເປັນສ່ວນຕົວທີ່ເຫມາະສົມໂດຍບໍ່ມີການລ້ຽງເດັກຟັງທຸກການຕັດສິນໃຈ. ໃຫ້ unpack it-shortcuts ແລະ side quests ລວມ. 😅

ບົດຄວາມທີ່ທ່ານອາດຈະຢາກອ່ານຫຼັງຈາກບົດຄວາມນີ້:

🔗 AI ທົ່ວໄປແມ່ນຫຍັງ
ຄໍາອະທິບາຍທີ່ຊັດເຈນຂອງ AI ການຜະລິດ, ວິທີການເຮັດວຽກ, ແລະການນໍາໃຊ້ຕົວຈິງ.

🔗 AI ຕົວແທນແມ່ນຫຍັງ
ພາບລວມຂອງ AI ຕົວແທນ, ພຶດຕິກໍາທີ່ປົກຄອງຕົນເອງ, ແລະຮູບແບບການໃຊ້ງານໃນໂລກທີ່ແທ້ຈິງ.

🔗 AI scalability ແມ່ນຫຍັງ
ຮຽນຮູ້ວິທີການປັບຂະຫນາດລະບົບ AI ໄວ້ວາງໃຈ, ປະສິດທິພາບ, ແລະຄ່າໃຊ້ຈ່າຍປະສິດທິຜົນ.

🔗 ໂຄງຮ່າງການຊອບແວສໍາລັບ AI ແມ່ນຫຍັງ
ການແບ່ງໂຄງຮ່າງຂອງຊອບແວ AI, ຜົນປະໂຫຍດທາງສະຖາປັດຕະຍະກໍາ, ແລະພື້ນຖານການປະຕິບັດ.

Edge AI ແມ່ນຫຍັງ? ຄໍານິຍາມໄວ🧭

Edge AI ແມ່ນການປະຕິບັດແບບຈໍາລອງການຮຽນຮູ້ເຄື່ອງຈັກທີ່ໄດ້ຮັບການຝຶກອົບຮົມໂດຍກົງໃນຫຼືຢູ່ໃກ້ກັບອຸປະກອນທີ່ເກັບກໍາຂໍ້ມູນ - ໂທລະສັບ, ກ້ອງຖ່າຍຮູບ, ຫຸ່ນຍົນ, ລົດ, ເຄື່ອງສວມໃສ່, ເຄື່ອງຄວບຄຸມອຸດສາຫະກໍາ, ທ່ານຕັ້ງຊື່ມັນ. ແທນທີ່ຈະສົ່ງຂໍ້ມູນດິບໄປຍັງເຊີບເວີທີ່ຢູ່ໄກເພື່ອການວິເຄາະ, ອຸປະກອນປະມວນຜົນຂໍ້ມູນພາຍໃນທ້ອງຖິ່ນແລະສົ່ງພຽງແຕ່ສະຫຼຸບຫຼືບໍ່ມີຫຍັງເລີຍ. ການເດີນທາງຮອບໜ້ອຍລົງ, ຊ້າໜ້ອຍລົງ, ຄວບຄຸມໄດ້ຫຼາຍຂຶ້ນ. ຖ້າທ່ານຕ້ອງການຜູ້ອະທິບາຍທີ່ສະອາດ, ຜູ້ຂາຍທີ່ເປັນກາງ, ເລີ່ມຕົ້ນທີ່ນີ້. [1]

ສິ່ງທີ່ເຮັດໃຫ້ Edge AI ມີປະໂຫຍດຢ່າງແທ້ຈິງ? 🌟

ເວລາ latency ຕ່ຳ - ການຕັດສິນໃຈເກີດຂຶ້ນໃນອຸປະກອນ, ດັ່ງນັ້ນການຕອບສະໜອງຈະຮູ້ສຶກທັນທີສຳລັບວຽກການຮັບຮູ້ເຊັ່ນ: ການກວດຫາວັດຖຸ, ການຈັບຄຳປຸກ ຫຼືການແຈ້ງເຕືອນຄວາມຜິດປົກກະຕິ. [1]
ຄວາມເປັນສ່ວນຕົວຕາມທ້ອງຖິ່ນ - ຂໍ້ມູນລະອຽດອ່ອນສາມາດຢູ່ໃນອຸປະກອນ, ການຫຼຸດຜ່ອນການເປີດເຜີຍແລະການຊ່ວຍເຫຼືອໃນການສົນທະນາການຫຼຸດຜ່ອນຂໍ້ມູນ. [1]
ການປະຫຍັດແບນວິດ - ສົ່ງຄຸນສົມບັດຫຼືເຫດການແທນທີ່ຈະເປັນກະແສດິບ. [1]
ຄວາມຢືດຢຸ່ນ - ເຮັດວຽກໃນລະຫວ່າງການເຊື່ອມຕໍ່ sketch.
ການຄວບຄຸມຄ່າໃຊ້ຈ່າຍ - ຮອບວຽນການຄິດໄລ່ຄລາວໜ້ອຍລົງ ແລະ ອັດຕາການລ້າທີ່ຕໍ່າລົງ.
ການຮັບຮູ້ສະພາບການ - ອຸປະກອນ "ຮູ້ສຶກ" ສະພາບແວດລ້ອມແລະປັບຕົວ.

ເລື່ອງຫຍໍ້ທີ່ໄວ: ນັກບິນຂາຍຍ່ອຍໄດ້ແລກປ່ຽນການອັບໂຫລດກ້ອງຖ່າຍຮູບຄົງທີ່ສໍາລັບການຈັດປະເພດບຸກຄົນກັບວັດຖຸໃນອຸປະກອນແລະຊຸກຍູ້ພຽງແຕ່ການນັບຊົ່ວໂມງແລະຄລິບຍົກເວັ້ນ. ຜົນໄດ້ຮັບ: ການແຈ້ງເຕືອນຍ່ອຍ 200 ms ຢູ່ແຂບຊັ້ນວາງແລະ ~90% ຫຼຸດລົງໃນການຈະລາຈອນ uplink- ໂດຍບໍ່ມີການປ່ຽນແປງສັນຍາ WAN ຂອງຮ້ານ. (ວິທີການ: inference ທ້ອງຖິ່ນ, batching ເຫດການ, ຜິດປົກກະຕິເທົ່ານັ້ນ.)

Edge AI vs cloud AI - ຄວາມຄົມຊັດໄວ 🥊

ບ່ອນທີ່ຄອມພິວເຕີ້ເກີດຂື້ນ : edge = on-device/near-device; cloud = ສູນຂໍ້ມູນຫ່າງໄກສອກຫຼີກ.
Latency : edge ≈ real-time; cloud ມີການເດີນທາງໄປມາ.
ການເຄື່ອນໄຫວຂໍ້ມູນ : edge filters/compresses first; cloud ມັກການອັບໂຫລດແບບເຕັມຮູບແບບ.
ຄວາມຫນ້າເຊື່ອຖື : edge ດໍາເນີນການ offline; cloud ຕ້ອງການການເຊື່ອມຕໍ່.
ການປົກຄອງ : edge ສະຫນັບສະຫນູນການຫຼຸດຜ່ອນຂໍ້ມູນ; cloud ຄວບຄຸມການຄວບຄຸມ. [1]

ມັນບໍ່ແມ່ນຫຼື. ລະບົບອັດສະລິຍະປະສົມປະສານທັງສອງຢ່າງ: ການຕັດສິນໃຈທີ່ໄວໃນທ້ອງຖິ່ນ, ການວິເຄາະທີ່ເລິກເຊິ່ງກວ່າ ແລະການຮຽນຮູ້ຂອງເຮືອເປັນສູນກາງ. ຄໍາຕອບແບບປະສົມແມ່ນຫນ້າເບື່ອ - ແລະຖືກຕ້ອງ.

Edge AI ເຮັດວຽກແນວໃດພາຍໃຕ້ກະເປົ໋າ🧩

ເຊັນເຊີ ຈັບສັນຍານດິບ - ກອບສຽງ, pixels ກ້ອງຖ່າຍຮູບ, ທໍ່ IMU, ການຕິດຕາມການສັ່ນສະເທືອນ.
ການປະມວນຜົນລ່ວງໜ້າ ຈະປ່ຽນສັນຍານເຫຼົ່ານັ້ນໃຫ້ເປັນຄຸນສົມບັດທີ່ເປັນມິດກັບຕົວແບບ.
Inference runtime ປະຕິບັດຮູບແບບທີ່ຫນາແຫນ້ນຢູ່ໃນອຸປະກອນໂດຍໃຊ້ເຄື່ອງເລັ່ງຄວາມໄວເມື່ອມີໃຫ້.
Postprocessing ປ່ຽນຜົນອອກມາເປັນເຫດການ, ປ້າຍກຳກັບ, ຫຼືການຄວບຄຸມ.
Telemetry ອັບໂຫລດພຽງແຕ່ສິ່ງທີ່ເປັນປະໂຫຍດ: ສະຫຼຸບ, ຄວາມຜິດປົກກະຕິ, ຫຼືຄໍາຄຶດຄໍາເຫັນແຕ່ລະໄລຍະ.

ເວລາແລ່ນໃນອຸປະກອນທີ່ເຈົ້າຈະເຫັນໃນທຳມະຊາດລວມມີ LiteRT (ເມື່ອກ່ອນເອີ້ນວ່າ TensorFlow Lite), ONNX Runtime OpenVINO ຂອງ Intel . ຕ່ອງໂສ້ເຄື່ອງມືເຫຼົ່ານີ້ບີບເອົາກະແສໄຟຟ້າຈາກງົບປະມານພະລັງງານ / ຫນ່ວຍຄວາມຈໍາທີ່ແຫນ້ນຫນາດ້ວຍ tricks ເຊັ່ນ: quantization ແລະ operator fusion. ຖ້າເຈົ້າມັກແກ່ນໝາກໄມ້ ແລະລູກກອດ, ເອກະສານຂອງພວກມັນແຂງ. [3][4]

ບ່ອນທີ່ມັນສະແດງໃຫ້ເຫັນ - ກໍລະນີການນໍາໃຊ້ທີ່ແທ້ຈິງທ່ານສາມາດຊີ້ໄປທີ່ 🧯🚗🏭

ວິໄສທັດຢູ່ຂອບ : ກ້ອງກະດິ່ງປະຕູ (ຄົນທຽບກັບສັດລ້ຽງ), ການສະແກນຊັ້ນວາງໃນຮ້ານຂາຍຍ່ອຍ, drones ຈຸດບົກພ່ອງ.
ສຽງໃນອຸປະກອນ : wake ຄໍາສັບຕ່າງໆ, dictation, ການກວດພົບຮົ່ວໃນພືດ.
IoT ອຸດສາຫະກໍາ : ມໍເຕີແລະປັ໊ມຕິດຕາມຄວາມຜິດປົກກະຕິຂອງການສັ່ນສະເທືອນກ່ອນຄວາມລົ້ມເຫຼວ.
ຍານຍົນ : ການຕິດຕາມຜູ້ຂັບຂີ່, ການກວດຫາເສັ້ນທາງ, ການຊ່ວຍຈອດລົດ-ຮອງວິນາທີ ຫຼືແຕກ.
ການດູແລສຸຂະພາບ : wearables flag arrhythmias ທ້ອງຖິ່ນ; ສະຫຼຸບສັງລວມໃນພາຍຫຼັງ.
ໂທລະສັບສະຫຼາດ : ການປັບປຸງຮູບພາບ, ການກວດສອບການໂທ spam, "ໂທລະສັບຂອງຂ້ອຍເຮັດແບບນັ້ນໄດ້ແນວໃດ" ໃນເວລາອອບໄລນ໌.

ສໍາລັບຄໍານິຍາມຢ່າງເປັນທາງການ (ແລະ "fog vs edge" cousin talk), ເບິ່ງຮູບແບບແນວຄວາມຄິດ NIST. [2]

ຮາດແວທີ່ເຮັດໃຫ້ມັນງ່ວງ🔌

ສອງສາມເວທີໄດ້ຮັບການກວດສອບຊື່ຫຼາຍ:

NVIDIA Jetson - ໂມດູນທີ່ໃຊ້ GPU ສໍາລັບຫຸ່ນຍົນ/ກ້ອງຖ່າຍຮູບ-Swiss-Army-knife vibes ສໍາລັບ AI ຝັງ.
Google Edge TPU + LiteRT - inference integer inference ປະສິດທິພາບ ແລະເປັນ runtime streamlined ສໍາລັບໂຄງການພະລັງງານຕ່ໍາສຸດ. [3]
Apple Neural Engine (ANE) - ແໜ້ນໃນອຸປະກອນ ML ສໍາລັບ iPhone, iPad, ແລະ Mac; Apple ໄດ້ເຜີຍແຜ່ວຽກງານປະຕິບັດໃນການນໍາໃຊ້ການຫັນເປັນປະສິດທິຜົນໃນ ANE. [5]
Intel CPUs/iGPUs/NPUs ກັບ OpenVINO - “ຂຽນຄັ້ງດຽວ, ນຳໃຊ້ໄດ້ທຸກບ່ອນ” ໃນທົ່ວຮາດແວ Intel; ຜ່ານການເພີ່ມປະສິດທິພາບທີ່ເປັນປະໂຫຍດ.
ONNX Runtime ຢູ່ທົ່ວທຸກແຫ່ງ - ເວລາແລ່ນທີ່ເປັນກາງກັບຜູ້ໃຫ້ບໍລິການປະຕິບັດການສຽບໄດ້ໃນທົ່ວໂທລະສັບ, PCs, ແລະ gateways. [4]

ທ່ານຕ້ອງການພວກມັນທັງໝົດບໍ? ບໍ່ແມ່ນແທ້ໆ. ເລືອກເສັ້ນທາງທີ່ເຂັ້ມແຂງທີ່ ເໝາະ ສົມກັບເຮືອຂອງເຈົ້າແລະຕິດກັບມັນ - ປັ່ນປ່ວນແມ່ນສັດຕູຂອງທີມຝັງ.

ຊອບແວ stack - ການທົວສັ້ນ 🧰

ການບີບອັດແບບຈໍາລອງ : quantization (ມັກຈະເປັນ int8), pruning, distillation.
ການເລັ່ງລະດັບຕົວປະຕິບັດການ : ແກ່ນແກ່ນຖືກປັບໃສ່ຊິລິໂຄນຂອງເຈົ້າ.
ເວລາແລ່ນ : LiteRT, ONNX Runtime, OpenVINO. [3][4]
ຜ້າຫໍ່ການນຳໃຊ້ : containers/app bundle; ບາງຄັ້ງບໍລິການຈຸລະພາກຢູ່ໃນປະຕູ.
MLOps ສຳລັບຂອບ : ການອັບເດດແບບ OTA, A/B rollout, telemetry loops.
ຄວາມເປັນສ່ວນຕົວ & ການຄວບຄຸມຄວາມປອດໄພ : ການເຂົ້າລະຫັດໃນອຸປະກອນ, ການບູດທີ່ປອດໄພ, ການຢັ້ງຢືນ, enclaves.

Mini-case: ທີມງານກວດກາ drone ໄດ້ກັ່ນເຄື່ອງກວດຫານ້ໍາຫນັກຫນັກເຂົ້າໄປໃນຕົວແບບນັກຮຽນທີ່ມີປະລິມານສໍາລັບ LiteRT, ຫຼັງຈາກນັ້ນໄດ້ປະສົມປະສານ NMS ໃນອຸປະກອນ. ໄລຍະເວລາການບິນປັບປຸງ ~15% ຍ້ອນການແຕ້ມຄອມພິວເຕີ້ຕ່ໍາ; ປະລິມານການອັບໂຫລດຫຼຸດລົງເປັນກອບຂໍ້ຍົກເວັ້ນ. (ວິທີການ: ການເກັບກໍາຊຸດຂໍ້ມູນຢູ່ໃນເວັບໄຊ, ການປັບປະລິມານຫຼັງຈາກການປະລິມານ, ຮູບແບບເງົາ A/B ກ່ອນທີ່ຈະນໍາໃຊ້ຢ່າງເຕັມທີ່.)

ຕາຕະລາງປຽບທຽບ - ຕົວເລືອກ Edge AI ຍອດນິຍົມ🧪

ການສົນທະນາທີ່ແທ້ຈິງ: ຕາຕະລາງນີ້ແມ່ນຄວາມຄິດເຫັນແລະເລັກນ້ອຍ messy - ຄືກັນກັບໂລກທີ່ແທ້ຈິງ.

ເຄື່ອງມື / ແພລດຟອມ	ຜູ້ຊົມທີ່ດີທີ່ສຸດ	ລາຄາທີ່ຄາດໄວ້	ເປັນຫຍັງມັນເຮັດວຽກຢູ່ໃນຂອບ
LiteRT (ອະດີດ TFLite)	Android, ຜູ້ຜະລິດ, ຝັງ	$ ຫາ $$	ເວລາແລ່ນແບບ lean, docs ທີ່ເຂັ້ມແຂງ, ops ມືຖືທໍາອິດ. ເຮັດວຽກອອຟໄລໄດ້ດີ. [3]
ເວລາແລ່ນ ONNX	ທີມງານຂ້າມເວທີ	$	ຮູບແບບທີ່ເປັນກາງ, ຮາດແວ backends pluggable-friendly ໃນອະນາຄົດ. [4]
OpenVINO	ການນຳໃຊ້ Intel-centric	$	ຊຸດເຄື່ອງມືຫນຶ່ງ, ຫຼາຍເປົ້າຫມາຍ Intel; ຜ່ານການເພີ່ມປະສິດທິພາບທີ່ມີປະໂຫຍດ.
NVIDIA Jetson	ຫຸ່ນຍົນ, ວິໄສທັດ - ຫນັກ	$$ ຫາ $$$	ການເລັ່ງ GPU ໃນກ່ອງອາຫານທ່ຽງ; ລະບົບນິເວດກວ້າງ.
Apple ANE	ແອັບ iOS/iPadOS/macOS	ຄ່າໃຊ້ຈ່າຍອຸປະກອນ	ການເຊື່ອມໂຍງ HW/SW ແຫນ້ນ; ເອກະສານ ANE ເຮັດວຽກດີ. [5]
ຂອບ TPU + LiteRT	ໂຄງການພະລັງງານຕ່ໍາສຸດ	$	ປະສິດທິພາບ int8 inference ຢູ່ແຂບ; ຂະຫນາດນ້ອຍແຕ່ມີຄວາມສາມາດ. [3]

ວິທີການເລືອກເສັ້ນທາງ Edge AI - ຕົ້ນໄມ້ການຕັດສິນໃຈຂະຫນາດນ້ອຍ 🌳

ຍາກໃນເວລາຈິງຊີວິດຂອງເຈົ້າ? ເລີ່ມຕົ້ນດ້ວຍເຄື່ອງເລັ່ງ + ແບບປະລິມານ.
ອຸປະກອນຫຼາຍປະເພດ? ມັກ ONNX Runtime ຫຼື OpenVINO ສໍາລັບການພົກພາ. [4]
ຈັດສົ່ງແອັບຯມືຖືບໍ? LiteRT ແມ່ນເສັ້ນທາງຂອງການຕໍ່ຕ້ານຢ່າງຫນ້ອຍ. [3]
ຫຸ່ນຍົນຫຼືການວິເຄາະກ້ອງຖ່າຍຮູບ? ops ທີ່ເປັນມິດກັບ GPU ຂອງ Jetson ປະຫຍັດເວລາ.
ທ່າທາງຄວາມເປັນສ່ວນຕົວທີ່ເຄັ່ງຄັດ? ຮັກສາຂໍ້ມູນຢູ່ໃນທ້ອງຖິ່ນ, ເຂົ້າລະຫັດທີ່ພັກຜ່ອນ, ບັນທຶກການລວບລວມບໍ່ແມ່ນກອບດິບ.
ທີມງານນ້ອຍໆ? ຫຼີກເວັ້ນການ toolchains exotic-ເຈາະແມ່ນງາມ.
ຕົວແບບຈະປ່ຽນແປງເລື້ອຍໆບໍ? ວາງແຜນ OTA ແລະ telemetry ຈາກມື້ຫນຶ່ງ.

ຄວາມສ່ຽງ, ຂີດຈຳກັດ, ແລະຂໍ້ບົກຜ່ອງທີ່ໜ້າເບື່ອ, ແຕ່ສຳຄັນ🧯

ການລອຍຕົວແບບ - ການປ່ຽນແປງສະພາບແວດລ້ອມ; ຕິດຕາມກວດກາການແຜ່ກະຈາຍ, ດໍາເນີນການຮູບແບບເງົາ, ຝຶກຄືນແຕ່ລະໄລຍະ.
ເພດານຄອມພີວເຕີ - ໜ່ວຍຄວາມຈຳທີ່ແໜ້ນໜາ/ກຳລັງແຮງແບບຈຳລອງຂະໜາດນ້ອຍ ຫຼື ຄວາມຖືກຕ້ອງທີ່ຜ່ອນຄາຍ.
ຄວາມປອດໄພ - ສົມມຸດວ່າການເຂົ້າເຖິງທາງດ້ານຮ່າງກາຍ; ໃຊ້ການໃສ່ເກີບທີ່ປອດໄພ, ເຊັນຊື່ປອມ, ການຢັ້ງຢືນ, ບໍລິການທີ່ມີສິດທິພິເສດໜ້ອຍທີ່ສຸດ.
ການຄຸ້ມຄອງຂໍ້ມູນ - ການປະມວນຜົນໃນທ້ອງຖິ່ນຊ່ວຍ, ແຕ່ທ່ານຍັງຕ້ອງການຄວາມຍິນຍອມ, ການຮັກສາໄວ້, ແລະ telemetry ທີ່ມີຂອບເຂດ.
Fleet ops - ອຸປະກອນໄປອອຟໄລໃນເວລາທີ່ຮ້າຍແຮງທີ່ສຸດ; ອອກແບບການອັບເດດທີ່ເລື່ອນເວລາແລະການອັບໂຫລດຄືນ.
ພອນສະຫວັນປະສົມ - ຝັງ + ML + DevOps ເປັນລູກເຮືອ motley; ລົດໄຟຂ້າມໄວ.

ແຜນທີ່ເສັ້ນທາງປະຕິບັດເພື່ອສົ່ງສິ່ງທີ່ມີປະໂຫຍດ 🗺️

ເລືອກກໍລະນີທີ່ໃຊ້ໄດ້ອັນໜຶ່ງ ທີ່ມີການກວດຫາຂໍ້ບົກພ່ອງທີ່ວັດແທກໄດ້ຢູ່ແຖວທີ 3, ປຸກຄຳສັບໃນລຳໂພງອັດສະລິຍະ, ແລະອື່ນໆ.
ເກັບກໍາຊຸດຂໍ້ມູນກະທັດຮັດ ທີ່ສະທ້ອນສະພາບແວດລ້ອມເປົ້າຫມາຍ; ໃສ່ສິ່ງລົບກວນເພື່ອໃຫ້ກົງກັບຄວາມເປັນຈິງ.
ຕົ້ນແບບໃນຊຸດ dev ໃກ້ກັບຮາດແວການຜະລິດ.
ບີບອັດຕົວແບບ ດ້ວຍ quantization / pruning; ວັດແທກການສູນເສຍຄວາມຖືກຕ້ອງຢ່າງຊື່ສັດ. [3]
Wrap inference in a clean API with backpressure and watchdogs-ເນື່ອງຈາກວ່າອຸປະກອນວາງສາຍຢູ່ 2 am
ການອອກແບບ telemetry ທີ່ເຄົາລົບຄວາມເປັນສ່ວນຕົວ: ສົ່ງການນັບ, histograms, ຄຸນນະສົມບັດສະກັດຂອບ.
ຄວາມປອດໄພແຂງ : binary ເຊັນ, boot ທີ່ປອດໄພ, ການບໍລິການຫນ້ອຍທີ່ເປີດ.
ແຜນ OTA : rollouts staggered, canaries, rollback ທັນ.
ນັກບິນໃນກໍລະນີມຸມທີ່ແປກປະຫຼາດ ກ່ອນ - ຖ້າມັນລອດຢູ່ທີ່ນັ້ນ, ມັນຈະຢູ່ລອດທຸກບ່ອນ.
ປັບຂະໜາດດ້ວຍປຶ້ມຫຼິ້ນ : ເຈົ້າຈະເພີ່ມແບບຈໍາລອງແນວໃດ, ໝຸນກະແຈ, ຈັດເກັບຂໍ້ມູນ - ດັ່ງນັ້ນໂຄງການ #2 ບໍ່ແມ່ນຄວາມວຸ່ນວາຍ.

FAQs - ຄໍາຕອບສັ້ນໆຂອງ Edge AI curiosities ແມ່ນຫຍັງ ❓

Edge AI ພຽງແຕ່ແລ່ນຮູບແບບຂະຫນາດນ້ອຍໃນຄອມພິວເຕີຂະຫນາດນ້ອຍບໍ?
ສ່ວນຫຼາຍແລ້ວ, ແມ່ນແລ້ວ, ແຕ່ຂະຫນາດບໍ່ແມ່ນເລື່ອງທັງຫມົດ. ມັນຍັງກ່ຽວກັບງົບປະມານ latency, ຄໍາຫມັ້ນສັນຍາຄວາມເປັນສ່ວນຕົວ, ແລະ orchestrating ອຸປະກອນຈໍານວນຫຼາຍປະຕິບັດໃນທ້ອງຖິ່ນແຕ່ການຮຽນຮູ້ທົ່ວໂລກ. [1]

ຂ້ອຍສາມາດຝຶກຢູ່ແຄມໄດ້ບໍ?
ມີການຝຶກອົບຮົມ/ການປັບແຕ່ງສ່ວນຕົວໃນອຸປະກອນທີ່ມີນ້ຳໜັກເບົາ; ການຝຶກອົບຮົມທີ່ຫນັກກວ່າຍັງດໍາເນີນການສູນກາງ. ONNX Runtime ເອກະສານທາງເລືອກການຝຶກອົບຮົມໃນອຸປະກອນຖ້າຫາກວ່າທ່ານກໍາລັງຜະຈົນໄພ. [4]

Edge AI vs fog computing ແມ່ນຫຍັງ?
ໝອກ ແລະ ຂອບແມ່ນພີ່ນ້ອງ. ທັງສອງນໍາເອົາຄອມພິວເຕີ້ເຂົ້າໃກ້ແຫຼ່ງຂໍ້ມູນ, ບາງຄັ້ງຜ່ານປະຕູໃກ້ຄຽງ. ສໍາລັບຄໍານິຍາມແລະສະພາບການທີ່ເປັນທາງການ, ເບິ່ງ NIST. [2]

Edge AI ປັບປຸງຄວາມເປັນສ່ວນຕົວສະເໝີບໍ?
ມັນຊ່ວຍ - ແຕ່ມັນບໍ່ແມ່ນ magic. ທ່ານຍັງຕ້ອງການການຫຼຸດຫນ້ອຍລົງ, ເສັ້ນທາງການປັບປຸງທີ່ປອດໄພ, ແລະບັນທຶກຢ່າງລະມັດລະວັງ. ຮັກສາຄວາມເປັນສ່ວນຕົວເປັນນິໄສ, ບໍ່ແມ່ນ checkbox.

ການຂຸດຂຸມເລິກທີ່ເຈົ້າອາດຈະອ່ານຕົວຈິງ📚

1) ການເພີ່ມປະສິດທິພາບແບບຈໍາລອງທີ່ບໍ່ທໍາລາຍຄວາມຖືກຕ້ອງ

Quantization ສາມາດ slash ຄວາມຈໍາແລະເລັ່ງ ops, ແຕ່ calibrate ກັບຂໍ້ມູນຕົວແທນຫຼືຕົວແບບອາດຈະ hallucinate ກະຮອກບ່ອນທີ່ມີ cones ການຈະລາຈອນ. ຄູກັ່ນ - ຄູແນະນໍານັກຮຽນນ້ອຍ - ມັກຈະຮັກສາຄວາມຫມາຍ. [3]

2) Edge runtimes inference ໃນພາກປະຕິບັດ

ນາຍພາສາຂອງ LiteRT ແມ່ນເຈດຕະນາຄວາມຈຳຄົງທີ່ໜ້ອຍລົງໃນເວລາແລ່ນ. ONNX Runtime ສຽບໃສ່ເຄື່ອງເລັ່ງທີ່ແຕກຕ່າງກັນຜ່ານຜູ້ໃຫ້ບໍລິການປະຕິບັດ. ທັງບໍ່ແມ່ນລູກປືນເງິນ; ທັງສອງແມ່ນຄ້ອນແຂງ. [3][4]

3) ຄວາມທົນທານໃນທໍາມະຊາດ

ຄວາມຮ້ອນ, ຂີ້ຝຸ່ນ, ພະລັງງານບໍ່ແຕກ, slapdash Wi-Fi: ສ້າງຕົວເຝົ້າລະວັງທີ່ປິດທໍ່ຄືນໃໝ່, ການຕັດສິນໃຈຂອງແຄດ, ແລະຄືນດີເມື່ອເຄືອຂ່າຍກັບຄືນມາ. glamorous ຫນ້ອຍກ່ວາຄວາມສົນໃຈຫົວຫນ້າ - ມີຄວາມສໍາຄັນຫຼາຍ.

ປະໂຫຍກທີ່ເຈົ້າຈະເວົ້າຊ້ຳໃນກອງປະຊຸມ - 🗣️ ແມ່ນຫຍັງ

Edge AI ຍ້າຍຄວາມສະຫຼາດເຂົ້າໃກ້ຂໍ້ມູນເພື່ອຕອບສະໜອງຂໍ້ຈຳກັດທາງປະຕິບັດຂອງຄວາມແຝງ, ຄວາມເປັນສ່ວນຕົວ, ແບນວິດ ແລະ ຄວາມໜ້າເຊື່ອຖື. ມະຫັດສະຈັນບໍ່ແມ່ນຊິບດຽວຫຼືກອບ - ມັນເລືອກຢ່າງສະຫລາດວ່າຈະຄິດໄລ່ບ່ອນໃດ.

ຂໍ້ສັງເກດສຸດທ້າຍ - ດົນເກີນໄປ, ຂ້ອຍບໍ່ໄດ້ອ່ານມັນ 🧵

Edge AI ແລ່ນແບບຈໍາລອງຢູ່ໃກ້ກັບຂໍ້ມູນເພື່ອໃຫ້ຜະລິດຕະພັນມີຄວາມຮູ້ສຶກໄວ, ເປັນສ່ວນຕົວ, ແລະທົນທານ. ທ່ານຈະຜະສົມຜະສານ inference ທ້ອງຖິ່ນກັບການຄວບຄຸມຟັງສໍາລັບທີ່ດີທີ່ສຸດຂອງທັງສອງໂລກ. ເລືອກເວລາແລ່ນທີ່ກົງກັບອຸປະກອນຂອງທ່ານ, ອີງໃສ່ເຄື່ອງເລັ່ງເວລາທີ່ເຈົ້າສາມາດ, ຮັກສາຕົວແບບຢ່າງກະທັດຮັດດ້ວຍການບີບອັດ, ແລະການອອກແບບການເຮັດວຽກຂອງເຮືອເຊັ່ນ: ວຽກຂອງເຈົ້າແມ່ນຂຶ້ນກັບມັນ - ເພາະວ່າ, ມັນອາດຈະ. ຖ້າມີຄົນຖາມວ່າ Edge AI ແມ່ນຫຍັງ , ໃຫ້ເວົ້າວ່າ: ການຕັດສິນໃຈທີ່ສະຫຼາດ, ເຮັດຢູ່ໃນທ້ອງຖິ່ນ, ຕາມເວລາ. ຫຼັງຈາກນັ້ນ, ຍິ້ມແລະປ່ຽນຫົວຂໍ້ເປັນຫມໍ້ໄຟ. 🔋🙂

ເອກະສານອ້າງອີງ

IBM - Edge AI ແມ່ນຫຍັງ? (ຄໍານິຍາມ, ຜົນປະໂຫຍດ).
https://www.ibm.com/think/topics/edge-ai
NIST - SP 500-325: Fog Computing Conceptual Model (ສະພາບທີ່ເປັນທາງການສຳລັບໝອກ/ຂອບ).
https://csrc.nist.gov/pubs/sp/500/325/final
Google AI Edge - LiteRT (ເມື່ອກ່ອນເອີ້ນວ່າ TensorFlow Lite) (runtime, quantization, migration).
https://ai.google.dev/edge/litert
ONNX Runtime - On-Device Training (ເວລາແລ່ນແບບພົກພາ + ການຝຶກອົບຮົມໃນອຸປະກອນຂອບ).
https://onnxruntime.ai/docs/get-started/training-on-device.html
ການຄົ້ນຄວ້າການຮຽນຮູ້ເຄື່ອງຈັກຂອງ Apple - ການນຳໃຊ້ເຄື່ອງຫັນປ່ຽນໃນ Apple Neural Engine (ບັນທຶກປະສິດທິພາບ ANE).
https://machinelearning.apple.com/research/neural-engine-transformers

ຊອກຫາ AI ລ່າສຸດໄດ້ທີ່ຮ້ານ AI Assistant ຢ່າງເປັນທາງການ

ກ່ຽວກັບພວກເຮົາ

ກັບໄປທີ່ບລັອກ

ປະເທດ/ພາກພື້ນ