AI ສາມາດສັງເກດເຫັນຮູບແບບທີ່ຕາເປົ່າຫາຍໄປ, ປະເຊີນຫນ້າກັບສັນຍານທີ່ຄ້າຍຄືກັບສຽງດັງໃນຕອນທໍາອິດ. ເຮັດຢ່າງຖືກຕ້ອງ, ມັນປ່ຽນພຶດຕິກໍາທີ່ສັບສົນເຂົ້າໄປໃນການຄາດຄະເນທີ່ເປັນປະໂຫຍດ - ການຂາຍໃນເດືອນຫນ້າ, ການຈະລາຈອນໃນມື້ອື່ນ, churn ຕໍ່ມາໃນໄຕມາດນີ້. ເຮັດຜິດ, ມັນເປັນ shrug ຫມັ້ນໃຈ. ໃນຄູ່ມືນີ້, ພວກເຮົາຈະຍ່າງຜ່ານກົນໄກທີ່ແນ່ນອນຂອງວິທີການ AI Predict Trends, ບ່ອນທີ່ຊະນະມາຈາກ, ແລະວິທີການຫຼີກເວັ້ນການຫຼອກລວງໂດຍຕາຕະລາງທີ່ສວຍງາມ. ຂ້ອຍຈະຮັກສາມັນໄວ້ໃຫ້ໃຊ້ໄດ້, ໂດຍມີເວລາເວົ້າຕົວຈິງໜ້ອຍໜຶ່ງ ແລະ ຍົກຄິ້ວເປັນບາງຄັ້ງຄາວ 🙃.
ບົດຄວາມທີ່ທ່ານອາດຈະຢາກອ່ານຫຼັງຈາກບົດຄວາມນີ້:
🔗 ວິທີການວັດແທກປະສິດທິພາບ AI
ຕົວຊີ້ວັດທີ່ສໍາຄັນສໍາລັບການປະເມີນຄວາມຖືກຕ້ອງ, ປະສິດທິພາບ, ແລະຄວາມຫນ້າເຊື່ອຖືຂອງລະບົບ AI.
🔗 ວິທີການສົນທະນາກັບ AI
ຄໍາແນະນໍາພາກປະຕິບັດສໍາລັບການສື່ສານກັບ AI ເພື່ອປັບປຸງຄຸນນະພາບການຕອບສະຫນອງ.
🔗 AI ແມ່ນການກະຕຸ້ນເຕືອນແມ່ນຫຍັງ
ຄຳອະທິບາຍທີ່ຊັດເຈນກ່ຽວກັບວິທີທີ່ການກະຕຸ້ນມີອິດທິພົນຕໍ່ພຶດຕິກຳ ແລະ ຜົນຜະລິດຂອງ AI.
🔗 ການຕິດສະຫຼາກຂໍ້ມູນ AI ແມ່ນຫຍັງ
ການແນະນໍາການຕິດສະຫຼາກຂໍ້ມູນຢ່າງມີປະສິດທິພາບສໍາລັບແບບຈໍາລອງການຮຽນຮູ້ເຄື່ອງຈັກ.
ສິ່ງທີ່ເຮັດໃຫ້ການຄາດເດົາແນວໂນ້ມ AI ທີ່ດີ ✅
ເມື່ອຄົນຖາມວ່າ AI Predict Trends ແນວໃດ, ພວກເຂົາມັກຈະຫມາຍຄວາມວ່າ: ມັນຄາດຄະເນບາງສິ່ງບາງຢ່າງທີ່ບໍ່ແນ່ນອນແຕ່ເກີດຂຶ້ນຄືນແນວໃດ. ການຄາດຄະເນແນວໂນ້ມທີ່ດີມີສ່ວນປະກອບທີ່ຫນ້າເບື່ອແຕ່ງາມ:
-
ຂໍ້ມູນທີ່ມີສັນຍານ - ທ່ານບໍ່ສາມາດບີບນ້ຳສົ້ມອອກຈາກກ້ອນຫີນໄດ້. ທ່ານຕ້ອງການຄຸນຄ່າ ແລະ ສະພາບການໃນອະດີດ.
-
ຄຸນສົມບັດທີ່ສະທ້ອນເຖິງຄວາມເປັນຈິງ - ລະດູການ, ວັນພັກຜ່ອນ, ໂປຣໂມຊັນ, ສະພາບການມະຫາພາກ, ເຖິງແມ່ນວ່າສະພາບອາກາດ. ບໍ່ແມ່ນພວກມັນທັງໝົດ, ພຽງແຕ່ເປັນເຂັມທີ່ຍ້າຍເຂັມຂອງເຈົ້າ.
-
ແບບຈໍາລອງທີ່ເຫມາະກັບໂມງ - ວິທີການຮູ້ເວລາທີ່ເຄົາລົບຄໍາສັ່ງ, ຊ່ອງຫວ່າງ, ແລະ drift.
-
ການປະເມີນຜົນທີ່ສະທ້ອນເຖິງການໃຊ້ງານ - backtests ທີ່ຈໍາລອງວິທີທີ່ທ່ານຈະຄາດຄະເນຢ່າງແທ້ຈິງ. ບໍ່ມີການເບິ່ງ [2].
-
ການຕິດຕາມການປ່ຽນແປງ - ໂລກປ່ຽນແປງ; ຕົວແບບຂອງທ່ານຄວນຄືກັນ [5].
ນັ້ນຄືໂຄງກະດູກ. ສ່ວນທີ່ເຫຼືອແມ່ນກ້າມຊີ້ນ, tendons, ແລະຄາເຟອີນເລັກນ້ອຍ.

ທໍ່ຫຼັກ: ວິທີ AI Predict Trends ຈາກຂໍ້ມູນດິບເພື່ອຄາດຄະເນ 🧪
-
ເກັບກໍາແລະຈັດລໍາດັບຂໍ້ມູນ
ນໍາເອົາຊຸດເປົ້າຫມາຍບວກກັບສັນຍານ exogenous. ແຫຼ່ງທີ່ມາປົກກະຕິ: ລາຍການສິນຄ້າ, ຄ່າໂຄສະນາ, ລາຄາ, ດັດຊະນີມະຫາພາກ ແລະເຫດການຕ່າງໆ. ຈັດຮຽງສະແຕມເວລາ, ຈັດການຄ່າທີ່ຂາດຫາຍໄປ, ສ້າງຫົວໜ່ວຍມາດຕະຖານ. ມັນເປັນການຂີ້ຮ້າຍແຕ່ສໍາຄັນ. -
ຄຸນສົມບັດຂອງວິສະວະກອນ
ສ້າງການຊັກຊ້າ, ວິທີການມ້ວນ, ປະລິມານການເຄື່ອນຍ້າຍ, ທຸງມື້ຂອງອາທິດ, ແລະຕົວຊີ້ວັດສະເພາະຂອງໂດເມນ. ສໍາລັບການປັບຕົວຕາມລະດູການ, ນັກປະຕິບັດຈໍານວນຫຼາຍ decompose ຊຸດເຂົ້າໄປໃນແນວໂນ້ມ, ຕາມລະດູການ, ແລະອົງປະກອບທີ່ຍັງເຫຼືອກ່ອນທີ່ຈະສ້າງແບບຈໍາລອງ; ໂຄງການ X-13 ຂອງສໍານັກງານສໍາມະໂນຄົວສະຫະລັດແມ່ນການອ້າງອິງ canonical ສໍາລັບວິທີການແລະວ່າເປັນຫຍັງນີ້ເຮັດວຽກ [1]. -
ເລືອກຄອບຄົວຕົວແບບ
ເຈົ້າມີສາມຖັງໃຫຍ່:
-
ສະຖິຕິຄລາສສິກ : ARIMA, ETS, state-space/Kalman. ແປໄດ້ ແລະໄວ.
-
ການຮຽນຮູ້ຂອງເຄື່ອງຈັກ : ການເພີ່ມລະດັບສີ, ປ່າໄມ້ແບບສຸ່ມທີ່ມີຄຸນສົມບັດທີ່ຮູ້ເວລາ. ປ່ຽນແປງໄດ້ໃນຫຼາຍຊຸດ.
-
ການຮຽນຮູ້ເລິກເຊິ່ງ : LSTM, Temporal CNNs, Transformers. ເປັນປະໂຫຍດໃນເວລາທີ່ທ່ານມີຂໍ້ມູນຈໍານວນຫລາຍແລະໂຄງສ້າງທີ່ສັບສົນ.
-
Backtest ຢ່າງຖືກຕ້ອງ
ການກວດສອບໄລຍະຂ້າມຜ່ານໃຊ້ຕົ້ນກຳເນີດແບບມ້ວນເພື່ອບໍ່ໃຫ້ເຈົ້າຝຶກຝົນອະນາຄົດໃນຂະນະທີ່ທົດສອບອະດີດ. ມັນເປັນຄວາມແຕກຕ່າງລະຫວ່າງຄວາມຖືກຕ້ອງທີ່ຊື່ສັດແລະການຄິດທີ່ປາດຖະຫນາ [2]. -
ການຄາດຄະເນ, ປະລິມານຄວາມບໍ່ແນ່ນອນ, ແລະເຮືອ
ກັບຄືນມາຄາດຄະເນທີ່ມີໄລຍະ, ຕິດຕາມກວດກາຄວາມຜິດພາດ, ແລະ retrain ເປັນໂລກ drifts. ການບໍລິການທີ່ມີການຄຸ້ມຄອງໂດຍທົ່ວໄປແລ້ວການວັດແທກຄວາມຖືກຕ້ອງຂອງພື້ນຜິວ (ເຊັ່ນ: MAPE, WAPE, MASE) ແລະການທົດສອບ backtesting windows ອອກຈາກກ່ອງ, ເຊິ່ງເຮັດໃຫ້ການຄຸ້ມຄອງແລະ dashboards ງ່າຍຂຶ້ນ [3].
ເລື່ອງສົງຄາມໄວ: ໃນການເປີດຕົວຄັ້ງດຽວ, ພວກເຮົາໄດ້ໃຊ້ເວລາ 1 ມື້ເພີ່ມເຕີມໃນລັກສະນະປະຕິທິນ (ວັນພັກລະດັບພາກພື້ນ + ທຸງໂຄສະນາ) ແລະຕັດຄວາມຜິດພາດໃນຊ່ວງຕົ້ນໆຢ່າງເຫັນໄດ້ຊັດເຈນຫຼາຍກວ່າການປ່ຽນແບບຈໍາລອງ. ຄຸນນະສົມບັດການຕີຮູບແບບທີ່ມີຄຸນນະສົມບັດ novelty-ເປັນຮູບແບບທີ່ທ່ານຈະໄດ້ຮັບການເຫັນອີກເທື່ອຫນຶ່ງ.
ຕາຕະລາງປຽບທຽບ: ເຄື່ອງມືທີ່ຊ່ວຍ AI Predict Trends 🧰
ບໍ່ສົມບູນແບບກ່ຽວກັບຈຸດປະສົງ - ຕາຕະລາງທີ່ແທ້ຈິງທີ່ມີ quirks ຂອງມະນຸດຈໍານວນຫນ້ອຍ.
| ເຄື່ອງມື / Stack | ຜູ້ຊົມທີ່ດີທີ່ສຸດ | ລາຄາ | ເປັນຫຍັງມັນເຮັດວຽກ… ປະເພດຂອງ | ບັນທຶກ |
|---|---|---|---|---|
| ສາດສະດາ | ນັກວິເຄາະ, ຄົນຜະລິດຕະພັນ | ຟຣີ | ລະດູການ + ວັນພັກຜ່ອນ, ຊະນະໄວ | ດີເລີດສຳລັບເສັ້ນຖານ; ໂອເຄກັບຄ່າຜິດປົກກະຕິ |
| ສະຖິຕິ ARIMA | ນັກວິທະຍາສາດຂໍ້ມູນ | ຟຣີ | ກະດູກສັນຫຼັງຄລາສສິກແຂງ - ແປໄດ້ | ຕ້ອງການການດູແລດ້ວຍຄວາມຕັ້ງໃຈ |
| Google Vertex AI Forecast | ທີມງານໃນລະດັບ | ລະດັບທີ່ຈ່າຍ | AutoML + ເຄື່ອງມືຄຸນນະສົມບັດ + hooks ການຕິດຕັ້ງ | ມີປະໂຫຍດຖ້າທ່ານຢູ່ໃນ GCP ແລ້ວ. ເອກະສານແມ່ນລະອຽດ. |
| Amazon ຄາດຄະເນ | ທີມຂໍ້ມູນ/ML ໃນ AWS | ລະດັບທີ່ຈ່າຍ | Backtesting, metrics ຄວາມຖືກຕ້ອງ, scalable endpoints | Metrics ເຊັ່ນ MAPE, WAPE, MASE ສາມາດໃຊ້ໄດ້ [3]. |
| GluonTS | ນັກຄົ້ນຄວ້າ, ML engs | ຟຣີ | ສະຖາປັດຕະຍະກຳທີ່ເລິກເຊິ່ງຫຼາຍອັນ, ສາມາດຂະຫຍາຍໄດ້ | ລະຫັດເພີ່ມເຕີມ, ການຄວບຄຸມຫຼາຍ |
| ກັດ | ນັກທົດລອງ | ຟຣີ | ຊຸດເຄື່ອງມືຂອງ Meta - ເຄື່ອງກວດຈັບ, ນັກພະຍາກອນ, ການວິນິດໄສ | ສະວິດ-ກອງທັບ vibes, ບາງຄັ້ງສົນທະນາ |
| ວົງໂຄຈອນ | ຄາດຄະເນ pros | ຟຣີ | ແບບ Bayesian, ຊ່ວງເວລາທີ່ເຊື່ອຖືໄດ້ | ດີຖ້າທ່ານຮັກກ່ອນ |
| ການພະຍາກອນ PyTorch | ຜູ້ຮຽນເລິກ | ຟຣີ | ສູດອາຫານ DL ທີ່ທັນສະໄຫມ, ຫຼາຍຊຸດທີ່ເປັນມິດ | ເອົາ GPUs, ອາຫານຫວ່າງ |
ແມ່ນແລ້ວ, ຄໍາສັບແມ່ນບໍ່ສະເຫມີພາບ. ນັ້ນຄືຊີວິດຈິງ.
ວິສະວະກໍາຄຸນສົມບັດທີ່ຈິງຍ້າຍເຂັມ🧩
ຄໍາຕອບທີ່ເປັນປະໂຫຍດທີ່ສຸດສໍາລັບວິທີການ AI Predict Trends ນີ້ແມ່ນ: ພວກເຮົາປ່ຽນຊຸດເປັນຕາຕະລາງການຮຽນຮູ້ທີ່ມີການເບິ່ງແຍງທີ່ຈື່ເວລາ. ການເຄື່ອນໄຫວບາງຢ່າງ:
-
Lags & windows : ລວມມີ y[t-1], y[t-7], y[t-28], ບວກກັບວິທີການມ້ວນ ແລະ std dev. ມັນຈັບ momentum ແລະ inertia.
-
ສັນຍານຕາມລະດູການ : ເດືອນ, ອາທິດ, ມື້ຂອງອາທິດ, ຊົ່ວໂມງຂອງມື້. Fourier ເງື່ອນໄຂໃຫ້ເສັ້ນໂຄ້ງຕາມລະດູການທີ່ລຽບງ່າຍ.
-
ປະຕິທິນ ແລະກິດຈະກຳ : ວັນພັກຜ່ອນ, ການເປີດຕົວຜະລິດຕະພັນ, ການປ່ຽນແປງລາຄາ, ໂປຣໂມຊັນ. ຜົນກະທົບວັນພັກແບບສາດສະດາເປັນພຽງແຕ່ລັກສະນະທີ່ມີກ່ອນ.
-
ການແຍກສ່ວນປະກອບ : ຫັກອົງປະກອບຕາມລະດູການ ແລະ ສ້າງແບບຈຳລອງສ່ວນທີ່ເຫຼືອເມື່ອຮູບແບບແຂງແຮງ; X-13 ແມ່ນເສັ້ນຖານທີ່ໄດ້ຮັບການທົດສອບຢ່າງດີສຳລັບສິ່ງນີ້ [1].
-
regressors ພາຍນອກ : ສະພາບອາກາດ, ດັດຊະນີມະຫາພາກ, pageviews, ຄວາມສົນໃຈຄົ້ນຫາ.
-
ຄໍາແນະນໍາການໂຕ້ຕອບ : ຂ້າມງ່າຍດາຍເຊັ່ນ promo_flag × day_of_week. ມັນເປັນການຂູດຮີດແຕ່ມັກຈະເຮັດວຽກ.
ຖ້າທ່ານມີຫຼາຍໆຊຸດທີ່ກ່ຽວຂ້ອງ, ໃຫ້ເວົ້າວ່າ SKUs ຫຼາຍພັນຄົນ - ທ່ານສາມາດລວບລວມຂໍ້ມູນໃນທົ່ວພວກມັນດ້ວຍຕົວແບບລໍາດັບຊັ້ນຫຼືທົ່ວໂລກ. ໃນທາງປະຕິບັດ, ຮູບແບບການເພີ່ມລະດັບຄວາມສູງຂອງໂລກທີ່ມີລັກສະນະການຮູ້ເວລາມັກຈະດີ້ນລົ້ນເຫນືອນ້ໍາຫນັກຂອງມັນ.
ການເລືອກຄອບຄົວຕົວແບບ: ການຜິດຖຽງທີ່ເປັນມິດ 🤼♀️
-
ARIMA/ETS
Pros: ແປໄດ້, ໄວ, ພື້ນຖານແຂງ. ຂໍ້ເສຍ: ການປັບແຕ່ງຕໍ່ຊຸດສາມາດໄດ້ຮັບຄວາມຄ່ອງແຄ້ວໃນລະດັບ. ການເຊື່ອມໂຍງກັນເອງບາງສ່ວນສາມາດຊ່ວຍເປີດເຜີຍຄໍາສັ່ງ, ແຕ່ຢ່າຄາດຫວັງວ່າການອັດສະຈັນ. -
ການເພີ່ມລະດັບສີ
ຂໍ້ດີ: ຈັດການກັບຄຸນສົມບັດຕາຕະລາງ, ທົນທານຕໍ່ສັນຍານປະສົມ, ດີຫຼາຍກັບຊຸດທີ່ກ່ຽວຂ້ອງ. ຂໍ້ເສຍ: ທ່ານຕ້ອງວິສະວະກຳຄຸນສົມບັດເວລາໃຫ້ດີ ແລະ ເຄົາລົບຄວາມເປັນສາເຫດ. -
ການຮຽນຮູ້ຢ່າງເລິກເຊິ່ງ
: ຈັບພາບທີ່ບໍ່ເປັນເສັ້ນຊື່ ແລະຮູບແບບຂ້າມຊຸດ. ຂໍ້ເສຍ: ຂໍ້ມູນຫິວ, trickier ເພື່ອ debug. ໃນເວລາທີ່ທ່ານໄດ້ຮັບສະພາບການອຸດົມສົມບູນຫຼືປະຫວັດສາດທີ່ຍາວນານ, ມັນສາມາດສ່ອງແສງ; ຖ້າບໍ່ດັ່ງນັ້ນ, ມັນເປັນລົດກິລາໃນການຈະລາຈອນຊົ່ວໂມງທີ່ຮີບດ່ວນ. -
ແບບປະສົມ ແລະ ຊຸດຕ່າງໆ
ຂໍໃຫ້ເວົ້າຕາມຄວາມຈິງ, ການວາງຊ້ອນເສັ້ນພື້ນຖານຕາມລະດູການດ້ວຍຕົວເສີມການไล่ระดับສີ ແລະ ການປະສົມກັບ LSTM ນ້ຳໜັກເບົາແມ່ນຄວາມສຸກທີ່ຜິດປົກກະຕິ. ຂ້ອຍໄດ້ກັບຄືນໄປຫາ “ຄວາມບໍລິສຸດຂອງຮູບແບບດຽວ” ຫຼາຍເທື່ອກວ່າທີ່ຂ້ອຍຍອມຮັບ.
ເຫດຜົນ vs ຄວາມກ່ຽວຂ້ອງກັນ: ຈັດການດ້ວຍຄວາມລະມັດລະວັງ 🧭
ພຽງແຕ່ຍ້ອນວ່າສອງເສັ້ນ wiggle ຮ່ວມກັນບໍ່ໄດ້ຫມາຍຄວາມວ່າຫນຶ່ງຂັບລົດອີກ. Granger ການທົດສອບ causality ບໍ່ວ່າຈະເປັນການເພີ່ມຜູ້ຂັບຂີ່ຜູ້ສະຫມັກປັບປຸງການຄາດເດົາສໍາລັບເປົ້າຫມາຍ, ໂດຍໃຫ້ປະຫວັດສາດຂອງຕົນເອງ. ມັນກ່ຽວກັບຜົນປະໂຫຍດຂອງການຄາດຄະເນພາຍໃຕ້ການສົມມຸດຕິຖານ autoregressive ເສັ້ນ, ບໍ່ແມ່ນເຫດຜົນທາງປັດຊະຍາ - ຄວາມແຕກຕ່າງທີ່ອ່ອນໂຍນແຕ່ມີຄວາມສໍາຄັນ [4].
ໃນການຜະລິດ, ທ່ານຍັງກວດສອບ sanity- ກັບຄວາມຮູ້ໂດເມນ. ຕົວຢ່າງ: ຜົນກະທົບໃນອາທິດແມ່ນສໍາຄັນຕໍ່ການຂາຍຍ່ອຍ, ແຕ່ການເພີ່ມການຄລິກໂຄສະນາໃນອາທິດທີ່ຜ່ານມາອາດຈະຊ້ໍາຊ້ອນຖ້າການໃຊ້ຈ່າຍຢູ່ໃນຕົວແບບ.
Backtesting & Metrics: ບ່ອນທີ່ຄວາມຜິດພາດສ່ວນໃຫຍ່ເຊື່ອງ 🔍
ເພື່ອປະເມີນວ່າ AI Predict Trends ຕົວຈິງແນວໃດ, ໃຫ້ເຮັດແບບຢ່າງທີ່ເຈົ້າຈະຄາດຄະເນໃນປ່າທໍາມະຊາດ:
-
ການກວດສອບຄວາມຖືກຕ້ອງຂອງຂໍ້ມູນຕົ້ນກຳເນີດແບບມ້ວນ : ຝຶກຊ້ອມຊ້ຳໆກ່ຽວກັບຂໍ້ມູນກ່ອນໜ້ານີ້ ແລະ ຄາດຄະເນຂໍ້ມູນຕໍ່ໄປ. ສິ່ງນີ້ເຄົາລົບລຳດັບເວລາ ແລະ ປ້ອງກັນການຮົ່ວໄຫຼໃນອະນາຄົດ [2].
-
ການວັດແທກຄວາມຜິດພາດ : ເລືອກສິ່ງທີ່ເໝາະສົມກັບການຕັດສິນໃຈຂອງເຈົ້າ. ຕົວວັດແທກເປີເຊັນເຊັ່ນ MAPE ແມ່ນເປັນທີ່ນິຍົມ, ແຕ່ການວັດແທກນໍ້າໜັກ (WAPE) ຫຼືແບບບໍ່ມີຂະໜາດ (MASE) ມັກຈະມີພຶດຕິກຳທີ່ດີກວ່າສຳລັບຫຼັກຊັບ ແລະ ຂໍ້ມູນລວມ [3].
-
ໄລຍະການຄາດເດົາ : ບໍ່ພຽງແຕ່ໃຫ້ຈຸດ. ສື່ສານຄວາມບໍ່ແນ່ນອນ. ຜູ້ບໍລິຫານບໍ່ຄ່ອຍມັກຂອບເຂດ, ແຕ່ພວກເຂົາມັກຄວາມແປກໃຈຫນ້ອຍລົງ.
gotcha ນ້ອຍໆ: ໃນເວລາທີ່ລາຍການສາມາດເປັນສູນ, metrics ເປີເຊັນຈະແປກ. ຕ້ອງການຄວາມຜິດພາດຢ່າງແທ້ຈິງຫຼືຂະຫນາດ, ຫຼືເພີ່ມການຊົດເຊີຍເລັກນ້ອຍ - ພຽງແຕ່ສອດຄ່ອງ.
Drift ເກີດຂຶ້ນ: ກວດພົບແລະປັບຕົວກັບການປ່ຽນແປງ 🌊
ການປ່ຽນແປງຂອງຕະຫຼາດ, ຄວາມມັກເລື່ອນລອຍ, ອາຍຸຂອງເຊັນເຊີ. ການລອຍລົມຂອງແນວຄວາມຄິດ ແມ່ນການຈັບຕົວທັງໝົດໃນເວລາທີ່ຄວາມສຳພັນລະຫວ່າງວັດສະດຸປ້ອນ ແລະເປົ້າໝາຍພັດທະນາຂຶ້ນ. ທ່ານສາມາດຕິດຕາມກວດກາສໍາລັບການ drift ດ້ວຍການທົດສອບສະຖິຕິ, ຄວາມຜິດພາດ sliding-window, ຫຼືການກວດສອບການແຜ່ກະຈາຍຂໍ້ມູນ. ຈາກນັ້ນເລືອກຍຸດທະສາດ: ປ່ອງຢ້ຽມການຝຶກອົບຮົມສັ້ນ, retraining ເປັນໄລຍະ, ຫຼືການປັບຕົວແບບທີ່ປັບປຸງອອນໄລນ໌. ການສໍາຫຼວດພາກສະຫນາມສະແດງໃຫ້ເຫັນຫຼາຍປະເພດ drift ແລະນະໂຍບາຍການປັບຕົວ; ບໍ່ມີນະໂຍບາຍດຽວທີ່ເຫມາະສົມກັບທັງຫມົດ [5].
ປຶ້ມແບບປະຕິບັດຕົວຈິງ: ກຳນົດເກນການແຈ້ງເຕືອນກ່ຽວກັບຄວາມຜິດພາດຂອງພະຍາກອນສົດ, ຝຶກຊ້ອມຕາມກຳນົດເວລາ, ແລະຮັກສາພື້ນຖານການຕອບແທນໃຫ້ພ້ອມ. ບໍ່ glamorous-ປະສິດທິພາບຫຼາຍ.
ຄໍາອະທິບາຍ: ເປີດກ່ອງດໍາໂດຍບໍ່ມີການທໍາລາຍມັນ 🔦
ພາກສ່ວນກ່ຽວຂ້ອງຖາມວ່າເປັນຫຍັງການຄາດຄະເນເພີ່ມຂຶ້ນ. ສົມເຫດສົມຜົນ. ເຄື່ອງມືທີ່ບໍ່ເຊື່ອໃນຕົວແບບເຊັ່ນ: SHAP ໃຫ້ການຄາດເດົາຕໍ່ກັບຄຸນສົມບັດຕ່າງໆໃນທາງທິດສະດີ, ຊ່ວຍໃຫ້ທ່ານເຫັນວ່າລະດູການ, ລາຄາ, ຫຼືສະຖານະໂປຣໂມຊັນໄດ້ຊຸກຍູ້ຕົວເລກ. ມັນຈະບໍ່ໄດ້ພິສູດເຫດຜົນ, ແຕ່ວ່າມັນຈະປັບປຸງຄວາມໄວ້ວາງໃຈແລະ debugging.
ໃນການທົດສອບຂອງຂ້ອຍເອງ, ລະດູການປະຈໍາອາທິດແລະທຸງສົ່ງເສີມການຂາຍມີແນວໂນ້ມທີ່ຈະຄອບງໍາການຄາດຄະເນການຂາຍຍ່ອຍໃນຂອບເຂດສັ້ນ, ໃນຂະນະທີ່ຂອບເຂດຍາວປ່ຽນໄປສູ່ macro proxies. ໄລຍະທາງຂອງເຈົ້າຈະແຕກຕ່າງກັນໄປ.
Cloud & MLOps: ການຄາດຄະເນການຂົນສົ່ງໂດຍບໍ່ມີທໍ່ທໍ່ 🚚
ຖ້າທ່ານຕ້ອງການເວທີທີ່ມີການຄຸ້ມຄອງ:
-
Google Vertex AI Forecast ໃຫ້ຂັ້ນຕອນການເຮັດວຽກທີ່ແນະນໍາສໍາລັບການກິນຊຸດເວລາ, ແລ່ນ AutoML forecasting, backtesting, ແລະ deploying endpoints. ມັນຍັງຫຼິ້ນໄດ້ດີກັບ stack ຂໍ້ມູນທີ່ທັນສະໄຫມ.
-
Amazon Forecast ສຸມໃສ່ການນໍາໃຊ້ຂະຫນາດໃຫຍ່, ມີການທົດສອບ backtesting ມາດຕະຖານແລະ metrics ຄວາມຖືກຕ້ອງທີ່ທ່ານສາມາດດຶງຜ່ານ API, ເຊິ່ງຊ່ວຍໃນການຄຸ້ມຄອງແລະ dashboards [3].
ທັງສອງເສັ້ນທາງຈະຫຼຸດຜ່ອນ boilerplate. ພຽງແຕ່ຮັກສາຕາຫນຶ່ງກ່ຽວກັບຄ່າໃຊ້ຈ່າຍແລະອີກອັນຫນຶ່ງກ່ຽວກັບສາຍຂໍ້ມູນ. ສອງຕາທັງ ໝົດ ຫຍຸ້ງຍາກແຕ່ສາມາດເຮັດໄດ້.
ການຍ່າງຜ່ານກໍລະນີນ້ອຍໆ: ຈາກການຄລິກດິບໄປຫາສັນຍານແນວໂນ້ມ 🧭✨
ໃຫ້ຈິນຕະນາການວ່າທ່ານກໍາລັງຄາດຄະເນການລົງທະບຽນປະຈໍາວັນສໍາລັບແອັບຯ freemium:
-
ຂໍ້ມູນ : ດຶງເອົາການລົງທະບຽນປະຈຳວັນ, ຄ່າໃຊ້ຈ່າຍໃນການໂຄສະນາຕາມຊ່ອງທາງ, ການຢຸດເຮັດວຽກຂອງເວັບໄຊທ໌, ແລະປະຕິທິນໂປຣໂມຊັນງ່າຍໆ.
-
ຄຸນນະສົມບັດ : lags 1, 7, 14; a 7-day rolling mean; ທຸງປະຈຳວັນ; ທຸງ promo ຄູ່; ໄລຍະເວລາ Fourier ຕາມລະດູການ; ແລະສ່ວນທີ່ເຫລືອຕາມລະດູການທີ່ເສື່ອມໂຊມເພື່ອໃຫ້ຕົວແບບສຸມໃສ່ສ່ວນທີ່ບໍ່ຊ້ໍາກັນ. ການເສື່ອມໂຊມຕາມລະດູການແມ່ນການເຄື່ອນໄຫວແບບຄລາສສິກໃນສະຖິຕິທີ່ເປັນທາງການຊື່ທີ່ຫນ້າເບື່ອ, ເງິນເດືອນໃຫຍ່ [1].
-
ຕົວແບບ : ເລີ່ມຕົ້ນດ້ວຍຕົວປັບປ່ຽນສີທີ່ເພີ່ມລະດັບເປັນຕົວແບບທົ່ວໂລກໃນທົ່ວທຸກພູມສາດ.
-
ການທົດສອບຍ້ອນຫຼັງ : ຕົ້ນກຳເນີດທີ່ມ້ວນດ້ວຍການພັບປະຈຳອາທິດ. ເພີ່ມປະສິດທິພາບ WAPE ໃນສ່ວນທຸລະກິດຫຼັກຂອງທ່ານ. ການທົດສອບຍ້ອນຫຼັງທີ່ເຄົາລົບເວລາແມ່ນບໍ່ສາມາດເຈລະຈາໄດ້ສຳລັບຜົນໄດ້ຮັບທີ່ໜ້າເຊື່ອຖື [2].
-
ອະທິບາຍ : ກວດເບິ່ງຄຸນລັກສະນະຂອງຄຸນສົມບັດທຸກອາທິດເພື່ອເບິ່ງວ່າທຸງໂປຣໂມຊັນແມ່ນເຮັດອັນໃດອັນໜຶ່ງນອກຈາກຈະເບິ່ງດີຢູ່ໃນສະໄລ້.
-
ຕິດຕາມກວດກາ : ຖ້າຜົນກະທົບຂອງໂປຣໂມຊັນຫາຍໄປ ຫຼືຮູບແບບຂອງມື້ເຮັດວຽກປ່ຽນຫຼັງຈາກການປ່ຽນແປງຜະລິດຕະພັນ, ກະຕຸ້ນໃຫ້ມີການຝຶກອົບຮົມຄືນ. Drift ບໍ່ແມ່ນແມງໄມ້ - ມັນແມ່ນວັນພຸດ [5].
ຜົນຜະລິດ: ການພະຍາກອນທີ່ໜ້າເຊື່ອຖືດ້ວຍແຖບຄວາມໝັ້ນໃຈ, ບວກກັບ dashboard ທີ່ບອກວ່າເຂັມຍ້າຍຫຍັງ. ການໂຕ້ວາທີຫນ້ອຍລົງ, ການປະຕິບັດຫຼາຍຂຶ້ນ.
ອຸປະສັກ ແລະ ຄວາມເຊື່ອທີ່ບໍ່ຖືກຕ້ອງເພື່ອຫຼີກລ່ຽງຢ່າງງຽບໆ 🚧
-
Myth: ຄຸນນະສົມບັດເພີ່ມເຕີມແມ່ນສະເຫມີໄປທີ່ດີກວ່າ. ບໍ່. ຄຸນສົມບັດທີ່ບໍ່ກ່ຽວຂ້ອງຫຼາຍເກີນໄປ ເຊີນຊວນໃຫ້ຄວາມເໝາະສົມເກີນໄປ. ຮັກສາສິ່ງທີ່ຊ່ວຍໃຫ້ backtest ແລະສອດຄ່ອງກັບຄວາມຮູ້ສຶກຂອງໂດເມນ.
-
ຄວາມລຶກລັບ: ເຄືອຂ່າຍທີ່ເລິກເຊິ່ງເອົາຊະນະທຸກຢ່າງ. ບາງຄັ້ງແມ່ນ, ມັກຈະບໍ່ແມ່ນ. ຖ້າຂໍ້ມູນສັ້ນ ຫຼື ມີສຽງລົບກວນ, ວິທີການແບບຄລາສສິກຈະຊະນະໃນດ້ານຄວາມໝັ້ນຄົງ ແລະ ຄວາມໂປ່ງໃສ.
-
ຂຸມ: ການຮົ່ວໄຫຼ. ໂດຍບັງເອີນໃຫ້ຂໍ້ມູນຂອງມື້ອື່ນເຂົ້າໄປໃນການຝຶກອົບຮົມຂອງມື້ນີ້ຈະເຮັດໃຫ້ຕົວຊີ້ບອກຂອງເຈົ້າເຮັດໃຫ້ເສື່ອມເສຍ ແລະລົງໂທດການຜະລິດຂອງເຈົ້າ [2].
-
Pitfall: ໄລ່ເລກທົດສະນິຍົມສຸດທ້າຍ. ຖ້າລະບົບຕ່ອງໂສ້ການສະຫນອງຂອງທ່ານແມ່ນ lumpy, ການໂຕ້ຖຽງລະຫວ່າງ 7.3 ແລະ 7.4 ເປີເຊັນຄວາມຜິດພາດແມ່ນສະແດງລະຄອນ. ສຸມໃສ່ການກໍານົດຂອບເຂດການຕັດສິນໃຈ.
-
Myth: causality ຈາກ correlation. ການທົດສອບ Granger ກວດເບິ່ງຜົນປະໂຫຍດທີ່ຄາດເດົາ, ບໍ່ແມ່ນຄວາມຈິງທາງປັດຊະຍາ - ໃຊ້ພວກມັນເປັນກອງ, ບໍ່ແມ່ນພຣະກິດຕິຄຸນ [4].
ລາຍການກວດສອບການຈັດຕັ້ງປະຕິບັດ ທ່ານສາມາດສຳເນົາ-ວາງ 📋
-
ກໍານົດຂອບເຂດ, ລະດັບການລວບລວມ, ແລະການຕັດສິນໃຈທີ່ທ່ານຈະຂັບລົດ.
-
ສ້າງດັດຊະນີເວລາທີ່ສະອາດ, ຕື່ມຂໍ້ມູນໃສ່ຫຼືທຸງຊ່ອງຫວ່າງ, ແລະຈັດຮຽງຂໍ້ມູນ exogenous.
-
ສ້າງຄວາມຊັກຊ້າ, ສະຖິຕິການເລື່ອນເວລາ, ທຸງຕາມລະດູການ, ແລະຄຸນສົມບັດໂດເມນຈຳນວນໜຶ່ງທີ່ທ່ານໄວ້ວາງໃຈ.
-
ເລີ່ມຕົ້ນດ້ວຍພື້ນຖານທີ່ເຂັ້ມແຂງ, ຫຼັງຈາກນັ້ນໃຫ້ເຮັດຊ້ໍາກັບຕົວແບບທີ່ສັບສົນຫຼາຍຖ້າຈໍາເປັນ.
-
ໃຊ້ backtest-origin ກັບ metric ທີ່ກົງກັບທຸລະກິດຂອງທ່ານ [2][3].
-
ເພີ່ມໄລຍະການຄາດເດົາ - ບໍ່ແມ່ນທາງເລືອກ.
-
ເຮືອ, ຕິດຕາມກວດກາ drift, ແລະ retrain ໃນຕາຕະລາງບວກກັບການແຈ້ງເຕືອນ [5].
ດົນເກີນໄປ, ຂ້ອຍບໍ່ໄດ້ອ່ານມັນ - ຂໍ້ສັງເກດສຸດທ້າຍ 💬
ຄວາມຈິງງ່າຍໆກ່ຽວກັບວິທີ AI Predict Trends: ມັນໜ້ອຍກວ່າກ່ຽວກັບສູດການຄິດໄລ່ magical ແລະເພີ່ມເຕີມກ່ຽວກັບການອອກແບບທີ່ມີລະບຽບວິໄນ, ຮູ້ຈັກເວລາ. ໄດ້ຮັບຂໍ້ມູນແລະຄຸນສົມບັດທີ່ຖືກຕ້ອງ, ການປະເມີນຄວາມຊື່ສັດ, ອະທິບາຍຢ່າງງ່າຍດາຍ, ແລະປັບຕາມຄວາມເປັນຈິງປ່ຽນແປງ. ມັນຄ້າຍຄືກັບການປັບວິທະຍຸທີ່ມີລູກບິດທີ່ມີສີຂີ້ເຖົ່າເລັກນ້ອຍ - ເລັກນ້ອຍ fiddly, ບາງຄັ້ງຄົງທີ່, ແຕ່ເມື່ອສະຖານີເຂົ້າມາ, ມັນເປັນເລື່ອງແປກທີ່ຈະແຈ້ງ.
ຖ້າທ່ານເອົາສິ່ງຫນຶ່ງໄປ: ເຄົາລົບເວລາ, ຢືນຢັນຄືກັບຄົນທີ່ບໍ່ຄ່ອຍເຊື່ອງ່າຍໆ, ແລະຕິດຕາມ. ສ່ວນທີ່ເຫຼືອແມ່ນພຽງແຕ່ເຄື່ອງມືແລະລົດຊາດ.
ເອກະສານອ້າງອີງ
-
ຫ້ອງການສໍາມະໂນຄົວສະຫະລັດ - ໂຄງການປັບຕົວຕາມລະດູການ X-13ARIMA-SEATS . ເຊື່ອມຕໍ່
-
Hyndman & Athanasopoulos - ການພະຍາກອນ: ຫຼັກການ ແລະ ການປະຕິບັດ (FPP3), §5.10 ການກວດສອບໄລຍະຂ້າມຜ່ານ . ເຊື່ອມຕໍ່
-
Amazon Web Services - ການປະເມີນຄວາມຖືກຕ້ອງຂອງການຄາດຄະເນ (Amazon Forecast) . ເຊື່ອມຕໍ່
-
ມະຫາວິທະຍາໄລ Houston - Granger Causality (ບັນທຶກການບັນຍາຍ) . ເຊື່ອມຕໍ່
-
Gama et al. - ການສໍາຫຼວດກ່ຽວກັບການປັບຕົວແບບພຽງການລອຍລົມ (ສະບັບເປີດ). ເຊື່ອມຕໍ່