AI ແບບໂອເພນຊອສຖືກເວົ້າເຖິງຄືກັບວ່າມັນເປັນກະແຈວິເສດທີ່ປົດລັອກທຸກຢ່າງ. ມັນບໍ່ແມ່ນ. ແຕ່ມັນ ເປັນ ວິທີທີ່ໃຊ້ໄດ້ຈິງ ແລະ ບໍ່ຕ້ອງຂໍອະນຸຍາດໃນການສ້າງລະບົບ AI ທີ່ທ່ານສາມາດເຂົ້າໃຈ, ປັບປຸງ ແລະ ຈັດສົ່ງໄດ້ໂດຍບໍ່ຕ້ອງຂໍໃຫ້ຜູ້ຂາຍປ່ຽນໃຈ. ຖ້າທ່ານສົງໄສວ່າສິ່ງໃດນັບວ່າເປັນ "ເປີດ", ສິ່ງໃດຄືການຕະຫຼາດ, ແລະວິທີການນຳໃຊ້ມັນໃນບ່ອນເຮັດວຽກ, ທ່ານຢູ່ໃນສະຖານທີ່ທີ່ຖືກຕ້ອງແລ້ວ. ດື່ມກາເຟ - ສິ່ງນີ້ຈະເປັນປະໂຫຍດ, ແລະ ບາງທີອາດຈະເປັນຄວາມຄິດເຫັນເລັກນ້ອຍ ☕🙂.
ບົດຄວາມທີ່ທ່ານອາດຈະຢາກອ່ານຫຼັງຈາກບົດຄວາມນີ້:
🔗 ວິທີການລວມເອົາ AI ເຂົ້າໃນທຸລະກິດຂອງທ່ານ
ຂັ້ນຕອນການປະຕິບັດຕົວຈິງເພື່ອປະສົມປະສານເຄື່ອງມື AI ເພື່ອການເຕີບໂຕຂອງທຸລະກິດທີ່ສະຫຼາດກວ່າ.
🔗 ວິທີການໃຊ້ AI ເພື່ອໃຫ້ມີປະສິດທິພາບຫຼາຍຂຶ້ນ
ຄົ້ນພົບຂະບວນການເຮັດວຽກ AI ທີ່ມີປະສິດທິພາບທີ່ຊ່ວຍປະຢັດເວລາ ແລະ ເພີ່ມປະສິດທິພາບ.
🔗 ທັກສະ AI ແມ່ນຫຍັງ?
ຮຽນຮູ້ຄວາມສາມາດດ້ານ AI ທີ່ສຳຄັນທີ່ຈຳເປັນສຳລັບຜູ້ຊ່ຽວຊານທີ່ພ້ອມສຳລັບອະນາຄົດ.
🔗 Google Vertex AI ແມ່ນຫຍັງ
ເຂົ້າໃຈ Vertex AI ຂອງ Google ແລະວິທີທີ່ມັນປັບປຸງການຮຽນຮູ້ຂອງເຄື່ອງຈັກ.
Open Source AI ແມ່ນຫຍັງ? 🤖🔓
ທີ່ງ່າຍທີ່ສຸດ, Open Source AI ຫມາຍຄວາມວ່າສ່ວນປະກອບຂອງລະບົບ AI - ລະຫັດ, ນ້ໍາຫນັກຕົວແບບ, ທໍ່ຂໍ້ມູນ, scripts ການຝຶກອົບຮົມ, ແລະເອກະສານ - ຖືກປ່ອຍອອກມາພາຍໃຕ້ໃບອະນຸຍາດທີ່ໃຫ້ໃຜໃຊ້, ສຶກສາ, ດັດແປງ, ແລະແບ່ງປັນມັນ, ພາຍໃຕ້ເງື່ອນໄຂທີ່ສົມເຫດສົມຜົນ. ພາສາເສລີພາບຫຼັກນັ້ນມາຈາກຄໍານິຍາມແຫຼ່ງເປີດ ແລະຫຼັກການອັນຍາວນານຂອງສິດເສລີພາບຂອງຜູ້ໃຊ້ [1]. ບິດກັບ AI ແມ່ນວ່າມີສ່ວນປະກອບຫຼາຍກ່ວາພຽງແຕ່ລະຫັດ.
ບາງໂຄງການເຜີຍແຜ່ທຸກຢ່າງ: ລະຫັດ, ແຫຼ່ງຂໍ້ມູນການຝຶກອົບຮົມ, ສູດອາຫານ ແລະ ຮູບແບບທີ່ໄດ້ຮັບການຝຶກອົບຮົມ. ບາງໂຄງການປ່ອຍພຽງແຕ່ນ ້ຳໜັກ ທີ່ມີໃບອະນຸຍາດທີ່ກຳນົດເອງເທົ່ານັ້ນ. ລະບົບນິເວດໃຊ້ຕົວອັກສອນຫຍໍ້ທີ່ບໍ່ເປັນລະບຽບບາງຄັ້ງຄາວ, ສະນັ້ນໃຫ້ພວກເຮົາຈັດລະບຽບມັນໃນພາກຕໍ່ໄປ.
Open Source AI vs open weights vs open access 😅
ນີ້ແມ່ນບ່ອນທີ່ຄົນເວົ້າຜ່ານມາເຊິ່ງກັນແລະກັນ.
-
AI ແບບໂອເພນຊອສ — ໂຄງການດັ່ງກ່າວປະຕິບັດຕາມຫຼັກການໂອເພນຊອສໃນທົ່ວຊຸດຂອງມັນ. ລະຫັດແມ່ນຢູ່ພາຍໃຕ້ໃບອະນຸຍາດທີ່ໄດ້ຮັບການອະນຸມັດຈາກ OSI, ແລະເງື່ອນໄຂການແຈກຢາຍອະນຸຍາດໃຫ້ມີການນຳໃຊ້, ການດັດແປງ ແລະ ການແບ່ງປັນຢ່າງກວ້າງຂວາງ. ຈິດໃຈຢູ່ທີ່ນີ້ສະທ້ອນເຖິງສິ່ງທີ່ OSI ອະທິບາຍ: ອິດສະລະພາບຂອງຜູ້ໃຊ້ມາກ່ອນ [1][2].
-
ນ້ຳໜັກເປີດ — ນ້ຳໜັກແບບຈຳລອງທີ່ໄດ້ຮັບການຝຶກອົບຮົມສາມາດດາວໂຫຼດໄດ້ (ມັກຈະບໍ່ເສຍຄ່າ) ແຕ່ພາຍໃຕ້ເງື່ອນໄຂທີ່ກຳນົດເອງ. ທ່ານຈະເຫັນເງື່ອນໄຂການນຳໃຊ້, ຂໍ້ຈຳກັດການແຈກຢາຍຄືນໃໝ່, ຫຼືກົດລະບຽບການລາຍງານ. ຄອບຄົວ Llama ຂອງ Meta ສະແດງໃຫ້ເຫັນສິ່ງນີ້: ລະບົບນິເວດລະຫັດແມ່ນເປີດກວ້າງ, ແຕ່ນ້ຳໜັກແບບຈຳລອງຖືກສົ່ງພາຍໃຕ້ໃບອະນຸຍາດສະເພາະທີ່ມີເງື່ອນໄຂອີງໃສ່ການນຳໃຊ້ [4].
-
ການເຂົ້າເຖິງແບບເປີດ — ເຈົ້າສາມາດເຂົ້າເບິ່ງ API ໄດ້, ບາງທີອາດຈະບໍ່ເສຍຄ່າ, ແຕ່ເຈົ້າບໍ່ໄດ້ຮັບນ້ຳໜັກ. ເປັນປະໂຫຍດສຳລັບການທົດລອງ, ແຕ່ບໍ່ແມ່ນແຫຼ່ງເປີດ.
ນີ້ບໍ່ແມ່ນພຽງແຕ່ semantics. ສິດ ແລະຄວາມສ່ຽງຂອງທ່ານມີການປ່ຽນແປງໃນທົ່ວປະເພດເຫຼົ່ານີ້. ການເຮັດວຽກໃນປັດຈຸບັນຂອງ OSI ກ່ຽວກັບ AI ແລະການເປີດແປນ unpacks nuances ເຫຼົ່ານີ້ໃນພາສາທໍາມະດາ [2].
ສິ່ງທີ່ເຮັດໃຫ້ Open Source AI ຕົວຈິງດີ ✅
ຂໍໃຫ້ໄວແລະຊື່ສັດ.
-
ການກວດສອບໄດ້ — ທ່ານສາມາດອ່ານລະຫັດ, ກວດສອບສູດຂໍ້ມູນ, ແລະຕິດຕາມຂັ້ນຕອນການຝຶກອົບຮົມ. ສິ່ງນັ້ນຊ່ວຍໃນການປະຕິບັດຕາມ, ການທົບທວນຄວາມປອດໄພ, ແລະ ຄວາມຢາກຮູ້ຢາກເຫັນແບບເກົ່າ. ຂອບການຄຸ້ມຄອງຄວາມສ່ຽງ AI ຂອງ NIST ສົ່ງເສີມການເອກະສານ ແລະ ການປະຕິບັດຄວາມໂປ່ງໃສທີ່ໂຄງການເປີດສາມາດຕອບສະໜອງໄດ້ງ່າຍຂຶ້ນ [3].
-
ການປັບຕົວ — ເຈົ້າບໍ່ໄດ້ຖືກຜູກມັດໄວ້ໃນແຜນການຂອງຜູ້ຂາຍ. ແຍກມັນອອກ. ແກ້ໄຂມັນ. ສົ່ງມັນ. Lego, ບໍ່ແມ່ນພາດສະຕິກທີ່ຕິດກາວ.
-
ການຄວບຄຸມຄ່າໃຊ້ຈ່າຍ — ໂຮດດ້ວຍຕົນເອງເມື່ອມັນລາຄາຖືກກວ່າ. ເປີດຕົວເປັນຄລາວດ໌ເມື່ອມັນລາຄາຖືກກວ່າ. ປະສົມປະສານຮາດແວ.
-
ຄວາມໄວຂອງຊຸມຊົນ — ຂໍ້ຜິດພາດໄດ້ຮັບການແກ້ໄຂ, ມີພື້ນທີ່, ແລະ ເຈົ້າຮຽນຮູ້ຈາກເພື່ອນຮ່ວມງານ. ວຸ້ນວາຍບໍ? ບາງຄັ້ງ. ມີປະສິດທິພາບບໍ? ເລື້ອຍໆ.
-
ຄວາມຊັດເຈນດ້ານການຄຸ້ມຄອງ — ໃບອະນຸຍາດເປີດທີ່ແທ້ຈິງແມ່ນຄາດເດົາໄດ້. ປຽບທຽບກັບເງື່ອນໄຂການໃຫ້ບໍລິການ API ທີ່ມີການປ່ຽນແປງຢ່າງງຽບໆໃນວັນອັງຄານ.
ມັນສົມບູນແບບບໍ? ບໍ່. ແຕ່ການຄ້າຂາຍແມ່ນຖືກຕ້ອງ - ຫຼາຍກວ່າທີ່ທ່ານໄດ້ຮັບຈາກການບໍລິການກ່ອງດໍາຫຼາຍ.
Open Source AI stack: ລະຫັດ, ນ້ຳໜັກ, ຂໍ້ມູນ, ແລະກາວ🧩
ຄິດເຖິງໂຄງການ AI ຄືກັບລາຊາການາທີ່ແປກປະຫຼາດ. ຊັ້ນຢູ່ທົ່ວທຸກແຫ່ງ.
-
ເຟຣມເວີກ ແລະ ເວລາເຮັດວຽກ — ເຄື່ອງມືເພື່ອກຳນົດ, ຝຶກອົບຮົມ ແລະ ຮັບໃຊ້ຮູບແບບຕ່າງໆ (ເຊັ່ນ PyTorch, TensorFlow). ຊຸມຊົນ ແລະ ເອກະສານທີ່ມີສຸຂະພາບດີມີຄວາມສຳຄັນຫຼາຍກວ່າຊື່ແບຣນ.
-
ສະຖາປັດຕະຍະກຳແບບຈຳລອງ — ແຜນຜັງ: ໝໍ້ແປງໄຟຟ້າ, ແບບຈຳລອງການແຜ່ກະຈາຍ, ການຕັ້ງຄ່າທີ່ເພີ່ມການດຶງຂໍ້ມູນຄືນ.
-
ນ້ຳໜັກ — ພາລາມິເຕີທີ່ໄດ້ຮຽນຮູ້ໃນລະຫວ່າງການຝຶກອົບຮົມ. “ເປີດ” ຢູ່ທີ່ນີ້ແມ່ນຂຶ້ນກັບສິດໃນການແຈກຢາຍຄືນ ແລະ ສິດການນຳໃຊ້ທາງການຄ້າ, ບໍ່ພຽງແຕ່ການດາວໂຫຼດເທົ່ານັ້ນ.
-
ຂໍ້ມູນ ແລະ ສູດອາຫານ — ສະຄຣິບການຄັດເລືອກ, ຕົວກອງ, ການເພີ່ມ, ຕາຕະລາງການຝຶກອົບຮົມ. ຄວາມໂປ່ງໃສຢູ່ທີ່ນີ້ແມ່ນຄຳສຳຄັນສຳລັບຄວາມສາມາດໃນການເຮັດຊ້ຳໄດ້.
-
ເຄື່ອງມື ແລະ ການປະສານງານ — ເຊີບເວີການອະນຸມານ, ຖານຂໍ້ມູນເວັກເຕີ, ສາຍຮັດການປະເມີນຜົນ, ຄວາມສາມາດໃນການສັງເກດການ, CI/CD.
-
ການອອກໃບອະນຸຍາດ — ກະດູກສັນຫຼັງທີ່ງຽບສະຫງົບທີ່ຕັດສິນໃຈວ່າທ່ານສາມາດເຮັດຫຍັງໄດ້ແທ້ໆ. ເພີ່ມເຕີມຢູ່ດ້ານລຸ່ມ.
ໃບອະນຸຍາດ 101 ສໍາລັບ Open Source AI 📜
ທ່ານບໍ່ ຈຳ ເປັນຕ້ອງເປັນທະນາຍຄວາມ. ທ່ານ ຈຳ ເປັນຕ້ອງຊອກຫາຮູບແບບຕ່າງໆ.
-
ໃບອະນຸຍາດລະຫັດທີ່ອະນຸຍາດ — MIT, BSD, Apache-2.0. Apache ປະກອບມີການອະນຸຍາດສິດທິບັດຢ່າງຊັດເຈນທີ່ຫຼາຍທີມຊື່ນຊົມ [1].
-
ລິຂະສິດ - ຄອບຄົວ GPL ຮຽກຮ້ອງໃຫ້ອະນຸພັນຍັງຄົງເປີດຢູ່ພາຍໃຕ້ໃບອະນຸຍາດດຽວກັນ. ມີປະສິດທິພາບ, ແຕ່ວາງແຜນສຳລັບມັນໃນສະຖາປັດຕະຍະກຳຂອງທ່ານ.
-
ໃບອະນຸຍາດສະເພາະຮູບແບບ — ສຳລັບນ້ຳໜັກ ແລະ ຊຸດຂໍ້ມູນ, ທ່ານຈະເຫັນໃບອະນຸຍາດທີ່ກຳນົດເອງ ເຊັ່ນ: ໃບອະນຸຍາດຄອບຄົວ Responsible AI License (OpenRAIL). ສິ່ງເຫຼົ່ານີ້ເຂົ້າລະຫັດການອະນຸຍາດ ແລະ ຂໍ້ຈຳກັດທີ່ອີງໃສ່ການນຳໃຊ້; ບາງອັນອະນຸຍາດໃຫ້ນຳໃຊ້ເພື່ອການຄ້າຢ່າງກວ້າງຂວາງ, ບາງອັນເພີ່ມຮົ້ວກັ້ນເພື່ອຫຼີກລ່ຽງການໃຊ້ໃນທາງທີ່ຜິດ [5].
-
Creative Commons ສຳລັບຂໍ້ມູນ — CC-BY ຫຼື CC0 ແມ່ນໃຊ້ທົ່ວໄປສຳລັບຊຸດຂໍ້ມູນ ແລະ ເອກະສານ. ການລະບຸຕົວຕົນສາມາດຈັດການໄດ້ໃນຂະໜາດນ້ອຍ; ສ້າງຮູບແບບແຕ່ຫົວທີ.
Pro tip: ຮັກສາລາຍຊື່ຫນຶ່ງ pager ແຕ່ລະການເພິ່ງພາອາໃສ, ໃບອະນຸຍາດຂອງມັນ, ແລະວ່າການແຈກຢາຍຄືນໃຫມ່ທາງການຄ້າໄດ້ຖືກອະນຸຍາດຫຼືບໍ່. ເບື່ອ? ແມ່ນແລ້ວ. ຈໍາເປັນ? ຄືກັນ.
ຕາຕະລາງປຽບທຽບ: ໂຄງການ AI Open Source ຍອດນິຍົມ ແລະບ່ອນທີ່ພວກມັນສ່ອງແສງ 📊
ສັບສົນເລັກນ້ອຍກ່ຽວກັບຈຸດປະສົງ - ນັ້ນແມ່ນວິທີທີ່ບັນທຶກທີ່ແທ້ຈິງເບິ່ງ
| ເຄື່ອງມື / ໂຄງການ | ສຳລັບໃຜ | ລາຄາປະມານ | ເປັນຫຍັງມັນເຮັດວຽກໄດ້ດີ |
|---|---|---|---|
| PyTorch | ນັກຄົ້ນຄວ້າ, ວິສະວະກອນ | ຟຣີ | ກຣາຟແບບໄດນາມິກ, ຊຸມຊົນໃຫຍ່, ເອກະສານທີ່ເຂັ້ມແຂງ. ຮົບທົດສອບໃນຜະລິດຕະພັນ. |
| TensorFlow | ທີມງານວິສາຫະກິດ, ML ops | ຟຣີ | ໂໝດກຣາບ, TF-Serving, ຄວາມເລິກຂອງລະບົບນິເວດ. ການຮຽນຮູ້ທີ່ກ້າວຂຶ້ນສໍາລັບບາງຄົນ, ຍັງແຂງ. |
| ກອດຕົວຫັນໜ້າ | ຜູ້ກໍ່ສ້າງທີ່ມີກໍານົດເວລາ | ຟຣີ | ຮູບແບບທີ່ໄດ້ຝຶກອົບຮົມ, ທໍ່, ຊຸດຂໍ້ມູນ, ການປັບລະອຽດງ່າຍ. ດ້ວຍຄວາມຊື່ສັດທາງລັດ. |
| vLLM | ທີມງານທີ່ມີຈິດໃຈ Infra-minded | ຟຣີ | ການບໍລິການ LLM ໄວ, ແຄດ KV ທີ່ມີປະສິດທິພາບ, ການສົ່ງຂໍ້ມູນທີ່ເຂັ້ມແຂງໃນ GPUs ທົ່ວໄປ. |
| Llama.cpp | Tinkerers, ອຸປະກອນຂອບ | ຟຣີ | ແລ່ນແບບຈໍາລອງຢູ່ໃນເຄື່ອງໃນຄອມພິວເຕີໂນດບຸກ ແລະໂທລະສັບທີ່ມີປະລິມານ. |
| LangChain | App devs, ຕົວແບບ | ຟຣີ | ລະບົບຕ່ອງໂສ້ປະກອບ, ຕົວເຊື່ອມຕໍ່, ຕົວແທນ. ໄວຊະນະຖ້າທ່ານຮັກສາມັນງ່າຍດາຍ. |
| ການແຜ່ກະຈາຍຄົງທີ່ | ຄວາມຄິດສ້າງສັນ, ທີມງານຜະລິດຕະພັນ | ນ້ຳໜັກຟຣີ | ການສ້າງຮູບພາບໃນທ້ອງຖິ່ນຫຼືຟັງ; ຂະບວນການເຮັດວຽກຂະຫນາດໃຫຍ່ແລະ UI ທີ່ຢູ່ອ້ອມຮອບມັນ. |
| ໂອລາມາ | ນັກພັດທະນາຜູ້ທີ່ຮັກ CLIs ທ້ອງຖິ່ນ | ຟຣີ | ດຶງແລະແລ່ນຕົວແບບທ້ອງຖິ່ນ. ໃບອະນຸຍາດແຕກຕ່າງກັນໄປຕາມບັດແບບຈໍາລອງ—ເບິ່ງວ່າ. |
ແມ່ນແລ້ວ, "ຟຣີ." ການເປັນເຈົ້າພາບ, GPUs, ບ່ອນຈັດເກັບຂໍ້ມູນ, ແລະຊົ່ວໂມງຄົນບໍ່ເສຍເງິນ.
ວິທີທີ່ບໍລິສັດໃຊ້ Open Source AI ຕົວຈິງຢູ່ບ່ອນເຮັດວຽກ 🏢⚙️
ທ່ານຈະໄດ້ຍິນສອງຢ່າງທີ່ສຸດ: ທັງຫມົດທຸກຄົນຄວນຈະເປັນເຈົ້າພາບຂອງທຸກສິ່ງທຸກຢ່າງ, ຫຼືບໍ່ມີໃຜຄວນ. ຊີວິດທີ່ແທ້ຈິງແມ່ນ squishier.
-
ການສ້າງຕົ້ນແບບຢ່າງໄວວາ — ເລີ່ມຕົ້ນດ້ວຍຮູບແບບເປີດທີ່ອະນຸຍາດເພື່ອກວດສອບຄວາມຖືກຕ້ອງຂອງ UX ແລະຜົນກະທົບ. ປັບໂຄງສ້າງໃໝ່ໃນພາຍຫຼັງ.
-
ການບໍລິການແບບປະສົມ — ຮັກສາຮູບແບບທີ່ໂຮດໂດຍ VPC ຫຼື ໃນສະຖານທີ່ສຳລັບການໂທທີ່ລະອຽດອ່ອນຕໍ່ຄວາມເປັນສ່ວນຕົວ. ກັບຄືນໄປໃຊ້ API ທີ່ໂຮດໄວ້ສຳລັບການໂຫຼດແບບ long-tail ຫຼື spiky. ປົກກະຕິຫຼາຍ.
-
ການປັບແຕ່ງໃຫ້ເໝາະສົມກັບໜ້າວຽກທີ່ຄັບແຄບ — ການປັບຕົວຂອງໂດເມນມັກຈະດີກ່ວາຂະໜາດດິບ.
-
RAG ຢູ່ທົ່ວທຸກແຫ່ງ — ການສ້າງແບບເຕີມເຕີມທີ່ດຶງຂໍ້ມູນຄືນມາຊ່ວຍຫຼຸດຜ່ອນອາການຫຼອນໂດຍການເພີ່ມຄຳຕອບພື້ນຖານໃນຂໍ້ມູນຂອງທ່ານ. ຖານຂໍ້ມູນເວັກເຕີເປີດ ແລະ ອະແດບເຕີເຮັດໃຫ້ສິ່ງນີ້ສາມາດເຂົ້າເຖິງໄດ້ງ່າຍ.
-
Edge ແລະ ອອບລາຍ — ຮຸ່ນນ້ຳໜັກເບົາທີ່ລວບລວມມາສຳລັບແລັບທັອບ, ໂທລະສັບ ຫຼື ບຣາວເຊີ ຂະຫຍາຍພື້ນຜິວຜະລິດຕະພັນ.
-
ການປະຕິບັດຕາມ ແລະ ການກວດສອບ — ເນື່ອງຈາກທ່ານສາມາດກວດສອບຢ່າງລະອຽດໄດ້, ຜູ້ກວດສອບຈຶ່ງມີບາງສິ່ງບາງຢ່າງທີ່ເປັນຮູບປະທຳທີ່ຕ້ອງທົບທວນຄືນ. ຈັບຄູ່ກັບນະໂຍບາຍ AI ທີ່ມີຄວາມຮັບຜິດຊອບທີ່ເຊື່ອມໂຍງກັບໝວດໝູ່ RMF ຂອງ NIST ແລະ ຄຳແນະນຳກ່ຽວກັບເອກະສານ [3].
ໝາຍເຫດນ້ອຍໆໃນພາກສະໜາມ: ທີມງານ SaaS ທີ່ຄຳນຶງເຖິງຄວາມເປັນສ່ວນຕົວທີ່ຂ້ອຍເຄີຍເຫັນ (ຜູ້ໃຊ້ຕະຫຼາດກາງ, EU) ໄດ້ຮັບຮອງເອົາການຕັ້ງຄ່າແບບປະສົມ: ຮູບແບບເປີດຂະໜາດນ້ອຍໃນ VPC ສຳລັບ 80% ຂອງການຮ້ອງຂໍ; ລະເບີດໄປຫາ API ທີ່ໂຮດໄວ້ສຳລັບການກະຕຸ້ນສະພາບການທີ່ຫາຍາກ ແລະ ຍາວ. ພວກມັນຫຼຸດຜ່ອນຄວາມໜ່ວງຊ້າສຳລັບເສັ້ນທາງທົ່ວໄປ ແລະ ເຮັດໃຫ້ເອກະສານ DPIA ງ່າຍຂຶ້ນ - ໂດຍບໍ່ຕ້ອງຕົ້ມມະຫາສະໝຸດ.
ຄວາມສ່ຽງ ແລະ gotchas ທີ່ທ່ານຄວນວາງແຜນສໍາລັບ 🧨
ຂໍໃຫ້ຜູ້ໃຫຍ່ກ່ຽວກັບເລື່ອງນີ້.
-
ການເລື່ອນລອຍຂອງໃບອະນຸຍາດ — ການເກັບຮັກສາໃບອະນຸຍາດເລີ່ມຕົ້ນ MIT, ຫຼັງຈາກນັ້ນນ້ຳໜັກຈະຍ້າຍໄປທີ່ໃບອະນຸຍາດແບບກຳນົດເອງ. ຮັກສາການລົງທະບຽນພາຍໃນຂອງທ່ານໃຫ້ທັນສະໄໝ ຫຼື ທ່ານຈະສົ່ງຄວາມແປກໃຈກ່ຽວກັບການປະຕິບັດຕາມກົດລະບຽບ [2][4][5].
-
ແຫຼ່ງທີ່ມາຂອງຂໍ້ມູນ — ຂໍ້ມູນການຝຶກອົບຮົມທີ່ມີສິດ fuzzy ສາມາດໄຫຼເຂົ້າໄປໃນຮູບແບບຕ່າງໆ. ຕິດຕາມແຫຼ່ງຂໍ້ມູນ ແລະ ປະຕິບັດຕາມໃບອະນຸຍາດຊຸດຂໍ້ມູນ, ບໍ່ແມ່ນ vibes [5].
-
ຄວາມປອດໄພ — ປະຕິບັດຕໍ່ສິ່ງປະດິດຂອງຮູບແບບຄືກັບລະບົບຕ່ອງໂສ້ການສະໜອງອື່ນໆ: checksums, signed releases, SBOMs. ເຖິງແມ່ນວ່າ SECURITY.md ພຽງເລັກນ້ອຍກໍ່ຍັງເອົາຊະນະຄວາມງຽບໄດ້.
-
ຄວາມແຕກຕ່າງດ້ານຄຸນນະພາບ — ຮູບແບບເປີດແຕກຕ່າງກັນຢ່າງຫຼວງຫຼາຍ. ປະເມີນຜົນດ້ວຍໜ້າວຽກຂອງທ່ານ, ບໍ່ພຽງແຕ່ກະດານຈັດອັນດັບເທົ່ານັ້ນ.
-
ຄ່າໃຊ້ຈ່າຍພື້ນຖານທີ່ເຊື່ອງໄວ້ — ການອະນຸມານໄວຕ້ອງການ GPU, ການວັດແທກປະລິມານ, ການແບ່ງກຸ່ມ, ການເກັບຂໍ້ມູນຊົ່ວຄາວ. ເຄື່ອງມືເປີດຊ່ວຍໄດ້; ທ່ານຍັງຕ້ອງຈ່າຍເງິນໃນການຄຳນວນ.
-
ໜີ້ສິນດ້ານການຄຸ້ມຄອງ — ຖ້າບໍ່ມີໃຜເປັນເຈົ້າຂອງວົງຈອນຊີວິດຂອງຮູບແບບ, ທ່ານຈະໄດ້ຮັບ spaghetti ການຕັ້ງຄ່າ. ບັນຊີກວດສອບ MLOps ທີ່ມີນ້ຳໜັກເບົາແມ່ນຄຳ.
ການເລືອກລະດັບຄວາມເປີດທີ່ເໝາະສົມສຳລັບກໍລະນີໃຊ້ຂອງເຈົ້າ 🧭
ເສັ້ນທາງການຕັດສິນໃຈທີ່ບິດເບືອນເລັກນ້ອຍ:
-
ຕ້ອງການ ການຂົນສົ່ງໄວ ທີ່ມີຄວາມຕ້ອງການປະຕິບັດຕາມແສງສະຫວ່າງບໍ? ເລີ່ມຕົ້ນດ້ວຍຮູບແບບເປີດທີ່ອະນຸຍາດ, ການປັບແຕ່ງໜ້ອຍສຸດ, ການບໍລິການຟັງຄລາວ.
-
ຕ້ອງການ ຄວາມເປັນສ່ວນຕົວຢ່າງເຂັ້ມງວດ ຫຼື ອອຟໄລ ? ເລືອກສະເຕກເປີດທີ່ຮອງຮັບໄດ້ດີ, ການສົມມຸດຕິຖານຂອງເຈົ້າຂອງເອງ, ແລະທົບທວນໃບອະນຸຍາດຢ່າງລະມັດລະວັງ.
-
ຕ້ອງ ການສິດທິທາງການຄ້າຢ່າງກວ້າງຂວາງ ແລະການແຈກຢາຍຄືນໃຫມ່ບໍ? ຕ້ອງການລະຫັດທີ່ສອດຄ່ອງ OSI ບວກກັບໃບອະນຸຍາດແບບຈໍາລອງທີ່ອະນຸຍາດໃຫ້ນໍາໃຊ້ທາງການຄ້າແລະການແຈກຢາຍຄືນໃຫມ່ [1][5].
-
ຕ້ອງການ ຄວາມຍືດຫຍຸ່ນການຄົ້ນຄວ້າ? ອະນຸຍາດໃຫ້ສິ້ນສຸດເຖິງຈຸດຈົບ, ລວມທັງຂໍ້ມູນ, ສໍາລັບການສືບພັນ ແລະຄວາມສາມາດໃນການແບ່ງປັນ.
-
ບໍ່ແນ່ໃຈວ່າ? ນັກບິນທັງສອງ. ເສັ້ນທາງໜຶ່ງຈະຮູ້ສຶກດີຂຶ້ນໃນໜຶ່ງອາທິດ.
ວິທີການປະເມີນໂຄງການ Open Source AI ຄືກັບມືອາຊີບ 🔍
ບັນຊີລາຍການດ່ວນທີ່ຂ້ອຍເກັບໄວ້, ບາງຄັ້ງກໍ່ໃສ່ຜ້າເຊັດຕົວ.
-
ຄວາມຊັດເຈນຂອງໃບອະນຸຍາດ — ໄດ້ຮັບການອະນຸມັດຈາກ OSI ສຳລັບລະຫັດບໍ? ແລ້ວນ້ຳໜັກ ແລະ ຂໍ້ມູນລ่ะ? ມີຂໍ້ຈຳກັດການນຳໃຊ້ໃດໆທີ່ເຮັດໃຫ້ຮູບແບບທຸລະກິດຂອງທ່ານເສຍຫາຍ [1][2][5] ບໍ?
-
ເອກະສານ — ຕິດຕັ້ງ, ເລີ່ມຕົ້ນດ່ວນ, ຕົວຢ່າງ, ການແກ້ໄຂບັນຫາ. ເອກະສານແມ່ນຕົວຊີ້ບອກວັດທະນະທຳ.
-
ຈັງຫວະການປ່ອຍ — ການປ່ອຍ ແລະ ບັນທຶກການປ່ຽນແປງທີ່ມີແທັກຊີ້ບອກເຖິງຄວາມໝັ້ນຄົງ; ການຊຸກຍູ້ເປັນໄລຍະໆຊີ້ບອກເຖິງຄວາມກ້າຫານ.
-
ມາດຕະຖານ ແລະ ການປະເມີນຜົນ — ໜ້າວຽກເປັນຈິງບໍ? ການປະເມີນຜົນສາມາດດຳເນີນການໄດ້ບໍ?
-
ການບຳລຸງຮັກສາ ແລະ ການຄຸ້ມຄອງ — ເຈົ້າຂອງລະຫັດທີ່ຊັດເຈນ, ການຈັດປະເພດບັນຫາ, ການຕອບສະໜອງຕໍ່ PR.
-
ຄວາມເໝາະສົມກັບລະບົບນິເວດ — ໃຊ້ງານໄດ້ດີກັບຮາດແວ, ບ່ອນເກັບຂໍ້ມູນ, ການບັນທຶກ, ແລະ ການກວດສອບຄວາມຖືກຕ້ອງຂອງທ່ານ.
-
ທ່າທີຄວາມປອດໄພ — ສິ່ງປະດິດທີ່ເຊັນແລ້ວ, ການສະແກນການເພິ່ງພາອາໄສ, ການຈັດການ CVE.
-
ສັນຍານຊຸມຊົນ — ການສົນທະນາ, ຄຳຕອບໃນເວທີສົນທະນາ, ຕົວຢ່າງ repos.
ສໍາລັບການສອດຄ່ອງຢ່າງກວ້າງຂວາງກັບການປະຕິບັດທີ່ຫນ້າເຊື່ອຖື, ວາງແຜນຂະບວນການຂອງທ່ານກັບປະເພດ NIST AI RMF ແລະເອກະສານປອມ [3].
Deep dive 1: ກາງ messy ຂອງໃບອະນຸຍາດແບບຈໍາລອງ 🧪
ບາງຮຸ່ນທີ່ມີຄວາມສາມາດຫຼາຍທີ່ສຸດແມ່ນຢູ່ໃນຖັງ "ນ້ຳໜັກເປີດທີ່ມີເງື່ອນໄຂ". ພວກມັນສາມາດເຂົ້າເຖິງໄດ້, ແຕ່ມີຂໍ້ຈຳກັດການນຳໃຊ້ ຫຼື ກົດລະບຽບການແຈກຢາຍຄືນໃໝ່. ນັ້ນອາດຈະບໍ່ເປັນຫຍັງຖ້າຜະລິດຕະພັນຂອງທ່ານບໍ່ໄດ້ຂຶ້ນກັບການຫຸ້ມຫໍ່ຮຸ່ນຄືນໃໝ່ ຫຼື ການຂົນສົ່ງມັນໄປສູ່ສະພາບແວດລ້ອມຂອງລູກຄ້າ. ຖ້າທ່ານ ຕ້ອງ ການສິ່ງນັ້ນ, ໃຫ້ເຈລະຈາ ຫຼື ເລືອກຖານອື່ນ. ສິ່ງສຳຄັນແມ່ນການວາງ ຂອງທ່ານ ແຜນການດຳເນີນງານ ຕົວຈິງ , ບໍ່ແມ່ນບົດຄວາມໃນບລັອກ [4][5].
ໃບອະນຸຍາດແບບ OpenRAIL ພະຍາຍາມເຮັດໃຫ້ສົມດູນກັນ: ຊຸກຍູ້ໃຫ້ມີການຄົ້ນຄວ້າເປີດ ແລະແບ່ງປັນ, ໃນຂະນະທີ່ຂັດຂວາງການໃຊ້ໃນທາງທີ່ຜິດ. ເຈດຕະນາດີ; ພັນທະຍັງຄົງເປັນຂອງເຈົ້າ. ອ່ານຂໍ້ກໍານົດແລະຕັດສິນໃຈວ່າເງື່ອນໄຂທີ່ເຫມາະສົມກັບຄວາມຢາກອາຫານຄວາມສ່ຽງຂອງທ່ານຫຼືບໍ່ [5].
Deep dive 2: ຄວາມໂປ່ງໃສຂອງຂໍ້ມູນ ແລະນິທານການສືບພັນ 🧬
“ຖ້າບໍ່ມີການຖິ້ມຂໍ້ມູນເຕັມຮູບແບບ, AI ແບບໂອເພນຊອສກໍ່ເປັນຂອງປອມ.” ບໍ່ແມ່ນແທ້. ແຫຼ່ງ ແລະ ສູດອາຫານ ສາມາດສົ່ງຄວາມໂປ່ງໃສທີ່ມີຄວາມໝາຍເຖິງແມ່ນວ່າຊຸດຂໍ້ມູນດິບບາງຊຸດຈະຖືກຈຳກັດ. ທ່ານສາມາດບັນທຶກຕົວກອງ, ອັດຕາສ່ວນການເກັບຕົວຢ່າງ, ແລະ ການເຮັດຄວາມສະອາດການວິເຄາະຂໍ້ມູນໄດ້ດີພໍສຳລັບທີມອື່ນທີ່ຈະປະມານຜົນໄດ້ຮັບ. ຄວາມສາມາດໃນການສ້າງຊ້ຳໄດ້ຢ່າງສົມບູນແບບແມ່ນດີ. ຄວາມໂປ່ງໃສທີ່ສາມາດປະຕິບັດໄດ້ມັກຈະພຽງພໍ [3][5].
ເມື່ອຊຸດຂໍ້ມູນເປີດ, ລົດຊາດ Creative Commons ເຊັ່ນ CC-BY ຫຼື CC0 ແມ່ນທົ່ວໄປ. ການສະແດງຕາມຂະໜາດອາດເຮັດໃຫ້ງຸ່ມງ່າມໄດ້, ສະນັ້ນໃຫ້ມາດຕະຖານວິທີທີ່ເຈົ້າຈັດການມັນກ່ອນໄວອັນຄວນ.
Deep dive 3: ການປະຕິບັດ MLOps ສໍາລັບແບບເປີດ 🚢
ການຂົນສົ່ງແບບເປີດແມ່ນຄ້າຍຄືການຂົນສົ່ງບໍລິການໃດກໍ່ຕາມ, ບວກກັບ quirks ເລັກນ້ອຍ.
-
ຊັ້ນການໃຫ້ບໍລິການ — ເຊີບເວີການອະນຸມານພິເສດຊ່ວຍເພີ່ມປະສິດທິພາບການ batching, ການຈັດການ KV-cache, ແລະ ການຖ່າຍທອດສົດໂທເຄັນ.
-
ການວັດແທກປະລິມານ — ນ້ຳໜັກທີ່ນ້ອຍກວ່າ → ການອະນຸມານທີ່ລາຄາຖືກກວ່າ ແລະ ການນຳໃຊ້ຂອບທີ່ງ່າຍຂຶ້ນ. ການແລກປ່ຽນຄຸນນະພາບແຕກຕ່າງກັນ; ວັດແທກດ້ວຍ ຂອງທ່ານ .
-
ຄວາມສາມາດໃນການສັງເກດການ — ບັນທຶກການກະຕຸ້ນ/ຜົນຜະລິດໂດຍຄຳນຶງເຖິງຄວາມເປັນສ່ວນຕົວ. ຕົວຢ່າງສຳລັບການປະເມີນຜົນ. ເພີ່ມການກວດສອບການເລື່ອນລອຍຄືກັບທີ່ທ່ານຕ້ອງການສຳລັບ ML ແບບດັ້ງເດີມ.
-
ການອັບເດດ — ຮູບແບບສາມາດປ່ຽນແປງພຶດຕິກຳໄດ້ຢ່າງລະອຽດ; ໃຊ້ນົກກະຈອກເທດ ແລະ ເກັບຮັກສາບ່ອນເກັບຂໍ້ມູນໄວ້ເພື່ອການຍ້ອນກັບ ແລະ ການກວດສອບ.
-
ການຄວບຄຸມການປະເມີນຜົນ — ຮັກສາຊຸດການປະເມີນຜົນສະເພາະໜ້າວຽກ, ບໍ່ພຽງແຕ່ມາດຕະຖານທົ່ວໄປເທົ່ານັ້ນ. ລວມເອົາການກະຕຸ້ນເຕືອນກ່ຽວກັບຄູ່ແຂ່ງ ແລະ ງົບປະມານຄວາມຊັກຊ້າ.
ແຜນຜັງຂະໜາດນ້ອຍ: ຈາກສູນໄປຫານັກບິນທີ່ໃຊ້ໄດ້ໃນ 10 ຂັ້ນຕອນ 🗺️
-
ກໍານົດຫນຶ່ງຫນ້າວຽກແຄບແລະ metric. ບໍ່ມີເວທີອັນຍິ່ງໃຫຍ່ເທື່ອ.
-
ເລືອກຮູບແບບພື້ນຖານທີ່ໄດ້ຮັບອະນຸຍາດທີ່ໃຊ້ຢ່າງກວ້າງຂວາງ ແລະເປັນເອກະສານທີ່ດີ.
-
ຢືນຂຶ້ນ inference ທ້ອງຖິ່ນແລະ API wrapper ບາງໆ. ຮັກສາມັນຫນ້າເບື່ອ.
-
ເພີ່ມການດຶງຂໍ້ມູນໃສ່ຂໍ້ມູນພື້ນຖານໃນຂໍ້ມູນຂອງທ່ານ.
-
ກະກຽມຊຸດ eval ທີ່ມີປ້າຍນ້ອຍໆທີ່ສະທ້ອນເຖິງຜູ້ໃຊ້ຂອງທ່ານ, warts ແລະທັງຫມົດ.
-
ການປບັລະອຽດ ຫຼືປບັທັນທີຫາກ eval ເວົ້າວ່າທ່ານຄວນ.
-
Quantize ຖ້າ latency ຫຼືຄ່າໃຊ້ຈ່າຍກັດ. ວັດແທກຄຸນນະພາບຄືນໃໝ່.
-
ເພີ່ມການບັນທຶກ, ການເຕືອນໃຫ້ທີມສີແດງ, ແລະນະໂຍບາຍການລ່ວງລະເມີດ.
-
ປະຕູທີ່ມີທຸງຄຸນສົມບັດແລະປ່ອຍໄປຫາກຸ່ມນ້ອຍ.
-
ເຮັດຊ້ຳ. ສົ່ງການປັບປຸງເລັກນ້ອຍຕໍ່ອາທິດ… ຫຼືເມື່ອມັນດີຂຶ້ນແທ້ໆ.
myths ທົ່ວໄປກ່ຽວກັບ Open Source AI, debunked ເລັກນ້ອຍ 🧱
-
Myth: ແບບເປີດແມ່ນສະເຫມີໄປຮ້າຍແຮງກວ່າເກົ່າ. ຄວາມເປັນຈິງ: ສໍາລັບວຽກງານເປົ້າຫມາຍທີ່ມີຂໍ້ມູນທີ່ຖືກຕ້ອງ, ຮູບແບບເປີດທີ່ປັບລະອຽດສາມາດປະຕິບັດຫນ້າທີ່ເປັນເຈົ້າພາບຂະຫນາດໃຫຍ່ກວ່າ.
-
Myth: ເປີດຫມາຍຄວາມວ່າບໍ່ປອດໄພ. ຄວາມເປັນຈິງ: ການເປີດກວ້າງສາມາດປັບປຸງການກວດສອບໄດ້. ຄວາມປອດໄພແມ່ນຂຶ້ນກັບການປະຕິບັດ, ບໍ່ແມ່ນຄວາມລັບ [3].
-
ຄວາມຫຼົງຜິດ: ໃບອະນຸຍາດບໍ່ສຳຄັນຖ້າມັນບໍ່ເສຍຄ່າ. ຄວາມເປັນຈິງ: ມັນສຳຄັນ ທີ່ສຸດ ເມື່ອມັນບໍ່ເສຍຄ່າ, ເພາະວ່າການຟຣີຈະຂະຫຍາຍການນຳໃຊ້. ທ່ານຕ້ອງການສິດທີ່ຊັດເຈນ, ບໍ່ແມ່ນຄວາມຮູ້ສຶກ [1][5].
Open Source AI 🧠✨
Open Source AI ບໍ່ແມ່ນສາສະຫນາ. ມັນເປັນຊຸດຂອງສິດເສລີພາບໃນການປະຕິບັດທີ່ຊ່ວຍໃຫ້ທ່ານສ້າງດ້ວຍການຄວບຄຸມຫຼາຍຂຶ້ນ, ການປົກຄອງທີ່ຊັດເຈນກວ່າ, ແລະເຮັດຊ້ໍາອີກໄວ. ເມື່ອມີຄົນເວົ້າວ່າຕົວແບບແມ່ນ "ເປີດ", ຖາມວ່າຊັ້ນໃດເປີດ: ລະຫັດ, ນ້ໍາຫນັກ, ຂໍ້ມູນ, ຫຼືພຽງແຕ່ເຂົ້າເຖິງ. ອ່ານໃບອະນຸຍາດ. ປຽບທຽບມັນກັບກໍລະນີການນໍາໃຊ້ຂອງທ່ານ. ແລະຫຼັງຈາກນັ້ນ, ສໍາຄັນ, ທົດສອບມັນກັບວຽກງານທີ່ແທ້ຈິງຂອງທ່ານ.
ສ່ວນທີ່ດີທີ່ສຸດ, ແປກ, ແມ່ນວັດທະນະທໍາ: ໂຄງການເປີດໄດ້ເຊື້ອເຊີນການປະກອບສ່ວນແລະການກວດສອບ, ເຊິ່ງມັກຈະເຮັດໃຫ້ທັງຊອບແວແລະຄົນດີຂຶ້ນ. ທ່ານອາດຈະຄົ້ນພົບວ່າການເຄື່ອນໄຫວທີ່ຊະນະບໍ່ແມ່ນຕົວແບບທີ່ໃຫຍ່ທີ່ສຸດຫຼືຕົວຊີ້ບອກທີ່ໄວທີ່ສຸດ, ແຕ່ເປັນແບບທີ່ເຈົ້າສາມາດເຂົ້າໃຈ, ແກ້ໄຂແລະປັບປຸງໃນອາທິດຫນ້າ. ນັ້ນແມ່ນພະລັງທີ່ງຽບສະຫງົບຂອງ Open Source AI - ບໍ່ແມ່ນລູກປືນເງິນ, ຄືກັບເຄື່ອງມືຫຼາຍອັນທີ່ໃສ່ດີທີ່ຊ່ວຍປະຫຍັດມື້.
ດົນເກີນໄປບໍ່ໄດ້ອ່ານ📝
Open Source AI ແມ່ນກ່ຽວກັບສິດເສລີພາບທີ່ມີຄວາມຫມາຍໃນການນໍາໃຊ້, ການສຶກສາ, ດັດແກ້, ແລະແບ່ງປັນລະບົບ AI. ມັນສະແດງໃນທົ່ວຊັ້ນຕ່າງໆ: ກອບ, ແບບຈໍາລອງ, ຂໍ້ມູນ, ແລະເຄື່ອງມື. ຢ່າສັບສົນແຫຼ່ງເປີດທີ່ມີນ້ໍາຫນັກເປີດຫຼືການເຂົ້າເຖິງທີ່ເປີດ. ກວດສອບໃບອະນຸຍາດ, ການປະເມີນຜົນກັບວຽກງານທີ່ແທ້ຈິງຂອງທ່ານ, ແລະການອອກແບບສໍາລັບການຄວາມປອດໄພແລະການຄຸ້ມຄອງຈາກມື້ຫນຶ່ງ. ເຮັດແນວນັ້ນ, ແລະທ່ານໄດ້ຮັບຄວາມໄວ, ການຄວບຄຸມ, ແລະແຜນທີ່ເສັ້ນທາງທີ່ສະຫງົບກວ່າ. ເປັນເລື່ອງແປກທີ່ຫາຍາກ, ຊື່ສັດບໍ່ມີຄ່າ🙃.
ເອກະສານອ້າງອີງ
[1] ໂຄງການ Open Source Initiative - ຄຳນິຍາມ Open Source (OSD): ອ່ານຕື່ມ
[2] OSI - ເຈາະເລິກກ່ຽວກັບ AI ແລະ ຄວາມເປີດເຜີຍ: ອ່ານຕື່ມ
[3] NIST - ຂອບການຄຸ້ມຄອງຄວາມສ່ຽງ AI: ອ່ານຕື່ມ
[4] ໃບອະນຸຍາດແບບ Meta - Llama: ອ່ານຕື່ມ
[5] ໃບອະນຸຍາດ AI ທີ່ມີຄວາມຮັບຜິດຊອບ (OpenRAIL): ອ່ານຕື່ມ