AI ແບບເປີດແມ່ນຫຍັງ

AI ແບບເປີດແມ່ນຫຍັງ?

AI ແບບໂອເພນຊອສຖືກເວົ້າເຖິງຄືກັບວ່າມັນເປັນກະແຈວິເສດທີ່ປົດລັອກທຸກຢ່າງ. ມັນບໍ່ແມ່ນ. ແຕ່ມັນ ເປັນ ວິທີທີ່ໃຊ້ໄດ້ຈິງ ແລະ ບໍ່ຕ້ອງຂໍອະນຸຍາດໃນການສ້າງລະບົບ AI ທີ່ທ່ານສາມາດເຂົ້າໃຈ, ປັບປຸງ ແລະ ຈັດສົ່ງໄດ້ໂດຍບໍ່ຕ້ອງຂໍໃຫ້ຜູ້ຂາຍປ່ຽນໃຈ. ຖ້າທ່ານສົງໄສວ່າສິ່ງໃດນັບວ່າເປັນ "ເປີດ", ສິ່ງໃດຄືການຕະຫຼາດ, ແລະວິທີການນຳໃຊ້ມັນໃນບ່ອນເຮັດວຽກ, ທ່ານຢູ່ໃນສະຖານທີ່ທີ່ຖືກຕ້ອງແລ້ວ. ດື່ມກາເຟ - ສິ່ງນີ້ຈະເປັນປະໂຫຍດ, ແລະ ບາງທີອາດຈະເປັນຄວາມຄິດເຫັນເລັກນ້ອຍ ☕🙂.

ບົດຄວາມທີ່ທ່ານອາດຈະຢາກອ່ານຫຼັງຈາກບົດຄວາມນີ້:

🔗 ວິທີການລວມເອົາ AI ເຂົ້າໃນທຸລະກິດຂອງທ່ານ
ຂັ້ນຕອນການປະຕິບັດຕົວຈິງເພື່ອປະສົມປະສານເຄື່ອງມື AI ເພື່ອການເຕີບໂຕຂອງທຸລະກິດທີ່ສະຫຼາດກວ່າ.

🔗 ວິທີການໃຊ້ AI ເພື່ອໃຫ້ມີປະສິດທິພາບຫຼາຍຂຶ້ນ
ຄົ້ນພົບຂະບວນການເຮັດວຽກ AI ທີ່ມີປະສິດທິພາບທີ່ຊ່ວຍປະຢັດເວລາ ແລະ ເພີ່ມປະສິດທິພາບ.

🔗 ທັກສະ AI ແມ່ນຫຍັງ?
ຮຽນຮູ້ຄວາມສາມາດດ້ານ AI ທີ່ສຳຄັນທີ່ຈຳເປັນສຳລັບຜູ້ຊ່ຽວຊານທີ່ພ້ອມສຳລັບອະນາຄົດ.

🔗 Google Vertex AI ແມ່ນຫຍັງ
ເຂົ້າໃຈ Vertex AI ຂອງ Google ແລະວິທີທີ່ມັນປັບປຸງການຮຽນຮູ້ຂອງເຄື່ອງຈັກ.


Open Source AI ແມ່ນຫຍັງ? 🤖🔓

ທີ່ງ່າຍທີ່ສຸດ, Open Source AI ຫມາຍຄວາມວ່າສ່ວນປະກອບຂອງລະບົບ AI - ລະຫັດ, ນ້ໍາຫນັກຕົວແບບ, ທໍ່ຂໍ້ມູນ, scripts ການຝຶກອົບຮົມ, ແລະເອກະສານ - ຖືກປ່ອຍອອກມາພາຍໃຕ້ໃບອະນຸຍາດທີ່ໃຫ້ໃຜໃຊ້, ສຶກສາ, ດັດແປງ, ແລະແບ່ງປັນມັນ, ພາຍໃຕ້ເງື່ອນໄຂທີ່ສົມເຫດສົມຜົນ. ພາສາເສລີພາບຫຼັກນັ້ນມາຈາກຄໍານິຍາມແຫຼ່ງເປີດ ແລະຫຼັກການອັນຍາວນານຂອງສິດເສລີພາບຂອງຜູ້ໃຊ້ [1]. ບິດກັບ AI ແມ່ນວ່າມີສ່ວນປະກອບຫຼາຍກ່ວາພຽງແຕ່ລະຫັດ.

ບາງໂຄງການເຜີຍແຜ່ທຸກຢ່າງ: ລະຫັດ, ແຫຼ່ງຂໍ້ມູນການຝຶກອົບຮົມ, ສູດອາຫານ ແລະ ຮູບແບບທີ່ໄດ້ຮັບການຝຶກອົບຮົມ. ບາງໂຄງການປ່ອຍພຽງແຕ່ນ ້ຳໜັກ ທີ່ມີໃບອະນຸຍາດທີ່ກຳນົດເອງເທົ່ານັ້ນ. ລະບົບນິເວດໃຊ້ຕົວອັກສອນຫຍໍ້ທີ່ບໍ່ເປັນລະບຽບບາງຄັ້ງຄາວ, ສະນັ້ນໃຫ້ພວກເຮົາຈັດລະບຽບມັນໃນພາກຕໍ່ໄປ.


Open Source AI vs open weights vs open access 😅

ນີ້ແມ່ນບ່ອນທີ່ຄົນເວົ້າຜ່ານມາເຊິ່ງກັນແລະກັນ.

  • AI ແບບໂອເພນຊອສ — ໂຄງການດັ່ງກ່າວປະຕິບັດຕາມຫຼັກການໂອເພນຊອສໃນທົ່ວຊຸດຂອງມັນ. ລະຫັດແມ່ນຢູ່ພາຍໃຕ້ໃບອະນຸຍາດທີ່ໄດ້ຮັບການອະນຸມັດຈາກ OSI, ແລະເງື່ອນໄຂການແຈກຢາຍອະນຸຍາດໃຫ້ມີການນຳໃຊ້, ການດັດແປງ ແລະ ການແບ່ງປັນຢ່າງກວ້າງຂວາງ. ຈິດໃຈຢູ່ທີ່ນີ້ສະທ້ອນເຖິງສິ່ງທີ່ OSI ອະທິບາຍ: ອິດສະລະພາບຂອງຜູ້ໃຊ້ມາກ່ອນ [1][2].

  • ນ້ຳໜັກເປີດ — ນ້ຳໜັກແບບຈຳລອງທີ່ໄດ້ຮັບການຝຶກອົບຮົມສາມາດດາວໂຫຼດໄດ້ (ມັກຈະບໍ່ເສຍຄ່າ) ແຕ່ພາຍໃຕ້ເງື່ອນໄຂທີ່ກຳນົດເອງ. ທ່ານຈະເຫັນເງື່ອນໄຂການນຳໃຊ້, ຂໍ້ຈຳກັດການແຈກຢາຍຄືນໃໝ່, ຫຼືກົດລະບຽບການລາຍງານ. ຄອບຄົວ Llama ຂອງ Meta ສະແດງໃຫ້ເຫັນສິ່ງນີ້: ລະບົບນິເວດລະຫັດແມ່ນເປີດກວ້າງ, ແຕ່ນ້ຳໜັກແບບຈຳລອງຖືກສົ່ງພາຍໃຕ້ໃບອະນຸຍາດສະເພາະທີ່ມີເງື່ອນໄຂອີງໃສ່ການນຳໃຊ້ [4].

  • ການເຂົ້າເຖິງແບບເປີດ — ເຈົ້າສາມາດເຂົ້າເບິ່ງ API ໄດ້, ບາງທີອາດຈະບໍ່ເສຍຄ່າ, ແຕ່ເຈົ້າບໍ່ໄດ້ຮັບນ້ຳໜັກ. ເປັນປະໂຫຍດສຳລັບການທົດລອງ, ແຕ່ບໍ່ແມ່ນແຫຼ່ງເປີດ.

ນີ້ບໍ່ແມ່ນພຽງແຕ່ semantics. ສິດ ແລະຄວາມສ່ຽງຂອງທ່ານມີການປ່ຽນແປງໃນທົ່ວປະເພດເຫຼົ່ານີ້. ການເຮັດວຽກໃນປັດຈຸບັນຂອງ OSI ກ່ຽວກັບ AI ແລະການເປີດແປນ unpacks nuances ເຫຼົ່ານີ້ໃນພາສາທໍາມະດາ [2].


ສິ່ງທີ່ເຮັດໃຫ້ Open Source AI ຕົວຈິງດີ ✅

ຂໍໃຫ້ໄວແລະຊື່ສັດ.

  • ການກວດສອບໄດ້ — ທ່ານສາມາດອ່ານລະຫັດ, ກວດສອບສູດຂໍ້ມູນ, ແລະຕິດຕາມຂັ້ນຕອນການຝຶກອົບຮົມ. ສິ່ງນັ້ນຊ່ວຍໃນການປະຕິບັດຕາມ, ການທົບທວນຄວາມປອດໄພ, ແລະ ຄວາມຢາກຮູ້ຢາກເຫັນແບບເກົ່າ. ຂອບການຄຸ້ມຄອງຄວາມສ່ຽງ AI ຂອງ NIST ສົ່ງເສີມການເອກະສານ ແລະ ການປະຕິບັດຄວາມໂປ່ງໃສທີ່ໂຄງການເປີດສາມາດຕອບສະໜອງໄດ້ງ່າຍຂຶ້ນ [3].

  • ການປັບຕົວ — ເຈົ້າບໍ່ໄດ້ຖືກຜູກມັດໄວ້ໃນແຜນການຂອງຜູ້ຂາຍ. ແຍກມັນອອກ. ແກ້ໄຂມັນ. ສົ່ງມັນ. Lego, ບໍ່ແມ່ນພາດສະຕິກທີ່ຕິດກາວ.

  • ການຄວບຄຸມຄ່າໃຊ້ຈ່າຍ — ໂຮດດ້ວຍຕົນເອງເມື່ອມັນລາຄາຖືກກວ່າ. ເປີດຕົວເປັນຄລາວດ໌ເມື່ອມັນລາຄາຖືກກວ່າ. ປະສົມປະສານຮາດແວ.

  • ຄວາມໄວຂອງຊຸມຊົນ — ຂໍ້ຜິດພາດໄດ້ຮັບການແກ້ໄຂ, ມີພື້ນທີ່, ແລະ ເຈົ້າຮຽນຮູ້ຈາກເພື່ອນຮ່ວມງານ. ວຸ້ນວາຍບໍ? ບາງຄັ້ງ. ມີປະສິດທິພາບບໍ? ເລື້ອຍໆ.

  • ຄວາມຊັດເຈນດ້ານການຄຸ້ມຄອງ — ໃບອະນຸຍາດເປີດທີ່ແທ້ຈິງແມ່ນຄາດເດົາໄດ້. ປຽບທຽບກັບເງື່ອນໄຂການໃຫ້ບໍລິການ API ທີ່ມີການປ່ຽນແປງຢ່າງງຽບໆໃນວັນອັງຄານ.

ມັນສົມບູນແບບບໍ? ບໍ່. ແຕ່ການຄ້າຂາຍແມ່ນຖືກຕ້ອງ - ຫຼາຍກວ່າທີ່ທ່ານໄດ້ຮັບຈາກການບໍລິການກ່ອງດໍາຫຼາຍ.


Open Source AI stack: ລະຫັດ, ນ້ຳໜັກ, ຂໍ້ມູນ, ແລະກາວ🧩

ຄິດເຖິງໂຄງການ AI ຄືກັບລາຊາການາທີ່ແປກປະຫຼາດ. ຊັ້ນຢູ່ທົ່ວທຸກແຫ່ງ.

  1. ເຟຣມເວີກ ແລະ ເວລາເຮັດວຽກ — ເຄື່ອງມືເພື່ອກຳນົດ, ຝຶກອົບຮົມ ແລະ ຮັບໃຊ້ຮູບແບບຕ່າງໆ (ເຊັ່ນ PyTorch, TensorFlow). ຊຸມຊົນ ແລະ ເອກະສານທີ່ມີສຸຂະພາບດີມີຄວາມສຳຄັນຫຼາຍກວ່າຊື່ແບຣນ.

  2. ສະຖາປັດຕະຍະກຳແບບຈຳລອງ — ແຜນຜັງ: ໝໍ້ແປງໄຟຟ້າ, ແບບຈຳລອງການແຜ່ກະຈາຍ, ການຕັ້ງຄ່າທີ່ເພີ່ມການດຶງຂໍ້ມູນຄືນ.

  3. ນ້ຳໜັກ — ພາລາມິເຕີທີ່ໄດ້ຮຽນຮູ້ໃນລະຫວ່າງການຝຶກອົບຮົມ. “ເປີດ” ຢູ່ທີ່ນີ້ແມ່ນຂຶ້ນກັບສິດໃນການແຈກຢາຍຄືນ ແລະ ສິດການນຳໃຊ້ທາງການຄ້າ, ບໍ່ພຽງແຕ່ການດາວໂຫຼດເທົ່ານັ້ນ.

  4. ຂໍ້ມູນ ແລະ ສູດອາຫານ — ສະຄຣິບການຄັດເລືອກ, ຕົວກອງ, ການເພີ່ມ, ຕາຕະລາງການຝຶກອົບຮົມ. ຄວາມໂປ່ງໃສຢູ່ທີ່ນີ້ແມ່ນຄຳສຳຄັນສຳລັບຄວາມສາມາດໃນການເຮັດຊ້ຳໄດ້.

  5. ເຄື່ອງມື ແລະ ການປະສານງານ — ເຊີບເວີການອະນຸມານ, ຖານຂໍ້ມູນເວັກເຕີ, ສາຍຮັດການປະເມີນຜົນ, ຄວາມສາມາດໃນການສັງເກດການ, CI/CD.

  6. ການອອກໃບອະນຸຍາດ — ກະດູກສັນຫຼັງທີ່ງຽບສະຫງົບທີ່ຕັດສິນໃຈວ່າທ່ານສາມາດເຮັດຫຍັງໄດ້ແທ້ໆ. ເພີ່ມເຕີມຢູ່ດ້ານລຸ່ມ.


ໃບອະນຸຍາດ 101 ສໍາລັບ Open Source AI 📜

ທ່ານບໍ່ ຈຳ ເປັນຕ້ອງເປັນທະນາຍຄວາມ. ທ່ານ ຈຳ ເປັນຕ້ອງຊອກຫາຮູບແບບຕ່າງໆ.

  • ໃບອະນຸຍາດລະຫັດທີ່ອະນຸຍາດ — MIT, BSD, Apache-2.0. Apache ປະກອບມີການອະນຸຍາດສິດທິບັດຢ່າງຊັດເຈນທີ່ຫຼາຍທີມຊື່ນຊົມ [1].

  • ລິຂະສິດ - ຄອບຄົວ GPL ຮຽກຮ້ອງໃຫ້ອະນຸພັນຍັງຄົງເປີດຢູ່ພາຍໃຕ້ໃບອະນຸຍາດດຽວກັນ. ມີປະສິດທິພາບ, ແຕ່ວາງແຜນສຳລັບມັນໃນສະຖາປັດຕະຍະກຳຂອງທ່ານ.

  • ໃບອະນຸຍາດສະເພາະຮູບແບບ — ສຳລັບນ້ຳໜັກ ແລະ ຊຸດຂໍ້ມູນ, ທ່ານຈະເຫັນໃບອະນຸຍາດທີ່ກຳນົດເອງ ເຊັ່ນ: ໃບອະນຸຍາດຄອບຄົວ Responsible AI License (OpenRAIL). ສິ່ງເຫຼົ່ານີ້ເຂົ້າລະຫັດການອະນຸຍາດ ແລະ ຂໍ້ຈຳກັດທີ່ອີງໃສ່ການນຳໃຊ້; ບາງອັນອະນຸຍາດໃຫ້ນຳໃຊ້ເພື່ອການຄ້າຢ່າງກວ້າງຂວາງ, ບາງອັນເພີ່ມຮົ້ວກັ້ນເພື່ອຫຼີກລ່ຽງການໃຊ້ໃນທາງທີ່ຜິດ [5].

  • Creative Commons ສຳລັບຂໍ້ມູນ — CC-BY ຫຼື CC0 ແມ່ນໃຊ້ທົ່ວໄປສຳລັບຊຸດຂໍ້ມູນ ແລະ ເອກະສານ. ການລະບຸຕົວຕົນສາມາດຈັດການໄດ້ໃນຂະໜາດນ້ອຍ; ສ້າງຮູບແບບແຕ່ຫົວທີ.

Pro tip: ຮັກສາລາຍຊື່ຫນຶ່ງ pager ແຕ່ລະການເພິ່ງພາອາໃສ, ໃບອະນຸຍາດຂອງມັນ, ແລະວ່າການແຈກຢາຍຄືນໃຫມ່ທາງການຄ້າໄດ້ຖືກອະນຸຍາດຫຼືບໍ່. ເບື່ອ? ແມ່ນແລ້ວ. ຈໍາເປັນ? ຄືກັນ.


ຕາຕະລາງປຽບທຽບ: ໂຄງການ AI Open Source ຍອດນິຍົມ ແລະບ່ອນທີ່ພວກມັນສ່ອງແສງ 📊

ສັບສົນເລັກນ້ອຍກ່ຽວກັບຈຸດປະສົງ - ນັ້ນແມ່ນວິທີທີ່ບັນທຶກທີ່ແທ້ຈິງເບິ່ງ

ເຄື່ອງມື / ໂຄງການ ສຳລັບໃຜ ລາຄາປະມານ ເປັນຫຍັງມັນເຮັດວຽກໄດ້ດີ
PyTorch ນັກຄົ້ນຄວ້າ, ວິສະວະກອນ ຟຣີ ກຣາຟແບບໄດນາມິກ, ຊຸມຊົນໃຫຍ່, ເອກະສານທີ່ເຂັ້ມແຂງ. ຮົບທົດສອບໃນຜະລິດຕະພັນ.
TensorFlow ທີມງານວິສາຫະກິດ, ML ops ຟຣີ ໂໝດກຣາບ, TF-Serving, ຄວາມເລິກຂອງລະບົບນິເວດ. ການຮຽນຮູ້ທີ່ກ້າວຂຶ້ນສໍາລັບບາງຄົນ, ຍັງແຂງ.
ກອດຕົວຫັນໜ້າ ຜູ້ກໍ່ສ້າງທີ່ມີກໍານົດເວລາ ຟຣີ ຮູບແບບທີ່ໄດ້ຝຶກອົບຮົມ, ທໍ່, ຊຸດຂໍ້ມູນ, ການປັບລະອຽດງ່າຍ. ດ້ວຍຄວາມຊື່ສັດທາງລັດ.
vLLM ທີມງານທີ່ມີຈິດໃຈ Infra-minded ຟຣີ ການບໍລິການ LLM ໄວ, ແຄດ KV ທີ່ມີປະສິດທິພາບ, ການສົ່ງຂໍ້ມູນທີ່ເຂັ້ມແຂງໃນ GPUs ທົ່ວໄປ.
Llama.cpp Tinkerers, ອຸປະກອນຂອບ ຟຣີ ແລ່ນແບບຈໍາລອງຢູ່ໃນເຄື່ອງໃນຄອມພິວເຕີໂນດບຸກ ແລະໂທລະສັບທີ່ມີປະລິມານ.
LangChain App devs, ຕົວແບບ ຟຣີ ລະບົບຕ່ອງໂສ້ປະກອບ, ຕົວເຊື່ອມຕໍ່, ຕົວແທນ. ໄວຊະນະຖ້າທ່ານຮັກສາມັນງ່າຍດາຍ.
ການແຜ່ກະຈາຍຄົງທີ່ ຄວາມຄິດສ້າງສັນ, ທີມງານຜະລິດຕະພັນ ນ້ຳໜັກຟຣີ ການສ້າງຮູບພາບໃນທ້ອງຖິ່ນຫຼືຟັງ; ຂະບວນການເຮັດວຽກຂະຫນາດໃຫຍ່ແລະ UI ທີ່ຢູ່ອ້ອມຮອບມັນ.
ໂອລາມາ ນັກພັດທະນາຜູ້ທີ່ຮັກ CLIs ທ້ອງຖິ່ນ ຟຣີ ດຶງແລະແລ່ນຕົວແບບທ້ອງຖິ່ນ. ໃບອະນຸຍາດແຕກຕ່າງກັນໄປຕາມບັດແບບຈໍາລອງ—ເບິ່ງວ່າ.

ແມ່ນແລ້ວ, "ຟຣີ." ການເປັນເຈົ້າພາບ, GPUs, ບ່ອນຈັດເກັບຂໍ້ມູນ, ແລະຊົ່ວໂມງຄົນບໍ່ເສຍເງິນ.


ວິທີທີ່ບໍລິສັດໃຊ້ Open Source AI ຕົວຈິງຢູ່ບ່ອນເຮັດວຽກ 🏢⚙️

ທ່ານ​ຈະ​ໄດ້​ຍິນ​ສອງ​ຢ່າງ​ທີ່​ສຸດ: ທັງ​ຫມົດ​ທຸກ​ຄົນ​ຄວນ​ຈະ​ເປັນ​ເຈົ້າ​ພາບ​ຂອງ​ທຸກ​ສິ່ງ​ທຸກ​ຢ່າງ, ຫຼື​ບໍ່​ມີ​ໃຜ​ຄວນ. ຊີວິດທີ່ແທ້ຈິງແມ່ນ squishier.

  1. ການສ້າງຕົ້ນແບບຢ່າງໄວວາ — ເລີ່ມຕົ້ນດ້ວຍຮູບແບບເປີດທີ່ອະນຸຍາດເພື່ອກວດສອບຄວາມຖືກຕ້ອງຂອງ UX ແລະຜົນກະທົບ. ປັບໂຄງສ້າງໃໝ່ໃນພາຍຫຼັງ.

  2. ການບໍລິການແບບປະສົມ — ຮັກສາຮູບແບບທີ່ໂຮດໂດຍ VPC ຫຼື ໃນສະຖານທີ່ສຳລັບການໂທທີ່ລະອຽດອ່ອນຕໍ່ຄວາມເປັນສ່ວນຕົວ. ກັບຄືນໄປໃຊ້ API ທີ່ໂຮດໄວ້ສຳລັບການໂຫຼດແບບ long-tail ຫຼື spiky. ປົກກະຕິຫຼາຍ.

  3. ການປັບແຕ່ງໃຫ້ເໝາະສົມກັບໜ້າວຽກທີ່ຄັບແຄບ — ການປັບຕົວຂອງໂດເມນມັກຈະດີກ່ວາຂະໜາດດິບ.

  4. RAG ຢູ່ທົ່ວທຸກແຫ່ງ — ການສ້າງແບບເຕີມເຕີມທີ່ດຶງຂໍ້ມູນຄືນມາຊ່ວຍຫຼຸດຜ່ອນອາການຫຼອນໂດຍການເພີ່ມຄຳຕອບພື້ນຖານໃນຂໍ້ມູນຂອງທ່ານ. ຖານຂໍ້ມູນເວັກເຕີເປີດ ແລະ ອະແດບເຕີເຮັດໃຫ້ສິ່ງນີ້ສາມາດເຂົ້າເຖິງໄດ້ງ່າຍ.

  5. Edge ແລະ ອອບລາຍ — ຮຸ່ນນ້ຳໜັກເບົາທີ່ລວບລວມມາສຳລັບແລັບທັອບ, ໂທລະສັບ ຫຼື ບຣາວເຊີ ຂະຫຍາຍພື້ນຜິວຜະລິດຕະພັນ.

  6. ການປະຕິບັດຕາມ ແລະ ການກວດສອບ — ເນື່ອງຈາກທ່ານສາມາດກວດສອບຢ່າງລະອຽດໄດ້, ຜູ້ກວດສອບຈຶ່ງມີບາງສິ່ງບາງຢ່າງທີ່ເປັນຮູບປະທຳທີ່ຕ້ອງທົບທວນຄືນ. ຈັບຄູ່ກັບນະໂຍບາຍ AI ທີ່ມີຄວາມຮັບຜິດຊອບທີ່ເຊື່ອມໂຍງກັບໝວດໝູ່ RMF ຂອງ NIST ແລະ ຄຳແນະນຳກ່ຽວກັບເອກະສານ [3].

ໝາຍເຫດນ້ອຍໆໃນພາກສະໜາມ: ທີມງານ SaaS ທີ່ຄຳນຶງເຖິງຄວາມເປັນສ່ວນຕົວທີ່ຂ້ອຍເຄີຍເຫັນ (ຜູ້ໃຊ້ຕະຫຼາດກາງ, EU) ໄດ້ຮັບຮອງເອົາການຕັ້ງຄ່າແບບປະສົມ: ຮູບແບບເປີດຂະໜາດນ້ອຍໃນ VPC ສຳລັບ 80% ຂອງການຮ້ອງຂໍ; ລະເບີດໄປຫາ API ທີ່ໂຮດໄວ້ສຳລັບການກະຕຸ້ນສະພາບການທີ່ຫາຍາກ ແລະ ຍາວ. ພວກມັນຫຼຸດຜ່ອນຄວາມໜ່ວງຊ້າສຳລັບເສັ້ນທາງທົ່ວໄປ ແລະ ເຮັດໃຫ້ເອກະສານ DPIA ງ່າຍຂຶ້ນ - ໂດຍບໍ່ຕ້ອງຕົ້ມມະຫາສະໝຸດ.


ຄວາມສ່ຽງ ແລະ gotchas ທີ່ທ່ານຄວນວາງແຜນສໍາລັບ 🧨

ຂໍໃຫ້ຜູ້ໃຫຍ່ກ່ຽວກັບເລື່ອງນີ້.

  • ການເລື່ອນລອຍຂອງໃບອະນຸຍາດ — ການເກັບຮັກສາໃບອະນຸຍາດເລີ່ມຕົ້ນ MIT, ຫຼັງຈາກນັ້ນນ້ຳໜັກຈະຍ້າຍໄປທີ່ໃບອະນຸຍາດແບບກຳນົດເອງ. ຮັກສາການລົງທະບຽນພາຍໃນຂອງທ່ານໃຫ້ທັນສະໄໝ ຫຼື ທ່ານຈະສົ່ງຄວາມແປກໃຈກ່ຽວກັບການປະຕິບັດຕາມກົດລະບຽບ [2][4][5].

  • ແຫຼ່ງທີ່ມາຂອງຂໍ້ມູນ — ຂໍ້ມູນການຝຶກອົບຮົມທີ່ມີສິດ fuzzy ສາມາດໄຫຼເຂົ້າໄປໃນຮູບແບບຕ່າງໆ. ຕິດຕາມແຫຼ່ງຂໍ້ມູນ ແລະ ປະຕິບັດຕາມໃບອະນຸຍາດຊຸດຂໍ້ມູນ, ບໍ່ແມ່ນ vibes [5].

  • ຄວາມປອດໄພ — ປະຕິບັດຕໍ່ສິ່ງປະດິດຂອງຮູບແບບຄືກັບລະບົບຕ່ອງໂສ້ການສະໜອງອື່ນໆ: checksums, signed releases, SBOMs. ເຖິງແມ່ນວ່າ SECURITY.md ພຽງເລັກນ້ອຍກໍ່ຍັງເອົາຊະນະຄວາມງຽບໄດ້.

  • ຄວາມແຕກຕ່າງດ້ານຄຸນນະພາບ — ຮູບແບບເປີດແຕກຕ່າງກັນຢ່າງຫຼວງຫຼາຍ. ປະເມີນຜົນດ້ວຍໜ້າວຽກຂອງທ່ານ, ບໍ່ພຽງແຕ່ກະດານຈັດອັນດັບເທົ່ານັ້ນ.

  • ຄ່າໃຊ້ຈ່າຍພື້ນຖານທີ່ເຊື່ອງໄວ້ — ການອະນຸມານໄວຕ້ອງການ GPU, ການວັດແທກປະລິມານ, ການແບ່ງກຸ່ມ, ການເກັບຂໍ້ມູນຊົ່ວຄາວ. ເຄື່ອງມືເປີດຊ່ວຍໄດ້; ທ່ານຍັງຕ້ອງຈ່າຍເງິນໃນການຄຳນວນ.

  • ໜີ້ສິນດ້ານການຄຸ້ມຄອງ — ຖ້າບໍ່ມີໃຜເປັນເຈົ້າຂອງວົງຈອນຊີວິດຂອງຮູບແບບ, ທ່ານຈະໄດ້ຮັບ spaghetti ການຕັ້ງຄ່າ. ​​ບັນຊີກວດສອບ MLOps ທີ່ມີນ້ຳໜັກເບົາແມ່ນຄຳ.


ການເລືອກລະດັບຄວາມເປີດທີ່ເໝາະສົມສຳລັບກໍລະນີໃຊ້ຂອງເຈົ້າ 🧭

ເສັ້ນທາງການຕັດສິນໃຈທີ່ບິດເບືອນເລັກນ້ອຍ:

  • ຕ້ອງການ ການຂົນສົ່ງໄວ ທີ່ມີຄວາມຕ້ອງການປະຕິບັດຕາມແສງສະຫວ່າງບໍ? ເລີ່ມຕົ້ນດ້ວຍຮູບແບບເປີດທີ່ອະນຸຍາດ, ການປັບແຕ່ງໜ້ອຍສຸດ, ການບໍລິການຟັງຄລາວ.

  • ຕ້ອງ​ການ ​ຄວາມ​ເປັນ​ສ່ວນ​ຕົວ​ຢ່າງ​ເຂັ້ມ​ງວດ ​ຫຼື ​ອ​ອ​ຟ​ໄລ ​? ເລືອກສະເຕກເປີດທີ່ຮອງຮັບໄດ້ດີ, ການສົມມຸດຕິຖານຂອງເຈົ້າຂອງເອງ, ແລະທົບທວນໃບອະນຸຍາດຢ່າງລະມັດລະວັງ.

  • ຕ້ອງ ການສິດທິທາງການຄ້າຢ່າງກວ້າງຂວາງ ແລະການແຈກຢາຍຄືນໃຫມ່ບໍ? ຕ້ອງການລະຫັດທີ່ສອດຄ່ອງ OSI ບວກກັບໃບອະນຸຍາດແບບຈໍາລອງທີ່ອະນຸຍາດໃຫ້ນໍາໃຊ້ທາງການຄ້າແລະການແຈກຢາຍຄືນໃຫມ່ [1][5].

  • ຕ້ອງການ ຄວາມຍືດຫຍຸ່ນການຄົ້ນຄວ້າ? ອະນຸຍາດໃຫ້ສິ້ນສຸດເຖິງຈຸດຈົບ, ລວມທັງຂໍ້ມູນ, ສໍາລັບການສືບພັນ ແລະຄວາມສາມາດໃນການແບ່ງປັນ.

  • ບໍ່ແນ່ໃຈວ່າ? ນັກບິນທັງສອງ. ເສັ້ນທາງໜຶ່ງຈະຮູ້ສຶກດີຂຶ້ນໃນໜຶ່ງອາທິດ.


ວິທີການປະເມີນໂຄງການ Open Source AI ຄືກັບມືອາຊີບ 🔍

ບັນຊີລາຍການດ່ວນທີ່ຂ້ອຍເກັບໄວ້, ບາງຄັ້ງກໍ່ໃສ່ຜ້າເຊັດຕົວ.

  1. ຄວາມຊັດເຈນຂອງໃບອະນຸຍາດ — ໄດ້ຮັບການອະນຸມັດຈາກ OSI ສຳລັບລະຫັດບໍ? ແລ້ວນ້ຳໜັກ ແລະ ຂໍ້ມູນລ่ะ? ມີຂໍ້ຈຳກັດການນຳໃຊ້ໃດໆທີ່ເຮັດໃຫ້ຮູບແບບທຸລະກິດຂອງທ່ານເສຍຫາຍ [1][2][5] ບໍ?

  2. ເອກະສານ — ຕິດຕັ້ງ, ເລີ່ມຕົ້ນດ່ວນ, ຕົວຢ່າງ, ການແກ້ໄຂບັນຫາ. ເອກະສານແມ່ນຕົວຊີ້ບອກວັດທະນະທຳ.

  3. ຈັງຫວະການປ່ອຍ — ການປ່ອຍ ແລະ ບັນທຶກການປ່ຽນແປງທີ່ມີແທັກຊີ້ບອກເຖິງຄວາມໝັ້ນຄົງ; ການຊຸກຍູ້ເປັນໄລຍະໆຊີ້ບອກເຖິງຄວາມກ້າຫານ.

  4. ມາດຕະຖານ ແລະ ການປະເມີນຜົນ — ໜ້າວຽກເປັນຈິງບໍ? ການປະເມີນຜົນສາມາດດຳເນີນການໄດ້ບໍ?

  5. ການບຳລຸງຮັກສາ ແລະ ການຄຸ້ມຄອງ — ເຈົ້າຂອງລະຫັດທີ່ຊັດເຈນ, ການຈັດປະເພດບັນຫາ, ການຕອບສະໜອງຕໍ່ PR.

  6. ຄວາມເໝາະສົມກັບລະບົບນິເວດ — ໃຊ້ງານໄດ້ດີກັບຮາດແວ, ບ່ອນເກັບຂໍ້ມູນ, ການບັນທຶກ, ແລະ ການກວດສອບຄວາມຖືກຕ້ອງຂອງທ່ານ.

  7. ທ່າທີຄວາມປອດໄພ — ສິ່ງປະດິດທີ່ເຊັນແລ້ວ, ການສະແກນການເພິ່ງພາອາໄສ, ການຈັດການ CVE.

  8. ສັນຍານຊຸມຊົນ — ການສົນທະນາ, ຄຳຕອບໃນເວທີສົນທະນາ, ຕົວຢ່າງ repos.

ສໍາລັບການສອດຄ່ອງຢ່າງກວ້າງຂວາງກັບການປະຕິບັດທີ່ຫນ້າເຊື່ອຖື, ວາງແຜນຂະບວນການຂອງທ່ານກັບປະເພດ NIST AI RMF ແລະເອກະສານປອມ [3].


Deep dive 1: ກາງ messy ຂອງໃບອະນຸຍາດແບບຈໍາລອງ 🧪

ບາງຮຸ່ນທີ່ມີຄວາມສາມາດຫຼາຍທີ່ສຸດແມ່ນຢູ່ໃນຖັງ "ນ້ຳໜັກເປີດທີ່ມີເງື່ອນໄຂ". ພວກມັນສາມາດເຂົ້າເຖິງໄດ້, ແຕ່ມີຂໍ້ຈຳກັດການນຳໃຊ້ ຫຼື ກົດລະບຽບການແຈກຢາຍຄືນໃໝ່. ນັ້ນອາດຈະບໍ່ເປັນຫຍັງຖ້າຜະລິດຕະພັນຂອງທ່ານບໍ່ໄດ້ຂຶ້ນກັບການຫຸ້ມຫໍ່ຮຸ່ນຄືນໃໝ່ ຫຼື ການຂົນສົ່ງມັນໄປສູ່ສະພາບແວດລ້ອມຂອງລູກຄ້າ. ຖ້າທ່ານ ຕ້ອງ ການສິ່ງນັ້ນ, ໃຫ້ເຈລະຈາ ຫຼື ເລືອກຖານອື່ນ. ສິ່ງສຳຄັນແມ່ນການວາງ ຂອງທ່ານ ແຜນການດຳເນີນງານ ຕົວຈິງ , ບໍ່ແມ່ນບົດຄວາມໃນບລັອກ [4][5].

ໃບອະນຸຍາດແບບ OpenRAIL ພະຍາຍາມເຮັດໃຫ້ສົມດູນກັນ: ຊຸກຍູ້ໃຫ້ມີການຄົ້ນຄວ້າເປີດ ແລະແບ່ງປັນ, ໃນຂະນະທີ່ຂັດຂວາງການໃຊ້ໃນທາງທີ່ຜິດ. ເຈດຕະນາດີ; ພັນທະຍັງຄົງເປັນຂອງເຈົ້າ. ອ່ານຂໍ້ກໍານົດແລະຕັດສິນໃຈວ່າເງື່ອນໄຂທີ່ເຫມາະສົມກັບຄວາມຢາກອາຫານຄວາມສ່ຽງຂອງທ່ານຫຼືບໍ່ [5].


Deep dive 2: ຄວາມໂປ່ງໃສຂອງຂໍ້ມູນ ແລະນິທານການສືບພັນ 🧬

“ຖ້າບໍ່ມີການຖິ້ມຂໍ້ມູນເຕັມຮູບແບບ, AI ແບບໂອເພນຊອສກໍ່ເປັນຂອງປອມ.” ບໍ່ແມ່ນແທ້. ແຫຼ່ງ ແລະ ສູດອາຫານ ສາມາດສົ່ງຄວາມໂປ່ງໃສທີ່ມີຄວາມໝາຍເຖິງແມ່ນວ່າຊຸດຂໍ້ມູນດິບບາງຊຸດຈະຖືກຈຳກັດ. ທ່ານສາມາດບັນທຶກຕົວກອງ, ອັດຕາສ່ວນການເກັບຕົວຢ່າງ, ແລະ ການເຮັດຄວາມສະອາດການວິເຄາະຂໍ້ມູນໄດ້ດີພໍສຳລັບທີມອື່ນທີ່ຈະປະມານຜົນໄດ້ຮັບ. ຄວາມສາມາດໃນການສ້າງຊ້ຳໄດ້ຢ່າງສົມບູນແບບແມ່ນດີ. ຄວາມໂປ່ງໃສທີ່ສາມາດປະຕິບັດໄດ້ມັກຈະພຽງພໍ [3][5].

ເມື່ອຊຸດຂໍ້ມູນເປີດ, ລົດຊາດ Creative Commons ເຊັ່ນ CC-BY ຫຼື CC0 ແມ່ນທົ່ວໄປ. ການສະແດງຕາມຂະໜາດອາດເຮັດໃຫ້ງຸ່ມງ່າມໄດ້, ສະນັ້ນໃຫ້ມາດຕະຖານວິທີທີ່ເຈົ້າຈັດການມັນກ່ອນໄວອັນຄວນ.


Deep dive 3: ການປະຕິບັດ MLOps ສໍາລັບແບບເປີດ 🚢

ການຂົນສົ່ງແບບເປີດແມ່ນຄ້າຍຄືການຂົນສົ່ງບໍລິການໃດກໍ່ຕາມ, ບວກກັບ quirks ເລັກນ້ອຍ.

  • ຊັ້ນການໃຫ້ບໍລິການ — ເຊີບເວີການອະນຸມານພິເສດຊ່ວຍເພີ່ມປະສິດທິພາບການ batching, ການຈັດການ KV-cache, ແລະ ການຖ່າຍທອດສົດໂທເຄັນ.

  • ການວັດແທກປະລິມານ — ນ້ຳໜັກທີ່ນ້ອຍກວ່າ → ການອະນຸມານທີ່ລາຄາຖືກກວ່າ ແລະ ການນຳໃຊ້ຂອບທີ່ງ່າຍຂຶ້ນ. ການແລກປ່ຽນຄຸນນະພາບແຕກຕ່າງກັນ; ວັດແທກດ້ວຍ ຂອງທ່ານ .

  • ຄວາມສາມາດໃນການສັງເກດການ — ບັນທຶກການກະຕຸ້ນ/ຜົນຜະລິດໂດຍຄຳນຶງເຖິງຄວາມເປັນສ່ວນຕົວ. ຕົວຢ່າງສຳລັບການປະເມີນຜົນ. ເພີ່ມການກວດສອບການເລື່ອນລອຍຄືກັບທີ່ທ່ານຕ້ອງການສຳລັບ ML ແບບດັ້ງເດີມ.

  • ການອັບເດດ — ຮູບແບບສາມາດປ່ຽນແປງພຶດຕິກຳໄດ້ຢ່າງລະອຽດ; ໃຊ້ນົກກະຈອກເທດ ແລະ ເກັບຮັກສາບ່ອນເກັບຂໍ້ມູນໄວ້ເພື່ອການຍ້ອນກັບ ແລະ ການກວດສອບ.

  • ການຄວບຄຸມການປະເມີນຜົນ — ຮັກສາຊຸດການປະເມີນຜົນສະເພາະໜ້າວຽກ, ບໍ່ພຽງແຕ່ມາດຕະຖານທົ່ວໄປເທົ່ານັ້ນ. ລວມເອົາການກະຕຸ້ນເຕືອນກ່ຽວກັບຄູ່ແຂ່ງ ແລະ ງົບປະມານຄວາມຊັກຊ້າ.


ແຜນຜັງຂະໜາດນ້ອຍ: ຈາກສູນໄປຫານັກບິນທີ່ໃຊ້ໄດ້ໃນ 10 ຂັ້ນຕອນ 🗺️

  1. ກໍານົດຫນຶ່ງຫນ້າວຽກແຄບແລະ metric. ບໍ່ມີເວທີອັນຍິ່ງໃຫຍ່ເທື່ອ.

  2. ເລືອກຮູບແບບພື້ນຖານທີ່ໄດ້ຮັບອະນຸຍາດທີ່ໃຊ້ຢ່າງກວ້າງຂວາງ ແລະເປັນເອກະສານທີ່ດີ.

  3. ຢືນຂຶ້ນ inference ທ້ອງຖິ່ນແລະ API wrapper ບາງໆ. ຮັກສາມັນຫນ້າເບື່ອ.

  4. ເພີ່ມການດຶງຂໍ້ມູນໃສ່ຂໍ້ມູນພື້ນຖານໃນຂໍ້ມູນຂອງທ່ານ.

  5. ກະກຽມຊຸດ eval ທີ່ມີປ້າຍນ້ອຍໆທີ່ສະທ້ອນເຖິງຜູ້ໃຊ້ຂອງທ່ານ, warts ແລະທັງຫມົດ.

  6. ການປບັລະອຽດ ຫຼືປບັທັນທີຫາກ eval ເວົ້າວ່າທ່ານຄວນ.

  7. Quantize ຖ້າ latency ຫຼືຄ່າໃຊ້ຈ່າຍກັດ. ວັດແທກຄຸນນະພາບຄືນໃໝ່.

  8. ເພີ່ມການບັນທຶກ, ການເຕືອນໃຫ້ທີມສີແດງ, ແລະນະໂຍບາຍການລ່ວງລະເມີດ.

  9. ປະຕູທີ່ມີທຸງຄຸນສົມບັດແລະປ່ອຍໄປຫາກຸ່ມນ້ອຍ.

  10. ເຮັດຊ້ຳ. ສົ່ງການປັບປຸງເລັກນ້ອຍຕໍ່ອາທິດ… ຫຼືເມື່ອມັນດີຂຶ້ນແທ້ໆ.


myths ທົ່ວໄປກ່ຽວກັບ Open Source AI, debunked ເລັກນ້ອຍ 🧱

  • Myth: ແບບເປີດແມ່ນສະເຫມີໄປຮ້າຍແຮງກວ່າເກົ່າ. ຄວາມເປັນຈິງ: ສໍາລັບວຽກງານເປົ້າຫມາຍທີ່ມີຂໍ້ມູນທີ່ຖືກຕ້ອງ, ຮູບແບບເປີດທີ່ປັບລະອຽດສາມາດປະຕິບັດຫນ້າທີ່ເປັນເຈົ້າພາບຂະຫນາດໃຫຍ່ກວ່າ.

  • Myth: ເປີດຫມາຍຄວາມວ່າບໍ່ປອດໄພ. ຄວາມເປັນຈິງ: ການເປີດກວ້າງສາມາດປັບປຸງການກວດສອບໄດ້. ຄວາມປອດໄພແມ່ນຂຶ້ນກັບການປະຕິບັດ, ບໍ່ແມ່ນຄວາມລັບ [3].

  • ຄວາມຫຼົງຜິດ: ໃບອະນຸຍາດບໍ່ສຳຄັນຖ້າມັນບໍ່ເສຍຄ່າ. ຄວາມເປັນຈິງ: ມັນສຳຄັນ ທີ່ສຸດ ເມື່ອມັນບໍ່ເສຍຄ່າ, ເພາະວ່າການຟຣີຈະຂະຫຍາຍການນຳໃຊ້. ທ່ານຕ້ອງການສິດທີ່ຊັດເຈນ, ບໍ່ແມ່ນຄວາມຮູ້ສຶກ [1][5].


Open Source AI 🧠✨

Open Source AI ບໍ່ແມ່ນສາສະຫນາ. ມັນເປັນຊຸດຂອງສິດເສລີພາບໃນການປະຕິບັດທີ່ຊ່ວຍໃຫ້ທ່ານສ້າງດ້ວຍການຄວບຄຸມຫຼາຍຂຶ້ນ, ການປົກຄອງທີ່ຊັດເຈນກວ່າ, ແລະເຮັດຊ້ໍາອີກໄວ. ເມື່ອມີຄົນເວົ້າວ່າຕົວແບບແມ່ນ "ເປີດ", ຖາມວ່າຊັ້ນໃດເປີດ: ລະຫັດ, ນ້ໍາຫນັກ, ຂໍ້ມູນ, ຫຼືພຽງແຕ່ເຂົ້າເຖິງ. ອ່ານໃບອະນຸຍາດ. ປຽບທຽບມັນກັບກໍລະນີການນໍາໃຊ້ຂອງທ່ານ. ແລະຫຼັງຈາກນັ້ນ, ສໍາຄັນ, ທົດສອບມັນກັບວຽກງານທີ່ແທ້ຈິງຂອງທ່ານ.

ສ່ວນທີ່ດີທີ່ສຸດ, ແປກ, ແມ່ນວັດທະນະທໍາ: ໂຄງການເປີດໄດ້ເຊື້ອເຊີນການປະກອບສ່ວນແລະການກວດສອບ, ເຊິ່ງມັກຈະເຮັດໃຫ້ທັງຊອບແວແລະຄົນດີຂຶ້ນ. ທ່ານອາດຈະຄົ້ນພົບວ່າການເຄື່ອນໄຫວທີ່ຊະນະບໍ່ແມ່ນຕົວແບບທີ່ໃຫຍ່ທີ່ສຸດຫຼືຕົວຊີ້ບອກທີ່ໄວທີ່ສຸດ, ແຕ່ເປັນແບບທີ່ເຈົ້າສາມາດເຂົ້າໃຈ, ແກ້ໄຂແລະປັບປຸງໃນອາທິດຫນ້າ. ນັ້ນແມ່ນພະລັງທີ່ງຽບສະຫງົບຂອງ Open Source AI - ບໍ່ແມ່ນລູກປືນເງິນ, ຄືກັບເຄື່ອງມືຫຼາຍອັນທີ່ໃສ່ດີທີ່ຊ່ວຍປະຫຍັດມື້.


ດົນເກີນໄປບໍ່ໄດ້ອ່ານ📝

Open Source AI ແມ່ນກ່ຽວກັບສິດເສລີພາບທີ່ມີຄວາມຫມາຍໃນການນໍາໃຊ້, ການສຶກສາ, ດັດແກ້, ແລະແບ່ງປັນລະບົບ AI. ມັນສະແດງໃນທົ່ວຊັ້ນຕ່າງໆ: ກອບ, ແບບຈໍາລອງ, ຂໍ້ມູນ, ແລະເຄື່ອງມື. ຢ່າສັບສົນແຫຼ່ງເປີດທີ່ມີນ້ໍາຫນັກເປີດຫຼືການເຂົ້າເຖິງທີ່ເປີດ. ກວດ​ສອບ​ໃບ​ອະ​ນຸ​ຍາດ​, ການ​ປະ​ເມີນ​ຜົນ​ກັບ​ວຽກ​ງານ​ທີ່​ແທ້​ຈິງ​ຂອງ​ທ່ານ​, ແລະ​ການ​ອອກ​ແບບ​ສໍາ​ລັບ​ການ​ຄວາມ​ປອດ​ໄພ​ແລະ​ການ​ຄຸ້ມ​ຄອງ​ຈາກ​ມື້​ຫນຶ່ງ​. ເຮັດແນວນັ້ນ, ແລະທ່ານໄດ້ຮັບຄວາມໄວ, ການຄວບຄຸມ, ແລະແຜນທີ່ເສັ້ນທາງທີ່ສະຫງົບກວ່າ. ເປັນເລື່ອງແປກທີ່ຫາຍາກ, ຊື່ສັດບໍ່ມີຄ່າ🙃.


ເອກະສານອ້າງອີງ

[1] ໂຄງການ Open Source Initiative - ຄຳນິຍາມ Open Source (OSD): ອ່ານຕື່ມ
[2] OSI - ເຈາະເລິກກ່ຽວກັບ AI ແລະ ຄວາມເປີດເຜີຍ: ອ່ານຕື່ມ
[3] NIST - ຂອບການຄຸ້ມຄອງຄວາມສ່ຽງ AI: ອ່ານຕື່ມ
[4] ໃບອະນຸຍາດແບບ Meta - Llama: ອ່ານຕື່ມ
[5] ໃບອະນຸຍາດ AI ທີ່ມີຄວາມຮັບຜິດຊອບ (OpenRAIL): ອ່ານຕື່ມ

ຊອກຫາ AI ລ່າສຸດໄດ້ທີ່ຮ້ານ AI Assistant ຢ່າງເປັນທາງການ

ກ່ຽວກັບພວກເຮົາ

ກັບໄປທີ່ບລັອກ