ຮູບແບບພື້ນຖານໃນ Generative AI ແມ່ນຫຍັງ?

ຮູບແບບພື້ນຖານໃນ Generative AI ແມ່ນຫຍັງ?

ຄຳຕອບສັ້ນໆ: ຮູບແບບພື້ນຖານແມ່ນຮູບແບບ AI ຂະໜາດໃຫຍ່ທີ່ມີຈຸດປະສົງທົ່ວໄປທີ່ໄດ້ຮັບການຝຶກອົບຮົມກ່ຽວກັບຊຸດຂໍ້ມູນທີ່ກວ້າງຂວາງ, ຫຼັງຈາກນັ້ນຈຶ່ງຖືກປັບໃຫ້ເໝາະສົມກັບວຽກງານຫຼາຍຢ່າງ (ການຂຽນ, ການຄົ້ນຫາ, ການຂຽນໂປຣແກຣມ, ຮູບພາບ) ຜ່ານການກະຕຸ້ນ, ການປັບແຕ່ງ, ເຄື່ອງມື ຫຼື ການດຶງຂໍ້ມູນຄືນ. ຖ້າທ່ານຕ້ອງການຄຳຕອບທີ່ໜ້າເຊື່ອຖື, ໃຫ້ຈັບຄູ່ກັບພື້ນຖານ (ເຊັ່ນ RAG), ຂໍ້ຈຳກັດທີ່ຊັດເຈນ, ແລະ ການກວດສອບ, ແທນທີ່ຈະປ່ອຍໃຫ້ພວກມັນປັບປຸງ.

ບົດຮຽນຫຼັກ:

ຄຳນິຍາມ : ຮູບແບບພື້ນຖານທີ່ໄດ້ຮັບການຝຶກອົບຮົມຢ່າງກວ້າງຂວາງອັນໜຶ່ງຖືກນຳໃຊ້ຄືນໃນຫຼາຍໆໜ້າວຽກ, ບໍ່ແມ່ນໜ້າວຽກໜຶ່ງຕໍ່ຮູບແບບ.

ການປັບຕົວ : ໃຊ້ການກະຕຸ້ນ, ການປັບແຕ່ງລະອຽດ, LoRA/ຕົວປັບ, RAG, ແລະ ເຄື່ອງມືຕ່າງໆເພື່ອຄວບຄຸມພຶດຕິກຳ.

ຄວາມເໝາະສົມທີ່ສ້າງສັນ : ພວກມັນຊ່ວຍໃຫ້ສາມາດສ້າງຂໍ້ຄວາມ, ຮູບພາບ, ສຽງ, ລະຫັດ ແລະ ເນື້ອຫາຫຼາຍຮູບແບບ.

ສັນຍານຄຸນນະພາບ : ໃຫ້ຄວາມສຳຄັນກັບການຄວບຄຸມ, ອາການຫຼອນໜ້ອຍລົງ, ຄວາມສາມາດໃນການຄິດຫຼາຍຮູບແບບ, ແລະ ການອະນຸມານທີ່ມີປະສິດທິພາບ.

ການຄວບຄຸມຄວາມສ່ຽງ : ວາງແຜນສຳລັບພາບຫຼອນ, ອະຄະຕິ, ການຮົ່ວໄຫຼຄວາມເປັນສ່ວນຕົວ, ແລະ ການສັກຢາຢ່າງວ່ອງໄວຜ່ານການຄຸ້ມຄອງ ແລະ ການທົດສອບ.

ຮູບແບບພື້ນຖານໃນ Generative AI ແມ່ນຫຍັງ? Infographic

ບົດຄວາມທີ່ທ່ານອາດຈະຢາກອ່ານຫຼັງຈາກບົດຄວາມນີ້:

🔗 ບໍລິສັດ AI ແມ່ນຫຍັງ
ເຂົ້າໃຈວິທີທີ່ບໍລິສັດ AI ສ້າງຜະລິດຕະພັນ, ທີມງານ ແລະ ຮູບແບບລາຍຮັບ.

🔗 ລະຫັດ AI ມີລັກສະນະແນວໃດ
ເບິ່ງຕົວຢ່າງຂອງລະຫັດ AI, ຕັ້ງແຕ່ຮູບແບບ Python ຈົນເຖິງ APIs.

🔗 ອັລກໍຣິທຶມ AI ແມ່ນຫຍັງ
ຮຽນຮູ້ວ່າອັລກໍຣິທຶມ AI ແມ່ນຫຍັງ ແລະ ພວກມັນຕັດສິນໃຈແນວໃດ.

🔗 ເທັກໂນໂລຢີ AI ແມ່ນຫຍັງ
ສຳຫຼວດເທັກໂນໂລຢີ AI ຫຼັກທີ່ຂັບເຄື່ອນລະບົບອັດຕະໂນມັດ, ການວິເຄາະ ແລະ ແອັບອັດສະລິຍະ.


1) ຮູບແບບພື້ນຖານ - ຄຳນິຍາມທີ່ບໍ່ມີໝອກ 🧠

ຮູບ ແບບພື້ນຖານ ແມ່ນຮູບແບບ AI ຂະໜາດໃຫຍ່ ແລະ ມີຈຸດປະສົງທົ່ວໄປທີ່ໄດ້ຮັບການຝຶກອົບຮົມກ່ຽວກັບຂໍ້ມູນຢ່າງກວ້າງຂວາງ (ໂດຍປົກກະຕິແລ້ວແມ່ນຂໍ້ມູນຈຳນວນຫຼວງຫຼາຍ) ສະນັ້ນມັນສາມາດປັບຕົວເຂົ້າກັບວຽກງານຫຼາຍຢ່າງ, ບໍ່ພຽງແຕ່ວຽກງານດຽວ ( NIST , Stanford CRFM ).

ແທນທີ່ຈະສ້າງແບບຈຳລອງແຍກຕ່າງຫາກສຳລັບ:

  • ການຂຽນອີເມວ

  • ການຕອບຄຳຖາມ

  • ການສະຫຼຸບ PDF

  • ກຳລັງສ້າງຮູບພາບ

  • ການຈັດປະເພດປີ້ສະໜັບສະໜູນ

  • ການແປພາສາ

  • ການແນະນຳລະຫັດ

...ເຈົ້າຝຶກອົບຮົມຮູບແບບພື້ນຖານໃຫຍ່ອັນໜຶ່ງທີ່ "ຮຽນຮູ້ໂລກ" ໃນລັກສະນະທາງສະຖິຕິທີ່ບໍ່ຊັດເຈນ, ຈາກນັ້ນເຈົ້າ ປັບ ມັນໃຫ້ເຂົ້າກັບວຽກສະເພາະດ້ວຍການກະຕຸ້ນ, ການປັບແຕ່ງລະອຽດ, ຫຼືເຄື່ອງມືເພີ່ມເຕີມ ( Bommasani et al., 2021 ).

ເວົ້າອີກຢ່າງໜຶ່ງ: ມັນເປັນ ເຄື່ອງຈັກທົ່ວໄປ ທີ່ທ່ານສາມາດຄວບຄຸມໄດ້.

ແລະແມ່ນແລ້ວ, ຄຳສຳຄັນແມ່ນ “ທົ່ວໄປ.” ນັ້ນແມ່ນເຄັດລັບທັງໝົດ.


2) ຮູບແບບພື້ນຖານໃນ Generative AI ແມ່ນຫຍັງ? (ພວກມັນເໝາະສົມກັນແນວໃດໂດຍສະເພາະ) 🎨📝

ສະນັ້ນ, ຮູບແບບພື້ນຖານໃນ Generative AI ແມ່ນຫຍັງ? ພວກມັນແມ່ນຮູບແບບພື້ນຖານທີ່ໃຫ້ພະລັງງານແກ່ລະບົບທີ່ສາມາດ ສ້າງ ເນື້ອຫາໃໝ່ໄດ້ - ຂໍ້ຄວາມ, ຮູບພາບ, ສຽງ, ລະຫັດ, ວິດີໂອ, ແລະ ການປະສົມປະສານທີ່ເພີ່ມຂຶ້ນເລື້ອຍໆຂອງທັງໝົດເຫຼົ່ານັ້ນ ( NIST , NIST Generative AI Profile ).

ປັນຍາປະດິດທີ່ສ້າງຂື້ນບໍ່ພຽງແຕ່ກ່ຽວກັບການຄາດຄະເນປ້າຍຊື່ເຊັ່ນ "ສະແປມ / ບໍ່ແມ່ນສະແປມ". ມັນກ່ຽວກັບການຜະລິດຜົນຜະລິດທີ່ເບິ່ງຄືວ່າພວກມັນຖືກສ້າງຂຶ້ນໂດຍຄົນ.

  • ວັກ

  • ບົດກະວີ

  • ລາຍລະອຽດຜະລິດຕະພັນ

  • ຮູບປະກອບ

  • ທຳນອງເພງ

  • ຕົ້ນແບບແອັບ

  • ສຽງສັງເຄາະ

  • ແລະບາງຄັ້ງກໍ່ເວົ້າເລື່ອງໄຮ້ສາລະທີ່ໜ້າເຊື່ອຖືບໍ່ໄດ້ 🙃

ຮູບແບບພື້ນຖານແມ່ນ ດີ ໂດຍສະເພາະ

  • ພວກເຂົາໄດ້ດູດຊຶມຮູບແບບທີ່ກວ້າງຂວາງຈາກຊຸດຂໍ້ມູນຂະໜາດໃຫຍ່ ( Bommasani et al., 2021 )

  • ພວກມັນສາມາດລວມເຂົ້າກັບການກະຕຸ້ນໃໝ່ໆ (ແມ່ນແຕ່ການກະຕຸ້ນທີ່ແປກປະຫຼາດ) ( Brown et al., 2020 )

  • ພວກມັນສາມາດຖືກນໍາໃຊ້ຄືນໃໝ່ສໍາລັບຜົນຜະລິດຫຼາຍສິບຢ່າງໂດຍບໍ່ຕ້ອງຝຶກອົບຮົມຄືນໃໝ່ຕັ້ງແຕ່ເລີ່ມຕົ້ນ ( Bommasani et al., 2021 )

ພວກມັນແມ່ນ "ຊັ້ນພື້ນຖານ" - ຄືກັບແປ້ງເຂົ້າຈີ່. ເຈົ້າສາມາດອົບມັນເປັນເຂົ້າຈີ່ຝຣັ່ງ, ພິຊຊ່າ, ຫຼື ເຂົ້າຈີ່ອົບຊິນນາມອນ... ບໍ່ແມ່ນຄຳປຽບທຽບທີ່ສົມບູນແບບ, ແຕ່ເຈົ້າເຂົ້າໃຈຂ້ອຍ 😄


3) ເປັນຫຍັງເຂົາເຈົ້າຈຶ່ງປ່ຽນແປງທຸກຢ່າງ (ແລະເປັນຫຍັງຄົນຈຶ່ງບໍ່ຢຸດເວົ້າກ່ຽວກັບເຂົາເຈົ້າ) 🚀

ກ່ອນຮູບແບບພື້ນຖານ, AI ຫຼາຍຢ່າງແມ່ນສະເພາະໜ້າວຽກ:

  • ຝຶກອົບຮົມຮູບແບບສຳລັບການວິເຄາະຄວາມຮູ້ສຶກ

  • ຝຶກຄົນອື່ນໃຫ້ແປ

  • ຝຶກອົບຮົມອີກອັນໜຶ່ງສຳລັບການຈັດປະເພດຮູບພາບ

  • ຝຶກອົບຮົມອີກອັນໜຶ່ງສຳລັບການຮັບຮູ້ໜ່ວຍງານທີ່ມີຊື່

ສິ່ງນັ້ນໄດ້ຜົນ, ແຕ່ມັນຊ້າ, ລາຄາແພງ, ແລະຂ້ອນຂ້າງ... ແຕກຫັກງ່າຍ.

ຮູບແບບພື້ນຖານໄດ້ປ່ຽນມັນ:

  • ຝຶກຊ້ອມລ່ວງໜ້າຄັ້ງໜຶ່ງ (ຄວາມພະຍາຍາມຢ່າງໃຫຍ່ຫຼວງ)

  • ນຳ​ໃຊ້​ຄືນ​ໃໝ່​ໄດ້​ທຸກ​ບ່ອນ (ການ​ຈ່າຍ​ເງິນ​ໃຫຍ່) ( Bommasani et al., 2021 )

ການນຳໃຊ້ຄືນໃໝ່ນັ້ນແມ່ນຕົວຄູນ. ບໍລິສັດຕ່າງໆສາມາດສ້າງ 20 ຄຸນສົມບັດຢູ່ເທິງສຸດຂອງຄອບຄົວຮຸ່ນດຽວ, ແທນທີ່ຈະປະດິດລໍ້ໃໝ່ 20 ເທື່ອ.

ນອກຈາກນີ້, ປະສົບການຂອງຜູ້ໃຊ້ກໍ່ເປັນທຳມະຊາດຫຼາຍຂຶ້ນ:

  • ເຈົ້າບໍ່ "ໃຊ້ຕົວຈັດປະເພດ"

  • ເຈົ້າລົມກັບນາງແບບຄືກັບວ່າລາວເປັນເພື່ອນຮ່ວມງານທີ່ຊ່ວຍເຫຼືອດີ ແຕ່ບໍ່ເຄີຍນອນຫຼັບ ☕🤝

ບາງຄັ້ງມັນກໍ່ຄືກັບເພື່ອນຮ່ວມງານທີ່ເຂົ້າໃຈຜິດທຸກຢ່າງຢ່າງໝັ້ນໃຈ, ແຕ່ວ່າ. ການເຕີບໂຕ.


4) ແນວຄວາມຄິດຫຼັກ: ການຝຶກອົບຮົມກ່ອນ + ການປັບຕົວ 🧩

ເກືອບທຸກຮູບແບບພື້ນຖານປະຕິບັດຕາມຮູບແບບ ( Stanford CRFM , NIST ):

ການຝຶກອົບຮົມກ່ອນໄວຮຽນ (ໄລຍະ "ດູດຊຶມອິນເຕີເນັດ") 📚

ຮູບແບບດັ່ງກ່າວໄດ້ຮັບການຝຶກອົບຮົມກ່ຽວກັບຊຸດຂໍ້ມູນຂະໜາດໃຫຍ່ ແລະ ກວ້າງຂວາງໂດຍໃຊ້ການຮຽນຮູ້ດ້ວຍຕົນເອງ ( NIST ). ສຳລັບຮູບແບບພາສາ, ໂດຍປົກກະຕິແລ້ວນັ້ນໝາຍເຖິງການຄາດຄະເນຄຳສັບທີ່ຫາຍໄປ ຫຼື ໂທເຄັນຕໍ່ໄປ ( Devlin et al., 2018 , Brown et al., 2020 ).

ຈຸດປະສົງບໍ່ແມ່ນເພື່ອສອນມັນໜ້າວຽກດຽວ. ຈຸດປະສົງແມ່ນເພື່ອສອນມັນ ກ່ຽວກັບການນຳສະເໜີທົ່ວໄປ :

  • ໄວຍາກອນ

  • ຂໍ້ເທັດຈິງ (ປະເພດ)

  • ຮູບແບບການຫາເຫດຜົນ (ບາງຄັ້ງ)

  • ແບບການຂຽນ

  • ໂຄງສ້າງລະຫັດ

  • ເຈດຕະນາທົ່ວໄປຂອງມະນຸດ

ການປັບຕົວ (ໄລຍະ "ເຮັດໃຫ້ມັນໃຊ້ໄດ້ຈິງ") 🛠️

ຫຼັງຈາກນັ້ນ, ທ່ານດັດແປງມັນໂດຍໃຊ້ໜຶ່ງ ຫຼື ຫຼາຍຢ່າງຂອງ:

  • ການກະຕຸ້ນ (ຄຳແນະນຳໃນພາສາທຳມະດາ)

  • ການປັບແຕ່ງຄຳສັ່ງ (ການຝຶກອົບຮົມມັນໃຫ້ປະຕິບັດຕາມຄຳແນະນຳ) ( Wei et al., 2021 )

  • ການປັບແຕ່ງຢ່າງລະອຽດ (ການຝຶກອົບຮົມກ່ຽວກັບຂໍ້ມູນໂດເມນຂອງທ່ານ)

  • LoRA / ຕົວປັບ (ວິທີການປັບແຕ່ງນ້ຳໜັກເບົາ) ( Hu et al., 2021 )

  • RAG (ການສ້າງແບບເຕີມຄືນ - ຮູບແບບຈະປຶກສາຫາລືເອກະສານຂອງທ່ານ) ( Lewis et al., 2020 )

  • ການໃຊ້ເຄື່ອງມື (ຟັງຊັນການເອີ້ນ, ການເບິ່ງລະບົບພາຍໃນ, ແລະອື່ນໆ)

ນີ້ແມ່ນເຫດຜົນທີ່ຮູບແບບພື້ນຖານດຽວກັນສາມາດຂຽນສາກຄວາມຮັກໄດ້... ຈາກນັ້ນຊ່ວຍດີບັກຄິວຣີ SQL ໃນຫ້າວິນາທີຕໍ່ມາ 😭


5) ສິ່ງໃດທີ່ເຮັດໃຫ້ຮູບແບບພື້ນຖານທີ່ດີ? ✅

ນີ້ແມ່ນພາກສ່ວນທີ່ຜູ້ຄົນຂ້າມໄປ, ແລະຫຼັງຈາກນັ້ນກໍ່ເສຍໃຈໃນພາຍຫຼັງ.

ຮູບແບບພື້ນຖານທີ່ "ດີ" ບໍ່ພຽງແຕ່ "ໃຫຍ່ກວ່າ". ໃຫຍ່ກວ່າຊ່ວຍໄດ້, ແນ່ນອນ ... ແຕ່ມັນບໍ່ແມ່ນສິ່ງດຽວ. ຮູບແບບພື້ນຖານທີ່ດີມັກຈະມີ:

ການອະທິບາຍທົ່ວໄປທີ່ເຂັ້ມແຂງ 🧠

ມັນປະຕິບັດໄດ້ດີໃນຫຼາຍໆໜ້າວຽກໂດຍບໍ່ຕ້ອງມີການຝຶກອົບຮົມຄືນໃໝ່ສະເພາະໜ້າວຽກ ( Bommasani et al., 2021 ).

ການຊີ້ນຳ ແລະ ການຄວບຄຸມ 🎛️

ມັນສາມາດປະຕິບັດຕາມຄໍາແນະນໍາໄດ້ຢ່າງໜ້າເຊື່ອຖືເຊັ່ນ:

  • "ໃຫ້ກະທັດຮັດ"

  • "ໃຊ້ຈຸດ bullet"

  • “ຂຽນດ້ວຍນໍ້າສຽງທີ່ເປັນມິດ”

  • "ຢ່າເປີດເຜີຍຂໍ້ມູນທີ່ເປັນຄວາມລັບ"

ບາງຮຸ່ນກໍ່ສະຫຼາດແຕ່ລື່ນ. ຄືກັບການພະຍາຍາມຖືສະບູ່ກ້ອນໜຶ່ງໄວ້ໃນຫ້ອງອາບນໍ້າ. ເປັນປະໂຫຍດ, ແຕ່ບໍ່ສະໝໍ່າສະເໝີ 😅

ແນວໂນ້ມທີ່ຈະເກີດອາການຫຼອນຕ່ຳ (ຫຼືຢ່າງໜ້ອຍກໍ່ຄວາມບໍ່ແນ່ນອນໂດຍກົງ) 🧯

ບໍ່ມີຮູບແບບໃດທີ່ມີພູມຕ້ານທານຕໍ່ການຫຼອນຫຼອນໄດ້, ແຕ່ຮູບແບບທີ່ດີແມ່ນ:

  • ຮູ້ສຶກຫຼອນໜ້ອຍລົງ

  • ຍອມຮັບຄວາມບໍ່ແນ່ນອນເລື້ອຍໆ

  • ໃຫ້ໃກ້ຊິດກັບສະພາບການທີ່ສະໜອງໃຫ້ເມື່ອໃຊ້ການດຶງຂໍ້ມູນ ( Ji et al., 2023 , Lewis et al., 2020 )

ມີຄວາມສາມາດຫຼາຍຮູບແບບໄດ້ດີ (ເມື່ອຕ້ອງການ) 🖼️🎧

ຖ້າທ່ານກຳລັງສ້າງຜູ້ຊ່ວຍທີ່ອ່ານຮູບພາບ, ຕີຄວາມໝາຍຕາຕະລາງ, ຫຼືເຂົ້າໃຈສຽງ, ຫຼາຍຮູບແບບມີຄວາມສຳຄັນຫຼາຍ ( Radford et al., 2021 ).

ການອະນຸມານທີ່ມີປະສິດທິພາບ ⚡

ຄວາມຊັກຊ້າ ແລະ ລາຄາມີຄວາມສຳຄັນ. ຮຸ່ນທີ່ແຂງແຮງແຕ່ຊ້າແມ່ນຄືກັບລົດກິລາທີ່ມີຢາງແຕກ.

ພຶດຕິກຳດ້ານຄວາມປອດໄພ ແລະ ການຈັດລຽນແບບ 🧩

ບໍ່ພຽງແຕ່ “ປະຕິເສດທຸກຢ່າງ”, ແຕ່:

  • ຫຼີກລ່ຽງຄຳແນະນຳທີ່ເປັນອັນຕະລາຍ

  • ຫຼຸດຜ່ອນຄວາມລຳອຽງ

  • ຈັດການກັບຫົວຂໍ້ທີ່ລະອຽດອ່ອນດ້ວຍຄວາມລະມັດລະວັງ

  • ຕ້ານທານກັບຄວາມພະຍາຍາມ jailbreak ພື້ນຖານ (ບາງຢ່າງ…) ( NIST AI RMF 1.0 , NIST Generative AI Profile )

ເອກະສານ + ລະບົບນິເວດ 🌱

ອັນນີ້ຟັງຄືແຫ້ງແລ້ງ, ແຕ່ມັນເປັນຄວາມຈິງ:

  • ເຄື່ອງມື

  • ສາຍຮັດ eval

  • ຕົວເລືອກການນຳໃຊ້

  • ການຄວບຄຸມວິສາຫະກິດ

  • ການສະໜັບສະໜູນການປັບແຕ່ງແບບລະອຽດ

ແມ່ນແລ້ວ, “ລະບົບນິເວດ” ເປັນຄຳສັບທີ່ບໍ່ຈະແຈ້ງ. ຂ້ອຍກໍ່ບໍ່ມັກມັນຄືກັນ. ແຕ່ມັນກໍ່ມີຄວາມໝາຍ.


6) ຕາຕະລາງປຽບທຽບ - ຕົວເລືອກຮູບແບບພື້ນຖານທົ່ວໄປ (ແລະສິ່ງທີ່ພວກມັນດີສຳລັບ) 🧾

ຂ້າງລຸ່ມນີ້ແມ່ນຕາຕະລາງປຽບທຽບທີ່ໃຊ້ໄດ້ຈິງ ແຕ່ບໍ່ສົມບູນແບບເລັກນ້ອຍ. ມັນບໍ່ແມ່ນ "ບັນຊີລາຍຊື່ທີ່ແທ້ຈິງອັນດຽວ", ມັນຄ້າຍຄືກັບ: ສິ່ງທີ່ຄົນເລືອກໃນທຳມະຊາດຫຼາຍກວ່າ.

ປະເພດເຄື່ອງມື / ຮູບແບບ ຜູ້ຊົມ ລາຄາພໍສົມຄວນ ເປັນຫຍັງມັນເຮັດວຽກ
LLM ທີ່ເປັນຂອງເຈົ້າຂອງ (ແບບສົນທະນາ) ທີມທີ່ຕ້ອງການຄວາມໄວ + ຄວາມສະຫຼາດ ອີງຕາມການນຳໃຊ້ / ການສະໝັກໃຊ້ ການປະຕິບັດຕາມຄຳແນະນຳທີ່ດີເລີດ, ປະສິດທິພາບໂດຍລວມທີ່ເຂັ້ມແຂງ, ໂດຍປົກກະຕິແລ້ວດີທີ່ສຸດ "ນອກກ່ອງ" 😌
LLM ແບບເປີດນ້ຳໜັກ (ສາມາດໂຮດດ້ວຍຕົນເອງໄດ້) ຜູ້ສ້າງທີ່ຕ້ອງການຄວບຄຸມ ຄ່າໃຊ້ຈ່າຍດ້ານພື້ນຖານໂຄງລ່າງ (ແລະ ບັນຫາຕ່າງໆ) ສາມາດປັບແຕ່ງໄດ້, ເປັນມິດກັບຄວາມເປັນສ່ວນຕົວ, ສາມາດດໍາເນີນການໄດ້ໃນທ້ອງຖິ່ນ... ຖ້າທ່ານມັກການຕົບແຕ່ງໃນເວລາທ່ຽງຄືນ
ເຄື່ອງສ້າງຮູບພາບການແຜ່ກະຈາຍ ທີມງານສ້າງສັນ, ທີມງານອອກແບບ ຈາກຟຣີຫາເສຍເງິນ ການສັງເຄາະຮູບພາບທີ່ດີເລີດ, ຄວາມຫຼາກຫຼາຍຂອງຮູບແບບ, ຂັ້ນຕອນການເຮັດວຽກແບບຊ້ຳໆ (ຫຼື: ນິ້ວມືອາດຈະຕິດຂັດ) ✋😬 ( Ho et al., 2020 , Rombach et al., 2021 )
ຮູບແບບ “ວິໄສທັດ-ພາສາ” ຫຼາຍຮູບແບບ ແອັບຯທີ່ອ່ານຮູບພາບ + ຂໍ້ຄວາມ ອີງຕາມການນຳໃຊ້ ຊ່ວຍໃຫ້ທ່ານສາມາດຖາມຄຳຖາມກ່ຽວກັບຮູບພາບ, ພາບໜ້າຈໍ, ແຜນວາດ - ມີປະໂຫຍດຢ່າງໜ້າປະຫລາດໃຈ ( Radford et al., 2021 )
ຮູບແບບການຝັງພື້ນຖານ ຄົ້ນຫາ + ລະບົບ RAG ຄ່າໃຊ້ຈ່າຍຕໍ່າຕໍ່ການໂທ ປ່ຽນຂໍ້ຄວາມໃຫ້ເປັນເວັກເຕີສຳລັບການຄົ້ນຫາຄວາມໝາຍ, ການຈັດກຸ່ມ, ການແນະນຳ - ພະລັງງານ MVP ທີ່ງຽບສະຫງົບ ( Karpukhin et al., 2020 , Douze et al., 2024 )
ຮູບແບບພື້ນຖານການປ່ຽນສຽງເປັນຂໍ້ຄວາມ ສູນໂທ, ຜູ້ສ້າງ ອີງຕາມການນຳໃຊ້ / ທ້ອງຖິ່ນ ການຖອດຂໍ້ຄວາມໄວ, ຮອງຮັບຫຼາຍພາສາ, ດີພໍສຳລັບສຽງລົບກວນ (ໂດຍປົກກະຕິ) 🎙️ ( ກະຊິບ )
ຮູບແບບພື້ນຖານການປ່ຽນຂໍ້ຄວາມເປັນສຽງ ທີມງານຜະລິດຕະພັນ, ສື່ມວນຊົນ ອີງຕາມການນຳໃຊ້ ການສ້າງສຽງທີ່ເປັນທຳມະຊາດ, ແບບສຽງ, ການບັນຍາຍ - ສາມາດກາຍເປັນເລື່ອງທີ່ໜ້າຢ້ານຄືກັບຈິງ ( Shen et al., 2017 )
LLM ທີ່ເນັ້ນໃສ່ລະຫັດ ນັກພັດທະນາ ອີງຕາມການນຳໃຊ້ / ການສະໝັກໃຊ້ ເກັ່ງກວ່າໃນຮູບແບບລະຫັດ, ການແກ້ໄຂຂໍ້ຜິດພາດ, ການປັບປຸງໂຄງສ້າງ... ແຕ່ກໍ່ຍັງບໍ່ແມ່ນຜູ້ອ່ານຄວາມຄິດຂອງຂ້ອຍ 😅

ສັງເກດວ່າ “ຮູບແບບພື້ນຖານ” ບໍ່ພຽງແຕ່ໝາຍເຖິງ “chatbot” ເທົ່ານັ້ນ. ການຝັງ ແລະ ຮູບແບບການປາກເວົ້າສາມາດເປັນແບບພື້ນຖານໄດ້ເຊັ່ນກັນ, ເພາະວ່າພວກມັນກວ້າງຂວາງ ແລະ ສາມາດນຳມາໃຊ້ຄືນໄດ້ໃນທົ່ວໜ້າວຽກຕ່າງໆ ( Bommasani et al., 2021 , NIST ).


7) ເບິ່ງໃກ້ໆ: ວິທີການຮຽນຮູ້ຂອງຮູບແບບພື້ນຖານພາສາ (ລຸ້ນ vibe) 🧠🧃

ຮູບແບບພື້ນຖານພາສາ (ມັກເອີ້ນວ່າ LLMs) ໂດຍປົກກະຕິແລ້ວແມ່ນໄດ້ຮັບການຝຶກອົບຮົມກ່ຽວກັບຊຸດຂໍ້ຄວາມຈຳນວນຫຼວງຫຼາຍ. ພວກມັນຮຽນຮູ້ໂດຍການຄາດຄະເນໂທເຄັນ ( Brown et al., 2020 ). ພຽງເທົ່ານີ້. ບໍ່ມີຝຸ່ນນາງຟ້າລັບໆ.

ແຕ່ສິ່ງມະຫັດສະຈັນແມ່ນວ່າ ການຄາດຄະເນໂທເຄັນບັງຄັບໃຫ້ຮູບແບບຮຽນຮູ້ໂຄງສ້າງ ( CSET ):

  • ໄວຍາກອນ ແລະ ວາຈົກ

  • ຄວາມສຳພັນທາງຫົວຂໍ້

  • ຮູບແບບຄ້າຍຄືກັບການຫາເຫດຜົນ (ບາງຄັ້ງ)

  • ລຳດັບຄວາມຄິດທົ່ວໄປ

  • ວິທີທີ່ຄົນອະທິບາຍສິ່ງຕ່າງໆ, ໂຕ້ຖຽງ, ຂໍໂທດ, ເຈລະຈາ, ສອນ

ມັນຄືກັບການຮຽນຮູ້ທີ່ຈະຮຽນແບບການສົນທະນາຫຼາຍລ້ານຄັ້ງໂດຍທີ່ບໍ່ "ເຂົ້າໃຈ" ໃນແບບທີ່ມະນຸດເຮັດ. ເຊິ່ງຟັງຄືວ່າມັນບໍ່ຄວນເຮັດວຽກ... ແຕ່ມັນກໍຍັງເຮັດວຽກຢູ່.

ການເວົ້າເກີນຈິງເລັກນ້ອຍຢ່າງໜຶ່ງ: ມັນຄືກັບການບີບອັດການຂຽນຂອງມະນຸດເຂົ້າໄປໃນສະໝອງທີ່ມີຄວາມເປັນໄປໄດ້ສູງ.
ແຕ່ອີກເທື່ອໜຶ່ງ, ຄຳປຽບທຽບນັ້ນຖືກສາບແຊ່ງເລັກນ້ອຍ. ແຕ່ພວກເຮົາກໍ່ຍ້າຍ 😄


8) ເບິ່ງໃກ້ໆ: ຮູບແບບການແຜ່ກະຈາຍ (ເປັນຫຍັງຮູບພາບຈຶ່ງເຮັດວຽກແຕກຕ່າງກັນ) 🎨🌀

ຮູບແບບພື້ນຖານຮູບພາບມັກໃຊ້ ການແຜ່ກະຈາຍ ( Ho et al., 2020 , Rombach et al., 2021 ).

ແນວຄວາມຄິດທີ່ຫຍາບຄາຍ:

  1. ເພີ່ມສຽງລົບກວນໃສ່ຮູບພາບຈົນກວ່າພວກມັນຈະຄົງທີ່ໂທລະພາບ

  2. ຝຶກຊ້ອມຮູບແບບໃຫ້ປີ້ນກັບສຽງລົບກວນນັ້ນເທື່ອລະຂັ້ນຕອນ

  3. ໃນເວລາສ້າງ, ເລີ່ມຕົ້ນດ້ວຍສຽງລົບກວນ ແລະ “ຫຼຸດສຽງລົບກວນ” ເຂົ້າໄປໃນຮູບພາບທີ່ນຳພາໂດຍການກະຕຸ້ນ ( Ho et al., 2020 )

ນີ້ແມ່ນເຫດຜົນທີ່ການສ້າງຮູບພາບຮູ້ສຶກຄືກັບການ "ພັດທະນາ" ຮູບພາບ, ຍົກເວັ້ນຮູບພາບທີ່ເປັນມັງກອນໃສ່ເກີບແຕະຢູ່ໃນຮ້ານຂາຍເຄື່ອງແຫ້ງ 🛒🐉

ຮູບແບບການແຜ່ກະຈາຍແມ່ນດີເພາະວ່າ:

  • ພວກເຂົາສ້າງຮູບພາບທີ່ມີຄຸນນະພາບສູງ

  • ພວກເຂົາສາມາດຖືກນໍາພາຢ່າງແຂງແຮງໂດຍຂໍ້ຄວາມ

  • ພວກມັນສະໜັບສະໜູນການປັບປຸງແບບຊ້ຳໆ (ການປ່ຽນແປງ, ການທາສີ, ການຍົກລະດັບ) ( Rombach et al., 2021 )

ບາງຄັ້ງພວກເຂົາຍັງມີບັນຫາກັບ:

  • ການສະແດງຂໍ້ຄວາມພາຍໃນຮູບພາບ

  • ລາຍລະອຽດດ້ານກາຍวิภาค

  • ເອກະລັກຂອງຕົວລະຄອນທີ່ສອດຄ່ອງກັນໃນທົ່ວສາກຕ່າງໆ (ມັນກຳລັງດີຂຶ້ນ, ແຕ່ຍັງດີຢູ່)


9) ເບິ່ງໃກ້ໆ: ຮູບແບບພື້ນຖານຫຼາຍຮູບແບບ (ຂໍ້ຄວາມ + ຮູບພາບ + ສຽງ) 👀🎧📝

ຮູບແບບພື້ນຖານຫຼາຍຮູບແບບມີຈຸດປະສົງເພື່ອເຂົ້າໃຈ ແລະ ສ້າງຂໍ້ມູນໃນຫຼາຍປະເພດ:

  • ຂໍ້ຄວາມ

  • ຮູບພາບ

  • ສຽງ

  • ວິດີໂອ

  • ບາງຄັ້ງການປ້ອນຂໍ້ມູນຄ້າຍຄືເຊັນເຊີ ( ໂປຣໄຟລ໌ AI ລຸ້ນ NIST )

ເປັນຫຍັງສິ່ງນີ້ຈຶ່ງສຳຄັນໃນຊີວິດຈິງ:

  • ຝ່າຍຊ່ວຍເຫຼືອລູກຄ້າສາມາດຕີຄວາມພາບໜ້າຈໍໄດ້

  • ເຄື່ອງມືການເຂົ້າເຖິງສາມາດອະທິບາຍຮູບພາບໄດ້

  • ແອັບການສຶກສາສາມາດອະທິບາຍແຜນວາດໄດ້

  • ຜູ້ສ້າງສາມາດຣີມິກຮູບແບບຕ່າງໆໄດ້ໄວ

  • ເຄື່ອງມືທາງທຸລະກິດສາມາດ "ອ່ານ" ພາບໜ້າຈໍຂອງແຜງຄວບຄຸມ ແລະ ສະຫຼຸບມັນໄດ້

ພາຍໃຕ້ຝາປິດ, ລະບົບຫຼາຍຮູບແບບມັກຈະຈັດລຽງການນຳສະເໜີ:

  • ປ່ຽນຮູບພາບໃຫ້ເປັນການຝັງ

  • ປ່ຽນຂໍ້ຄວາມໃຫ້ເປັນການຝັງ

  • ຮຽນຮູ້ພື້ນທີ່ຮ່ວມກັນບ່ອນທີ່ “ແມວ” ກົງກັບພິກເຊວແມວ 😺 ( Radford et al., 2021 )

ມັນບໍ່ແມ່ນວ່າມັນຈະສະຫງ່າງາມສະເໝີໄປ. ບາງຄັ້ງມັນກໍ່ຖືກຫຍິບຕິດກັນຄືກັບຜ້າຫົ່ມ. ແຕ່ມັນກໍ່ໃຊ້ໄດ້ຜົນ.


10) ການປັບແຕ່ງລະອຽດ vs ການກະຕຸ້ນ vs RAG (ວິທີທີ່ເຈົ້າປັບຮູບແບບພື້ນຖານ) 🧰

ຖ້າທ່ານກຳລັງພະຍາຍາມເຮັດໃຫ້ຮູບແບບພື້ນຖານສາມາດນຳໃຊ້ໄດ້ຈິງສຳລັບຂົງເຂດສະເພາະໃດໜຶ່ງ (ທາງດ້ານກົດໝາຍ, ການແພດ, ການບໍລິການລູກຄ້າ, ຄວາມຮູ້ພາຍໃນ), ທ່ານມີບາງສິ່ງກີດຂວາງຄື:

ກະຕຸ້ນ🗣️

ໄວທີ່ສຸດ ແລະ ງ່າຍທີ່ສຸດ.

  • ຂໍ້ດີ: ບໍ່ມີການຝຶກອົບຮົມ, ເຮັດຊ້ຳໄດ້ທັນທີ

  • ຂໍ້ເສຍ: ອາດຈະບໍ່ສອດຄ່ອງກັນ, ຂໍ້ຈຳກັດຂອງບໍລິບົດ, ຄວາມບອບບາງຂອງການກະຕຸ້ນ

ການປັບແຕ່ງຢ່າງລະອຽດ🎯

ຝຶກແບບຈຳລອງຕື່ມອີກກ່ຽວກັບຕົວຢ່າງຂອງເຈົ້າ.

  • ຂໍ້ດີ: ພຶດຕິກຳທີ່ສອດຄ່ອງກັນຫຼາຍຂຶ້ນ, ພາສາໂດເມນທີ່ດີກວ່າ, ສາມາດຫຼຸດຄວາມຍາວຂອງຂໍ້ຄວາມໄດ້

  • ຂໍ້ເສຍ: ຄ່າໃຊ້ຈ່າຍ, ຄວາມຕ້ອງການຄຸນນະພາບຂໍ້ມູນ, ຄວາມສ່ຽງຂອງການໃຊ້ງານຫຼາຍເກີນໄປ, ການບຳລຸງຮັກສາ

ການປັບແຕ່ງນ້ຳໜັກເບົາ (LoRA / ອະແດບເຕີ) 🧩

ຮຸ່ນທີ່ມີປະສິດທິພາບຫຼາຍກວ່າຂອງການປັບແຕ່ງແບບລະອຽດ ( Hu et al., 2021 ).

  • ຂໍ້ດີ: ລາຄາຖືກກວ່າ, ໂມດູນ, ງ່າຍຕໍ່ການແລກປ່ຽນ

  • ຂໍ້ເສຍ: ຍັງຕ້ອງການຂັ້ນຕອນການຝຶກອົບຮົມ ແລະ ການປະເມີນຜົນ

RAG (ການສ້າງແບບເຕີມເຕັມທີ່ດຶງຂໍ້ມູນຄືນ) 🔎

ຮູບແບບດັ່ງກ່າວດຶງເອົາເອກະສານທີ່ກ່ຽວຂ້ອງຈາກຖານຄວາມຮູ້ຂອງທ່ານ ແລະ ຄຳຕອບໂດຍໃຊ້ເອກະສານເຫຼົ່ານັ້ນ ( Lewis et al., 2020 ).

  • ຂໍ້ດີ: ຄວາມຮູ້ທີ່ທັນສະໄໝ, ການອ້າງອີງພາຍໃນ (ຖ້າທ່ານນຳໃຊ້ມັນ), ການຝຶກອົບຮົມຄືນໃໝ່ໜ້ອຍລົງ

  • ຂໍ້ເສຍ: ຄຸນນະພາບການດຶງຂໍ້ມູນຄືນສາມາດເຮັດໃຫ້ມັນສຳເລັດ ຫຼື ລົ້ມເຫຼວໄດ້, ຕ້ອງການການແບ່ງສ່ວນທີ່ດີ + ການຝັງ

ການເວົ້າຕົວຈິງ: ລະບົບທີ່ປະສົບຜົນສຳເລັດຫຼາຍຢ່າງລວມການກະຕຸ້ນ + RAG. ການປັບແຕ່ງແບບລະອຽດແມ່ນມີພະລັງ, ແຕ່ບໍ່ຈຳເປັນສະເໝີໄປ. ຜູ້ຄົນກະໂດດໄປຫາມັນໄວເກີນໄປເພາະມັນຟັງແລ້ວໜ້າປະທັບໃຈ 😅


11) ຄວາມສ່ຽງ, ຂໍ້ຈຳກັດ, ແລະພາກສ່ວນ “ກະລຸນາຢ່ານຳໃຊ້ສິ່ງນີ້ຢ່າງບໍ່ຄິດ” 🧯😬

ຮູບແບບພື້ນຖານມີປະສິດທິພາບ, ແຕ່ພວກມັນບໍ່ໝັ້ນຄົງຄືກັບຊອບແວແບບດັ້ງເດີມ. ພວກມັນຄ້າຍຄືກັບ... ນັກສຶກສາຝຶກງານທີ່ມີພອນສະຫວັນທີ່ມີບັນຫາຄວາມໝັ້ນໃຈ.

ຂໍ້ຈຳກັດທີ່ສຳຄັນໃນການວາງແຜນ:

ພາບຫຼອນ🌀

ຮູບແບບອາດຈະປະດິດ:

  • ແຫຼ່ງທີ່ມາປອມ

  • ຂໍ້ເທັດຈິງທີ່ບໍ່ຖືກຕ້ອງ

  • ຂັ້ນຕອນທີ່ໜ້າເຊື່ອຖືແຕ່ຜິດພາດ ( Ji et al., 2023 )

ການຫຼຸດຜ່ອນ:

  • RAG ທີ່ມີສະພາບການພື້ນຖານ ( Lewis et al., 2020 )

  • ຜົນຜະລິດທີ່ມີຂໍ້ຈຳກັດ (ໂຄງຮ່າງ, ການເອີ້ນໃຊ້ເຄື່ອງມື)

  • ຄຳສັ່ງ “ຢ່າຄາດເດົາ” ຢ່າງຊັດເຈນ

  • ຊັ້ນການຢັ້ງຢືນ (ກົດລະບຽບ, ການກວດສອບຂ້າມ, ການທົບທວນໂດຍມະນຸດ)

ອະຄະຕິ ແລະ ຮູບແບບທີ່ເປັນອັນຕະລາຍ ⚠️

ເນື່ອງຈາກຂໍ້ມູນການຝຶກອົບຮົມສະທ້ອນເຖິງມະນຸດ, ທ່ານສາມາດໄດ້ຮັບ:

  • ແບບແຜນ

  • ການປະຕິບັດທີ່ບໍ່ສະເໝີພາບກັນລະຫວ່າງກຸ່ມຕ່າງໆ

  • ການສຳເລັດທີ່ບໍ່ປອດໄພ ( NIST AI RMF 1.0 , Bommasani et al., 2021 )

ການຫຼຸດຜ່ອນ:

ຄວາມເປັນສ່ວນຕົວ ແລະ ການຮົ່ວໄຫຼຂອງຂໍ້ມູນ 🔒

ຖ້າທ່ານປ້ອນຂໍ້ມູນລັບເຂົ້າໄປໃນຈຸດສິ້ນສຸດຂອງຮູບແບບ, ທ່ານຈໍາເປັນຕ້ອງຮູ້:

  • ມັນຖືກເກັບຮັກສາແນວໃດ

  • ບໍ່ວ່າຈະໃຊ້ສຳລັບການຝຶກອົບຮົມຫຼືບໍ່

  • ມີການບັນທຶກຫຍັງແດ່

  • ສິ່ງທີ່ຄວບຄຸມຄວາມຕ້ອງການຂອງອົງກອນຂອງທ່ານ ( NIST AI RMF 1.0 )

ການຫຼຸດຜ່ອນ:

  • ຕົວເລືອກການນຳໃຊ້ສ່ວນຕົວ

  • ການປົກຄອງທີ່ເຂັ້ມແຂງ

  • ການເປີດເຜີຍຂໍ້ມູນໜ້ອຍທີ່ສຸດ

  • RAG ພາຍໃນເທົ່ານັ້ນທີ່ມີການຄວບຄຸມການເຂົ້າເຖິງຢ່າງເຂັ້ມງວດ ( ໂປຣໄຟລ໌ AI ທົ່ວໄປຂອງ NIST , Carlini et al., 2021 )

ການສັກຢາຢ່າງຮີບດ່ວນ (ໂດຍສະເພາະດ້ວຍຜ້າເຊັດປາກ) 🕳️

ຖ້າຮູບແບບອ່ານຂໍ້ຄວາມທີ່ບໍ່ໜ້າເຊື່ອຖື, ຂໍ້ຄວາມນັ້ນສາມາດພະຍາຍາມປັບແຕ່ງມັນໄດ້:

ການຫຼຸດຜ່ອນ:

  • ຄຳແນະນຳກ່ຽວກັບລະບົບແຍກ

  • ເຮັດຄວາມສະອາດເນື້ອຫາທີ່ດຶງມາ

  • ໃຊ້ນະໂຍບາຍທີ່ອີງໃສ່ເຄື່ອງມື (ບໍ່ພຽງແຕ່ການກະຕຸ້ນເຕືອນເທົ່ານັ້ນ)

  • ທົດສອບດ້ວຍການປ້ອນຂໍ້ມູນແບບກົງກັນຂ້າມ ( OWASP Cheat Sheet , NIST Generative AI Profile )

ບໍ່ໄດ້ພະຍາຍາມເຮັດໃຫ້ເຈົ້າຢ້ານ. ພຽງແຕ່... ມັນດີກວ່າທີ່ຈະຮູ້ວ່າແຜ່ນພື້ນມີສຽງດັງຢູ່ໃສ.


12) ວິທີການເລືອກຮູບແບບພື້ນຖານສຳລັບກໍລະນີການນຳໃຊ້ຂອງທ່ານ 🎛️

ຖ້າທ່ານເລືອກຮູບແບບພື້ນຖານ (ຫຼື ກໍ່ສ້າງຕໍ່ຈາກຮູບແບບໜຶ່ງ), ໃຫ້ເລີ່ມຕົ້ນດ້ວຍຄຳແນະນຳເຫຼົ່ານີ້:

ກຳນົດສິ່ງທີ່ເຈົ້າກຳລັງສ້າງ 🧾

  • ຂໍ້ຄວາມເທົ່ານັ້ນ

  • ຮູບພາບ

  • ສຽງ

  • ຫຼາຍຮູບແບບປະສົມ

ກຳນົດມາດຕະຖານຄວາມເປັນຈິງຂອງເຈົ້າ📌

ຖ້າທ່ານຕ້ອງການຄວາມຖືກຕ້ອງສູງ (ການເງິນ, ສຸຂະພາບ, ກົດໝາຍ, ຄວາມປອດໄພ):

  • ເຈົ້າຈະຕ້ອງການໃຊ້ RAG ( Lewis et al., 2020 )

  • ທ່ານຈະຕ້ອງການການຢືນຢັນ

  • ທ່ານຈະຕ້ອງການກວດສອບໂດຍມະນຸດ (ຢ່າງໜ້ອຍບາງຄັ້ງ) ( NIST AI RMF 1.0 )

ຕັດສິນໃຈເປົ້າໝາຍຄວາມຊັກຊ້າຂອງເຈົ້າ ⚡

ການສົນທະນາແມ່ນເຮັດໄດ້ທັນທີ. ການສະຫຼຸບແບບກຸ່ມອາດຈະຊ້າລົງ.
ຖ້າທ່ານຕ້ອງການການຕອບສະໜອງທັນທີ, ຂະໜາດຂອງໂມເດວ ແລະ ການໂຮດຕິ້ງແມ່ນມີຄວາມສຳຄັນ.

ຄວາມຕ້ອງການດ້ານຄວາມເປັນສ່ວນຕົວ ແລະ ການປະຕິບັດຕາມກົດລະບຽບຂອງແຜນທີ່ 🔐

ບາງທີມຕ້ອງການ:

  • ການນຳໃຊ້ໃນສະຖານທີ່ / VPC

  • ບໍ່ມີການເກັບຮັກສາຂໍ້ມູນ

  • ບັນທຶກການກວດສອບທີ່ເຂັ້ມງວດ

  • ການຄວບຄຸມການເຂົ້າເຖິງຕໍ່ເອກະສານ ( NIST AI RMF 1.0 , NIST Generative AI Profile )

ດຸ່ນດ່ຽງງົບປະມານ - ແລະຄວາມອົດທົນໃນການປະຕິບັດການ 😅

ການໂຮດຕິ້ງດ້ວຍຕົນເອງໃຫ້ການຄວບຄຸມແຕ່ເພີ່ມຄວາມສັບສົນ.
API ທີ່ມີການຈັດການແມ່ນງ່າຍແຕ່ສາມາດມີລາຄາແພງ ແລະ ປັບແຕ່ງໄດ້ໜ້ອຍກວ່າ.

ຄຳແນະນຳທີ່ເປັນປະໂຫຍດເລັກນ້ອຍ: ສ້າງແບບຕົ້ນແບບດ້ວຍສິ່ງທີ່ງ່າຍກ່ອນ, ຈາກນັ້ນເຮັດໃຫ້ແຂງໃນພາຍຫຼັງ. ການເລີ່ມຕົ້ນດ້ວຍການຕັ້ງຄ່າ "ສົມບູນແບບ" ໂດຍປົກກະຕິແລ້ວຈະເຮັດໃຫ້ທຸກຢ່າງຊ້າລົງ.


13) ຮູບແບບພື້ນຖານໃນ Generative AI ແມ່ນຫຍັງ? (ຮູບແບບທາງຈິດໃຈໄວ) 🧠✨

ລອງເອົາມັນກັບຄືນມາ. ຮູບແບບພື້ນຖານໃນ Generative AI ແມ່ນຫຍັງ?

ພວກເຂົາແມ່ນ:

  • ຮູບແບບຂະໜາດໃຫຍ່, ທົ່ວໄປທີ່ໄດ້ຮັບການຝຶກອົບຮົມກ່ຽວກັບຂໍ້ມູນກວ້າງ ( NIST , Stanford CRFM )

  • ສາມາດສ້າງເນື້ອຫາ (ຂໍ້ຄວາມ, ຮູບພາບ, ສຽງ, ແລະອື່ນໆ) ( ໂປຣໄຟລ໌ NIST Generative AI )

  • ສາມາດປັບຕົວເຂົ້າກັບວຽກງານຫຼາຍຢ່າງຜ່ານການກະຕຸ້ນ, ການປັບແຕ່ງລະອຽດ, ແລະ ການດຶງຂໍ້ມູນຄືນ ( Bommasani et al., 2021 )

  • ຊັ້ນພື້ນຖານທີ່ໃຫ້ພະລັງງານແກ່ຜະລິດຕະພັນ AI ທີ່ທັນສະໄໝທີ່ສຸດ

ພວກມັນບໍ່ແມ່ນສະຖາປັດຕະຍະກຳ ຫຼື ຍີ່ຫໍ້ດຽວ. ພວກມັນເປັນໝວດໝູ່ຂອງຮູບແບບທີ່ປະພຶດຕົວຄືກັບແພລດຟອມ.

ຮູບແບບພື້ນຖານບໍ່ຄືກັບເຄື່ອງຄິດເລກ ແຕ່ຄ້າຍຄືກັບເຮືອນຄົວຫຼາຍກວ່າ. ເຈົ້າສາມາດແຕ່ງກິນອາຫານໄດ້ຫຼາຍຢ່າງໃນນັ້ນ. ເຈົ້າຍັງສາມາດປີ້ງເຂົ້າຈີ່ໄດ້ຖ້າເຈົ້າບໍ່ໄດ້ເອົາໃຈໃສ່... ແຕ່ເຮືອນຄົວຍັງສະດວກຢູ່ 🍳🔥


14) ສະຫຼຸບ ແລະ ເອົາໄປກິນ ✅🙂

ຮູບແບບພື້ນຖານແມ່ນເຄື່ອງຈັກທີ່ສາມາດນຳມາໃຊ້ຄືນໄດ້ຂອງ AI ທີ່ສ້າງສັນ. ພວກມັນໄດ້ຮັບການຝຶກອົບຮົມຢ່າງກວ້າງຂວາງ, ຈາກນັ້ນປັບຕົວເຂົ້າກັບວຽກງານສະເພາະໂດຍຜ່ານການກະຕຸ້ນ, ການປັບແຕ່ງຢ່າງລະອຽດ, ແລະ ການຄົ້ນຫາຄືນ ( NIST , Stanford CRFM ). ພວກມັນສາມາດເປັນສິ່ງທີ່ໜ້າອັດສະຈັນ, ບໍ່ເປັນລະບຽບ, ມີພະລັງ, ແລະ ບາງຄັ້ງຄາວກໍ່ເປັນຕາຫົວຂວັນ - ທັງໝົດໃນເທື່ອດຽວ.

ສະຫຼຸບ:

  • ຮູບແບບພື້ນຖານ = ຮູບແບບພື້ນຖານທົ່ວໄປ ( NIST )

  • AI ທີ່ສ້າງສັນ = ການສ້າງເນື້ອຫາ, ບໍ່ພຽງແຕ່ການຈັດປະເພດ ( ໂປຣໄຟລ໌ AI ທີ່ສ້າງສັນ NIST )

  • ວິທີການປັບຕົວ (ການກະຕຸ້ນ, RAG, ການປັບ) ເຮັດໃຫ້ມັນໃຊ້ໄດ້ຈິງ ( Lewis et al., 2020 , Hu et al., 2021 )

  • ການເລືອກຮູບແບບແມ່ນກ່ຽວກັບການແລກປ່ຽນ: ຄວາມຖືກຕ້ອງ, ຄ່າໃຊ້ຈ່າຍ, ຄວາມຊັກຊ້າ, ຄວາມເປັນສ່ວນຕົວ, ຄວາມປອດໄພ ( NIST AI RMF 1.0 )

ຖ້າທ່ານກຳລັງສ້າງສິ່ງໃດກໍ່ຕາມດ້ວຍ AI ທີ່ສ້າງສັນ, ການເຂົ້າໃຈຮູບແບບພື້ນຖານບໍ່ແມ່ນທາງເລືອກ. ມັນແມ່ນພື້ນທີ່ທັງໝົດທີ່ອາຄານຕັ້ງຢູ່... ແລະແມ່ນແລ້ວ, ບາງຄັ້ງພື້ນກໍ່ສັ່ນເລັກນ້ອຍ 😅

ຄຳຖາມທີ່ຖືກຖາມເລື້ອຍໆ

ຮູບແບບພື້ນຖານ, ໃນແງ່ງ່າຍໆ

ຮູບແບບພື້ນຖານແມ່ນຮູບແບບ AI ຂະໜາດໃຫຍ່ທີ່ມີຈຸດປະສົງທົ່ວໄປທີ່ໄດ້ຮັບການຝຶກອົບຮົມກ່ຽວກັບຂໍ້ມູນຢ່າງກວ້າງຂວາງ ດັ່ງນັ້ນມັນສາມາດນຳໃຊ້ຄືນໄດ້ສຳລັບວຽກງານຫຼາຍຢ່າງ. ແທນທີ່ຈະສ້າງຮູບແບບໜຶ່ງຕໍ່ວຽກ, ທ່ານເລີ່ມຕົ້ນດ້ວຍຮູບແບບ "ພື້ນຖານ" ທີ່ເຂັ້ມແຂງ ແລະ ປັບມັນຕາມຄວາມຕ້ອງການ. ການປັບຕົວນັ້ນມັກຈະເກີດຂຶ້ນຜ່ານການກະຕຸ້ນ, ການປັບແຕ່ງລະອຽດ, ການດຶງຂໍ້ມູນຄືນ (RAG), ຫຼື ເຄື່ອງມືຕ່າງໆ. ແນວຄວາມຄິດຫຼັກແມ່ນຄວາມກວ້າງບວກກັບຄວາມສາມາດໃນການຊີ້ນຳ.

ຮູບແບບພື້ນຖານແຕກຕ່າງຈາກຮູບແບບ AI ສະເພາະໜ້າວຽກແບບດັ້ງເດີມແນວໃດ

AI ແບບດັ້ງເດີມມັກຈະຝຶກອົບຮົມຮູບແບບແຍກຕ່າງຫາກສຳລັບແຕ່ລະໜ້າວຽກ, ເຊັ່ນ: ການວິເຄາະຄວາມຮູ້ສຶກ ຫຼື ການແປ. ຮູບແບບພື້ນຖານຈະປ່ຽນຮູບແບບນັ້ນ: ຝຶກອົບຮົມລ່ວງໜ້າພຽງຄັ້ງດຽວ, ຈາກນັ້ນນຳໃຊ້ຄືນໃໝ່ໃນຫຼາຍໆຄຸນສົມບັດ ແລະ ຜະລິດຕະພັນ. ສິ່ງນີ້ສາມາດຫຼຸດຜ່ອນຄວາມພະຍາຍາມທີ່ຊໍ້າຊ້ອນ ແລະ ເລັ່ງການສົ່ງມອບຄວາມສາມາດໃໝ່. ຂໍ້ເສຍປຽບແມ່ນພວກມັນສາມາດຄາດເດົາໄດ້ໜ້ອຍກວ່າຊອບແວຄລາສສິກ ເວັ້ນເສຍແຕ່ວ່າທ່ານຈະເພີ່ມຂໍ້ຈຳກັດ ແລະ ການທົດສອບ.

ຮູບແບບພື້ນຖານໃນ AI ທີ່ສ້າງສັນ

ໃນ AI ທີ່ສ້າງສັນ, ຮູບແບບພື້ນຖານແມ່ນລະບົບພື້ນຖານທີ່ສາມາດຜະລິດເນື້ອຫາໃໝ່ເຊັ່ນ: ຂໍ້ຄວາມ, ຮູບພາບ, ສຽງ, ລະຫັດ ຫຼື ຜົນຜະລິດຫຼາຍຮູບແບບ. ພວກມັນບໍ່ໄດ້ຈຳກັດພຽງແຕ່ການຕິດສະຫຼາກ ຫຼື ການຈັດປະເພດ; ພວກມັນສ້າງການຕອບສະໜອງທີ່ຄ້າຍຄືກັບວຽກງານທີ່ມະນຸດສ້າງຂຶ້ນ. ເນື່ອງຈາກພວກມັນຮຽນຮູ້ຮູບແບບທີ່ກວ້າງຂວາງໃນລະຫວ່າງການຝຶກອົບຮົມກ່ອນ, ພວກເຂົາສາມາດຈັດການກັບປະເພດ ແລະ ຮູບແບບການກະຕຸ້ນຫຼາຍຢ່າງ. ພວກມັນແມ່ນ "ຊັ້ນພື້ນຖານ" ທີ່ຢູ່ເບື້ອງຫຼັງປະສົບການການສ້າງທີ່ທັນສະໄໝສ່ວນໃຫຍ່.

ວິທີການທີ່ຮູບແບບພື້ນຖານຮຽນຮູ້ໃນລະຫວ່າງການຝຶກອົບຮົມກ່ອນ

ຮູບແບບພື້ນຖານພາສາສ່ວນໃຫຍ່ຮຽນຮູ້ໂດຍການຄາດເດົາໂທເຄັນ, ເຊັ່ນ: ຄຳສັບຕໍ່ໄປ ຫຼື ຄຳສັບທີ່ຫາຍໄປໃນຂໍ້ຄວາມ. ຈຸດປະສົງງ່າຍໆນັ້ນຊຸກຍູ້ໃຫ້ພວກເຂົາເຂົ້າໃຈໂຄງສ້າງເຊັ່ນ: ໄວຍາກອນ, ແບບ, ແລະຮູບແບບການອະທິບາຍທົ່ວໄປ. ພວກເຂົາຍັງສາມາດດູດຊຶມຄວາມຮູ້ຂອງໂລກໄດ້ຢ່າງຫຼວງຫຼາຍ, ເຖິງແມ່ນວ່າບໍ່ແມ່ນສະເໝີໄປທີ່ຈະໜ້າເຊື່ອຖື. ຜົນໄດ້ຮັບແມ່ນຕົວແທນທົ່ວໄປທີ່ເຂັ້ມແຂງທີ່ທ່ານສາມາດນຳໄປສູ່ວຽກງານສະເພາະໃນພາຍຫຼັງ.

ຄວາມແຕກຕ່າງລະຫວ່າງການກະຕຸ້ນ, ການປັບແຕ່ງລະອຽດ, LoRA, ແລະ RAG

ການກະຕຸ້ນເຕືອນແມ່ນວິທີທີ່ໄວທີ່ສຸດໃນການຄວບຄຸມພຶດຕິກຳໂດຍໃຊ້ຄຳແນະນຳ, ແຕ່ມັນອາດຈະບອບບາງ. ການປັບແຕ່ງແບບລະອຽດຈະຝຶກອົບຮົມແບບຈຳລອງຕື່ມອີກໃນຕົວຢ່າງຂອງທ່ານເພື່ອໃຫ້ມີພຶດຕິກຳທີ່ສອດຄ່ອງກັນຫຼາຍຂຶ້ນ, ແຕ່ມັນເພີ່ມຄ່າໃຊ້ຈ່າຍ ແລະ ການບຳລຸງຮັກສາ. LoRA/ອະແດບເຕີແມ່ນວິທີການປັບແຕ່ງທີ່ເບົາກວ່າ ເຊິ່ງມັກຈະມີລາຄາຖືກກວ່າ ແລະ ເປັນໂມດູນຫຼາຍກວ່າ. RAG ດຶງເອົາເອກະສານທີ່ກ່ຽວຂ້ອງ ແລະ ໃຫ້ຄຳຕອບແບບຈຳລອງໂດຍໃຊ້ສະພາບການນັ້ນ, ເຊິ່ງຊ່ວຍໃຫ້ມີຄວາມສົດໃໝ່ ແລະ ພື້ນຖານ.

ເວລາທີ່ຈະໃຊ້ RAG ແທນການປັບແຕ່ງລະອຽດ

RAG ມັກຈະເປັນທາງເລືອກທີ່ດີເມື່ອທ່ານຕ້ອງການຄຳຕອບທີ່ອີງໃສ່ເອກະສານປະຈຸບັນ ຫຼື ພື້ນຖານຄວາມຮູ້ພາຍໃນຂອງທ່ານ. ມັນສາມາດຫຼຸດຜ່ອນ “ການຄາດເດົາ” ໂດຍການສະໜອງຮູບແບບດ້ວຍສະພາບການທີ່ກ່ຽວຂ້ອງໃນເວລາສ້າງ. ການປັບແຕ່ງລະອຽດແມ່ນເໝາະສົມກວ່າເມື່ອທ່ານຕ້ອງການຮູບແບບທີ່ສອດຄ່ອງ, ການໃຊ້ຄຳສັບໂດເມນ, ຫຼື ພຶດຕິກຳທີ່ການກະຕຸ້ນບໍ່ສາມາດຜະລິດໄດ້ຢ່າງໜ້າເຊື່ອຖື. ລະບົບທີ່ໃຊ້ໄດ້ຈິງຫຼາຍຢ່າງລວມການກະຕຸ້ນ + RAG ກ່ອນທີ່ຈະເຂົ້າເຖິງການປັບແຕ່ງລະອຽດ.

ວິທີການຫຼຸດຜ່ອນອາການປະສາດຫຼອນ ແລະ ໄດ້ຮັບຄຳຕອບທີ່ໜ້າເຊື່ອຖືຫຼາຍຂຶ້ນ

ວິທີການທົ່ວໄປແມ່ນການນຳຮູບແບບມາໃຊ້ກັບການຄົ້ນຫາຄືນ (RAG) ເພື່ອໃຫ້ມັນຢູ່ໃກ້ກັບສະພາບການທີ່ກຳນົດໃຫ້. ທ່ານຍັງສາມາດຈຳກັດຜົນຜະລິດດ້ວຍຮູບແບບ, ຮຽກຮ້ອງໃຫ້ມີການເອີ້ນໃຊ້ເຄື່ອງມືສຳລັບຂັ້ນຕອນທີ່ສຳຄັນ, ແລະ ເພີ່ມຄຳແນະນຳ "ຢ່າຄາດເດົາ" ທີ່ຊັດເຈນ. ຊັ້ນການຢັ້ງຢືນກໍ່ມີຄວາມສຳຄັນເຊັ່ນກັນ, ເຊັ່ນ: ການກວດສອບກົດລະບຽບ, ການກວດສອບຂ້າມ, ແລະ ການທົບທວນຂອງມະນຸດສຳລັບກໍລະນີການນຳໃຊ້ທີ່ມີຄວາມສ່ຽງສູງ. ປະຕິບັດຕໍ່ຮູບແບບຄືກັບຜູ້ຊ່ວຍທີ່ຄາດຄະເນໄດ້, ບໍ່ແມ່ນແຫຼ່ງຄວາມຈິງໂດຍຄ່າເລີ່ມຕົ້ນ.

ຄວາມສ່ຽງທີ່ໃຫຍ່ທີ່ສຸດກັບຮູບແບບພື້ນຖານໃນການຜະລິດ

ຄວາມສ່ຽງທົ່ວໄປປະກອບມີການຫຼອນ, ຮູບແບບທີ່ມີອະຄະຕິ ຫຼື ເປັນອັນຕະລາຍຈາກຂໍ້ມູນການຝຶກອົບຮົມ, ແລະ ການຮົ່ວໄຫຼຄວາມເປັນສ່ວນຕົວ ຖ້າຂໍ້ມູນທີ່ລະອຽດອ່ອນຖືກຈັດການບໍ່ດີ. ລະບົບຍັງສາມາດມີຄວາມສ່ຽງຕໍ່ການສີດຂໍ້ມູນຢ່າງວ່ອງໄວ, ໂດຍສະເພາະເມື່ອຮູບແບບອ່ານຂໍ້ຄວາມທີ່ບໍ່ໜ້າເຊື່ອຖືຈາກເອກະສານ ຫຼື ເນື້ອຫາເວັບ. ການຫຼຸດຜ່ອນຄວາມສ່ຽງມັກຈະປະກອບມີການຄຸ້ມຄອງ, ການຈັດກຸ່ມ, ການຄວບຄຸມການເຂົ້າເຖິງ, ຮູບແບບການກະຕຸ້ນທີ່ປອດໄພກວ່າ, ແລະ ການປະເມີນຜົນທີ່ມີໂຄງສ້າງ. ວາງແຜນສຳລັບຄວາມສ່ຽງເຫຼົ່ານີ້ແຕ່ຫົວທີແທນທີ່ຈະແກ້ໄຂໃນພາຍຫຼັງ.

ການສີດຢາຢ່າງວ່ອງໄວ ແລະ ເປັນຫຍັງມັນຈຶ່ງສຳຄັນໃນລະບົບ RAG

ການສີດຂໍ້ມູນແບບວ່ອງໄວແມ່ນເວລາທີ່ຂໍ້ຄວາມທີ່ບໍ່ໜ້າເຊື່ອຖືພະຍາຍາມລົບລ້າງຄຳແນະນຳ, ເຊັ່ນ "ບໍ່ສົນໃຈຄຳແນະນຳກ່ອນໜ້ານີ້" ຫຼື "ເປີດເຜີຍຄວາມລັບ." ໃນ RAG, ເອກະສານທີ່ຖືກດຶງມາສາມາດມີຄຳແນະນຳທີ່ເປັນອັນຕະລາຍເຫຼົ່ານັ້ນ, ແລະຮູບແບບອາດຈະປະຕິບັດຕາມພວກມັນຖ້າທ່ານບໍ່ລະມັດລະວັງ. ວິທີການທົ່ວໄປແມ່ນການແຍກຄຳແນະນຳຂອງລະບົບ, ເຮັດຄວາມສະອາດເນື້ອຫາທີ່ດຶງມາ, ແລະອີງໃສ່ນະໂຍບາຍທີ່ອີງໃສ່ເຄື່ອງມືແທນທີ່ຈະເປັນການກະຕຸ້ນພຽງຢ່າງດຽວ. ການທົດສອບດ້ວຍການປ້ອນຂໍ້ມູນແບບກົງກັນຂ້າມຊ່ວຍເປີດເຜີຍຈຸດອ່ອນ.

ວິທີການເລືອກຮູບແບບພື້ນຖານສຳລັບກໍລະນີການນຳໃຊ້ຂອງທ່ານ

ເລີ່ມຕົ້ນດ້ວຍການກຳນົດສິ່ງທີ່ທ່ານຕ້ອງການສ້າງ: ຂໍ້ຄວາມ, ຮູບພາບ, ສຽງ, ລະຫັດ ຫຼື ຜົນຜະລິດຫຼາຍຮູບແບບ. ຈາກນັ້ນຕັ້ງຄ່າແຖບຂໍ້ເທັດຈິງຂອງທ່ານ - ໂດເມນທີ່ມີຄວາມແມ່ນຍຳສູງມັກຈະຕ້ອງການການຕໍ່ສາຍດິນ (RAG), ການກວດສອບຄວາມຖືກຕ້ອງ, ແລະບາງຄັ້ງການກວດສອບໂດຍມະນຸດ. ພິຈາລະນາຄວາມຊັກຊ້າ ແລະ ຄ່າໃຊ້ຈ່າຍ, ເພາະວ່າຮູບແບບທີ່ເຂັ້ມແຂງທີ່ຊ້າ ຫຼື ລາຄາແພງອາດຈະຍາກທີ່ຈະສົ່ງ. ສຸດທ້າຍ, ຄວາມເປັນສ່ວນຕົວຂອງແຜນທີ່ ແລະ ການປະຕິບັດຕາມຄວາມຕ້ອງການຕໍ່ກັບຕົວເລືອກການນຳໃຊ້ ແລະ ການຄວບຄຸມ.

ເອກະສານອ້າງອີງ

  1. ສະຖາບັນມາດຕະຖານ ແລະ ເຕັກໂນໂລຊີແຫ່ງຊາດ (NIST) - ຮູບແບບພື້ນຖານ (ຄຳສັບໃນອະຖິຖານ) - csrc.nist.gov

  2. ສະຖາບັນມາດຕະຖານ ແລະ ເຕັກໂນໂລຊີແຫ່ງຊາດ (NIST) - NIST AI 600-1: ໂປຣໄຟລ໌ AI ທີ່ສ້າງສັນ - nvlpubs.nist.gov

  3. ສະຖາບັນມາດຕະຖານ ແລະ ເຕັກໂນໂລຊີແຫ່ງຊາດ (NIST) - NIST AI 100-1: ຂອບການຄຸ້ມຄອງຄວາມສ່ຽງດ້ານ AI (AI RMF 1.0) - nvlpubs.nist.gov

  4. ສູນຄົ້ນຄວ້າກ່ຽວກັບຮູບແບບພື້ນຖານ Stanford (CRFM) - ບົດລາຍງານ - crfm.stanford.edu

  5. arXiv - ກ່ຽວກັບໂອກາດ ແລະຄວາມສ່ຽງຂອງຕົວແບບພື້ນຖານ (Bommasani et al., 2021) - arxiv.org

  6. arXiv - ຮູບແບບພາສາແມ່ນຜູ້ຮຽນທີ່ມີໂອກາດໜ້ອຍ (Brown et al., 2020) - arxiv.org

  7. arXiv - ການສ້າງແບບເຕີມເຕີມເພື່ອດຶງຂໍ້ມູນສຳລັບວຽກງານ NLP ທີ່ມີຄວາມຮູ້ຫຼາຍ (Lewis et al., 2020) - arxiv.org

  8. arXiv - LoRA: ການປັບຕົວລະດັບຕ່ຳຂອງຮູບແບບພາສາຂະໜາດໃຫຍ່ (Hu et al., 2021) - arxiv.org

  9. arXiv - BERT: ການຝຶກອົບຮົມລ່ວງໜ້າຂອງຕົວປ່ຽນສອງທິດທາງທີ່ເລິກເຊິ່ງສຳລັບການເຂົ້າໃຈພາສາ (Devlin et al., 2018) - arxiv.org

  10. arXiv - ຮູບແບບພາສາທີ່ລະອຽດແມ່ນຜູ້ຮຽນທີ່ບໍ່ມີຈຸດອ່ອນ (Wei et al., 2021) - arxiv.org

  11. ຫໍສະໝຸດດິຈິຕອລ ACM - ການສຳຫຼວດການຫຼອນຫຼອນໃນການສ້າງພາສາທຳມະຊາດ (Ji et al., 2023) - dl.acm.org

  12. arXiv - ການຮຽນຮູ້ຮູບແບບສາຍຕາທີ່ສາມາດໂອນໄດ້ຈາກການຊີ້ນຳພາສາທຳມະຊາດ (Radford et al., 2021) - arxiv.org

  13. arXiv - ຮູບແບບຄວາມເປັນໄປໄດ້ຂອງການແຜ່ກະຈາຍສຽງລົບກວນ (Ho et al., 2020) - arxiv.org

  14. arXiv - ການສັງເຄາະຮູບພາບຄວາມລະອຽດສູງດ້ວຍຮູບແບບການແຜ່ກະຈາຍແຝງ (Rombach et al., 2021) - arxiv.org

  15. arXiv - ການດຶງເອົາຂໍ້ມູນຜ່ານໜາແໜ້ນສຳລັບການຕອບຄຳຖາມແບບ Open-Domain (Karpukhin et al., 2020) - arxiv.org

  16. arXiv - ຫໍສະໝຸດ Faiss (Douze et al., 2024) - arxiv.org

  17. OpenAI - ແນະນຳ Whisper - openai.com

  18. arXiv - ການສັງເຄາະ TTS ຕາມທຳມະຊາດໂດຍການປັບສະພາບ WaveNet ກ່ຽວກັບການຄາດຄະເນສະເປກໂຕຣແກຣມ Mel (Shen et al., 2017) - arxiv.org

  19. ສູນຄວາມປອດໄພ ແລະ ເຕັກໂນໂລຊີທີ່ພົ້ນເດັ່ນ (CSET), ມະຫາວິທະຍາໄລ Georgetown - ພະລັງທີ່ໜ້າປະຫລາດໃຈຂອງການຄາດຄະເນຄຳສັບຕໍ່ໄປ: ການອະທິບາຍຮູບແບບພາສາຂະໜາດໃຫຍ່ (ພາກທີ 1) - cset.georgetown.edu

  20. USENIX - ການສະກັດຂໍ້ມູນການຝຶກອົບຮົມຈາກຮູບແບບພາສາຂະໜາດໃຫຍ່ (Carlini et al., 2021) - usenix.org

  21. OWASP - LLM01: ການສັກຢາແບບໄວ - genai.owasp.org

  22. arXiv - ຫຼາຍກວ່າທີ່ທ່ານໄດ້ຮ້ອງຂໍ: ການວິເຄາະທີ່ສົມບູນແບບກ່ຽວກັບໄພຂົ່ມຂູ່ການສີດແບບກະຕຸ້ນໃໝ່ຕໍ່ຮູບແບບພາສາຂະໜາດໃຫຍ່ທີ່ປະສົມປະສານກັບແອັບພລິເຄຊັນ (Greshake et al., 2023) - arxiv.org

  23. ຊຸດເອກະສານ Cheat Sheet ຂອງ OWASP - ເອກະສານ Cheat Sheet ປ້ອງກັນການສັກຢາ LLM - cheatsheetseries.owasp.org

ຊອກຫາ AI ລ່າສຸດໄດ້ທີ່ຮ້ານ AI Assistant ຢ່າງເປັນທາງການ

ກ່ຽວກັບພວກເຮົາ

ກັບໄປທີ່ບລັອກ