ຄຳຕອບສັ້ນໆ: ຮູບແບບພື້ນຖານແມ່ນຮູບແບບ AI ຂະໜາດໃຫຍ່ທີ່ມີຈຸດປະສົງທົ່ວໄປທີ່ໄດ້ຮັບການຝຶກອົບຮົມກ່ຽວກັບຊຸດຂໍ້ມູນທີ່ກວ້າງຂວາງ, ຫຼັງຈາກນັ້ນຈຶ່ງຖືກປັບໃຫ້ເໝາະສົມກັບວຽກງານຫຼາຍຢ່າງ (ການຂຽນ, ການຄົ້ນຫາ, ການຂຽນໂປຣແກຣມ, ຮູບພາບ) ຜ່ານການກະຕຸ້ນ, ການປັບແຕ່ງ, ເຄື່ອງມື ຫຼື ການດຶງຂໍ້ມູນຄືນ. ຖ້າທ່ານຕ້ອງການຄຳຕອບທີ່ໜ້າເຊື່ອຖື, ໃຫ້ຈັບຄູ່ກັບພື້ນຖານ (ເຊັ່ນ RAG), ຂໍ້ຈຳກັດທີ່ຊັດເຈນ, ແລະ ການກວດສອບ, ແທນທີ່ຈະປ່ອຍໃຫ້ພວກມັນປັບປຸງ.
ບົດຮຽນຫຼັກ:
ຄຳນິຍາມ : ຮູບແບບພື້ນຖານທີ່ໄດ້ຮັບການຝຶກອົບຮົມຢ່າງກວ້າງຂວາງອັນໜຶ່ງຖືກນຳໃຊ້ຄືນໃນຫຼາຍໆໜ້າວຽກ, ບໍ່ແມ່ນໜ້າວຽກໜຶ່ງຕໍ່ຮູບແບບ.
ການປັບຕົວ : ໃຊ້ການກະຕຸ້ນ, ການປັບແຕ່ງລະອຽດ, LoRA/ຕົວປັບ, RAG, ແລະ ເຄື່ອງມືຕ່າງໆເພື່ອຄວບຄຸມພຶດຕິກຳ.
ຄວາມເໝາະສົມທີ່ສ້າງສັນ : ພວກມັນຊ່ວຍໃຫ້ສາມາດສ້າງຂໍ້ຄວາມ, ຮູບພາບ, ສຽງ, ລະຫັດ ແລະ ເນື້ອຫາຫຼາຍຮູບແບບ.
ສັນຍານຄຸນນະພາບ : ໃຫ້ຄວາມສຳຄັນກັບການຄວບຄຸມ, ອາການຫຼອນໜ້ອຍລົງ, ຄວາມສາມາດໃນການຄິດຫຼາຍຮູບແບບ, ແລະ ການອະນຸມານທີ່ມີປະສິດທິພາບ.
ການຄວບຄຸມຄວາມສ່ຽງ : ວາງແຜນສຳລັບພາບຫຼອນ, ອະຄະຕິ, ການຮົ່ວໄຫຼຄວາມເປັນສ່ວນຕົວ, ແລະ ການສັກຢາຢ່າງວ່ອງໄວຜ່ານການຄຸ້ມຄອງ ແລະ ການທົດສອບ.

ບົດຄວາມທີ່ທ່ານອາດຈະຢາກອ່ານຫຼັງຈາກບົດຄວາມນີ້:
🔗 ບໍລິສັດ AI ແມ່ນຫຍັງ
ເຂົ້າໃຈວິທີທີ່ບໍລິສັດ AI ສ້າງຜະລິດຕະພັນ, ທີມງານ ແລະ ຮູບແບບລາຍຮັບ.
🔗 ລະຫັດ AI ມີລັກສະນະແນວໃດ
ເບິ່ງຕົວຢ່າງຂອງລະຫັດ AI, ຕັ້ງແຕ່ຮູບແບບ Python ຈົນເຖິງ APIs.
🔗 ອັລກໍຣິທຶມ AI ແມ່ນຫຍັງ
ຮຽນຮູ້ວ່າອັລກໍຣິທຶມ AI ແມ່ນຫຍັງ ແລະ ພວກມັນຕັດສິນໃຈແນວໃດ.
🔗 ເທັກໂນໂລຢີ AI ແມ່ນຫຍັງ
ສຳຫຼວດເທັກໂນໂລຢີ AI ຫຼັກທີ່ຂັບເຄື່ອນລະບົບອັດຕະໂນມັດ, ການວິເຄາະ ແລະ ແອັບອັດສະລິຍະ.
1) ຮູບແບບພື້ນຖານ - ຄຳນິຍາມທີ່ບໍ່ມີໝອກ 🧠
ຮູບ ແບບພື້ນຖານ ແມ່ນຮູບແບບ AI ຂະໜາດໃຫຍ່ ແລະ ມີຈຸດປະສົງທົ່ວໄປທີ່ໄດ້ຮັບການຝຶກອົບຮົມກ່ຽວກັບຂໍ້ມູນຢ່າງກວ້າງຂວາງ (ໂດຍປົກກະຕິແລ້ວແມ່ນຂໍ້ມູນຈຳນວນຫຼວງຫຼາຍ) ສະນັ້ນມັນສາມາດປັບຕົວເຂົ້າກັບວຽກງານຫຼາຍຢ່າງ, ບໍ່ພຽງແຕ່ວຽກງານດຽວ ( NIST , Stanford CRFM ).
ແທນທີ່ຈະສ້າງແບບຈຳລອງແຍກຕ່າງຫາກສຳລັບ:
-
ການຂຽນອີເມວ
-
ການຕອບຄຳຖາມ
-
ການສະຫຼຸບ PDF
-
ກຳລັງສ້າງຮູບພາບ
-
ການຈັດປະເພດປີ້ສະໜັບສະໜູນ
-
ການແປພາສາ
-
ການແນະນຳລະຫັດ
...ເຈົ້າຝຶກອົບຮົມຮູບແບບພື້ນຖານໃຫຍ່ອັນໜຶ່ງທີ່ "ຮຽນຮູ້ໂລກ" ໃນລັກສະນະທາງສະຖິຕິທີ່ບໍ່ຊັດເຈນ, ຈາກນັ້ນເຈົ້າ ປັບ ມັນໃຫ້ເຂົ້າກັບວຽກສະເພາະດ້ວຍການກະຕຸ້ນ, ການປັບແຕ່ງລະອຽດ, ຫຼືເຄື່ອງມືເພີ່ມເຕີມ ( Bommasani et al., 2021 ).
ເວົ້າອີກຢ່າງໜຶ່ງ: ມັນເປັນ ເຄື່ອງຈັກທົ່ວໄປ ທີ່ທ່ານສາມາດຄວບຄຸມໄດ້.
ແລະແມ່ນແລ້ວ, ຄຳສຳຄັນແມ່ນ “ທົ່ວໄປ.” ນັ້ນແມ່ນເຄັດລັບທັງໝົດ.
2) ຮູບແບບພື້ນຖານໃນ Generative AI ແມ່ນຫຍັງ? (ພວກມັນເໝາະສົມກັນແນວໃດໂດຍສະເພາະ) 🎨📝
ສະນັ້ນ, ຮູບແບບພື້ນຖານໃນ Generative AI ແມ່ນຫຍັງ? ພວກມັນແມ່ນຮູບແບບພື້ນຖານທີ່ໃຫ້ພະລັງງານແກ່ລະບົບທີ່ສາມາດ ສ້າງ ເນື້ອຫາໃໝ່ໄດ້ - ຂໍ້ຄວາມ, ຮູບພາບ, ສຽງ, ລະຫັດ, ວິດີໂອ, ແລະ ການປະສົມປະສານທີ່ເພີ່ມຂຶ້ນເລື້ອຍໆຂອງທັງໝົດເຫຼົ່ານັ້ນ ( NIST , NIST Generative AI Profile ).
ປັນຍາປະດິດທີ່ສ້າງຂື້ນບໍ່ພຽງແຕ່ກ່ຽວກັບການຄາດຄະເນປ້າຍຊື່ເຊັ່ນ "ສະແປມ / ບໍ່ແມ່ນສະແປມ". ມັນກ່ຽວກັບການຜະລິດຜົນຜະລິດທີ່ເບິ່ງຄືວ່າພວກມັນຖືກສ້າງຂຶ້ນໂດຍຄົນ.
-
ວັກ
-
ບົດກະວີ
-
ລາຍລະອຽດຜະລິດຕະພັນ
-
ຮູບປະກອບ
-
ທຳນອງເພງ
-
ຕົ້ນແບບແອັບ
-
ສຽງສັງເຄາະ
-
ແລະບາງຄັ້ງກໍ່ເວົ້າເລື່ອງໄຮ້ສາລະທີ່ໜ້າເຊື່ອຖືບໍ່ໄດ້ 🙃
ຮູບແບບພື້ນຖານແມ່ນ ດີ ໂດຍສະເພາະ
-
ພວກເຂົາໄດ້ດູດຊຶມຮູບແບບທີ່ກວ້າງຂວາງຈາກຊຸດຂໍ້ມູນຂະໜາດໃຫຍ່ ( Bommasani et al., 2021 )
-
ພວກມັນສາມາດລວມເຂົ້າກັບການກະຕຸ້ນໃໝ່ໆ (ແມ່ນແຕ່ການກະຕຸ້ນທີ່ແປກປະຫຼາດ) ( Brown et al., 2020 )
-
ພວກມັນສາມາດຖືກນໍາໃຊ້ຄືນໃໝ່ສໍາລັບຜົນຜະລິດຫຼາຍສິບຢ່າງໂດຍບໍ່ຕ້ອງຝຶກອົບຮົມຄືນໃໝ່ຕັ້ງແຕ່ເລີ່ມຕົ້ນ ( Bommasani et al., 2021 )
ພວກມັນແມ່ນ "ຊັ້ນພື້ນຖານ" - ຄືກັບແປ້ງເຂົ້າຈີ່. ເຈົ້າສາມາດອົບມັນເປັນເຂົ້າຈີ່ຝຣັ່ງ, ພິຊຊ່າ, ຫຼື ເຂົ້າຈີ່ອົບຊິນນາມອນ... ບໍ່ແມ່ນຄຳປຽບທຽບທີ່ສົມບູນແບບ, ແຕ່ເຈົ້າເຂົ້າໃຈຂ້ອຍ 😄
3) ເປັນຫຍັງເຂົາເຈົ້າຈຶ່ງປ່ຽນແປງທຸກຢ່າງ (ແລະເປັນຫຍັງຄົນຈຶ່ງບໍ່ຢຸດເວົ້າກ່ຽວກັບເຂົາເຈົ້າ) 🚀
ກ່ອນຮູບແບບພື້ນຖານ, AI ຫຼາຍຢ່າງແມ່ນສະເພາະໜ້າວຽກ:
-
ຝຶກອົບຮົມຮູບແບບສຳລັບການວິເຄາະຄວາມຮູ້ສຶກ
-
ຝຶກຄົນອື່ນໃຫ້ແປ
-
ຝຶກອົບຮົມອີກອັນໜຶ່ງສຳລັບການຈັດປະເພດຮູບພາບ
-
ຝຶກອົບຮົມອີກອັນໜຶ່ງສຳລັບການຮັບຮູ້ໜ່ວຍງານທີ່ມີຊື່
ສິ່ງນັ້ນໄດ້ຜົນ, ແຕ່ມັນຊ້າ, ລາຄາແພງ, ແລະຂ້ອນຂ້າງ... ແຕກຫັກງ່າຍ.
ຮູບແບບພື້ນຖານໄດ້ປ່ຽນມັນ:
-
ຝຶກຊ້ອມລ່ວງໜ້າຄັ້ງໜຶ່ງ (ຄວາມພະຍາຍາມຢ່າງໃຫຍ່ຫຼວງ)
-
ນຳໃຊ້ຄືນໃໝ່ໄດ້ທຸກບ່ອນ (ການຈ່າຍເງິນໃຫຍ່) ( Bommasani et al., 2021 )
ການນຳໃຊ້ຄືນໃໝ່ນັ້ນແມ່ນຕົວຄູນ. ບໍລິສັດຕ່າງໆສາມາດສ້າງ 20 ຄຸນສົມບັດຢູ່ເທິງສຸດຂອງຄອບຄົວຮຸ່ນດຽວ, ແທນທີ່ຈະປະດິດລໍ້ໃໝ່ 20 ເທື່ອ.
ນອກຈາກນີ້, ປະສົບການຂອງຜູ້ໃຊ້ກໍ່ເປັນທຳມະຊາດຫຼາຍຂຶ້ນ:
-
ເຈົ້າບໍ່ "ໃຊ້ຕົວຈັດປະເພດ"
-
ເຈົ້າລົມກັບນາງແບບຄືກັບວ່າລາວເປັນເພື່ອນຮ່ວມງານທີ່ຊ່ວຍເຫຼືອດີ ແຕ່ບໍ່ເຄີຍນອນຫຼັບ ☕🤝
ບາງຄັ້ງມັນກໍ່ຄືກັບເພື່ອນຮ່ວມງານທີ່ເຂົ້າໃຈຜິດທຸກຢ່າງຢ່າງໝັ້ນໃຈ, ແຕ່ວ່າ. ການເຕີບໂຕ.
4) ແນວຄວາມຄິດຫຼັກ: ການຝຶກອົບຮົມກ່ອນ + ການປັບຕົວ 🧩
ເກືອບທຸກຮູບແບບພື້ນຖານປະຕິບັດຕາມຮູບແບບ ( Stanford CRFM , NIST ):
ການຝຶກອົບຮົມກ່ອນໄວຮຽນ (ໄລຍະ "ດູດຊຶມອິນເຕີເນັດ") 📚
ຮູບແບບດັ່ງກ່າວໄດ້ຮັບການຝຶກອົບຮົມກ່ຽວກັບຊຸດຂໍ້ມູນຂະໜາດໃຫຍ່ ແລະ ກວ້າງຂວາງໂດຍໃຊ້ການຮຽນຮູ້ດ້ວຍຕົນເອງ ( NIST ). ສຳລັບຮູບແບບພາສາ, ໂດຍປົກກະຕິແລ້ວນັ້ນໝາຍເຖິງການຄາດຄະເນຄຳສັບທີ່ຫາຍໄປ ຫຼື ໂທເຄັນຕໍ່ໄປ ( Devlin et al., 2018 , Brown et al., 2020 ).
ຈຸດປະສົງບໍ່ແມ່ນເພື່ອສອນມັນໜ້າວຽກດຽວ. ຈຸດປະສົງແມ່ນເພື່ອສອນມັນ ກ່ຽວກັບການນຳສະເໜີທົ່ວໄປ :
-
ໄວຍາກອນ
-
ຂໍ້ເທັດຈິງ (ປະເພດ)
-
ຮູບແບບການຫາເຫດຜົນ (ບາງຄັ້ງ)
-
ແບບການຂຽນ
-
ໂຄງສ້າງລະຫັດ
-
ເຈດຕະນາທົ່ວໄປຂອງມະນຸດ
ການປັບຕົວ (ໄລຍະ "ເຮັດໃຫ້ມັນໃຊ້ໄດ້ຈິງ") 🛠️
ຫຼັງຈາກນັ້ນ, ທ່ານດັດແປງມັນໂດຍໃຊ້ໜຶ່ງ ຫຼື ຫຼາຍຢ່າງຂອງ:
-
ການກະຕຸ້ນ (ຄຳແນະນຳໃນພາສາທຳມະດາ)
-
ການປັບແຕ່ງຄຳສັ່ງ (ການຝຶກອົບຮົມມັນໃຫ້ປະຕິບັດຕາມຄຳແນະນຳ) ( Wei et al., 2021 )
-
ການປັບແຕ່ງຢ່າງລະອຽດ (ການຝຶກອົບຮົມກ່ຽວກັບຂໍ້ມູນໂດເມນຂອງທ່ານ)
-
LoRA / ຕົວປັບ (ວິທີການປັບແຕ່ງນ້ຳໜັກເບົາ) ( Hu et al., 2021 )
-
RAG (ການສ້າງແບບເຕີມຄືນ - ຮູບແບບຈະປຶກສາຫາລືເອກະສານຂອງທ່ານ) ( Lewis et al., 2020 )
-
ການໃຊ້ເຄື່ອງມື (ຟັງຊັນການເອີ້ນ, ການເບິ່ງລະບົບພາຍໃນ, ແລະອື່ນໆ)
ນີ້ແມ່ນເຫດຜົນທີ່ຮູບແບບພື້ນຖານດຽວກັນສາມາດຂຽນສາກຄວາມຮັກໄດ້... ຈາກນັ້ນຊ່ວຍດີບັກຄິວຣີ SQL ໃນຫ້າວິນາທີຕໍ່ມາ 😭
5) ສິ່ງໃດທີ່ເຮັດໃຫ້ຮູບແບບພື້ນຖານທີ່ດີ? ✅
ນີ້ແມ່ນພາກສ່ວນທີ່ຜູ້ຄົນຂ້າມໄປ, ແລະຫຼັງຈາກນັ້ນກໍ່ເສຍໃຈໃນພາຍຫຼັງ.
ຮູບແບບພື້ນຖານທີ່ "ດີ" ບໍ່ພຽງແຕ່ "ໃຫຍ່ກວ່າ". ໃຫຍ່ກວ່າຊ່ວຍໄດ້, ແນ່ນອນ ... ແຕ່ມັນບໍ່ແມ່ນສິ່ງດຽວ. ຮູບແບບພື້ນຖານທີ່ດີມັກຈະມີ:
ການອະທິບາຍທົ່ວໄປທີ່ເຂັ້ມແຂງ 🧠
ມັນປະຕິບັດໄດ້ດີໃນຫຼາຍໆໜ້າວຽກໂດຍບໍ່ຕ້ອງມີການຝຶກອົບຮົມຄືນໃໝ່ສະເພາະໜ້າວຽກ ( Bommasani et al., 2021 ).
ການຊີ້ນຳ ແລະ ການຄວບຄຸມ 🎛️
ມັນສາມາດປະຕິບັດຕາມຄໍາແນະນໍາໄດ້ຢ່າງໜ້າເຊື່ອຖືເຊັ່ນ:
-
"ໃຫ້ກະທັດຮັດ"
-
"ໃຊ້ຈຸດ bullet"
-
“ຂຽນດ້ວຍນໍ້າສຽງທີ່ເປັນມິດ”
-
"ຢ່າເປີດເຜີຍຂໍ້ມູນທີ່ເປັນຄວາມລັບ"
ບາງຮຸ່ນກໍ່ສະຫຼາດແຕ່ລື່ນ. ຄືກັບການພະຍາຍາມຖືສະບູ່ກ້ອນໜຶ່ງໄວ້ໃນຫ້ອງອາບນໍ້າ. ເປັນປະໂຫຍດ, ແຕ່ບໍ່ສະໝໍ່າສະເໝີ 😅
ແນວໂນ້ມທີ່ຈະເກີດອາການຫຼອນຕ່ຳ (ຫຼືຢ່າງໜ້ອຍກໍ່ຄວາມບໍ່ແນ່ນອນໂດຍກົງ) 🧯
ບໍ່ມີຮູບແບບໃດທີ່ມີພູມຕ້ານທານຕໍ່ການຫຼອນຫຼອນໄດ້, ແຕ່ຮູບແບບທີ່ດີແມ່ນ:
-
ຮູ້ສຶກຫຼອນໜ້ອຍລົງ
-
ຍອມຮັບຄວາມບໍ່ແນ່ນອນເລື້ອຍໆ
-
ໃຫ້ໃກ້ຊິດກັບສະພາບການທີ່ສະໜອງໃຫ້ເມື່ອໃຊ້ການດຶງຂໍ້ມູນ ( Ji et al., 2023 , Lewis et al., 2020 )
ມີຄວາມສາມາດຫຼາຍຮູບແບບໄດ້ດີ (ເມື່ອຕ້ອງການ) 🖼️🎧
ຖ້າທ່ານກຳລັງສ້າງຜູ້ຊ່ວຍທີ່ອ່ານຮູບພາບ, ຕີຄວາມໝາຍຕາຕະລາງ, ຫຼືເຂົ້າໃຈສຽງ, ຫຼາຍຮູບແບບມີຄວາມສຳຄັນຫຼາຍ ( Radford et al., 2021 ).
ການອະນຸມານທີ່ມີປະສິດທິພາບ ⚡
ຄວາມຊັກຊ້າ ແລະ ລາຄາມີຄວາມສຳຄັນ. ຮຸ່ນທີ່ແຂງແຮງແຕ່ຊ້າແມ່ນຄືກັບລົດກິລາທີ່ມີຢາງແຕກ.
ພຶດຕິກຳດ້ານຄວາມປອດໄພ ແລະ ການຈັດລຽນແບບ 🧩
ບໍ່ພຽງແຕ່ “ປະຕິເສດທຸກຢ່າງ”, ແຕ່:
-
ຫຼີກລ່ຽງຄຳແນະນຳທີ່ເປັນອັນຕະລາຍ
-
ຫຼຸດຜ່ອນຄວາມລຳອຽງ
-
ຈັດການກັບຫົວຂໍ້ທີ່ລະອຽດອ່ອນດ້ວຍຄວາມລະມັດລະວັງ
-
ຕ້ານທານກັບຄວາມພະຍາຍາມ jailbreak ພື້ນຖານ (ບາງຢ່າງ…) ( NIST AI RMF 1.0 , NIST Generative AI Profile )
ເອກະສານ + ລະບົບນິເວດ 🌱
ອັນນີ້ຟັງຄືແຫ້ງແລ້ງ, ແຕ່ມັນເປັນຄວາມຈິງ:
-
ເຄື່ອງມື
-
ສາຍຮັດ eval
-
ຕົວເລືອກການນຳໃຊ້
-
ການຄວບຄຸມວິສາຫະກິດ
-
ການສະໜັບສະໜູນການປັບແຕ່ງແບບລະອຽດ
ແມ່ນແລ້ວ, “ລະບົບນິເວດ” ເປັນຄຳສັບທີ່ບໍ່ຈະແຈ້ງ. ຂ້ອຍກໍ່ບໍ່ມັກມັນຄືກັນ. ແຕ່ມັນກໍ່ມີຄວາມໝາຍ.
6) ຕາຕະລາງປຽບທຽບ - ຕົວເລືອກຮູບແບບພື້ນຖານທົ່ວໄປ (ແລະສິ່ງທີ່ພວກມັນດີສຳລັບ) 🧾
ຂ້າງລຸ່ມນີ້ແມ່ນຕາຕະລາງປຽບທຽບທີ່ໃຊ້ໄດ້ຈິງ ແຕ່ບໍ່ສົມບູນແບບເລັກນ້ອຍ. ມັນບໍ່ແມ່ນ "ບັນຊີລາຍຊື່ທີ່ແທ້ຈິງອັນດຽວ", ມັນຄ້າຍຄືກັບ: ສິ່ງທີ່ຄົນເລືອກໃນທຳມະຊາດຫຼາຍກວ່າ.
| ປະເພດເຄື່ອງມື / ຮູບແບບ | ຜູ້ຊົມ | ລາຄາພໍສົມຄວນ | ເປັນຫຍັງມັນເຮັດວຽກ |
|---|---|---|---|
| LLM ທີ່ເປັນຂອງເຈົ້າຂອງ (ແບບສົນທະນາ) | ທີມທີ່ຕ້ອງການຄວາມໄວ + ຄວາມສະຫຼາດ | ອີງຕາມການນຳໃຊ້ / ການສະໝັກໃຊ້ | ການປະຕິບັດຕາມຄຳແນະນຳທີ່ດີເລີດ, ປະສິດທິພາບໂດຍລວມທີ່ເຂັ້ມແຂງ, ໂດຍປົກກະຕິແລ້ວດີທີ່ສຸດ "ນອກກ່ອງ" 😌 |
| LLM ແບບເປີດນ້ຳໜັກ (ສາມາດໂຮດດ້ວຍຕົນເອງໄດ້) | ຜູ້ສ້າງທີ່ຕ້ອງການຄວບຄຸມ | ຄ່າໃຊ້ຈ່າຍດ້ານພື້ນຖານໂຄງລ່າງ (ແລະ ບັນຫາຕ່າງໆ) | ສາມາດປັບແຕ່ງໄດ້, ເປັນມິດກັບຄວາມເປັນສ່ວນຕົວ, ສາມາດດໍາເນີນການໄດ້ໃນທ້ອງຖິ່ນ... ຖ້າທ່ານມັກການຕົບແຕ່ງໃນເວລາທ່ຽງຄືນ |
| ເຄື່ອງສ້າງຮູບພາບການແຜ່ກະຈາຍ | ທີມງານສ້າງສັນ, ທີມງານອອກແບບ | ຈາກຟຣີຫາເສຍເງິນ | ການສັງເຄາະຮູບພາບທີ່ດີເລີດ, ຄວາມຫຼາກຫຼາຍຂອງຮູບແບບ, ຂັ້ນຕອນການເຮັດວຽກແບບຊ້ຳໆ (ຫຼື: ນິ້ວມືອາດຈະຕິດຂັດ) ✋😬 ( Ho et al., 2020 , Rombach et al., 2021 ) |
| ຮູບແບບ “ວິໄສທັດ-ພາສາ” ຫຼາຍຮູບແບບ | ແອັບຯທີ່ອ່ານຮູບພາບ + ຂໍ້ຄວາມ | ອີງຕາມການນຳໃຊ້ | ຊ່ວຍໃຫ້ທ່ານສາມາດຖາມຄຳຖາມກ່ຽວກັບຮູບພາບ, ພາບໜ້າຈໍ, ແຜນວາດ - ມີປະໂຫຍດຢ່າງໜ້າປະຫລາດໃຈ ( Radford et al., 2021 ) |
| ຮູບແບບການຝັງພື້ນຖານ | ຄົ້ນຫາ + ລະບົບ RAG | ຄ່າໃຊ້ຈ່າຍຕໍ່າຕໍ່ການໂທ | ປ່ຽນຂໍ້ຄວາມໃຫ້ເປັນເວັກເຕີສຳລັບການຄົ້ນຫາຄວາມໝາຍ, ການຈັດກຸ່ມ, ການແນະນຳ - ພະລັງງານ MVP ທີ່ງຽບສະຫງົບ ( Karpukhin et al., 2020 , Douze et al., 2024 ) |
| ຮູບແບບພື້ນຖານການປ່ຽນສຽງເປັນຂໍ້ຄວາມ | ສູນໂທ, ຜູ້ສ້າງ | ອີງຕາມການນຳໃຊ້ / ທ້ອງຖິ່ນ | ການຖອດຂໍ້ຄວາມໄວ, ຮອງຮັບຫຼາຍພາສາ, ດີພໍສຳລັບສຽງລົບກວນ (ໂດຍປົກກະຕິ) 🎙️ ( ກະຊິບ ) |
| ຮູບແບບພື້ນຖານການປ່ຽນຂໍ້ຄວາມເປັນສຽງ | ທີມງານຜະລິດຕະພັນ, ສື່ມວນຊົນ | ອີງຕາມການນຳໃຊ້ | ການສ້າງສຽງທີ່ເປັນທຳມະຊາດ, ແບບສຽງ, ການບັນຍາຍ - ສາມາດກາຍເປັນເລື່ອງທີ່ໜ້າຢ້ານຄືກັບຈິງ ( Shen et al., 2017 ) |
| LLM ທີ່ເນັ້ນໃສ່ລະຫັດ | ນັກພັດທະນາ | ອີງຕາມການນຳໃຊ້ / ການສະໝັກໃຊ້ | ເກັ່ງກວ່າໃນຮູບແບບລະຫັດ, ການແກ້ໄຂຂໍ້ຜິດພາດ, ການປັບປຸງໂຄງສ້າງ... ແຕ່ກໍ່ຍັງບໍ່ແມ່ນຜູ້ອ່ານຄວາມຄິດຂອງຂ້ອຍ 😅 |
ສັງເກດວ່າ “ຮູບແບບພື້ນຖານ” ບໍ່ພຽງແຕ່ໝາຍເຖິງ “chatbot” ເທົ່ານັ້ນ. ການຝັງ ແລະ ຮູບແບບການປາກເວົ້າສາມາດເປັນແບບພື້ນຖານໄດ້ເຊັ່ນກັນ, ເພາະວ່າພວກມັນກວ້າງຂວາງ ແລະ ສາມາດນຳມາໃຊ້ຄືນໄດ້ໃນທົ່ວໜ້າວຽກຕ່າງໆ ( Bommasani et al., 2021 , NIST ).
7) ເບິ່ງໃກ້ໆ: ວິທີການຮຽນຮູ້ຂອງຮູບແບບພື້ນຖານພາສາ (ລຸ້ນ vibe) 🧠🧃
ຮູບແບບພື້ນຖານພາສາ (ມັກເອີ້ນວ່າ LLMs) ໂດຍປົກກະຕິແລ້ວແມ່ນໄດ້ຮັບການຝຶກອົບຮົມກ່ຽວກັບຊຸດຂໍ້ຄວາມຈຳນວນຫຼວງຫຼາຍ. ພວກມັນຮຽນຮູ້ໂດຍການຄາດຄະເນໂທເຄັນ ( Brown et al., 2020 ). ພຽງເທົ່ານີ້. ບໍ່ມີຝຸ່ນນາງຟ້າລັບໆ.
ແຕ່ສິ່ງມະຫັດສະຈັນແມ່ນວ່າ ການຄາດຄະເນໂທເຄັນບັງຄັບໃຫ້ຮູບແບບຮຽນຮູ້ໂຄງສ້າງ ( CSET ):
-
ໄວຍາກອນ ແລະ ວາຈົກ
-
ຄວາມສຳພັນທາງຫົວຂໍ້
-
ຮູບແບບຄ້າຍຄືກັບການຫາເຫດຜົນ (ບາງຄັ້ງ)
-
ລຳດັບຄວາມຄິດທົ່ວໄປ
-
ວິທີທີ່ຄົນອະທິບາຍສິ່ງຕ່າງໆ, ໂຕ້ຖຽງ, ຂໍໂທດ, ເຈລະຈາ, ສອນ
ມັນຄືກັບການຮຽນຮູ້ທີ່ຈະຮຽນແບບການສົນທະນາຫຼາຍລ້ານຄັ້ງໂດຍທີ່ບໍ່ "ເຂົ້າໃຈ" ໃນແບບທີ່ມະນຸດເຮັດ. ເຊິ່ງຟັງຄືວ່າມັນບໍ່ຄວນເຮັດວຽກ... ແຕ່ມັນກໍຍັງເຮັດວຽກຢູ່.
ການເວົ້າເກີນຈິງເລັກນ້ອຍຢ່າງໜຶ່ງ: ມັນຄືກັບການບີບອັດການຂຽນຂອງມະນຸດເຂົ້າໄປໃນສະໝອງທີ່ມີຄວາມເປັນໄປໄດ້ສູງ.
ແຕ່ອີກເທື່ອໜຶ່ງ, ຄຳປຽບທຽບນັ້ນຖືກສາບແຊ່ງເລັກນ້ອຍ. ແຕ່ພວກເຮົາກໍ່ຍ້າຍ 😄
8) ເບິ່ງໃກ້ໆ: ຮູບແບບການແຜ່ກະຈາຍ (ເປັນຫຍັງຮູບພາບຈຶ່ງເຮັດວຽກແຕກຕ່າງກັນ) 🎨🌀
ຮູບແບບພື້ນຖານຮູບພາບມັກໃຊ້ ການແຜ່ກະຈາຍ ( Ho et al., 2020 , Rombach et al., 2021 ).
ແນວຄວາມຄິດທີ່ຫຍາບຄາຍ:
-
ເພີ່ມສຽງລົບກວນໃສ່ຮູບພາບຈົນກວ່າພວກມັນຈະຄົງທີ່ໂທລະພາບ
-
ຝຶກຊ້ອມຮູບແບບໃຫ້ປີ້ນກັບສຽງລົບກວນນັ້ນເທື່ອລະຂັ້ນຕອນ
-
ໃນເວລາສ້າງ, ເລີ່ມຕົ້ນດ້ວຍສຽງລົບກວນ ແລະ “ຫຼຸດສຽງລົບກວນ” ເຂົ້າໄປໃນຮູບພາບທີ່ນຳພາໂດຍການກະຕຸ້ນ ( Ho et al., 2020 )
ນີ້ແມ່ນເຫດຜົນທີ່ການສ້າງຮູບພາບຮູ້ສຶກຄືກັບການ "ພັດທະນາ" ຮູບພາບ, ຍົກເວັ້ນຮູບພາບທີ່ເປັນມັງກອນໃສ່ເກີບແຕະຢູ່ໃນຮ້ານຂາຍເຄື່ອງແຫ້ງ 🛒🐉
ຮູບແບບການແຜ່ກະຈາຍແມ່ນດີເພາະວ່າ:
-
ພວກເຂົາສ້າງຮູບພາບທີ່ມີຄຸນນະພາບສູງ
-
ພວກເຂົາສາມາດຖືກນໍາພາຢ່າງແຂງແຮງໂດຍຂໍ້ຄວາມ
-
ພວກມັນສະໜັບສະໜູນການປັບປຸງແບບຊ້ຳໆ (ການປ່ຽນແປງ, ການທາສີ, ການຍົກລະດັບ) ( Rombach et al., 2021 )
ບາງຄັ້ງພວກເຂົາຍັງມີບັນຫາກັບ:
-
ການສະແດງຂໍ້ຄວາມພາຍໃນຮູບພາບ
-
ລາຍລະອຽດດ້ານກາຍวิภาค
-
ເອກະລັກຂອງຕົວລະຄອນທີ່ສອດຄ່ອງກັນໃນທົ່ວສາກຕ່າງໆ (ມັນກຳລັງດີຂຶ້ນ, ແຕ່ຍັງດີຢູ່)
9) ເບິ່ງໃກ້ໆ: ຮູບແບບພື້ນຖານຫຼາຍຮູບແບບ (ຂໍ້ຄວາມ + ຮູບພາບ + ສຽງ) 👀🎧📝
ຮູບແບບພື້ນຖານຫຼາຍຮູບແບບມີຈຸດປະສົງເພື່ອເຂົ້າໃຈ ແລະ ສ້າງຂໍ້ມູນໃນຫຼາຍປະເພດ:
-
ຂໍ້ຄວາມ
-
ຮູບພາບ
-
ສຽງ
-
ວິດີໂອ
-
ບາງຄັ້ງການປ້ອນຂໍ້ມູນຄ້າຍຄືເຊັນເຊີ ( ໂປຣໄຟລ໌ AI ລຸ້ນ NIST )
ເປັນຫຍັງສິ່ງນີ້ຈຶ່ງສຳຄັນໃນຊີວິດຈິງ:
-
ຝ່າຍຊ່ວຍເຫຼືອລູກຄ້າສາມາດຕີຄວາມພາບໜ້າຈໍໄດ້
-
ເຄື່ອງມືການເຂົ້າເຖິງສາມາດອະທິບາຍຮູບພາບໄດ້
-
ແອັບການສຶກສາສາມາດອະທິບາຍແຜນວາດໄດ້
-
ຜູ້ສ້າງສາມາດຣີມິກຮູບແບບຕ່າງໆໄດ້ໄວ
-
ເຄື່ອງມືທາງທຸລະກິດສາມາດ "ອ່ານ" ພາບໜ້າຈໍຂອງແຜງຄວບຄຸມ ແລະ ສະຫຼຸບມັນໄດ້
ພາຍໃຕ້ຝາປິດ, ລະບົບຫຼາຍຮູບແບບມັກຈະຈັດລຽງການນຳສະເໜີ:
-
ປ່ຽນຮູບພາບໃຫ້ເປັນການຝັງ
-
ປ່ຽນຂໍ້ຄວາມໃຫ້ເປັນການຝັງ
-
ຮຽນຮູ້ພື້ນທີ່ຮ່ວມກັນບ່ອນທີ່ “ແມວ” ກົງກັບພິກເຊວແມວ 😺 ( Radford et al., 2021 )
ມັນບໍ່ແມ່ນວ່າມັນຈະສະຫງ່າງາມສະເໝີໄປ. ບາງຄັ້ງມັນກໍ່ຖືກຫຍິບຕິດກັນຄືກັບຜ້າຫົ່ມ. ແຕ່ມັນກໍ່ໃຊ້ໄດ້ຜົນ.
10) ການປັບແຕ່ງລະອຽດ vs ການກະຕຸ້ນ vs RAG (ວິທີທີ່ເຈົ້າປັບຮູບແບບພື້ນຖານ) 🧰
ຖ້າທ່ານກຳລັງພະຍາຍາມເຮັດໃຫ້ຮູບແບບພື້ນຖານສາມາດນຳໃຊ້ໄດ້ຈິງສຳລັບຂົງເຂດສະເພາະໃດໜຶ່ງ (ທາງດ້ານກົດໝາຍ, ການແພດ, ການບໍລິການລູກຄ້າ, ຄວາມຮູ້ພາຍໃນ), ທ່ານມີບາງສິ່ງກີດຂວາງຄື:
ກະຕຸ້ນ🗣️
ໄວທີ່ສຸດ ແລະ ງ່າຍທີ່ສຸດ.
-
ຂໍ້ດີ: ບໍ່ມີການຝຶກອົບຮົມ, ເຮັດຊ້ຳໄດ້ທັນທີ
-
ຂໍ້ເສຍ: ອາດຈະບໍ່ສອດຄ່ອງກັນ, ຂໍ້ຈຳກັດຂອງບໍລິບົດ, ຄວາມບອບບາງຂອງການກະຕຸ້ນ
ການປັບແຕ່ງຢ່າງລະອຽດ🎯
ຝຶກແບບຈຳລອງຕື່ມອີກກ່ຽວກັບຕົວຢ່າງຂອງເຈົ້າ.
-
ຂໍ້ດີ: ພຶດຕິກຳທີ່ສອດຄ່ອງກັນຫຼາຍຂຶ້ນ, ພາສາໂດເມນທີ່ດີກວ່າ, ສາມາດຫຼຸດຄວາມຍາວຂອງຂໍ້ຄວາມໄດ້
-
ຂໍ້ເສຍ: ຄ່າໃຊ້ຈ່າຍ, ຄວາມຕ້ອງການຄຸນນະພາບຂໍ້ມູນ, ຄວາມສ່ຽງຂອງການໃຊ້ງານຫຼາຍເກີນໄປ, ການບຳລຸງຮັກສາ
ການປັບແຕ່ງນ້ຳໜັກເບົາ (LoRA / ອະແດບເຕີ) 🧩
ຮຸ່ນທີ່ມີປະສິດທິພາບຫຼາຍກວ່າຂອງການປັບແຕ່ງແບບລະອຽດ ( Hu et al., 2021 ).
-
ຂໍ້ດີ: ລາຄາຖືກກວ່າ, ໂມດູນ, ງ່າຍຕໍ່ການແລກປ່ຽນ
-
ຂໍ້ເສຍ: ຍັງຕ້ອງການຂັ້ນຕອນການຝຶກອົບຮົມ ແລະ ການປະເມີນຜົນ
RAG (ການສ້າງແບບເຕີມເຕັມທີ່ດຶງຂໍ້ມູນຄືນ) 🔎
ຮູບແບບດັ່ງກ່າວດຶງເອົາເອກະສານທີ່ກ່ຽວຂ້ອງຈາກຖານຄວາມຮູ້ຂອງທ່ານ ແລະ ຄຳຕອບໂດຍໃຊ້ເອກະສານເຫຼົ່ານັ້ນ ( Lewis et al., 2020 ).
-
ຂໍ້ດີ: ຄວາມຮູ້ທີ່ທັນສະໄໝ, ການອ້າງອີງພາຍໃນ (ຖ້າທ່ານນຳໃຊ້ມັນ), ການຝຶກອົບຮົມຄືນໃໝ່ໜ້ອຍລົງ
-
ຂໍ້ເສຍ: ຄຸນນະພາບການດຶງຂໍ້ມູນຄືນສາມາດເຮັດໃຫ້ມັນສຳເລັດ ຫຼື ລົ້ມເຫຼວໄດ້, ຕ້ອງການການແບ່ງສ່ວນທີ່ດີ + ການຝັງ
ການເວົ້າຕົວຈິງ: ລະບົບທີ່ປະສົບຜົນສຳເລັດຫຼາຍຢ່າງລວມການກະຕຸ້ນ + RAG. ການປັບແຕ່ງແບບລະອຽດແມ່ນມີພະລັງ, ແຕ່ບໍ່ຈຳເປັນສະເໝີໄປ. ຜູ້ຄົນກະໂດດໄປຫາມັນໄວເກີນໄປເພາະມັນຟັງແລ້ວໜ້າປະທັບໃຈ 😅
11) ຄວາມສ່ຽງ, ຂໍ້ຈຳກັດ, ແລະພາກສ່ວນ “ກະລຸນາຢ່ານຳໃຊ້ສິ່ງນີ້ຢ່າງບໍ່ຄິດ” 🧯😬
ຮູບແບບພື້ນຖານມີປະສິດທິພາບ, ແຕ່ພວກມັນບໍ່ໝັ້ນຄົງຄືກັບຊອບແວແບບດັ້ງເດີມ. ພວກມັນຄ້າຍຄືກັບ... ນັກສຶກສາຝຶກງານທີ່ມີພອນສະຫວັນທີ່ມີບັນຫາຄວາມໝັ້ນໃຈ.
ຂໍ້ຈຳກັດທີ່ສຳຄັນໃນການວາງແຜນ:
ພາບຫຼອນ🌀
ຮູບແບບອາດຈະປະດິດ:
-
ແຫຼ່ງທີ່ມາປອມ
-
ຂໍ້ເທັດຈິງທີ່ບໍ່ຖືກຕ້ອງ
-
ຂັ້ນຕອນທີ່ໜ້າເຊື່ອຖືແຕ່ຜິດພາດ ( Ji et al., 2023 )
ການຫຼຸດຜ່ອນ:
-
RAG ທີ່ມີສະພາບການພື້ນຖານ ( Lewis et al., 2020 )
-
ຜົນຜະລິດທີ່ມີຂໍ້ຈຳກັດ (ໂຄງຮ່າງ, ການເອີ້ນໃຊ້ເຄື່ອງມື)
-
ຄຳສັ່ງ “ຢ່າຄາດເດົາ” ຢ່າງຊັດເຈນ
-
ຊັ້ນການຢັ້ງຢືນ (ກົດລະບຽບ, ການກວດສອບຂ້າມ, ການທົບທວນໂດຍມະນຸດ)
ອະຄະຕິ ແລະ ຮູບແບບທີ່ເປັນອັນຕະລາຍ ⚠️
ເນື່ອງຈາກຂໍ້ມູນການຝຶກອົບຮົມສະທ້ອນເຖິງມະນຸດ, ທ່ານສາມາດໄດ້ຮັບ:
-
ແບບແຜນ
-
ການປະຕິບັດທີ່ບໍ່ສະເໝີພາບກັນລະຫວ່າງກຸ່ມຕ່າງໆ
-
ການສຳເລັດທີ່ບໍ່ປອດໄພ ( NIST AI RMF 1.0 , Bommasani et al., 2021 )
ການຫຼຸດຜ່ອນ:
-
ການປັບແຕ່ງຄວາມປອດໄພ
-
ທີມແດງ
-
ຕົວກອງເນື້ອຫາ
-
ຂໍ້ຈຳກັດຂອງໂດເມນທີ່ລະມັດລະວັງ ( ໂປຣໄຟລ໌ AI ທົ່ວໄປຂອງ NIST )
ຄວາມເປັນສ່ວນຕົວ ແລະ ການຮົ່ວໄຫຼຂອງຂໍ້ມູນ 🔒
ຖ້າທ່ານປ້ອນຂໍ້ມູນລັບເຂົ້າໄປໃນຈຸດສິ້ນສຸດຂອງຮູບແບບ, ທ່ານຈໍາເປັນຕ້ອງຮູ້:
-
ມັນຖືກເກັບຮັກສາແນວໃດ
-
ບໍ່ວ່າຈະໃຊ້ສຳລັບການຝຶກອົບຮົມຫຼືບໍ່
-
ມີການບັນທຶກຫຍັງແດ່
-
ສິ່ງທີ່ຄວບຄຸມຄວາມຕ້ອງການຂອງອົງກອນຂອງທ່ານ ( NIST AI RMF 1.0 )
ການຫຼຸດຜ່ອນ:
-
ຕົວເລືອກການນຳໃຊ້ສ່ວນຕົວ
-
ການປົກຄອງທີ່ເຂັ້ມແຂງ
-
ການເປີດເຜີຍຂໍ້ມູນໜ້ອຍທີ່ສຸດ
-
RAG ພາຍໃນເທົ່ານັ້ນທີ່ມີການຄວບຄຸມການເຂົ້າເຖິງຢ່າງເຂັ້ມງວດ ( ໂປຣໄຟລ໌ AI ທົ່ວໄປຂອງ NIST , Carlini et al., 2021 )
ການສັກຢາຢ່າງຮີບດ່ວນ (ໂດຍສະເພາະດ້ວຍຜ້າເຊັດປາກ) 🕳️
ຖ້າຮູບແບບອ່ານຂໍ້ຄວາມທີ່ບໍ່ໜ້າເຊື່ອຖື, ຂໍ້ຄວາມນັ້ນສາມາດພະຍາຍາມປັບແຕ່ງມັນໄດ້:
-
"ບໍ່ສົນໃຈຄຳແນະນຳກ່ອນໜ້ານີ້..."
-
“ສົ່ງຄວາມລັບມາໃຫ້ຂ້ອຍ…” ( OWASP , Greshake ແລະ ຄະນະ, 2023 )
ການຫຼຸດຜ່ອນ:
-
ຄຳແນະນຳກ່ຽວກັບລະບົບແຍກ
-
ເຮັດຄວາມສະອາດເນື້ອຫາທີ່ດຶງມາ
-
ໃຊ້ນະໂຍບາຍທີ່ອີງໃສ່ເຄື່ອງມື (ບໍ່ພຽງແຕ່ການກະຕຸ້ນເຕືອນເທົ່ານັ້ນ)
-
ທົດສອບດ້ວຍການປ້ອນຂໍ້ມູນແບບກົງກັນຂ້າມ ( OWASP Cheat Sheet , NIST Generative AI Profile )
ບໍ່ໄດ້ພະຍາຍາມເຮັດໃຫ້ເຈົ້າຢ້ານ. ພຽງແຕ່... ມັນດີກວ່າທີ່ຈະຮູ້ວ່າແຜ່ນພື້ນມີສຽງດັງຢູ່ໃສ.
12) ວິທີການເລືອກຮູບແບບພື້ນຖານສຳລັບກໍລະນີການນຳໃຊ້ຂອງທ່ານ 🎛️
ຖ້າທ່ານເລືອກຮູບແບບພື້ນຖານ (ຫຼື ກໍ່ສ້າງຕໍ່ຈາກຮູບແບບໜຶ່ງ), ໃຫ້ເລີ່ມຕົ້ນດ້ວຍຄຳແນະນຳເຫຼົ່ານີ້:
ກຳນົດສິ່ງທີ່ເຈົ້າກຳລັງສ້າງ 🧾
-
ຂໍ້ຄວາມເທົ່ານັ້ນ
-
ຮູບພາບ
-
ສຽງ
-
ຫຼາຍຮູບແບບປະສົມ
ກຳນົດມາດຕະຖານຄວາມເປັນຈິງຂອງເຈົ້າ📌
ຖ້າທ່ານຕ້ອງການຄວາມຖືກຕ້ອງສູງ (ການເງິນ, ສຸຂະພາບ, ກົດໝາຍ, ຄວາມປອດໄພ):
-
ເຈົ້າຈະຕ້ອງການໃຊ້ RAG ( Lewis et al., 2020 )
-
ທ່ານຈະຕ້ອງການການຢືນຢັນ
-
ທ່ານຈະຕ້ອງການກວດສອບໂດຍມະນຸດ (ຢ່າງໜ້ອຍບາງຄັ້ງ) ( NIST AI RMF 1.0 )
ຕັດສິນໃຈເປົ້າໝາຍຄວາມຊັກຊ້າຂອງເຈົ້າ ⚡
ການສົນທະນາແມ່ນເຮັດໄດ້ທັນທີ. ການສະຫຼຸບແບບກຸ່ມອາດຈະຊ້າລົງ.
ຖ້າທ່ານຕ້ອງການການຕອບສະໜອງທັນທີ, ຂະໜາດຂອງໂມເດວ ແລະ ການໂຮດຕິ້ງແມ່ນມີຄວາມສຳຄັນ.
ຄວາມຕ້ອງການດ້ານຄວາມເປັນສ່ວນຕົວ ແລະ ການປະຕິບັດຕາມກົດລະບຽບຂອງແຜນທີ່ 🔐
ບາງທີມຕ້ອງການ:
-
ການນຳໃຊ້ໃນສະຖານທີ່ / VPC
-
ບໍ່ມີການເກັບຮັກສາຂໍ້ມູນ
-
ບັນທຶກການກວດສອບທີ່ເຂັ້ມງວດ
-
ການຄວບຄຸມການເຂົ້າເຖິງຕໍ່ເອກະສານ ( NIST AI RMF 1.0 , NIST Generative AI Profile )
ດຸ່ນດ່ຽງງົບປະມານ - ແລະຄວາມອົດທົນໃນການປະຕິບັດການ 😅
ການໂຮດຕິ້ງດ້ວຍຕົນເອງໃຫ້ການຄວບຄຸມແຕ່ເພີ່ມຄວາມສັບສົນ.
API ທີ່ມີການຈັດການແມ່ນງ່າຍແຕ່ສາມາດມີລາຄາແພງ ແລະ ປັບແຕ່ງໄດ້ໜ້ອຍກວ່າ.
ຄຳແນະນຳທີ່ເປັນປະໂຫຍດເລັກນ້ອຍ: ສ້າງແບບຕົ້ນແບບດ້ວຍສິ່ງທີ່ງ່າຍກ່ອນ, ຈາກນັ້ນເຮັດໃຫ້ແຂງໃນພາຍຫຼັງ. ການເລີ່ມຕົ້ນດ້ວຍການຕັ້ງຄ່າ "ສົມບູນແບບ" ໂດຍປົກກະຕິແລ້ວຈະເຮັດໃຫ້ທຸກຢ່າງຊ້າລົງ.
13) ຮູບແບບພື້ນຖານໃນ Generative AI ແມ່ນຫຍັງ? (ຮູບແບບທາງຈິດໃຈໄວ) 🧠✨
ລອງເອົາມັນກັບຄືນມາ. ຮູບແບບພື້ນຖານໃນ Generative AI ແມ່ນຫຍັງ?
ພວກເຂົາແມ່ນ:
-
ຮູບແບບຂະໜາດໃຫຍ່, ທົ່ວໄປທີ່ໄດ້ຮັບການຝຶກອົບຮົມກ່ຽວກັບຂໍ້ມູນກວ້າງ ( NIST , Stanford CRFM )
-
ສາມາດສ້າງເນື້ອຫາ (ຂໍ້ຄວາມ, ຮູບພາບ, ສຽງ, ແລະອື່ນໆ) ( ໂປຣໄຟລ໌ NIST Generative AI )
-
ສາມາດປັບຕົວເຂົ້າກັບວຽກງານຫຼາຍຢ່າງຜ່ານການກະຕຸ້ນ, ການປັບແຕ່ງລະອຽດ, ແລະ ການດຶງຂໍ້ມູນຄືນ ( Bommasani et al., 2021 )
-
ຊັ້ນພື້ນຖານທີ່ໃຫ້ພະລັງງານແກ່ຜະລິດຕະພັນ AI ທີ່ທັນສະໄໝທີ່ສຸດ
ພວກມັນບໍ່ແມ່ນສະຖາປັດຕະຍະກຳ ຫຼື ຍີ່ຫໍ້ດຽວ. ພວກມັນເປັນໝວດໝູ່ຂອງຮູບແບບທີ່ປະພຶດຕົວຄືກັບແພລດຟອມ.
ຮູບແບບພື້ນຖານບໍ່ຄືກັບເຄື່ອງຄິດເລກ ແຕ່ຄ້າຍຄືກັບເຮືອນຄົວຫຼາຍກວ່າ. ເຈົ້າສາມາດແຕ່ງກິນອາຫານໄດ້ຫຼາຍຢ່າງໃນນັ້ນ. ເຈົ້າຍັງສາມາດປີ້ງເຂົ້າຈີ່ໄດ້ຖ້າເຈົ້າບໍ່ໄດ້ເອົາໃຈໃສ່... ແຕ່ເຮືອນຄົວຍັງສະດວກຢູ່ 🍳🔥
14) ສະຫຼຸບ ແລະ ເອົາໄປກິນ ✅🙂
ຮູບແບບພື້ນຖານແມ່ນເຄື່ອງຈັກທີ່ສາມາດນຳມາໃຊ້ຄືນໄດ້ຂອງ AI ທີ່ສ້າງສັນ. ພວກມັນໄດ້ຮັບການຝຶກອົບຮົມຢ່າງກວ້າງຂວາງ, ຈາກນັ້ນປັບຕົວເຂົ້າກັບວຽກງານສະເພາະໂດຍຜ່ານການກະຕຸ້ນ, ການປັບແຕ່ງຢ່າງລະອຽດ, ແລະ ການຄົ້ນຫາຄືນ ( NIST , Stanford CRFM ). ພວກມັນສາມາດເປັນສິ່ງທີ່ໜ້າອັດສະຈັນ, ບໍ່ເປັນລະບຽບ, ມີພະລັງ, ແລະ ບາງຄັ້ງຄາວກໍ່ເປັນຕາຫົວຂວັນ - ທັງໝົດໃນເທື່ອດຽວ.
ສະຫຼຸບ:
-
ຮູບແບບພື້ນຖານ = ຮູບແບບພື້ນຖານທົ່ວໄປ ( NIST )
-
AI ທີ່ສ້າງສັນ = ການສ້າງເນື້ອຫາ, ບໍ່ພຽງແຕ່ການຈັດປະເພດ ( ໂປຣໄຟລ໌ AI ທີ່ສ້າງສັນ NIST )
-
ວິທີການປັບຕົວ (ການກະຕຸ້ນ, RAG, ການປັບ) ເຮັດໃຫ້ມັນໃຊ້ໄດ້ຈິງ ( Lewis et al., 2020 , Hu et al., 2021 )
-
ການເລືອກຮູບແບບແມ່ນກ່ຽວກັບການແລກປ່ຽນ: ຄວາມຖືກຕ້ອງ, ຄ່າໃຊ້ຈ່າຍ, ຄວາມຊັກຊ້າ, ຄວາມເປັນສ່ວນຕົວ, ຄວາມປອດໄພ ( NIST AI RMF 1.0 )
ຖ້າທ່ານກຳລັງສ້າງສິ່ງໃດກໍ່ຕາມດ້ວຍ AI ທີ່ສ້າງສັນ, ການເຂົ້າໃຈຮູບແບບພື້ນຖານບໍ່ແມ່ນທາງເລືອກ. ມັນແມ່ນພື້ນທີ່ທັງໝົດທີ່ອາຄານຕັ້ງຢູ່... ແລະແມ່ນແລ້ວ, ບາງຄັ້ງພື້ນກໍ່ສັ່ນເລັກນ້ອຍ 😅
ຄຳຖາມທີ່ຖືກຖາມເລື້ອຍໆ
ຮູບແບບພື້ນຖານ, ໃນແງ່ງ່າຍໆ
ຮູບແບບພື້ນຖານແມ່ນຮູບແບບ AI ຂະໜາດໃຫຍ່ທີ່ມີຈຸດປະສົງທົ່ວໄປທີ່ໄດ້ຮັບການຝຶກອົບຮົມກ່ຽວກັບຂໍ້ມູນຢ່າງກວ້າງຂວາງ ດັ່ງນັ້ນມັນສາມາດນຳໃຊ້ຄືນໄດ້ສຳລັບວຽກງານຫຼາຍຢ່າງ. ແທນທີ່ຈະສ້າງຮູບແບບໜຶ່ງຕໍ່ວຽກ, ທ່ານເລີ່ມຕົ້ນດ້ວຍຮູບແບບ "ພື້ນຖານ" ທີ່ເຂັ້ມແຂງ ແລະ ປັບມັນຕາມຄວາມຕ້ອງການ. ການປັບຕົວນັ້ນມັກຈະເກີດຂຶ້ນຜ່ານການກະຕຸ້ນ, ການປັບແຕ່ງລະອຽດ, ການດຶງຂໍ້ມູນຄືນ (RAG), ຫຼື ເຄື່ອງມືຕ່າງໆ. ແນວຄວາມຄິດຫຼັກແມ່ນຄວາມກວ້າງບວກກັບຄວາມສາມາດໃນການຊີ້ນຳ.
ຮູບແບບພື້ນຖານແຕກຕ່າງຈາກຮູບແບບ AI ສະເພາະໜ້າວຽກແບບດັ້ງເດີມແນວໃດ
AI ແບບດັ້ງເດີມມັກຈະຝຶກອົບຮົມຮູບແບບແຍກຕ່າງຫາກສຳລັບແຕ່ລະໜ້າວຽກ, ເຊັ່ນ: ການວິເຄາະຄວາມຮູ້ສຶກ ຫຼື ການແປ. ຮູບແບບພື້ນຖານຈະປ່ຽນຮູບແບບນັ້ນ: ຝຶກອົບຮົມລ່ວງໜ້າພຽງຄັ້ງດຽວ, ຈາກນັ້ນນຳໃຊ້ຄືນໃໝ່ໃນຫຼາຍໆຄຸນສົມບັດ ແລະ ຜະລິດຕະພັນ. ສິ່ງນີ້ສາມາດຫຼຸດຜ່ອນຄວາມພະຍາຍາມທີ່ຊໍ້າຊ້ອນ ແລະ ເລັ່ງການສົ່ງມອບຄວາມສາມາດໃໝ່. ຂໍ້ເສຍປຽບແມ່ນພວກມັນສາມາດຄາດເດົາໄດ້ໜ້ອຍກວ່າຊອບແວຄລາສສິກ ເວັ້ນເສຍແຕ່ວ່າທ່ານຈະເພີ່ມຂໍ້ຈຳກັດ ແລະ ການທົດສອບ.
ຮູບແບບພື້ນຖານໃນ AI ທີ່ສ້າງສັນ
ໃນ AI ທີ່ສ້າງສັນ, ຮູບແບບພື້ນຖານແມ່ນລະບົບພື້ນຖານທີ່ສາມາດຜະລິດເນື້ອຫາໃໝ່ເຊັ່ນ: ຂໍ້ຄວາມ, ຮູບພາບ, ສຽງ, ລະຫັດ ຫຼື ຜົນຜະລິດຫຼາຍຮູບແບບ. ພວກມັນບໍ່ໄດ້ຈຳກັດພຽງແຕ່ການຕິດສະຫຼາກ ຫຼື ການຈັດປະເພດ; ພວກມັນສ້າງການຕອບສະໜອງທີ່ຄ້າຍຄືກັບວຽກງານທີ່ມະນຸດສ້າງຂຶ້ນ. ເນື່ອງຈາກພວກມັນຮຽນຮູ້ຮູບແບບທີ່ກວ້າງຂວາງໃນລະຫວ່າງການຝຶກອົບຮົມກ່ອນ, ພວກເຂົາສາມາດຈັດການກັບປະເພດ ແລະ ຮູບແບບການກະຕຸ້ນຫຼາຍຢ່າງ. ພວກມັນແມ່ນ "ຊັ້ນພື້ນຖານ" ທີ່ຢູ່ເບື້ອງຫຼັງປະສົບການການສ້າງທີ່ທັນສະໄໝສ່ວນໃຫຍ່.
ວິທີການທີ່ຮູບແບບພື້ນຖານຮຽນຮູ້ໃນລະຫວ່າງການຝຶກອົບຮົມກ່ອນ
ຮູບແບບພື້ນຖານພາສາສ່ວນໃຫຍ່ຮຽນຮູ້ໂດຍການຄາດເດົາໂທເຄັນ, ເຊັ່ນ: ຄຳສັບຕໍ່ໄປ ຫຼື ຄຳສັບທີ່ຫາຍໄປໃນຂໍ້ຄວາມ. ຈຸດປະສົງງ່າຍໆນັ້ນຊຸກຍູ້ໃຫ້ພວກເຂົາເຂົ້າໃຈໂຄງສ້າງເຊັ່ນ: ໄວຍາກອນ, ແບບ, ແລະຮູບແບບການອະທິບາຍທົ່ວໄປ. ພວກເຂົາຍັງສາມາດດູດຊຶມຄວາມຮູ້ຂອງໂລກໄດ້ຢ່າງຫຼວງຫຼາຍ, ເຖິງແມ່ນວ່າບໍ່ແມ່ນສະເໝີໄປທີ່ຈະໜ້າເຊື່ອຖື. ຜົນໄດ້ຮັບແມ່ນຕົວແທນທົ່ວໄປທີ່ເຂັ້ມແຂງທີ່ທ່ານສາມາດນຳໄປສູ່ວຽກງານສະເພາະໃນພາຍຫຼັງ.
ຄວາມແຕກຕ່າງລະຫວ່າງການກະຕຸ້ນ, ການປັບແຕ່ງລະອຽດ, LoRA, ແລະ RAG
ການກະຕຸ້ນເຕືອນແມ່ນວິທີທີ່ໄວທີ່ສຸດໃນການຄວບຄຸມພຶດຕິກຳໂດຍໃຊ້ຄຳແນະນຳ, ແຕ່ມັນອາດຈະບອບບາງ. ການປັບແຕ່ງແບບລະອຽດຈະຝຶກອົບຮົມແບບຈຳລອງຕື່ມອີກໃນຕົວຢ່າງຂອງທ່ານເພື່ອໃຫ້ມີພຶດຕິກຳທີ່ສອດຄ່ອງກັນຫຼາຍຂຶ້ນ, ແຕ່ມັນເພີ່ມຄ່າໃຊ້ຈ່າຍ ແລະ ການບຳລຸງຮັກສາ. LoRA/ອະແດບເຕີແມ່ນວິທີການປັບແຕ່ງທີ່ເບົາກວ່າ ເຊິ່ງມັກຈະມີລາຄາຖືກກວ່າ ແລະ ເປັນໂມດູນຫຼາຍກວ່າ. RAG ດຶງເອົາເອກະສານທີ່ກ່ຽວຂ້ອງ ແລະ ໃຫ້ຄຳຕອບແບບຈຳລອງໂດຍໃຊ້ສະພາບການນັ້ນ, ເຊິ່ງຊ່ວຍໃຫ້ມີຄວາມສົດໃໝ່ ແລະ ພື້ນຖານ.
ເວລາທີ່ຈະໃຊ້ RAG ແທນການປັບແຕ່ງລະອຽດ
RAG ມັກຈະເປັນທາງເລືອກທີ່ດີເມື່ອທ່ານຕ້ອງການຄຳຕອບທີ່ອີງໃສ່ເອກະສານປະຈຸບັນ ຫຼື ພື້ນຖານຄວາມຮູ້ພາຍໃນຂອງທ່ານ. ມັນສາມາດຫຼຸດຜ່ອນ “ການຄາດເດົາ” ໂດຍການສະໜອງຮູບແບບດ້ວຍສະພາບການທີ່ກ່ຽວຂ້ອງໃນເວລາສ້າງ. ການປັບແຕ່ງລະອຽດແມ່ນເໝາະສົມກວ່າເມື່ອທ່ານຕ້ອງການຮູບແບບທີ່ສອດຄ່ອງ, ການໃຊ້ຄຳສັບໂດເມນ, ຫຼື ພຶດຕິກຳທີ່ການກະຕຸ້ນບໍ່ສາມາດຜະລິດໄດ້ຢ່າງໜ້າເຊື່ອຖື. ລະບົບທີ່ໃຊ້ໄດ້ຈິງຫຼາຍຢ່າງລວມການກະຕຸ້ນ + RAG ກ່ອນທີ່ຈະເຂົ້າເຖິງການປັບແຕ່ງລະອຽດ.
ວິທີການຫຼຸດຜ່ອນອາການປະສາດຫຼອນ ແລະ ໄດ້ຮັບຄຳຕອບທີ່ໜ້າເຊື່ອຖືຫຼາຍຂຶ້ນ
ວິທີການທົ່ວໄປແມ່ນການນຳຮູບແບບມາໃຊ້ກັບການຄົ້ນຫາຄືນ (RAG) ເພື່ອໃຫ້ມັນຢູ່ໃກ້ກັບສະພາບການທີ່ກຳນົດໃຫ້. ທ່ານຍັງສາມາດຈຳກັດຜົນຜະລິດດ້ວຍຮູບແບບ, ຮຽກຮ້ອງໃຫ້ມີການເອີ້ນໃຊ້ເຄື່ອງມືສຳລັບຂັ້ນຕອນທີ່ສຳຄັນ, ແລະ ເພີ່ມຄຳແນະນຳ "ຢ່າຄາດເດົາ" ທີ່ຊັດເຈນ. ຊັ້ນການຢັ້ງຢືນກໍ່ມີຄວາມສຳຄັນເຊັ່ນກັນ, ເຊັ່ນ: ການກວດສອບກົດລະບຽບ, ການກວດສອບຂ້າມ, ແລະ ການທົບທວນຂອງມະນຸດສຳລັບກໍລະນີການນຳໃຊ້ທີ່ມີຄວາມສ່ຽງສູງ. ປະຕິບັດຕໍ່ຮູບແບບຄືກັບຜູ້ຊ່ວຍທີ່ຄາດຄະເນໄດ້, ບໍ່ແມ່ນແຫຼ່ງຄວາມຈິງໂດຍຄ່າເລີ່ມຕົ້ນ.
ຄວາມສ່ຽງທີ່ໃຫຍ່ທີ່ສຸດກັບຮູບແບບພື້ນຖານໃນການຜະລິດ
ຄວາມສ່ຽງທົ່ວໄປປະກອບມີການຫຼອນ, ຮູບແບບທີ່ມີອະຄະຕິ ຫຼື ເປັນອັນຕະລາຍຈາກຂໍ້ມູນການຝຶກອົບຮົມ, ແລະ ການຮົ່ວໄຫຼຄວາມເປັນສ່ວນຕົວ ຖ້າຂໍ້ມູນທີ່ລະອຽດອ່ອນຖືກຈັດການບໍ່ດີ. ລະບົບຍັງສາມາດມີຄວາມສ່ຽງຕໍ່ການສີດຂໍ້ມູນຢ່າງວ່ອງໄວ, ໂດຍສະເພາະເມື່ອຮູບແບບອ່ານຂໍ້ຄວາມທີ່ບໍ່ໜ້າເຊື່ອຖືຈາກເອກະສານ ຫຼື ເນື້ອຫາເວັບ. ການຫຼຸດຜ່ອນຄວາມສ່ຽງມັກຈະປະກອບມີການຄຸ້ມຄອງ, ການຈັດກຸ່ມ, ການຄວບຄຸມການເຂົ້າເຖິງ, ຮູບແບບການກະຕຸ້ນທີ່ປອດໄພກວ່າ, ແລະ ການປະເມີນຜົນທີ່ມີໂຄງສ້າງ. ວາງແຜນສຳລັບຄວາມສ່ຽງເຫຼົ່ານີ້ແຕ່ຫົວທີແທນທີ່ຈະແກ້ໄຂໃນພາຍຫຼັງ.
ການສີດຢາຢ່າງວ່ອງໄວ ແລະ ເປັນຫຍັງມັນຈຶ່ງສຳຄັນໃນລະບົບ RAG
ການສີດຂໍ້ມູນແບບວ່ອງໄວແມ່ນເວລາທີ່ຂໍ້ຄວາມທີ່ບໍ່ໜ້າເຊື່ອຖືພະຍາຍາມລົບລ້າງຄຳແນະນຳ, ເຊັ່ນ "ບໍ່ສົນໃຈຄຳແນະນຳກ່ອນໜ້ານີ້" ຫຼື "ເປີດເຜີຍຄວາມລັບ." ໃນ RAG, ເອກະສານທີ່ຖືກດຶງມາສາມາດມີຄຳແນະນຳທີ່ເປັນອັນຕະລາຍເຫຼົ່ານັ້ນ, ແລະຮູບແບບອາດຈະປະຕິບັດຕາມພວກມັນຖ້າທ່ານບໍ່ລະມັດລະວັງ. ວິທີການທົ່ວໄປແມ່ນການແຍກຄຳແນະນຳຂອງລະບົບ, ເຮັດຄວາມສະອາດເນື້ອຫາທີ່ດຶງມາ, ແລະອີງໃສ່ນະໂຍບາຍທີ່ອີງໃສ່ເຄື່ອງມືແທນທີ່ຈະເປັນການກະຕຸ້ນພຽງຢ່າງດຽວ. ການທົດສອບດ້ວຍການປ້ອນຂໍ້ມູນແບບກົງກັນຂ້າມຊ່ວຍເປີດເຜີຍຈຸດອ່ອນ.
ວິທີການເລືອກຮູບແບບພື້ນຖານສຳລັບກໍລະນີການນຳໃຊ້ຂອງທ່ານ
ເລີ່ມຕົ້ນດ້ວຍການກຳນົດສິ່ງທີ່ທ່ານຕ້ອງການສ້າງ: ຂໍ້ຄວາມ, ຮູບພາບ, ສຽງ, ລະຫັດ ຫຼື ຜົນຜະລິດຫຼາຍຮູບແບບ. ຈາກນັ້ນຕັ້ງຄ່າແຖບຂໍ້ເທັດຈິງຂອງທ່ານ - ໂດເມນທີ່ມີຄວາມແມ່ນຍຳສູງມັກຈະຕ້ອງການການຕໍ່ສາຍດິນ (RAG), ການກວດສອບຄວາມຖືກຕ້ອງ, ແລະບາງຄັ້ງການກວດສອບໂດຍມະນຸດ. ພິຈາລະນາຄວາມຊັກຊ້າ ແລະ ຄ່າໃຊ້ຈ່າຍ, ເພາະວ່າຮູບແບບທີ່ເຂັ້ມແຂງທີ່ຊ້າ ຫຼື ລາຄາແພງອາດຈະຍາກທີ່ຈະສົ່ງ. ສຸດທ້າຍ, ຄວາມເປັນສ່ວນຕົວຂອງແຜນທີ່ ແລະ ການປະຕິບັດຕາມຄວາມຕ້ອງການຕໍ່ກັບຕົວເລືອກການນຳໃຊ້ ແລະ ການຄວບຄຸມ.
ເອກະສານອ້າງອີງ
-
ສະຖາບັນມາດຕະຖານ ແລະ ເຕັກໂນໂລຊີແຫ່ງຊາດ (NIST) - ຮູບແບບພື້ນຖານ (ຄຳສັບໃນອະຖິຖານ) - csrc.nist.gov
-
ສະຖາບັນມາດຕະຖານ ແລະ ເຕັກໂນໂລຊີແຫ່ງຊາດ (NIST) - NIST AI 600-1: ໂປຣໄຟລ໌ AI ທີ່ສ້າງສັນ - nvlpubs.nist.gov
-
ສະຖາບັນມາດຕະຖານ ແລະ ເຕັກໂນໂລຊີແຫ່ງຊາດ (NIST) - NIST AI 100-1: ຂອບການຄຸ້ມຄອງຄວາມສ່ຽງດ້ານ AI (AI RMF 1.0) - nvlpubs.nist.gov
-
ສູນຄົ້ນຄວ້າກ່ຽວກັບຮູບແບບພື້ນຖານ Stanford (CRFM) - ບົດລາຍງານ - crfm.stanford.edu
-
arXiv - ກ່ຽວກັບໂອກາດ ແລະຄວາມສ່ຽງຂອງຕົວແບບພື້ນຖານ (Bommasani et al., 2021) - arxiv.org
-
arXiv - ຮູບແບບພາສາແມ່ນຜູ້ຮຽນທີ່ມີໂອກາດໜ້ອຍ (Brown et al., 2020) - arxiv.org
-
arXiv - ການສ້າງແບບເຕີມເຕີມເພື່ອດຶງຂໍ້ມູນສຳລັບວຽກງານ NLP ທີ່ມີຄວາມຮູ້ຫຼາຍ (Lewis et al., 2020) - arxiv.org
-
arXiv - LoRA: ການປັບຕົວລະດັບຕ່ຳຂອງຮູບແບບພາສາຂະໜາດໃຫຍ່ (Hu et al., 2021) - arxiv.org
-
arXiv - BERT: ການຝຶກອົບຮົມລ່ວງໜ້າຂອງຕົວປ່ຽນສອງທິດທາງທີ່ເລິກເຊິ່ງສຳລັບການເຂົ້າໃຈພາສາ (Devlin et al., 2018) - arxiv.org
-
arXiv - ຮູບແບບພາສາທີ່ລະອຽດແມ່ນຜູ້ຮຽນທີ່ບໍ່ມີຈຸດອ່ອນ (Wei et al., 2021) - arxiv.org
-
ຫໍສະໝຸດດິຈິຕອລ ACM - ການສຳຫຼວດການຫຼອນຫຼອນໃນການສ້າງພາສາທຳມະຊາດ (Ji et al., 2023) - dl.acm.org
-
arXiv - ການຮຽນຮູ້ຮູບແບບສາຍຕາທີ່ສາມາດໂອນໄດ້ຈາກການຊີ້ນຳພາສາທຳມະຊາດ (Radford et al., 2021) - arxiv.org
-
arXiv - ຮູບແບບຄວາມເປັນໄປໄດ້ຂອງການແຜ່ກະຈາຍສຽງລົບກວນ (Ho et al., 2020) - arxiv.org
-
arXiv - ການສັງເຄາະຮູບພາບຄວາມລະອຽດສູງດ້ວຍຮູບແບບການແຜ່ກະຈາຍແຝງ (Rombach et al., 2021) - arxiv.org
-
arXiv - ການດຶງເອົາຂໍ້ມູນຜ່ານໜາແໜ້ນສຳລັບການຕອບຄຳຖາມແບບ Open-Domain (Karpukhin et al., 2020) - arxiv.org
-
arXiv - ຫໍສະໝຸດ Faiss (Douze et al., 2024) - arxiv.org
-
OpenAI - ແນະນຳ Whisper - openai.com
-
arXiv - ການສັງເຄາະ TTS ຕາມທຳມະຊາດໂດຍການປັບສະພາບ WaveNet ກ່ຽວກັບການຄາດຄະເນສະເປກໂຕຣແກຣມ Mel (Shen et al., 2017) - arxiv.org
-
ສູນຄວາມປອດໄພ ແລະ ເຕັກໂນໂລຊີທີ່ພົ້ນເດັ່ນ (CSET), ມະຫາວິທະຍາໄລ Georgetown - ພະລັງທີ່ໜ້າປະຫລາດໃຈຂອງການຄາດຄະເນຄຳສັບຕໍ່ໄປ: ການອະທິບາຍຮູບແບບພາສາຂະໜາດໃຫຍ່ (ພາກທີ 1) - cset.georgetown.edu
-
USENIX - ການສະກັດຂໍ້ມູນການຝຶກອົບຮົມຈາກຮູບແບບພາສາຂະໜາດໃຫຍ່ (Carlini et al., 2021) - usenix.org
-
OWASP - LLM01: ການສັກຢາແບບໄວ - genai.owasp.org
-
arXiv - ຫຼາຍກວ່າທີ່ທ່ານໄດ້ຮ້ອງຂໍ: ການວິເຄາະທີ່ສົມບູນແບບກ່ຽວກັບໄພຂົ່ມຂູ່ການສີດແບບກະຕຸ້ນໃໝ່ຕໍ່ຮູບແບບພາສາຂະໜາດໃຫຍ່ທີ່ປະສົມປະສານກັບແອັບພລິເຄຊັນ (Greshake et al., 2023) - arxiv.org
-
ຊຸດເອກະສານ Cheat Sheet ຂອງ OWASP - ເອກະສານ Cheat Sheet ປ້ອງກັນການສັກຢາ LLM - cheatsheetseries.owasp.org