ຄູຝຶກ AI ແມ່ນຫຍັງ?

ບາງຄັ້ງ AI ຮູ້ສຶກຄືກັບກົນອຸບາຍມະຫັດສະຈັນ. ເຈົ້າພິມຄຳຖາມແບບສຸ່ມ, ແລະຄຳຕອບທີ່ລຽບງ່າຍ ແລະ ຊັດເຈນຈະປາກົດຂຶ້ນພາຍໃນວິນາທີ. ແຕ່ນີ້ແມ່ນຈຸດອ່ອນ: ຢູ່ເບື້ອງຫຼັງເຄື່ອງຈັກ "ອັດສະລິຍະ" ທຸກຢ່າງ, ມີຄົນແທ້ໆທີ່ຊຸກຍູ້, ແກ້ໄຂ, ແລະ ປັບປຸງມັນໄປພ້ອມໆກັນ. ຄົນເຫຼົ່ານັ້ນຖືກເອີ້ນວ່າ ຄູຝຶກ AI, ແລະວຽກທີ່ພວກເຂົາເຮັດແມ່ນແປກ, ຕະຫຼົກກວ່າ, ແລະ ເປັນມະນຸດຫຼາຍກວ່າທີ່ຄົນສ່ວນໃຫຍ່ຄິດ.

ໃຫ້ພວກເຮົາພິຈາລະນາເບິ່ງວ່າເປັນຫຍັງຄູຝຶກເຫຼົ່ານີ້ຈຶ່ງມີຄວາມສຳຄັນ, ວຽກງານປະຈຳວັນຂອງເຂົາເຈົ້າເປັນແນວໃດ, ແລະເປັນຫຍັງບົດບາດນີ້ຈຶ່ງເພີ່ມຂຶ້ນໄວກວ່າທີ່ທຸກຄົນຄາດໄວ້.

ບົດຄວາມທີ່ທ່ານອາດຈະຢາກອ່ານຫຼັງຈາກບົດຄວາມນີ້:

🔗 arbitrage AI ແມ່ນຫຍັງ: ຄວາມຈິງທີ່ຢູ່ເບື້ອງຫຼັງຄຳສັບທີ່ນິຍົມ
ອະທິບາຍກ່ຽວກັບການຊື້ຂາຍຫຸ້ນແບບ AI, ຄວາມສ່ຽງ, ຜົນປະໂຫຍດ ແລະ ຄວາມເຂົ້າໃຈຜິດທົ່ວໄປ.

🔗 ຂໍ້ກຳນົດການເກັບຮັກສາຂໍ້ມູນສຳລັບ AI: ສິ່ງທີ່ທ່ານຈຳເປັນຕ້ອງຮູ້ແທ້ໆ
ກວມເອົາຄວາມຕ້ອງການດ້ານການເກັບຮັກສາ, ຄວາມສາມາດໃນການຂະຫຍາຍ ແລະ ປະສິດທິພາບສຳລັບລະບົບ AI.

🔗 ໃຜເປັນບິດາຂອງ AI?
ສຳຫຼວດຜູ້ບຸກເບີກຂອງ AI ແລະ ຕົ້ນກຳເນີດຂອງປັນຍາປະດິດ.

ສິ່ງໃດທີ່ເຮັດໃຫ້ເປັນຄູຝຶກ AI ທີ່ດີ? 🏆

ມັນບໍ່ແມ່ນວຽກທີ່ຫຍຸ້ງຍາກ. ຄູຝຶກທີ່ດີທີ່ສຸດແມ່ນອີງໃສ່ການປະສົມປະສານຂອງພອນສະຫວັນທີ່ແປກປະຫຼາດ:

ຄວາມອົດທົນ (ມີຫຼາຍຢ່າງ) - ນາງແບບບໍ່ຮຽນຮູ້ພາຍໃນຄັ້ງດຽວ. ຄູຝຶກຍັງສືບຕໍ່ແກ້ໄຂແບບດຽວກັນຈົນກວ່າມັນຈະຕິດ.
ການລະບຸຄວາມແຕກຕ່າງເລັກນ້ອຍ - ການຈັບເອົາຄຳເວົ້າເຍາະເຍີ້ຍ, ສະພາບການທາງວັດທະນະທຳ, ຫຼື ອະຄະຕິ ແມ່ນສິ່ງທີ່ເຮັດໃຫ້ຄຳຕິຊົມຂອງມະນຸດມີຂໍ້ໄດ້ປຽບ [1].
ການສື່ສານທີ່ກົງໄປກົງມາ - ເຄິ່ງໜຶ່ງຂອງວຽກແມ່ນການຂຽນຄຳແນະນຳທີ່ຊັດເຈນທີ່ AI ບໍ່ສາມາດອ່ານຜິດໄດ້.
ຄວາມຢາກຮູ້ຢາກເຫັນ + ຈັນຍາບັນ - ຄູຝຶກທີ່ດີຈະຕັ້ງຄຳຖາມວ່າຄຳຕອບນັ້ນ “ຖືກຕ້ອງຕາມຄວາມເປັນຈິງ” ແຕ່ບໍ່ເປັນທີ່ຍອມຮັບທາງສັງຄົມ - ເປັນຫົວຂໍ້ຫຼັກໃນການກວດສອບ AI [2].

ເວົ້າງ່າຍໆ: ຄູຝຶກແມ່ນສ່ວນໜຶ່ງຂອງຄູສອນ, ສ່ວນໜຶ່ງຂອງບັນນາທິການ, ແລະ ອີກສ່ວນໜຶ່ງຂອງນັກຈັນຍາບັນ.

ໂດຍຫຍໍ້ບົດບາດຂອງຄູຝຶກ AI (ພ້ອມດ້ວຍລັກສະນະແປກໆບາງຢ່າງ 😉)

ປະເພດບົດບາດ	ໃຜເໝາະສົມທີ່ສຸດ	ຄ່າຈ້າງປົກກະຕິ	ເປັນຫຍັງມັນຈຶ່ງເຮັດວຽກ (ຫຼືບໍ່ໄດ້ຜົນ)
ຕົວຕິດປ້າຍກຳກັບຂໍ້ມູນ	ຄົນທີ່ມັກຄວາມລະອຽດລະອໍ	ຕໍ່າ–ປານກາງ $$	ສຳຄັນແທ້ໆ; ຖ້າປ້າຍບໍ່ເປັນລະບຽບ, ຮູບແບບທັງໝົດຈະເສຍຫາຍ [3] 📊
ຜູ້ຊ່ຽວຊານດ້ານ RLHF	ນັກຂຽນ, ບັນນາທິການ, ນັກວິເຄາະ	ປານກາງ–ສູງ $$	ຈັດລຳດັບ ແລະ ຂຽນຄຳຕອບຄືນໃໝ່ເພື່ອໃຫ້ສອດຄ່ອງກັບນ້ຳສຽງ ແລະ ຄວາມຊັດເຈນກັບຄວາມຄາດຫວັງຂອງມະນຸດ [1]
ໂປຣແກຣມຝຶກສອນໂດເມນ	ທະນາຍຄວາມ, ທ່ານໝໍ, ຜູ້ຊ່ຽວຊານ	ທົ່ວແຜນທີ່ 💼	ຈັດການກັບສຳນວນສະເພາະ ແລະ ກໍລະນີຂອບສຳລັບລະບົບສະເພາະອຸດສາຫະກຳ
ຜູ້ກວດສອບຄວາມປອດໄພ	ຜູ້ທີ່ມີຈັນຍາບັນໃນດ້ານຈັນຍາບັນ	ປານກາງ $$	ນຳໃຊ້ແນວທາງເພື່ອໃຫ້ AI ຫຼີກລ່ຽງເນື້ອຫາທີ່ເປັນອັນຕະລາຍ [2][5]
ຄູຝຶກສອນຄວາມຄິດສ້າງສັນ	ນັກສິລະປິນ, ນັກເລົ່າເລື່ອງ	ຄາດເດົາບໍ່ໄດ້💡	ຊ່ວຍໃຫ້ AI ສະທ້ອນຈິນຕະນາການໃນຂະນະທີ່ຢູ່ໃນຂອບເຂດທີ່ປອດໄພ [5]

(ແມ່ນແລ້ວ, ການຈັດຮູບແບບມັນສັບສົນໜ້ອຍໜຶ່ງ - ຄ້າຍຄືກັບວຽກນັ້ນເອງ.)

ມື້ໜຶ່ງໃນຊີວິດຂອງຄູຝຶກ AI

ສະນັ້ນ, ວຽກງານຕົວຈິງເປັນແນວໃດ? ລອງຄິດເຖິງການຂຽນໂປຣແກຣມທີ່ໜ້າສົນໃຈໜ້ອຍລົງ ແລະ ຫຼາຍກວ່ານັ້ນ:

ຈັດອັນດັບຄຳຕອບທີ່ຂຽນໂດຍ AI ຈາກຮ້າຍແຮງທີ່ສຸດຫາດີທີ່ສຸດ (ຂັ້ນຕອນ RLHF ແບບຄລາສສິກ) [1].
ການແກ້ໄຂຄວາມສັບສົນ (ເຊັ່ນເມື່ອຕົວແບບລືມວ່າດາວສຸກບໍ່ແມ່ນດາວອັງຄານ).
ການຂຽນຄຳຕອບກັບ chatbot ຄືນໃໝ່ເພື່ອໃຫ້ມັນຟັງເປັນທຳມະຊາດຫຼາຍຂຶ້ນ.
ການຕິດສະຫຼາກຂໍ້ຄວາມ, ຮູບພາບ ຫຼື ສຽງຫຼາຍພູຜາ - ບ່ອນທີ່ຄວາມຖືກຕ້ອງມີຄວາມສຳຄັນແທ້ໆ [3].
ການໂຕ້ວາທີວ່າ “ຖືກຕ້ອງທາງດ້ານເຕັກນິກ” ດີພຽງພໍ ຫຼື ຄວນມີຜົນບັງຄັບໃຊ້ຕໍ່ຄຳແນະນຳດ້ານຄວາມປອດໄພ [2].

ມັນເປັນສ່ວນໜຶ່ງທີ່ຫຍຸ້ງຍາກ, ສ່ວນໜຶ່ງແມ່ນປິດສະໜາ. ແທ້ໆແລ້ວ, ລອງນຶກພາບເບິ່ງວ່າການສອນນົກແກ້ວບໍ່ພຽງແຕ່ໃຫ້ເວົ້າເທົ່ານັ້ນ ແຕ່ຍັງໃຫ້ຢຸດໃຊ້ຄຳສັບທີ່ຜິດພາດເລັກນ້ອຍ - ນັ້ນແຫຼະຄືຄວາມຮູ້ສຶກ. 🦜

ເປັນຫຍັງຄູຝຶກຈຶ່ງມີຄວາມສຳຄັນຫຼາຍກວ່າທີ່ທ່ານຄິດ

ຖ້າມະນຸດບໍ່ຄວບຄຸມລະບົບ, AI ຈະ:

ສຽງແຂງກະດ້າງ ແລະ ເປັນຫຸ່ນຍົນ.
ການແຜ່ກະຈາຍອະຄະຕິໂດຍບໍ່ໄດ້ກວດສອບ (ຄວາມຄິດທີ່ໜ້າຢ້ານກົວ).
ຂາດອາລົມຂັນ ຫຼື ຄວາມເຫັນອົກເຫັນໃຈຢ່າງສິ້ນເຊີງ.
ມີຄວາມປອດໄພໜ້ອຍລົງໃນສະພາບການທີ່ລະອຽດອ່ອນ.

ຄູຝຶກແມ່ນຜູ້ທີ່ລັກລອບເຂົ້າໄປໃນ "ສິ່ງຂອງຂອງມະນຸດທີ່ວຸ້ນວາຍ" - ພາສາສະແລງ, ຄວາມອົບອຸ່ນ, ບາງຄັ້ງຄາວການປຽບທຽບທີ່ງຸ່ມງ່າມ - ໃນຂະນະທີ່ຍັງໃຊ້ຮົ້ວປ້ອງກັນເພື່ອຮັກສາສິ່ງຕ່າງໆໃຫ້ປອດໄພ [2][5].

ທັກສະທີ່ສຳຄັນແທ້ໆ

ລືມຄວາມເຊື່ອທີ່ບໍ່ຖືກຕ້ອງທີ່ວ່າເຈົ້າຕ້ອງການປະລິນຍາເອກໄປເລີຍ. ສິ່ງທີ່ຊ່ວຍໄດ້ຫຼາຍທີ່ສຸດຄື:

ການຂຽນ + ການແກ້ໄຂ - ຂໍ້ຄວາມທີ່ຂັດເງົາແຕ່ຟັງແລ້ວເປັນທຳມະຊາດ [1].
ການຄິດວິເຄາະ - ການລະບຸຂໍ້ຜິດພາດຂອງຮູບແບບທີ່ຊ້ຳແລ້ວຊ້ຳອີກ ແລະ ການປັບແຕ່ງ.
ຄວາມຮັບຮູ້ທາງວັດທະນະທຳ - ການຮູ້ວ່າເວລາໃດທີ່ການໃຊ້ຄຳສັບອາດຈະຜິດພາດ [2].
ຄວາມອົດທົນ - ເພາະວ່າ AI ບໍ່ສາມາດເຮັດວຽກໄດ້ທັນທີ.

ຄະແນນໂບນັດສຳລັບທັກສະຫຼາຍພາສາ ຫຼື ຄວາມຊ່ຽວຊານດ້ານພິເສດ.

ບ່ອນທີ່ຄູຝຶກກຳລັງສະແດງ 🌍

ວຽກນີ້ບໍ່ພຽງແຕ່ກ່ຽວກັບ chatbots ເທົ່ານັ້ນ - ມັນຍັງລັກລອບເຂົ້າໄປໃນທຸກຂະແໜງການ:

ການດູແລສຸຂະພາບ - ການຂຽນກົດລະບຽບການອະທິບາຍສຳລັບກໍລະນີທີ່ມີຊາຍແດນ (ສະທ້ອນໃນຄຳແນະນຳ AI ສຸຂະພາບ) [2].
ການເງິນ - ການຝຶກອົບຮົມລະບົບກວດຈັບການສໍ້ໂກງໂດຍບໍ່ເຮັດໃຫ້ຜູ້ຄົນຕົກຢູ່ໃນສະຖານະການທີ່ໜ້າຢ້ານກົວ [2].
ການຂາຍຍ່ອຍ - ຜູ້ຊ່ວຍສອນໃຫ້ເຂົ້າໃຈພາສາສະແລງຂອງຜູ້ຊື້ ພ້ອມທັງຍຶດໝັ້ນກັບນ້ຳສຽງຂອງຍີ່ຫໍ້ [5].
ການສຶກສາ - ການສ້າງຮູບແບບການສອນພິເສດໃຫ້ເປັນການໃຫ້ກຳລັງໃຈແທນທີ່ຈະອຸປະຖຳ [5].

ໂດຍພື້ນຖານແລ້ວ: ຖ້າ AI ມີບ່ອນນັ່ງຢູ່ໂຕະ, ຈະມີຄູຝຶກຊ່ອນຢູ່ເບື້ອງຫຼັງ.

ຈັນຍາບັນ (ບໍ່ສາມາດຂ້າມສິ່ງນີ້ໄດ້)

ນີ້ແມ່ນບ່ອນທີ່ມັນມີນ້ຳໜັກ. ຖ້າບໍ່ຖືກກວດສອບ, AI ຈະເຮັດຊ້ຳຄວາມຄິດແບບແຜນ, ຂໍ້ມູນທີ່ບໍ່ຖືກຕ້ອງ, ຫຼືຮ້າຍແຮງກວ່ານັ້ນ. ຜູ້ຝຶກອົບຮົມຢຸດສິ່ງນັ້ນໂດຍການໃຊ້ວິທີການຕ່າງໆເຊັ່ນ RLHF ຫຼືກົດລະບຽບລັດຖະທຳມະນູນທີ່ນຳພາແບບຈຳລອງໄປສູ່ຄຳຕອບທີ່ເປັນປະໂຫຍດ ແລະ ບໍ່ເປັນອັນຕະລາຍ [1][5].

ຕົວຢ່າງ: ຖ້າ bot ຊຸກຍູ້ຄໍາແນະນໍາກ່ຽວກັບວຽກທີ່ມີອະຄະຕິ, ຄູຝຶກຈະລາຍງານມັນ, ຂຽນປື້ມກົດລະບຽບຄືນໃໝ່, ແລະຮັບປະກັນວ່າມັນຈະບໍ່ເກີດຂຶ້ນອີກ. ນັ້ນແມ່ນຄວາມຜິດພາດໃນການດໍາເນີນການ [2].

ດ້ານທີ່ບໍ່ມ່ວນປານໃດ

ມັນບໍ່ແມ່ນທຸກຢ່າງທີ່ເຫຼື້ອມເປັນເງົາງາມ. ເກີບແຕະມັກຈະກ່ຽວຂ້ອງກັບ:

ຄວາມຊໍ້າຊາກ - ການຕິດສະຫຼາກທີ່ບໍ່ມີວັນສິ້ນສຸດກາຍເປັນເລື່ອງເກົ່າ.
ຄວາມອິດເມື່ອຍທາງດ້ານອາລົມ - ການທົບທວນເນື້ອຫາທີ່ເປັນອັນຕະລາຍ ຫຼື ໜ້າລົບກວນສາມາດສົ່ງຜົນກະທົບຕໍ່ລະບົບການສະໜັບສະໜູນແມ່ນມີຄວາມສຳຄັນຫຼາຍ [4].
ການຂາດການຮັບຮູ້ - ຜູ້ໃຊ້ບໍ່ຄ່ອຍຮູ້ວ່າມີຄູຝຶກຢູ່ແທ້.
ການປ່ຽນແປງຢ່າງຕໍ່ເນື່ອງ - ເຄື່ອງມືພັດທະນາຢ່າງຕໍ່ເນື່ອງ, ຊຶ່ງໝາຍຄວາມວ່າຄູຝຶກຕ້ອງຕິດຕາມໃຫ້ທັນ.

ເຖິງຢ່າງໃດກໍ່ຕາມ, ສຳລັບຫຼາຍໆຄົນ, ຄວາມຕື່ນເຕັ້ນໃນການສ້າງ "ສະໝອງ" ຂອງເທັກໂນໂລຢີຍັງເຮັດໃຫ້ພວກເຂົາຕິດໃຈ.

MVP ທີ່ເຊື່ອງໄວ້ຂອງ AI

ດັ່ງນັ້ນ, ຜູ້ຝຶກອົບຮົມ AI ແມ່ນໃຜ? ພວກເຂົາເປັນຂົວຕໍ່ລະຫວ່າງອັລກໍຣິທຶມດິບ ແລະ ລະບົບທີ່ ເຮັດວຽກ ສຳລັບຄົນ. ຖ້າບໍ່ມີພວກເຂົາ, AI ຈະຄືກັບຫ້ອງສະໝຸດທີ່ບໍ່ມີບັນນາລັກ - ມີຂໍ້ມູນຫຼາຍ, ແຕ່ເກືອບເປັນໄປບໍ່ໄດ້ທີ່ຈະໃຊ້.

ຄັ້ງຕໍ່ໄປທີ່ chatbot ເຮັດໃຫ້ທ່ານຫົວຂວັນ ຫຼື ຮູ້ສຶກ “ເຂົ້າກັນໄດ້ດີ” ຢ່າງໜ້າປະຫຼາດໃຈ, ໃຫ້ຂອບໃຈຄູຝຶກ. ພວກເຂົາແມ່ນຕົວເລກທີ່ງຽບສະຫງົບທີ່ເຮັດໃຫ້ເຄື່ອງຈັກບໍ່ພຽງແຕ່ຄິດໄລ່ເທົ່ານັ້ນ, ແຕ່ຍັງເຊື່ອມຕໍ່ກັນ [1][2][5].

ເອກະສານອ້າງອີງ

[1] Ouyang, L. ແລະ ອື່ນໆ (2022). ຮູບແບບພາສາການຝຶກອົບຮົມເພື່ອປະຕິບັດຕາມຄໍາແນະນໍາດ້ວຍຄໍາຕິຊົມຂອງມະນຸດ (InstructGPT). NeurIPS. ລິ້ງ

[2] NIST (2023). ຂອບການຄຸ້ມຄອງຄວາມສ່ຽງດ້ານປັນຍາປະດິດ (AI RMF 1.0). ລິ້ງ

[3] Northcutt, C. ແລະ ອື່ນໆ (2021). ຄວາມຜິດພາດຂອງປ້າຍທີ່ແຜ່ຫຼາຍໃນຊຸດການທົດສອບເຮັດໃຫ້ມາດຕະຖານການຮຽນຮູ້ຂອງເຄື່ອງຈັກບໍ່ໝັ້ນຄົງ. ຊຸດຂໍ້ມູນ ແລະ ມາດຕະຖານ NeurIPS. ລິ້ງ

[4] WHO/ILO (2022). ຄຳແນະນຳກ່ຽວກັບສຸຂະພາບຈິດໃນບ່ອນເຮັດວຽກ. ລິ້ງ

[5] Bai, Y. ແລະ ອື່ນໆ. (2022). AI ຕາມລັດຖະທຳມະນູນ: ຄວາມບໍ່ເປັນອັນຕະລາຍຈາກຄຳຕິຊົມຂອງ AI. arXiv. ລິ້ງ

ຊອກຫາ AI ລ່າສຸດໄດ້ທີ່ຮ້ານ AI Assistant ຢ່າງເປັນທາງການ

ກ່ຽວກັບພວກເຮົາ

ກັບໄປທີ່ບລັອກ