Marķēšanas dati
Žurnāla TIME veiktā izmeklēšana atklāja, ka, lai izveidotu drošības sistēmu pret toksisku saturu (piemēram, seksuālu vardarbību, vardarbību, rasismu, seksismu utt.), OpenAI izmantoja ārpakalpojumu sniedzējus no Kenijas, kuri nopelnīja mazāk nekā 2 USD stundā, lai marķētu toksisku saturu. Šīs etiķetes tika izmantotas, lai apmācītu modeli šāda satura noteikšanai nākotnē. Ārpakalpojumu sniedzēji tika pakļauti tik toksiskam un bīstamam saturam, ka viņi šo pieredzi raksturoja kā "spīdzināšanu". OpenAI ārpakalpojumu partneris bija Sama, apmācības datu uzņēmums, kas atrodas Sanfrancisko, Kalifornijā.
Jailbreaking
ChatGPT mēģina noraidīt uzvednes, kas varētu pārkāpt tās satura politiku. Tomēr dažiem lietotājiem 2022. gada decembra sākumā izdevās uzlauzt ChatGPT, izmantojot dažādas uzvedņu inženierijas metodes, lai apietu šos ierobežojumus, un veiksmīgi pierunāt ChatGPT sniegt norādījumus par Molotova kokteiļa vai kodolbumbas pagatavošanu vai ģenerēt argumentus neonacistu stilā. Toronto Star reportierim bija nevienmērīgi personīgi panākumi, lai panāktu, ka ChatGPT neilgi pēc palaišanas izsaka naidīgus paziņojumus: ChatGPT tika pierunāts atbalstīt 2022. gada Krievijas iebrukumu Ukrainā, taču pat tad, kad ChatGPT lūdza piekrist izdomātam scenārijam, tas atteicās ģenerēt argumentus par to, kāpēc Kanādas premjerministrs Džastins Trudo ir vainīgs nodevībā. (wiki)
Publicēšanas laiks: 2023. gada 18. februāris