Մեդիափորձագետ Սամվել Մարտիրոսյանը գրում է.
«Բոլոր նրանց համար, ով ԱԲ-ին վերջում շնորհակալություն ա ասում։ Ուրեմն, ըստ ուսումնասիրության, ինչքան կոպիտ ես հետը խոսում, էդքան լավ ա պատասխանում:
Համառոտ ուսումնասիրության նկարագրությունը ստորեւ
Այս ուսումնասիրությունը քննում է, թե ինչպես է հրահանգի (prompt) քաղաքավարությունը ազդում Լեզվական մեծ մոդելների (LLM) ճշգրտության վրա՝ բազմակի ընտրությամբ հարցերին պատասխանելիս։ Հետազոտողները ստեղծել են 50 հարցից բաղկացած տվյալների բազա՝ մաթեմատիկայի, գիտության և պատմության ոլորտներից, որոնցից յուրաքանչյուրը վերաձևակերպվել է հինգ տոնային տարբերակներով՝ Շատ քաղաքավարի, Քաղաքավարի, Չեզոք, Կոպիտ և Շատ կոպիտ։
Կարդացեք նաև
ChatGPT-4o-ով թեստավորման արդյունքում պարզվել է, որ անքաղաքավարի հրահանգները հետևողականորեն ավելի լավ արդյունք են ցույց տվել, քան քաղաքավարի տարբերակները։ Ճշգրտությունը տատանվել է «Շատ քաղաքավարի» հրահանգների դեպքում 80.8%-ից մինչև «Շատ կոպիտ» հրահանգների դեպքում 84.8%։ Այս արդյունքը հակասում է որոշ նախորդ ուսումնասիրությունների, որոնք կոպտությունը կապում էին ավելի վատ արդյունքների հետ՝ ենթադրելով, որ ավելի նոր մոդելները, ինչպիսին է ChatGPT-4o-ն, կարող են այլ կերպ արձագանքել տոնային տատանումներին։
Հեղինակները նշում են սահմանափակումներ, այդ թվում՝ տվյալների փոքր բազան և մեկ LLM-ի վրա կենտրոնանալը։ Նրանք եզրակացնում են, որ թեև LLM-ները զգայուն են հրահանգների ձևակերպման նկատմամբ, այնուամենայնիվ, նրանք խորհուրդ չեն տալիս գործնականում օգտագործել թշնամական լեզու, քանի որ դա կարող է բացասաբար ազդել օգտատերերի փորձառության վրա և խթանել վնասակար հաղորդակցման նորմերի տարածումը։