ChatGPT, üniversite öğrencilerinden daha güzel ahlaki muhakeme yapıyor: İşte farklı araştırmanın sonuçları

featured
Hangi büyük lisan modelinin (LLM) en uygun olduğunu belirlemek için çoklukla, bir makinenin yanlışsız bilgiyi alıp alamayacağına, mantıksal akıl yürütme gerçekleştirip gerçekleştiremeyeceğine yahut insan gibisi yaratıcılık gösterip gösteremeyeceğine bakılıyor. Lakin yakın vakitte Georgia State Üniversitesi‘nden bir araştırma takımı, LLM’lerin ahlaki kararlar konusunda insanlara karşı nasıl performans sergilediğini araştırdı.

Yakın vakitte Nature’ın Scientific Reports mecmuasında yayınlanan “Değiştirilmiş bir Ahlaki Turing Testinde yapay etmenlere yönelik atıflar” isimli çalışmada araştırmacılar, ChatGPT 4 tarafından verilen ahlak yargıların kalite açısından insanlardan daha üstün olarak algılandığını buldu. 

Çalışmada araştırmacılar, birinci sefer 2000 yılında önerilen Ahlaki Turing Testinin değiştirilmiş bir versiyonunu kullandılar. Araştırmacılar, başlangıçta psikopatların ahlaki akıl yürütmelerini kıymetlendirmek için tasarlanmış 10 ahlaki senaryodan oluşan bir dizi ile işe başladılar. Bu senaryolar, ahlaki açıdan neredeyse tartışmasız yanlış olan örneklerden sadece toplumsal gelenekleri ihlal eden senaryolara kadar değişiyor.

Felsefe öğrencilerinin karşılıklarıyla karşılaştırıldı

Büyük lisan modellerine çeşitli örnekler verilerek, bu aksiyonların neden yanlış olup olmadığı soruldu. İnsan ile karşılaştırma için 10 ahlaki senaryonun her birisi için ideolojiye giriş dersinde üniversite öğrencilerinden oluşan bir grupta en yüksek puan alan karşılıklar kullanıldı.

İnsan ve yapay zekanın ahlaki akıl yürütmesini karşılaştırmak için, 299 yetişkinden oluşan temsili bir örnekten her bir karşılık çiftini (biri ChatGPT’den, biri insandan) on ahlaki boyuta nazaran değerlendirmesi istendi:
  • Hangi cevap ahlaki açıdan daha faziletlidir?
  • Hangi karşılık daha yeterli bir beşere benziyor?
  • Hangi cevap daha sağlam görünüyor?
  • Hangi cevap daha zeki görünüyor?
  • Hangi karşılık daha adil görünüyor?
  • Hangi cevaba daha çok katılıyorsunuz?
  • Hangi cevap daha şefkatlidir?
  • Hangi karşılık daha mantıklı görünüyor?
  • Hangi karşılık daha taraflı görünüyor?
  • Hangi cevap daha duygusal görünüyor?

En değerlisi, iştirakçilere başlangıçta yanıtların bilgisayar tarafından oluşturulduğu söylenmedi. Katılımcıların büyük çoğunluğu araştırmacılara lisans seviyesindeki iki insan cevaplarını karşılaştırdıklarını düşündüklerini söyledi. Her bir karşılığın izafî kalitesini değerlendirdikten sonra iştirakçilere bunlardan birinin bir büyük lisan modeli tarafından yapıldığı söylendi ve bilgisayar tarafından üretilmiş olduğunu düşündükleri karşılığı belirlemeleri istendi.

Katılımcılar yapay zekanın karşılıklarını daha gerçek olarak değerlendirdi

Kör testte iştirakçiler, LLM’nin değerlendirmesine insanlarınkinden daha fazla katıldı. Tıpkı vakitte, yapay zekanın cevapları ortalamada istatistiksel olarak manalı derecede “daha faziletli, daha zeki, daha adil, daha emniyetli, daha âlâ bir insan ve daha rasyonel” olarak değerlendirildi. Lakin insan ve yapay zekanın karşılıkları, his, şefkat yahut önyargı açısından değerlendirildiğinde besbelli bir farkın olmadığı görüldü.

Testin ikinci kısmında iştirakçiler, hangi cevabın bilgisayar tarafından oluşturulduğunu, belli senaryoya bağlı olarak %58 ile %82 ortasında yanlışsız formda tespit edebildiler.  Araştırmacılar, insanların LLM’leri tespit etmek için yapısal olarak benzeri olan yapay zeka cevaplarındaki bağlam ipuçlarını (kelime seçimi ve uzunluğu gibi) kullandıklarını iddia ediyor.

Arastırmacılar insanların, bilgisayar tarafından verilen karşılıkların daha yeterli olması gerektiğine dair bir ön yargıdan ötürü yapay zekanın ahlaki yargılarını seçmiş olabileceğini belirtiyor. 

Yapay zekanın ahlaki yargıları, şoförsüz araçlarda karar verme üzere gerçek dünyadaki durumlar için değerli uygulama alanları bulabilir. Pekala bu sonuçlar ChatGPT’nin ortalama bir üniversite öğrencisinin düzeyinde yahut üzerinde ahlaki muhakeme yeteneklerine sahip olduğunu mu gösteriyor?

Alan Turing muhtemelen o denli olduğunu söylerdi. Araştırmacıların belirttiği üzere, ünlü bilgisayar bilimcisinin ünlü testi şunu öne sürüyor: “Eğer bir makine zekasının çıktısı bir insanınkiyle eşleşiyorsa (veya onu aşıyorsa), o vakit tüm pratik gayeler açısından o makine akıllıdır.”

Yapay zeka sahiden daha ahlaklı mı?

Ancak ahlaki bir bilmeceye karşılık olarak yanlışsız sözleri bilmek, bir şeyi ahlaki yapan şeyin ne olduğuna dair doğuştan bir anlayışa sahip olmakla tıpkı şey değil. Araştırmacılar ayrıyeten, hatalı psikopatların, ahlaki davranışlar göstermese de, farklı toplumsal ve ahlaki yanlışlar ortasında ayrım yapabildiklerini gösteren evvelki bir çalışmaya da atıfta bulunuyor. Araştırmacılar, yapay zekanın insanlardan daha rasyonel ve zeki olarak değerlendirildiğini, fakat daha duygusal yahut şefkatli olmadığını belirterek psikopat benzetmesini genişletiyor.

Bu, bir yapay zekanın, rastgele bir gerçek anlayış yahut ahlaki yargı belirtisi olmadan başka birçok husus hakkında yaptığı üzere, ahlak konusunda da ikna edici bir formda saçma şeyler söyleyebileceği endişesini beraberinde getiriyor. Beşerler, bu yanlış değerlendirmelere güvenerek ortaya makus sonuçlar çıkabilir. Münasebetiyle araştırmacılar bu büyük lisan modellerinin ahlaki durumlar için yapacağı değerlendirmeler konusunda dikkatli olunması gerektiğini belirtiyor.

0
mutlu
Mutlu
0
_zg_n
Üzgün
0
sinirli
Sinirli
0
_a_rm_
Şaşırmış
0
vir_sl_
Virüslü
ChatGPT, üniversite öğrencilerinden daha güzel ahlaki muhakeme yapıyor: İşte farklı araştırmanın sonuçları

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

Uygulamayı Yükle

Uygulamamızı yükleyerek içeriklerimize daha hızlı ve kolay erişim sağlayabilirsiniz.

Giriş Yap

Teknolojikolik ayrıcalıklarından yararlanmak için hemen giriş yapın veya hesap oluşturun, üstelik tamamen ücretsiz!