Yapay Zekaların Ne Kadar Akıllı Olduğunu Bilecek Kadar Akıllı mıyız?
Hayvanlar, bir zamanlar onlara inandığımızdan çok daha fazlasını düşünüyor. Artık karmaşık sosyal oyunlar oynayan şempanzeler, rakiplerinden yiyecek saklayan, hatta kamufle eden çalı alakargaları veya soyut kuralları öğrenebilen arılar hakkında okumak artık yaygın. Ancak 20. yüzyılın ortalarına kadar yakın bir tarihte, zihinsel durumları hayvanlara atfetmek bilimde tabuydu. Davranışçılar basit ve kontrollü davranışları (bir kola basmak, bir yiyecek topakını almak) incelerken, vahşi doğada karmaşık hayvan davranışlarını gözlemleyen doğa bilimciler, bunları doğuştan gelen içgüdüler veya ekolojik ortamlara adaptasyon açısından tanımlama eğilimindeydi. Her iki grup da hayvan davranışlarını inançlar, teoriler veya niyetler gibi zihinsel durumlar açısından açıklamaya çalışmadı.
O günden bu yana geçen on yıllarda, hayvanlar aleminde karmaşık bilişi ortaya çıkarmak bizi şaşırttı: ilk önce en yakın primat akrabalarımızda, sonra karga ve papağan gibi daha uzak canlılarda ve son olarak ahtapot ve bal arısı gibi omurgasızlarda. Karmaşık zihniyetin aşırı ihtiyatlı bir şekilde inkar edilmesinden - titizlik arzusu ve antropomorfizm korkusundan kaynaklanan - hayvan zihinlerine ilişkin daha sofistike bir anlayışa doğru ilerleme, 20. yüzyıl biliminin en büyük hikayelerinden biridir. Ve insanlığın Paleolitik dönemden bu yana en kritik zeka patlamasına, yani yapay zeka patlamasına nasıl yaklaşabileceğine dair dersler içeriyor.
rak gösterdi. Ancak yapılan bir araştırma, atın yeteneklerine kesinlikle inanan sahibinin haberi olmadan, Hans'ın yalnızca soruyu soran kişinin yüz ifadelerini ve vücut dilini okuyarak doğru cevaba ulaştığını gösterdi.
Böylesine bir saflıkta hüküm sürmek için katı bir şeye ihtiyaç vardı. Hem insan hem de hayvan davranışlarının düşünce ve duygulara atıfta bulunulmadan açıklanabileceğini ve açıklanması gerektiğini savunan davranışçılık bir çözüm önerdi. John Watson'ın 1913 tarihli "Davranışçıların Bakış Açısıyla Psikoloji" başlıklı makalesi, bilim adamlarını, zihin de dahil olmak üzere, dışarıdan gözlemlenemeyen ve ölçülemeyen her türlü davranışı incelemeyi bırakmaya çağırıyordu: "Psikolojinin bilince yapılan her türlü göndermeyi bir kenara bırakması gerektiği zaman gelmiş gibi görünüyor; artık zihinsel durumları gözlem nesnesi haline getirdiğini düşünerek kendini kandırmasına gerek kalmadığında.2
"Davranışçılığın babası" olarak kabul edilen psikolog BF Skinner'ın çalışması, deneysel kesinliğin hayvan bilişi hakkındaki çarpık düşünceyle nasıl el ele gittiğinin simgesidir. Skinner'ın 1938 tarihli kitabı Organizmaların Davranışı , fareler üzerinde, Skinner kutuları adı verilen hassas bir şekilde inşa edilmiş edimsel koşullandırma odalarında yürütülen düzinelerce iyi kontrol edilen deneyleri anlatır. Yiyecek için kaldıraçlara basmak test edilen ana davranıştı ve test edilen birincil hayvan olan fareler Skinner için bir sınırlama değildi.' Görmeyi beklediğim tek fark, fare ve insan davranışları arasında ortaya çıktı (muazzam karmaşıklık farklılıkları dışında). ) sözlü davranış alanında yatıyor” diye yazdı.
En azından Batı'da, vahşi doğada hayvan davranışlarını inceleyen bilim adamları bile deneklerine çok fazla zihinsel gelişmişlik atfetmekten kaçındılar. Hayvanlara 'çok yaklaşmak' konusunda ihtiyatlıydılar; hatta Batılı doğa bilimciler, üzerinde çalışılan primatlara isim vermenin kötü bir uygulama olduğunu düşünüyorlardı.3 İşte bu arka plana karşı Jane Goodall, Tanzanya'nın Gombe kentindeki bir ormana geldi ve hayvan bilişinin ilk önemli yeniden genişlemesinin başlatılmasına yardımcı oldu.
Goodall ilk kez 1960 yılında şempanzelerin tepeciklerinden termitleri sopalarla çıkardıklarını gözlemledi. Darwin ve çağdaşları maymunlar arasında alet kullanımını hemen kabul etmiş olsalar da bu fikir gözden düşmüştü. Alet kullanımının insanlara özel olduğu inancı o kadar merkeziydi ki, Goodall'ın akıl hocası Kenyalı-İngiliz antropolog Louis Leakey ona, eğer bulgusu geçerliyse, "tanım gereği şempanzeyi İnsan olarak kabul etmemiz gerekir" dedi.4 Goodall başlangıçta şüpheyle karşılandı. Birçoğu onun duygusallığı olarak tanımladıkları şeyi eleştirdi. Günümüzde alet kullanımı yalnızca şempanzeler arasında yaygın olarak kabul edilmekle kalmıyor, aynı zamanda filler, yunuslar, yengeçler ve kuşların yanı sıra diğer birçok hominidde de tanımlanıyor.
Primatolog Frans de Waal'ın hayvan bilişi tarihinde anlattığı gibi: Hayvanların Ne Kadar Akıllı Olduğunu Bilecek Kadar Akıllı Mıyız? 1970'ler ve 1980'ler, hem vahşi davranışların gözlemlenmesinde hem de bunları araştırmak için daha karmaşık laboratuvar tekniklerinin geliştirilmesinde bir patlama gördü. Sonuç olarak bilim insanları, davranışçıların tahmin edemeyeceği, hatta gözlemleyemeyeceği karmaşık davranışları belirlediler. Daha da önemlisi, bu davranışları hayvanların ne düşündüğü ve hissettiği açısından açıklamak için biliş temelli teorileri oluşturup test edebildiler.
Zihinsel durumların tartışılmasına ilişkin davranışçı yasağın, tamamıyla yanlış olmasa da, artık aşırı derecede kısıtlayıcı olduğu kabul edilmektedir. Örneğin De Waal, maymunlar arasındaki karmaşık "politik" rekabetin en iyi şekilde onların bir "zihin teorisine" sahip olmaları veya diğer etmenlerin inançlarını ve niyetlerini modelleme yetenekleriyle açıklanabileceğini öne sürüyor. Her ne kadar zihin teorileri insanlarınkinden farklı ve daha "sınırlı" olsa da, artık primatların bu temel bilişsel kapasiteyi ve daha birçoklarını insanlarla paylaştığı konusunda fikir birliği var.5 Antropomorfizm her zaman bir hata değildir, özellikle de aslında insanlarla çok akraba olan canlılarda.
Goodall, Tanzanya'da şempanzeler üzerinde çalışırken, diğer bilim insanları da kuşlarda beklenmedik bilişsel yetenekler keşfediyordu. 1960 tarihli bir rapor, alet kullanma yeteneğine sahip yalnızca bir türün, Galapagos Adaları'ndaki ağaçkakan ispinozunun belgelendiğini belgeliyor. 1970'li ve 80'li yıllarda yapılan araştırmalar listeye daha fazla tür ekledi; çoğunlukla kuzgunları, küçük kargaları ve kargaları içeren akıllı bir grup olan kargagiller familyasından. Kargaların, sopaları araç olarak kullandıkları ve karmaşık problem çözme faaliyetleriyle meşgul oldukları ortaya çıktıktan sonra bir zamanlar "tüylü maymunlar" olarak adlandırılmıştı. En ünlüsü, Irene Pepperberg'in Alex adlı bir Afrika gri papağanı ile yaptığı otuz yıllık deney, hayal bile edilemeyen bilişsel yetenekleri ortaya çıkardı. Alex yalnızca renkleri, şekilleri ve miktarları tanımlamakla kalmadı, aynı zamanda aynı/farklı ve daha büyük/daha küçük gibi daha soyut kavramları da anladığını gösterdi.
Son yıllarda, biliş çemberi insanlardan daha da uzak olan canlıları kapsayacak şekilde genişledi. Ahtapotlar, gelişmiş sinir sistemleri, oyun çağrıştıran davranışları, problem çözme yetenekleri, kendilerine özgü "kişilikleri" ve diğer etmenlere karşı farkındalıklarıyla belki de 2010'ların hayvan bilişi ünlüleriydi.
Bal arısının gelişmişliği de aynı derecede şaşırtıcıdır. Böceklerin uzun süredir tamamen içgüdüyle hareket eden "robotik" olduğu düşünülüyordu. 1860'lardan 1915'teki ölümüne kadar eşekarısı, arı ve diğer birçok böcek üzerinde çalışan Jean-Henri Fabre, onların "inatçı bir makine" olduğu yorumunu yaptı. 1940'ların ortalarında, böcek bilimci ve seçkin etolog Karl von Frisch, arıların çiçeklere, su kaynaklarına veya yeni yuva alanlarına olan yönü ve mesafeyi tanımlayabilen ayrıntılı bir koreografi olan "sallanma dansı" aracılığıyla iletişim kurduğunu keşfetti. Bu yüzyılda arılar, aynılık ve farklılığın soyut, çok modlu temsillerini içeren kuralları öğrenme yeteneğini sergilediler.
Daha fazla araştırmayla bilim insanları, insanlardan giderek daha uzaktaki hayvanlarda beklenenden daha karmaşık bilişlerin başarıyla bulunduğunu buldu. Çember neden giderek genişliyor?
Alanın erken dönem aşırılıklarına ve safdilliğine bir tepki olarak davranışçılık, kolu bastırmak gibi tek davranışlarla ve yanıp sönen ışıklar gibi basit uyaranlarla sınırlı, sıkı bir şekilde kontrol edilen deneyler talep etti. Davranışçının hatası, yapay olarak basit olan bu durumların, tüm organizmalardaki tüm davranışları açıklayacak şekilde genişletilebileceğini düşünmekti . Kullandıkları araçlar, daha karmaşık davranışları fark etmeyi zorlaştırdı ve keşfedildikten sonra bunları açıklamayı daha da zorlaştırdı.
Davranışçılara karşı en güçlü argümanlardan biri, Skinner'ın, dili diğerleri gibi davranışsal bir fenomen olarak açıklamaya çalışan Verbal Behavior kitabının incelemesinde geldi ; bu, Skinner'ın Organizmaların Davranışı'nda verdiği bir sözdü . 1959'da Language dergisinde yayınlanan inceleme, Skinner'ın insan dilinin derinliğini hafife aldığını sert bir şekilde savundu; bu, fareleri incelemek için kullandığı uyaran, tepki ve ödül yöntemlerinin genişletilmesiyle basitçe açıklanamazdı.
Artık bu, zihin bilimlerinin davranışçılıktan uzaklaşıp bunun yerine zihinsel temsillere ve işlemlere baktığı "bilişsel devrim"de bir dönüm noktası, bir kilometre taşı olarak görülüyor. Aynı zamanda onu yazan genç dilbilimci Noam Chomsky'nin profilini de büyük ölçüde yükseltti. Chomsky, insan ve hayvan davranışlarını doğru bir şekilde anlamak için bilimin davranışsal karmaşıklığı giderebilecek yöntemlere ihtiyacı olduğunu anlamıştı. "Açıktır ki böyle bir durumda gerekli olan şey, dogmatik ve tamamen keyfi iddialar değil, deneysel literatürün ilgi duyulan küçük kısmıyla analojilere dayanan araştırmadır." Ve karmaşık bilişsel yetenekler bir hipotez olarak kabul edilebildiğinde, bunları incelemek için yöntemler geliştirilebilir.
Araştırmacılar hayvanlara empati ve hayal gücüyle yaklaşmayı öğrendikçe, giderek daha fazla yetenek keşfettiler. Bilim insanları dünyayı her bir hayvanın deneyimlediği şekilde hayal edebildiklerinde çığır açıcı gelişmeler ortaya çıktı. Bir zamanlar Güneydoğu Asya'ya özgü küçük maymunlar olan şebekler arasında alet kullanımının bariz bir şekilde eksik olduğu düşünülüyordu. Yiyecek almak için kullanılabilecek aletler yere, önlerine konulduğunda ise şebekler onları yakalamıyordu. Sorun şebeğin zekasında değil, insanın hayal gücündeydi. Gibbons ağaçlarda yaşar. Elleri sallanmaya çok uygundur, ancak yerden bir şeyler toplamaya pek uygun değildir. Aletler bir daldan sarkıtıldığında, şebeklerin hiçbir sorunu yoktu ve bunları kolaylıkla kullandılar. Filler başlangıçta, kendini tanımayı belirlemek için yaygın bir yöntem olan ayna testinde, kullanılan aynaların çok küçük olması nedeniyle başarısız oldu. Ve gerçek bir empati eksikliği nedeniyle pek çok davranışçı, deneklerini motive etmek için onları yarı aç bırakmaları gerektiğini varsayıyordu. İyi muamele gören ve önemsendiğini hisseden hayvanların, tıpkı insanlarda olduğu gibi, ilginç şekillerde davranma olasılığının çok daha yüksek olduğu artık açık.
Vahşi gözlemler aynı zamanda hayvanlarla (tam anlamıyla) bulundukları yerde tanışmanın ve onların neler yapabileceklerini görmenin bir yoludur. Bilim insanları artık sahada sadece gözlem yaparak yüzlerce saat harcıyor (yüksek lisans öğrencileri daha da fazlasını harcıyor). Hayvanlar genellikle kendi türleri arasında ve doğal ortamlarında, laboratuvar kaplamalı tüysüz primatlarla çevrili steril bir laboratuvarda davranacaklarından çok farklı davranacaklardır. Daha fazla vahşi gözlem, laboratuvar bilim adamlarının hayvanların yapabileceğini hayal ettiğinden daha karmaşık davranışları ortaya çıkardı.
Ayrıca beyinlerin bizimkinden çok farklı şekillerde çalışabildiğini de öğrendik. Kuş zekası ornitologlar için şaşırtıcıydı çünkü kuşların neokorteksi yoktu. Arıların zekası şaşırtıcıydı çünkü beyinleri çok azdı. (Sallanma dansını çözen ilk kişi olmasına rağmen, Karl von Frisch bir keresinde şöyle demişti: "Arının beyni bir çim tohumu büyüklüğündedir ve düşünmek için yaratılmamıştır.") Her durumda, doğanın bunu gerçekleştirmek için daha fazla yolu vardır. aramayı düşündüğümüzden daha fazla bilgi. Kuşların korteksle aynı işlevi gören alternatif beyin bölgeleri vardır. Arılar, bir çim tohumu büyüklüğündeki bir şeye oldukça fazla biliş sığdıran çok yoğun bir şekilde paketlenmiş nöronlara sahiptir. Hepsinden tuhafı, ahtapotun dokunaçlarının her birinde bir nöron kümesi vardır ve bu da bizim için hayal edilmesi zor olacak kadar dağılmış bir düşünce türüne neden olur.
Hayvanlara "çok yaklaşma" ve onların bilişsel yeteneklerini abartma konusundaki ihtiyatlılık hâlâ mevcut ve bunun iyi bir nedeni var. Araştırmacıların önceden hayvanın ilginç şeyler yapabileceğine inanmaları durumunda bir hayvanla çalışma olasılıklarının daha yüksek olduğu seçilim etkileri iş başında olmaya devam ediyor. Yayıncılık teşvikleri ise etkileyici ve şaşırtıcı becerileri ödüllendiriyor. Bir hayvan davranışına deflasyonist bir açıklama bulan bilim insanının parlak profilinin pazarda yeri yok. Çok az kişi ayna testini geçemeyen bir somonun videosunu tweetleyecektir.
Yani ortak bir ikilem, hayvanlara zihniyetlerini gereğinden fazla atfeden hayvan meraklıları ile mesafelerini ve dolayısıyla metodolojik titizliklerini koruyan sert, sert burunlu vızıltıları karşı karşıya getiriyor. Ancak inatçı ve titiz bir çalışma yapmak farklı bir şey gerektirir; sevgiye benzer bir şey: uzun süreli sürekli ilgiden doğan, hayvana dair bütünsel bir anlayış. Bu tür bir iş için en iyi motivasyon kaynağı sevgidir. Gerçekten de De Waal'ın derslerinden biri, "sevgi ve saygıya dayanan sezgisel bir anlayış olmadan" hayvan zekasının çalışılamayacağıdır.
Ve şimdi tamamen farklı bir zeka türü geldi. Yapay zeka çalışması tutarlı yöntemlerden yoksundur. Yapay zeka yetenekleri bazı açılardan insanüstü, bazı açılardan ise tehlikeli derecede sınırlıdır. Ve hiç kimse bu kadar insani ama aynı zamanda yabancı bir şeyin ne anlama geleceğinden henüz emin değil. Geçtiğimiz yüzyılda hayvan bilişi üzerine yapılan araştırmalar, günümüzün yapay zeka sistemleri hakkında nasıl düşünüleceğine dair hangi dersleri içeriyor?
Birçok bakımdan, hayvanlar üzerinde yapılan çalışmaların 20. yüzyılın ortalarında olduğu geniş dil modelleri anlayışındayız. Hayvan bilişi gibi, yapay zeka alanı da kurucu travmalar nedeniyle gölgede kalıyor; bu vakalarda safdillik ve antropomorfizm, araştırmacıların yapay zeka sistemlerinin yeteneklerini abartmasına ve yanlış yorumlamasına yol açıyor. Araştırmacılar ELIZA etkisinin, yani insan benzeri niyetliliği çok basit yapay zeka sistemlerinde bile kolayca okuma eğilimimizin çok iyi farkındalar; bu isim, bir psikanalisti taklit etmek için basit buluşsal yöntemler kullanan, 1964'te inşa edilen ilk sohbet robotundan geliyor. Yapay zekanın ilerlemesine gereğinden fazla söz verildiği ve yetersiz teslim edildiği ve hayal kırıklığına uğrayan fon verenlerin işlerini kestiği geçmiş yapay zeka kışlarını hatırlıyorlar. Birçoğu anlaşılır bir şekilde saflık ve abartıya karşı ihtiyatlı davranıyor.
Ve şu anda çok az konu dil modelleri kadar abartılı bir şekilde öne çıkıyor. Katılığı empoze etmenin ve doğal insanileştirme eğilimimizle mücadele etmenin bir yolu, yapay zeka sistemlerini tanımlamak için psikolojik dilin kullanılmasını yasaklamaktır. Shevlin ve Halina'nın Nature Machine Intelligence'da iddia ettiği gibi , "zihin teorisi", "motivasyon" ve "anlama" gibi belirli psikolojik terimlerin kullanılması, insanları insan zihni için geçerli olabilecek ancak yapay zeka için geçerli olmayan çıkarımlar yapmaya teşvik ederse yanıltıcı olabilir. sistemler.6 Eğer GPT-4'ün inançlara sahip olduğu söylenebilirse, onun inançlarının bir bakıma insan inançlarından çok farklı olması gerekir. Eğer GPT-4'ün bir zihin teorisine sahip olduğu söylenebilirse, onun zihin teorisinin bizimkinden çok farklı bir şekilde gelişmiş olması gerekir. (Daha spekülatif olarak: Eğer GPT-6 bilinçli olacaksa, bizim için oldukça tuhaf ve hayal etmesi zor deneyimler yaşayacaktır.)
Karışıklıkla mücadele etmenin bir başka yolu da modellerin ne yapmak üzere eğitildiğini ve bunun insanlardan ne kadar farklı olduğunu vurgulamaktır: büyük dil modelleri, metni bizden çok farklı bir şekilde üretmeyi öğrenmiştir. Ancak davranışçılıkta olduğu gibi, bu anlaşılır yasaklar, yapay zeka davranışının, modellerin gerçekte neler yapabileceğini küçümseyen dar bir açıklamasına geri dönmemize yol açma riski taşıyor. Dil modellerini bir sonraki jetonu tahmin eden "adil" olarak tanımlamak, onların şaşırtıcı çalışma şekillerini haklı çıkarmaz.
Örneğin, dil modellerinin yalnızca yüzeysel istatistiksel metin kalıplarını modellemediği, aynı zamanda metnin arkasındaki dünyanın çeşitli yönlerini de modellediği artık açıktır. Aslında, geniş bir dil modelinin doğru olarak kabul ettiği "gerçekleri" belirlemek mümkündür. Araştırmacılar , Eyfel Kulesi'nin Roma şehrinde bulunduğuna "inandırmak" için bir dil modelini seçici olarak düzenleyebileceklerini keşfettiler .7 Modelin çıktıları bu yeni “inancı” hem kesin bir şekilde (çıktıları yalnızca Paris'in tamamını Roma'ya taşımakla kalmıyor, yalnızca Eyfel Kulesi'ni taşıyor) hem de genelleştirilmiş (Roma hakkında farklı ifadelerle ifade edilen geniş bir yelpazedeki sorularla) yansıtıyor. veya Eyfel Kulesi'nin, İtalya'ya gelen ziyaretçilere turistik bir destinasyon olarak önerilmesi gibi, Eyfel Kulesi'nin Roma'da olmasıyla tutarlı çıktılar üretecektir. Daha yakın zamanlarda başka bir grup, basit bir masa oyununun transkriptleri üzerinde bir dil modeli eğitti ve ardından tahtanın farklı durumlarını temsil etmeyi öğrendiğini bulmak için aktivasyonlarını araştırdı.8 Başka bir deyişle model, bir sonraki hamleyi belirlemek için yalnızca verilerini bir araya getirmiyordu. Oyun tahtasının içsel bir resmini geliştirmiş ve kurallarını sezmişti.
Tıpkı Skinner'ın fareler, maymunlar ve insanlar arasındaki farkların bir bakıma yüzeysel olduğunu düşünmesi gibi, tüm LLM'leri yalnızca bir sonraki belirteç tahmin edicileri olarak görmek, aralarındaki önemli farkları görmenizi engelleyebilir. Hem GPT-2 hem de GPT-4'ün "rastgele papağanlar" olduğunu söylersek, o zaman GPT-4'ün bir Python paketinin nasıl kullanılacağı, çıtanın nasıl geçileceği veya zor mantık bulmacalarının nasıl çözüleceği hakkında Shakespeare'e özgü bir sone yazabileceği gerçeğini açıklayan şey nedir? GPT-2'nin yeteneklerinin çok dışında beceriler mi var? Her modelin çıktısını araştırmamız ve neden farklı olduklarını açıklamamız gerekiyor.
Hayvan bilişinde olduğu gibi, katılık empoze etme arzusu kişinin açıklanacak davranışın ne kadar ilginç olduğunu görme yeteneğini sınırlayabilir. Bazıları yüksek lisans eğitimlerini o kadar önemsemiyor ki, büyük dil modellerinden elde edilen çıktılara bakmayı reddeden genel bir politikaya sahipler. Bu, modellerin neler yapabileceği konusunda kişinin fikrinin değişmesini imkansız hale getirme etkisine sahiptir. Eğer kişi önceden bir yapay zeka sisteminin o kadar da ilginç olmadığına karar vermişse, o zaman ilginç davranışları arama olasılığı daha düşük olacaktır. Chomsky kısa bir süre önce ChatGPT'yi "yüzlerce terabaytlık veriyi tıka basa dolduran ve bilimsel bir soruya verilen en olası konuşma yanıtını veya en olası yanıtı tahmin eden kalıp eşleştirme için hantal bir istatistiksel motor" olarak tanımladı .
Bu iddiaya kanıt olarak, New York Times'ta Mayıs ayında yazdığı köşe yazısında şunları beyan etti : "Bu programlar İngilizce söz dizimi kurallarını açıklayamadıkları için, örneğin, 'John konuşamayacak kadar inatçıdır' şeklinde yanlış bir tahminde bulunabilirler." 'ya', John'un birisiyle veya başka biriyle konuşmayacak kadar inatçı olduğu anlamına gelir (aksine, mantık yürütemeyecek kadar inatçı olduğu anlamına gelir). Okuyucular, ChatGPT'nin aslında doğru yorumu çıkarabildiğini hemen fark etti. Dil modelleri üzerine yapılan çalışmalar halen gelişmektedir. Nasıl çalıştıkları hakkında o kadar az şey biliyoruz ki, Chomsky'nin Skinner'a yaptığı öğüdü hatırlamamız akıllıca olacaktır: İhtiyaç duyulan şey, literatürün ilgi duyulan küçük bir kısmıyla analojilere dayanan iddialar değil, araştırmadır.
Neyse ki, büyük dil modellerinin doğa bilimcilerin (akademisyenler ve endüstri araştırmacılarının yanı sıra profesyonel olmayanlar da dahil olmak üzere meraklılar) eşdeğerleri var ve modellerle ilgilenmek için uzun saatler harcayanlar var. Onlar gibi insanlar, büyük dil modellerinin neler yapabileceğini, başarısızlık modlarını ve kendine has özelliklerini keşfetme konusunda çoğu zaman son noktadaydı. Yüksek Lisans meraklılarının yapay zeka anlayışımıza kattığı şey, sevdikleri şeyi yaparak, yani saatlerce Yüksek Lisans'la uğraşarak, ortaya çıkan çok sayıda ilginç kapasitedir.
Bu araştırmalar, Yüksek Lisans'ların hayvanlara benzediğini bir şekilde ortaya çıkardı: Deneğin doğal sınırlamalarına ve yeteneklerine daha iyi uyum sağlamak için görevleri yeniden şekillendirirseniz, daha iyi performans elde edebilirsiniz. Yüksek Lisans'ların bariz sınırlamalarından biri, devam eden metinler konusunda uzman olmalarına rağmen, bir soruyu yanıtlarken düşünecek herhangi bir alana sahip olmamalarıdır. Onlara bir soru sorduktan sonra basit bir şekilde "Adım adım düşünelim" ifadesini eklemek, Yüksek Lisans öğrencilerine düşünmeleri için bir alan (kendi çıktıları) vermek ve onları bunu kullanmaya teşvik etmek olarak düşünülebilir. Örneğin , GPT-3 genellikle başlangıçta matematiksel kelime problemlerinde başarısız olur. Ancak aynı soru "Adım adım düşünelim" şeklinde sorulursa model, doğru cevap için gerekli olan akıl yürütme adımlarıyla yanıt verecektir. Bu tekniğin "Düşünce Zinciri" yönlendirmesi adı verilen versiyonları, makine öğrenimi akademisyenleri ve GPT'nin ilk sürümleriyle oynayan amatörler tarafından keşfedildi.
Düşünce Zinciri, tıpkı bir şebeğin sarkan bir aleti yakalaması gibi, modellerin bir görevi yeteneklerine uygun bir şekilde tamamlamasını sağlayan doğal bir parlaklığa sahiptir. Modellerin gerekçelerini açıklamalarını istemek, çıktılar arasında seçim yapmalarına izin vermek veya yalnızca daha net talimatlar sağlamak da etkileyici sonuçlar doğurabilir. Yetenekleri ortaya çıkaran şeyler basit veya karmaşık olabilir, ancak her iki durumda da keşfedilmeleri için modellerle etkileşime girmeyi gerektirir.
Ancak insanları Zeki Hans etkisine duyarlı hale getiren aynı güçler, daha güçlü olmasa da, dil modellerinde de mevcuttur. Bizi memnun etmek ve mümkün olan en insani araç olan dil aracılığıyla bizimle arayüz oluşturmak için optimize edilmişlerdir. Ayrıca insan girdilerine yanıt verme ve kullanıcıların niyetlerini anlama konusunda da başarılılar. Bu, kullanıcıları özellikle onay yanlılığına karşı duyarlı hale getirir. Konuştuğum bir Yüksek Lisans doğa bilimci - tek bir isim altında yazan karı-koca ikilisi Janus - beni yansıtmanın tehlikesi konusunda uyardı: "Modelin ne olduğuna dair bir anlatınız varsa, açıkça belirtmeseniz bile bunu söylerken söylediğiniz her şey bu etkiyi içerecek ve bu da modeli etkileyecektir." Dil modellerini basit gören kullanıcılar, onlardan basit davranışlar elde edebilirler; Büyük dil modellerini bilinçli olarak gören kullanıcılar, bilindiği gibi, kendilerini bilinçli gösteren yanıtlar alabilirler.
Günümüzün Yüksek Lisans'ları, içgüdüsel zihin anlayışımızı bir kenara atmak için mükemmel bir fırtına gibi görünebilir. İnsanlar gibi davranacak, bizimle anladığımız dilde etkileşime girecek şekilde optimize edilmişlerdir. Ancak arılar ve ahtapotlara kıyasla bizimle daha az evrimsel miras paylaşıyorlar; aslında hiçbirini paylaşmıyorlar. Bu, kişiyi ya davranışçılık gibi içsel durumlarla ilgili tüm konuşmaları bir kenara bırakmak zorunda kalacağımız ya da umutsuzca kafamızın karışacağı konusunda karamsarlığa sürükleyebilir. Hayvan bilişi, dikkatle her ikisinden de daha iyisini yapabileceğimize dair umut veriyor. Bu modellerle vakit geçirmek ve onların “bakış açılarını” takdir etmek için empati ve saygı duymak, insani bir biliş veya öznellik varsaymak anlamına gelmez. Janus, "İnsanlar bu modellerin insanlardan ne kadar farklı olduğunu gerçekten anlamalı" dedi. “Ve neden büyüleyici ve güzel olduklarının bir parçası olarak bunu düşünmeliler.”
Yüksek Lisans'ın tuhaflığı onların kendi tarzlarında akıllı oldukları anlamına gelir . Bunların ne sadece bir sonraki belirteç tahmincileri olduğu ne de insan psikolojisini düzgün bir şekilde haritalandırdığı varsayılabilir. De Waal'ın şempanzeler hakkında söylediği gibi, büyük dil modellerini yalnızca insan zeka standartlarını karşılayıp karşılamadıklarına göre düşünmek, onlara haksızlık ediyor. Saf antropomorfizm bize onların neler yapabilecekleri konusunda abartılı bir görüş sunabilir. Bu aynı zamanda onların karmaşık ve insanlık dışı zeki olma yönlerine karşı bizi kör ederek onları küçümsememize de yol açabilir.
Robert Long