Co to jest test Turinga?
Test Turinga jest narz?dziem do oceny sztucznej inteligencji (AI), które w 1950 roku wprowadzi? dr Alan Turing, brytyjski matematyk i informatyk. Turing szuka? odpowiedzi na pytanie: ?Czy maszyny mog? my?le??”.
Zamiast zag??bia? si? w filozoficzne pytanie, co oznacza ?my?lenie”, Turing przeformu?owa? problem i zaproponowa? konkretny test operacyjny: je?li maszyna potrafi na?ladowa? ludzkie reakcje na tyle przekonuj?co, by oszuka? cz?owieka, to dla wszystkich praktycznych celów mo?na za?o?y?, ?e ?my?li”. Przedstawiona przez niego strategia sta?a si? jednym z najwcze?niejszych wska?ników oceny inteligencji maszynowej.
Aby zebra? dane jako?ciowe na temat inteligencji maszyn, Turing zaproponowa? gr? opart? na zapytaniach. Sta?a si? ona pó?niej znana jako ?gra w na?ladownictwo” (Imitation Game) lub, bardziej powszechnie, ?test Turinga”.
Co to jest Imitation Game?
Test Turinga na inteligencj? maszyn opiera si? na grze towarzyskiej, która by?a popularna w epoce wiktoriańskiej. Oryginalna gra tajemnic wymaga?a udzia?u trzech osób: m??czyzny, kobiety i s?dziego. W przypadku s?dziego p?e? nie mia?a znaczenia. M??czyzna i kobieta byli umieszczani w jednym pokoju, a s?dzia w innym.
S?dzia rozpoczyna? gr? – zadawa? seri? pytań i prosi? uczestników o napisanie (lub wprowadzenie) odpowiedzi. Aby utrudni? gr?, jednemu z uczestników pozwalano k?ama? i zmy?la? odpowiedzi, a od drugiego wymagano wy??cznie prawdy. Celem gry by?o to, aby s?dzia prawid?owo odgad?, które odpowiedzi zosta?y udzielone przez m??czyzn?, a które przez kobiet?.
Jak dzia?a test Turinga?
W swoim artykule pt. ?Computing Machinery and Intelligence” z 1950 roku Turing przedstawi? swoj? wersj? Imitation Game. Ta odmiana równie? wymaga?a s?dziego i dwóch uczestników. Co jednak istotne, w tym przypadku jeden z uczestników by?by cz?owiekiem, a drugi – maszyn? obliczeniow?.
Zasadniczo wersja gry Turinga by?a pioniersk? prób? ustanowienia praktycznego miernika inteligencji maszyn, która omija?a filozoficzne pytanie: co to znaczy ?my?le?”. Turing zaproponowa?, ?e je?li s?dzia nie potrafi wiarygodnie odró?ni? odpowiedzi maszyny od odpowiedzi cz?owieka, mo?na za?o?y?, ?e maszyna demonstruje procesy my?lowe i posiada inteligencj? podobn? do ludzkiej.
Dok?adne kryteria okre?lania inteligencji maszyny zawsze by?y przedmiotem debaty. W oparciu o rzeczony artyku? cz?sto argumentowano jednak, ?e je?li s?dzia wierzy, i? komunikuje si? z innym cz?owiekiem przez co najmniej 70% czasu – podczas gdy w rzeczywisto?ci rozmawia z programem komputerowym – twórcy mog? stwierdzi?, ?e ich oprogramowanie AI przesz?o test Turinga.
Dlaczego test Turinga jest tak wa?ny?
Test Turinga jest wa?ny pod wzgl?dem historycznym, poniewa? przeniós? debat? z pytania: ?Czy maszyny mog? my?le??” na inne: ?Czy mog? na?ladowa? ludzk? rozmow??”. Ta zmiana zapewni?a powstaj?cej spo?eczno?ci informatycznej pragmatyczne ramy do oceny post?pów.
Na przestrzeni lat Turing test wywo?ywa? wiele sporów w?ród informatyków, filozofów i psychologów poznawczych. Jego trwa?o?? le?y w mo?liwo?ci stanowienia zarówno technicznego wska?nika, jak i filozoficznego narz?dzia do badania i dyskusji na temat tego, czy maszyna kiedykolwiek mo?e by? naprawd? inteligentna.
Wykorzystanie konwersacji jako g?ównego kryterium inteligencji mimowolnie zaw?zi?o jednak poj?cie inteligencji. Ponadto zanegowa?o znaczenie innych jej rodzajów, takich jak inteligencja emocjonalna, przestrzenna czy twórcza.
Dzi?ki dzisiejszym post?pom, jakie odnotowa?y sieci neuronowe i uczenie maszynowe (ML), coraz ?atwiej mo?na tworzy? chatboty z architekturami, które dok?adnie na?laduj? wzorce z danych szkoleniowych. Na przyk?ad ChatGPT-4 i Google Bard do?? biegle radz? sobie w konwersacji na wiele przeró?nych tematów. W wielu przypadkach generuj? odpowiedzi, których nie da si? odró?ni? od ludzkich.
Nie musi to jednak oznacza?, ?e chatbot jest inteligentny. W d?ugotrwa?ych interakcjach du?e modele j?zykowe, które obs?uguj? chatboty, mog? mie? halucynacje i generowa? niespójne, sprzeczne lub nielogiczne wyniki.
Pocz?tkowe zastrze?enia do testu Turinga
Warto podkre?li?, ?e cho? Turing obecnie uchodzi za wizjonera, za ?ycia uwa?ano go za do?? kontrowersyjn? osob?, a jego praca nie zawsze by?a doceniana. Wielu naukowców i teologów w?tpi?o, by maszyny mog?y kiedykolwiek na?ladowa? ludzkie my?lenie. Co wi?cej, do?? radykalne pomys?y Turinga dotycz?ce inteligencji maszyn wywo?a?y wiele burzliwych debat filozoficznych i teologicznych.
Turing przewidzia? jednak zastrze?enia do swoich pomys?ów i przedstawi? kontrargumenty, które wyja?nia?y, dlaczego jego zdaniem maszyny mog? na?ladowa? ludzkie my?li. Przekonanie to zosta?o uzasadnione w tezie Churcha-Turinga.
Teza Churcha-Turinga sugeruje, ?e ka?de obliczenie lub problem matematyczny, który cz?owiek potrafi rozwik?a? przy u?yciu okre?lonego zestawu instrukcji, mo?e zosta? rozwi?zany tak?e przez maszyn?. Koncepcja sta?a si? podstaw? wspó?czesnej informatyki.
Maszyna Turinga a uniwersalna maszyna Turinga
Turing po raz pierwszy wprowadzi? poj?cie inteligencji maszynowej (machine intelligence) w swoim artykule ?On Computable Numbers, with an Application to the Entscheidung’s Problem” z 1936 roku. Przedstawi? w nim proste urz?dzenie teoretyczne, które w zasadzie mog?oby obliczy? dowoln? sekwencj? liczb, je?li otrzyma odpowiednie instrukcje.
Maszyna Turinga (TM) to abstrakcyjny model matematyczny do obliczeń. W umy?le Turinga jego wyimaginowana maszyna sk?ada?a si? z nieskończonej ta?my podzielonej na komórki, ruchomej g?owicy ta?my, która mo?e porusza? si? w lewo lub w prawo, oraz zestawu stanów i regu?, które dyktowa?y, w jaki sposób g?owica ta?my odczytuje i zapisuje informacje na ta?mie. Przewidywa? on, ?e ka?da maszyna Turinga b?dzie zaprojektowana do wykonywania okre?lonego zadania lub obliczenia.
Zaproponowa? równie? uniwersaln? maszyn? Turinga. By?by to specjalny rodzaj maszyny Turinga, która mo?e symulowa? ka?d? inn? maszyn? Turinga. Gdy UTM otrzyma?aby opis innej maszyny Turinga (i jej dane wej?ciowe), teoretycznie mog?aby wykorzysta? te informacje jako w?asne dane wej?ciowe.
Koncepcja Uniwersalnej Maszyny Turinga wprowadzi?a ide?, ?e jedna maszyna obliczeniowa mo?e symulowa? dowoln? maszyn? obliczeniow?, je?li otrzyma odpowiednie dane wej?ciowe. Sta?o si? to podstaw? dzisiejszych programów komputerowych i wa?nym krokiem w rozwoju komputerów ogólnego przeznaczenia.
Czy test Turinga jest nadal istotnym narz?dziem oceny?
Test Turinga jest dzi? uwa?any przede wszystkim za historyczne narz?dzie do oceny sztucznej inteligencji.
Jest jednak nadal omawiany ze wzgl?du na jego wp?yw na badania nad sztuczn? inteligencj?. Zasadniczo Turing przeniós? filozoficzne pytanie ?czy maszyny mog? my?le??” na inne, na które mo?na by?o udzieli? odpowiedzi popartej danymi.
Jest to wa?ne, poniewa? na nowe pytanie (?Czy maszyny mog? zachowywa? si? w sposób nieodró?nialny od ludzi podczas rozmowy?”) mo?na jednoznacznie odpowiedzie? przy wykorzystaniu metody badawczej.
Ta subtelna, lecz g??boka zmiana perspektywy wywar?a ogromny wp?yw. Zach?ci?a bowiem pierwszych badaczy AI do po?o?enia wi?kszego nacisku na badanie przetwarzania j?zyka naturalnego (NLP), rozumienia j?zyka naturalnego (NLU) i generowania j?zyka naturalnego (NLG).
Konwersacyjna sztuczna inteligencja a test Turinga
Po dekadach od ?mierci Turinga powszechnie znana sta?a si? jego rola w z?amaniu szyfru Enigmy. Ponownie zbadano tak?e wk?ad i spostrze?enia Alana na temat inteligencji maszyn. Poni?sze technologie i koncepcje dziel? wspólny w?tek z testem Turinga. Wszystkie d??? bowiem do dok?adnego odtworzenia ludzkiego zachowania w kontek?cie maszyny.
Chatboty: S? to aplikacje zaprojektowane do symulowania ludzkiej konwersacji. Wczesne przyk?ady mia?y na celu na?ladowanie interakcji podobnych do ludzkich i sta?y si? bezpo?rednim odniesieniem do celów testu Turinga.
Asystenci g?osowi: Technologie, takie jak Amazon Alexa, Google Assistant, Siri czy Cortana, zosta?y zaprojektowane tak, aby rozumie? i reagowa? na polecenia u?ytkownika w sposób podobny do ludzkiego, odzwierciedlaj?c wzorce konwersacyjne testu Turinga.
Przetwarzanie j?zyka naturalnego (NLP): Koncentracja testu Turinga na konwersacji przyczyni?a si? do badań nad zrozumieniem i generowaniem ludzkiego j?zyka, co doprowadzi?o do rozwoju narz?dzi i algorytmów natural language processing (NLP) dla biznesu.
Machine Learning: Mimo i? nie s? bezpo?rednio zwi?zane z testem Turinga, techniki uczenia maszynowego, zw?aszcza w obszarach takich jak g??bokie uczenie modeli j?zykowych (np. seria GPT OpenAI), mo?na postrzega? jako wysi?ki, które maj? na celu wygenerowanie wyników bardziej podobnych do ludzkich i zdanie testu Turinga.
Platformy konwersacyjnej sztucznej inteligencji: Narz?dzia i platformy, takie jak Dialogflow Google lub Bot Framework Microsoftu, umo?liwiaj? tworzenie agentów konwersacyjnych i konwersacyjnych interfejsów u?ytkownika (CUI).
CAPTCHA: Testy te, cz?sto u?ywane na stronach internetowych w celu odró?nienia ludzi od botów, s? rodzajem odwrotnego testu Turinga. Zosta?y zaprojektowane tak, aby by?y ?atwe do wykonania przez ludzi, ale trudne do wykonania przez maszyny.
Liczba Turinga: Jest to kolejny proces sprawdzania u?ytkowników online i odró?niania ludzi od botów.
Narz?dzia analizy nastrojów: Podczas gdy narz?dzia te koncentruj? si? na zrozumieniu emocji w tek?cie, ich celem jest uchwycenie ludzkiego aspektu komunikacji, który przypomina test Turinga.
Interaktywne opowiadanie historii i postacie niezale?ne (NPC): Gry wideo z postaciami NPC, zaawansowanymi dialogami i drzewami decyzyjnymi staraj? si? zapewni? interakcje podobne do ludzkich, a wi?c odzwierciedla? wzorce testu Turinga.
Boty obs?ugi klienta: Boty te powszechnie spotyka si? na stronach internetowych i kana?ach wsparcia klienta. Próbuj? odpowiada? na zapytania w sposób podobny do ludzkiego, zanim, w razie potrzeby, przeka?? rozmow? prawdziwemu cz?owiekowi.
Generative Adversarial Networks (GAN): Przeciwstawny proces, który wykorzystuj? sieci GAN do generowania nowych danych, przypomina nieco test Turinga. W obu przypadkach celem jest wygenerowanie danych wyj?ciowych, których nie da si? odró?ni? od ?prawdziwego” lub ?autentycznego” ?ród?a.
Test Turinga a GenAI
Test Turinga jest cz?sto wspominany w artyku?ach o generatywnej sztucznej inteligencji, gdy? z natury jest generatywny. Kiedy model j?zykowy generuje histori?, artyku? lub wiersz, nie chodzi tylko o po??czenie s?ów. Próbuje wykreowa? tre??, która sprawia wra?enie, jakby zosta?a stworzona przez cz?owieka.
Jednym z pierwszych programów komputerowych, które podj??y prób? interaktywnej konwersacji, by? chatbot ELIZA. Stworzy? go w latach 60. XX wieku Joseph Weizenbaum na MIT. ELIZA cz?sto pojawia si? w dyskusjach na temat testu Turinga, poniewa? uchodzi za jeden z pierwszych programów komputerowych, który potrafi na?ladowa? ludzk? rozmow? i oszuka? ludzi w taki sposób, by my?leli, ?e wchodz? w interakcj? z prawdziw? osob?.
Ponadto w kontek?cie tamtych czasów ELIZA mog?a by? postrzegana jako generatywna, gdy? tworzy?a zró?nicowane odpowiedzi bez konieczno?ci okre?lania przez cz?owieka ka?dego mo?liwego zwrotu konwersacji.
S?ynne próby zdania testu Turinga
ELIZA nie zosta?a zaprojektowana specjalnie w celu przej?cia testu Turinga, ale dzi?ki zdolno?ci chatbota do na?ladowania niektórych rodzajów interakcji mi?dzyludzkich sta? si? kamieniem milowym w historii sztucznej inteligencji i interakcji cz?owiek-komputer.
Jak na ironi?, reakcje na Eliz? uwypukli?y równie? ludzk? tendencj? do przypisywania maszynom innych ludzkich cech. Zjawisko to, znane jako efekt Elizy, stosuje si? jako synonim personifikacji w kontek?cie technologii informatycznych.
Oprócz Elizy do godnych uwagi chatbotów zwi?zanych z konwersacyjn? sztuczn? inteligencj? i testem Turinga nale??:
PARRY (1972): Zaprojektowany przez psychiatr? Kennetha Colby’ego, PARRY symulowa? pacjenta ze schizofreni? paranoidaln?. Kiedy u?y? dalekopisu do ?rozmowy” z psychiatrami, niektórzy lekarze uwierzyli, ?e komunikuj? si? z prawdziwym cz?owiekiem.
Racter (lata 80.): Jego twórcy twierdzili, ?e Racter by? pierwszym programem AI, który napisa? ksi??k?. Jej tytu? brzmia? ?The Policeman’s Beard is Half Constructed”. Podnoszono jednak kwesti?, ile ludzkiej interwencji zaanga?owano w stworzenie ksi??ki.
Jabberwacky (1990): Zaprojektowany przez brytyjskiego programist? Rollo Carpentera Jabberwacky powsta? w celu na?ladowania ludzkiej konwersacji i uczenia si? na podstawie interakcji. Jego nast?pca, Cleverbot, wzi?? udzia? w formalnym te?cie Turinga podczas festiwalu Techniche w Indiach (2011).
Eugene Goostman (2014): Ten chatbot, zaprojektowany do symulowania rozmowy 13-letniego ukraińskiego ch?opca, twierdzi, ?e zda? test Turinga podczas turnieju w Royal Society w Londynie. Bot Goostman bra? udzia? w wielu konkursach testu Turinga i zaj?? drugie miejsce w walce o nagrod? Loebnera (2005 i 2008).
Google Duplex (2018): Google Duplex powsta? w celu dokonywania za u?ytkowników rezerwacji w restauracjach, umawiania wizyt w salonach i podobnych zadań. Cho? bot nigdy nie pretendowa? do testu Turinga w tradycyjnym sensie, jego oprogramowanie zas?uguje na uznanie ze wzgl?du na zdolno?? do prowadzenia naturalnie brzmi?cych rozmów przez telefon z u?yciem wype?niaczy, takich jak ?hmm” i ?yyy”.
GPT-3 OpenAI (2020): Trzecia iteracja chatbota OpenAI Generative Pre-trained Transformer odnowi?a zainteresowanie i debat? na temat tre?ci generowanych maszynowo i ograniczeń testu Turinga.
S?ynne konkursy testu Turinga
Na przestrzeni lat kilka konkursów wykorzysta?o kontrowersyjny test Turinga do oceny ?inteligencji” oprogramowania AI. Te najs?ynniejsze z nich to:
- Nagroda Loebnera, turniej, który zosta? zapocz?tkowany w 1990 roku przez Hugh Loebnera we wspó?pracy z Cambridge Center for Behavioral Studies, jest jednym z najs?ynniejszych konkursów testu Turinga. Nagroda Loebnera zosta?a zniesiona w 2020 roku.
- Chatterbox Challenge by? corocznym konkursem, który rozpocz?? si? na pocz?tku XXI wieku i odbywa? przez kilka lat. W czasach swej ?wietno?ci Chatterbox Challenge uchodzi? za jeden z najwa?niejszych konkursów chatbotów.
- Strona Chatbot Battle Arena stawia przeciwko sobie ró?ne chatboty i pozwala widzom okre?li?, który z nich powinien wygra?. W tym konkursie, który przypomina test Turinga, widz okre?la w?asne kryteria zwyci?stwa.
- Turing100 zosta? zorganizowany przez Europejskie Stowarzyszenie Sztucznej Inteligencji w 2012 roku. By?a to cz??? obchodów 100. rocznicy urodzin Alana Turinga.
- 2K BotPrize by? konkursem organizowanym w kontek?cie gry wideo Unreal Tournament 2004. Zamiast skupia? si? na konwersacji, programi?ci tworzyli boty, które mia?y zachowywa? si? w grze tak ludzko, ?e by?yby mylone z ludzkim graczem.
Alternatywy testu Turinga
Zaproponowano ró?ne alternatywy i uzupe?nienia testu Turinga, aby zrekompensowa? jego ograniczenia. Niektóre z nich maj? na celu ocen? inteligencji maszyn wykraczaj?cej poza konwersacyjn? sztuczn? inteligencj?:
Argument chińskiego pokoju jest eksperymentem my?lowym, który zaproponowa? filozof Johna Searle. Podwa?y? zasadno?? testu Turinga i stara? si? udowodni?, ?e komputery cyfrowe nie mog? rozumie? j?zyka lub my?le?.
Test Lovelace zosta? nazwany na cze?? Ady Lovelace, pierwszej ?eńskiej programistki. Ocenia zdolno?? maszyny do tworzenia oryginalnych, artystycznych tre?ci, które nie zosta?y w niej wyra?nie zaprogramowane.
Test Marcusa jest testem AI zaproponowanym przez Gary’ego Marcusa, kognitywist? z New York University. Zosta? zaprojektowany w celu oceny zdolno?ci sztucznej inteligencji do rozumienia i reagowania na rzeczywiste wydarzenia.
Jak obecnie wykorzystuje si? test Turinga?
Cho? Turing test mo?e nie mie? takiego samego statusu jak kiedy? w odniesieniu do inteligencji maszyn, jego spu?cizna nadal pozosta?a. Wci?? jest cennym narz?dziem dyskusyjnym i marketingowym. Oto kilka sposobów jego wykorzystania w dzisiejszych czasach:
Konkursy AI: Cho? nie przyznaje si? ju? nagrody Loebnera, nadal istniej? niewielkie konkursy dla twórców chatbotów, które lu?no uwzgl?dniaj? test Turinga w swoich kryteriach oceny jako?ci wyników konkurentów.
Ocena mo?liwo?ci przetwarzania j?zyka naturalnego (NLP): Testu Turinga czasami nieformalnie u?ywa si? w spo?eczno?ci AI jako punktu odniesienia dla wydajno?ci algorytmów NLP. Je?li model NLP mo?e generowa? odpowiedzi podobne do ludzkich, cz?sto mówi si?, ?e osi?gn?? kompletno?? Turinga, nawet je?li model nie przeszed? formalnego testu.
Narz?dzie edukacyjne: Test Turinga cz?sto omawia si? na kursach akademickich zwi?zanych ze sztuczn? inteligencj?, obliczeniami kognitywnymi i filozofi?. Gra tajemnic (Imitation Game) nadal ma swoje zastosowanie jako punkt wyj?cia do g??bszych badań nad my?l?c? inteligencj? maszynow? i koncepcj? ?wiadomo?ci.
Media i popkultura: Test Turinga jest cz?sto przywo?ywany w filmach, literaturze i dyskusjach zwi?zanych z robotami, androidami i samo?wiadomymi maszynami.
Etyka: Niedawne post?py, szczególnie w zakresie modeli generatywnej sztucznej inteligencji, które opieraj? si? na g?osie, wideo i tek?cie, wznowi?y dyskusje na temat nast?pstw testu Turinga. Je?li maszyna potrafi przekonuj?co na?ladowa? cz?owieka, mo?e to mie? potencjalne konsekwencje w zakresie oszustwa i zaufania, a tak?e etycznego wykorzystania takich technologii.
Marketing: Firmy tworz?ce chatboty, asystentów g?osowych i innych agentów konwersacyjnych cz?sto odwo?uj? si? do testu Turinga jako miary tego, jak ?ludzkie” jest ich generatywne oprogramowanie. W tym kontek?cie test Turinga s?u?y bardziej jako termin promocyjny ni? rzeczywisty punkt odniesienia.