Google Gemini aikoo haastaa supersuositun ChatGPT:n! Kenelt?k??n ei varmaan j??nyt huomiotta, kuinka ChatGPT:n julkaisu marraskuussa 2022 ravisteli Googlea sen perustuksia my?ten. Suosittu chatbot uhkasi j?ttim?isen hakukoneyhti?n liiketoimintaa niin suurella volyymilla, ett? se joutui julistamaan itselleen melkein h?t?tilan ja alkoi sen my?t? investoida generatiivisen teko?lyn kehitt?miseen omassa tallissaan.
Googlen kehitysty? teko?lyn saralla onkin jo ennen Google Gemini? tuottanut tulosta. Google Bardi tuotiin ensin markkinoille haastamaan ChatGPT erityyppisten sis?lt?jen, kuten kuvan ja tekstin tuottamisessa. Ja nyt yhti? on lanseerannut my?s Google Geminin.
Google Gemini lanseerattiin keskiviikkona 6. joulukuuta 2023, ja aloitimme sen kehityksen seuraamisen vain kuukausi lanseerauksen j?lkeen. Mied?n n?kemyksemme mukaan on olemassa suuri mahdollisuus, ett? Google saa viel? haltuunsa kovasti kilpaillun AI-kruunun ChatGPT:lt?.
Mik? on Google Gemini?
Google Gemini on joukko suuria kielimalleja (LLM), jotka hy?dynt?v?t AlphaGo:sta otettuja koulutustekniikoita, mukaan lukien vahvistusoppiminen ja erityislaatuinen hakutoiminto, joka voi jatkossa poistaa ChatGPT:n sen asemasta planeetan hallitsevimpana generatiivisena teko?lyratkaisuna.
T?m? Googlen vastaus ChatGPT:lle tulee vain kuukausia sen j?lkeen, kun Google yhdisti Brain- ja DeepMind AI -laboratorionsa luodakseen uuden tutkimusryhm?n nimelt? Google DeepMind. T?m?n ty?ryhm?n tavoitteena on jatkokehitt?? sek? Bardin ja sen seuraavan sukupolven PaLM 2 LLM:?? eteenp?in.
Tutkijat odottavat, ett? generatiivisten teko?lymarkkinoiden arvo nousee arviolta 1,3 triljoonaan dollariin vuoteen 2032 menness?, joten on selv??, ett? Google investoi t?h?n alaan isolla k?dell? s?ilytt??kseen asemansa johtavana teko?lykehitt?j?n?.
Mik? on Large Language Model (LLM)?
LLM:??n perustuvat ty?kalut koulutetaan valtavilla tietom??rill?, ja ne k?ytt?v?t itseohjattua oppimista, jonka avulla ne ennustavat seuraavan lauseen edellist? lausetta ymp?r?iv?n kontekstin perusteella. Prosessi toistetaan yh? uudelleen, kunnes malli saavuttaa hyv?ksytt?v?n tarkkuustason.
Kun LLM on koulutettu, sit? voidaan hienos??t?? monenlaisia NLP-teht?vi? varten, mukaan lukien:
- Keskustelevien chatbottien, kuten ChatGPT:n, rakentaminen.
- Tekstin luominen tuotekuvauksiin, blogikirjoituksiin ja artikkeleihin.
- Vastaukset usein kysyttyihin kysymyksiin (FAQ) ja ohjaa asiakkaiden tiedustelut sopivimmalle ihmiselle.
- Analysoi asiakkaiden palautetta s?hk?postista, sosiaalisen median viesteist? ja tuotearvosteluista.
- Liiketoiminnan sis?ll?n k??nt?minen eri kielille.
- Suurten tekstidatam??rien luokittelu ja jaottelu tehokkaampaan k?sittelyyn ja analysointiin.
Mik? on ChatGPT?
ChatGPT (Chat Generative Pre-trained Transformer) on sarja suosittuja generatiivisia AI-chatbotteja, jotka on kehitt?nyt, ja joita yll?pit?? OpenAI -niminen yritys. Suuret kielimallit (LLM), jotka tukevat aiemmin luotuja chatbot-malleja, olivat yksimuotoisia ja pystyiv?t k?sittelem??n ja luomaan ainoastaan tekstisis?lt??. T?m?n “alkuper?isen” chatbotin uusimmat versiot ovat multimodaalisia, eli ne voivat tunnistaa ja luoda kuvia, osallistua keskusteluihin ja etsi? keskusteluun lis?? sis?lt?? Internetist? reaaliajassa saman keskustelullisen k?ytt?liittym?n (CUI) kautta.
OpenAI julkaisi aluksi ilmaisen version ChatGPT:st?, mutta toi markkinoille my?s kaupallistetun version vuonna 2023.
- Se veloitusmalli perustuu kehitt?jilt? peritt?v??n p??symaksuun chatbotin sovellusohjelmoinnin rajapintoihin (API)
- Lis?ksi se tarjoaa kahdenlaisia maksullisia tilauksia.
- OpenAI on my?s julkaissut Assistants API -nimisen ved? ja pudota -ty?kalun, joka antaa kehitt?jille mahdollisuuden k?ytt?? vaihtelevaa koodausasiantuntemusta.
- T?m? LCNC-kehitt?j?ty?kalu antaa sellaisille k?ytt?jille, joilla on hyvin v?h?n koodauskokemusta, mahdollisuuden luoda mukautettuja chatbotteja, jotka voidaan jakaa tai myyd? OpenAI:n GPT-kaupan kautta.
ChatGPT:ll? on t?ll? hetkell? yli kaksi miljoonaa kehitt?j?? ja yli 100 miljoonaa viikoittaista aktiivista k?ytt?j??. Sit? k?ytt?? v?hint??n 92% Fortune 500 -yrityksist?, mik? kertoo siit?, ett? Google Gemini taistelee hyvin varteenotettavaa kilpailijaa vastaan.
Auttaakseen varmistamaan teko?lyn (AI) vastuullisen k?yt?n, ChatGPT:n teko?lyinsin??rit ja automaattiset valvontaj?rjestelm?t valvovat jatkuvasti k?ytt?jien kehotteita ja mallien tuloksia. K?ytt?jien tietosuojan turvaamiseksi OpenAI ei k?yt? ChatGPT-keskusteluja mallikoulutukseen ilman k?ytt?jien lupaa.
Lue my?s: Voivatko nestem?iset hermoverkot mullistaa teko?lyn maailmaa?
Kaikki mit? toistaiseksi tied?mme Google Geminist??
Toukokuussa Googlen ja Alphabetin toimitusjohtaja Sundar Pichai julkaisi blogikirjoituksen, jossa on h?n tarjoaa korkeatasoisen katsauksen hakukonej?tin LLM:??n seuraavien kommenttien my?t?:
“Google Gemini luotiin alusta alkaen multimodaaliksi, eritt?in tehokkaaksi ty?kalujen ja sovellusliittymien integroinnissa, ja se on suunniteltu mahdollistamaan tulevaisuuden innovaatiot, kuten muisti ja suunnittelu.”
Pichai totesi my?s, ett? “vaikka viel? on hyvin aikaista, n?emme jo vaikuttavia multimodaalisia ominaisuuksia, joita ei ole n?hty aikaisemmissa malleissa.
“Kun Google Gemini on hienos??detty ja turvallisuustestattu tarkasti, se tulee saatavaksi eri kokoisena ja eri ominaisuuksilla, aivan kuten PaLM 2.”
Google DeepMindin toimitusjohtajan Demis Hassabiksen Wired-haastattelussa todettiin, ett? Google Gemini “yhdist?? joitain AlphaGo-tyyppisten j?rjestelmien vahvuuksia suurten kielimallien h?mm?stytt?viin ominaisuuksiin.”
Viek? Google Gemini kruunun ChatGPT:lt??
Yksi suurimmista keskusteluista Google Geminin julkaisun ymp?rill? on se, onko sen kielimallilla kaikki se, mit? tarvitaan ChatGPT:n voittamiseen. ChatGPT nimitt?in saavutti vuonna 2023 yli 100 miljoonaa aktiivista k?ytt?j?? joka kuukausi.
Alun perin Google k?ytti Geminin kyky? luoda teksti? ja kuvia erottaakseen sen GPT4:st?, mutta 25. syyskuuta 2023 OpenAI ilmoitti, ett? k?ytt?j?t voivat tehd? tekstikehotteiden lis?ksi my?s puhe- ja kuvakyselyit? ChatGPT:ll?.
Nyt kun OpenAI kokeilee multimodaalista mallil?hestymistapaa ja on yhdist?nyt ChatGPT:n Internetiin, ehk? suurin ero n?iden kahden v?lill? on Googlen laaja valikoima sen omaa koulutusdataa, jota Gemini voi k?ytt??. Google Gemini voi k?sitell? tietoja, jotka on ker?tty palveluista, kuten Googlen hausta, YouTubesta, Google-kirjoista ja Google Scholarista.
N?iden omistusoikeudellisten tietojen k?ytt? Gemini-mallien koulutuksessa voi johtaa selke??n etuly?ntiasemaan niiden oivallusten ja p??telmien kehittyneisyydess?, jotka se voi saada kaikista n?ist? valtavista tietojoukosta. T?m? p?tee erityisesti silloin, jos varhaiset raportit pit?v?t paikkansa, joiden mukaan Gemini on koulutettu k?ytt?m??n kaksi kertaa niin monta merkki? kuin ChatGPT4.
Lis?ksi Google DeepMind- ja Brain-tiimien v?list? kumppanuutta ei voida aliarvioida t?n? vuonna, sill? OpenAI kohtaa alan kilpailussa maailmanluokan teko?lytutkijoita, mukaan lukien Googlen perustaja Sergey Brin ja DeepMind vanhempi teko?lytiedemies ja koneoppimisen asiantuntija Paul Barham.
Kyseess? on siis eritt?in kokenut tiimi, jolla on syv? ymm?rrys siit?, kuinka soveltaa eri teknologioita, kuten vahvistusoppimista, luodakseen teko?lyohjelmia, jotka voivat ker?t? tietoa ja parantaa ongelmanratkaisukyky??n ajan my?t? itsen?isesti ja entist? tehokkaammin.
Yhteenveto – Google Gemini vs. ChatGPT
Google Geminin yhdistelm? multimodaalisia kykyj?, vahvistusoppimisen k?ytt??, sen tekstin ja kuvan luontiominaisuudet sek? Googlen omistamat tietol?hteet ovat kaikki ainesosia, joita Gemini tarvitsee p?ihitt??kseen ChatGPT-4:n.
Harjoitteludata on avaintekij?, sill? LLM:n asekilpailun voittava organisaatio p??tet??n suurelta osin sen perusteella, kuka kouluttaa heid?n mallejaan suurimmalla ja rikkaimmalla tietojoukolla.
T?st? huolimatta, samalla kun OpenAI:n kerrotaan ty?skentelev?n uuden seuraavan sukupolven multimodaalisen Gobi-nimisen LLM:n parissa, emme voi viel? kirjata pois t?t? generatiivista teko?lyj?tti?. Nyt kysymys kuuluu, kuka toteuttaa jatkossa multimodaalista teko?ly? paremmin?