Anthropic Claude 3.5 Sonnetti vs. OpenAI GPT-4o: kumpi on parempi?

Mies ja nainen poseeraavat vaalean oranssin seinän takana

Dario ja Daniela Amodei perustivat Anthropicin vuonna 2021.Kohteliaisuus Anthropic.

Anthropic, A.I. Entisten OpenAI-insinöörien perustama startup julkaisi eilen (20. kesäkuuta) Claude 3.5 Sonnetin, sen tehokkaimman A.I. malli vielä. Uusi malli ei ole vain kaksi kertaa nopeampi kuin edeltäjänsä, vain kolme kuukautta sitten julkaistu Claude 3 Opus, vaan ylittää OpenAI:n GPT-4o:n lukuisissa päättely-, koodauksen ja visuaalisen ymmärtämisen mittauksissa, yhtiön mukaan. Tämänpäiväisen julkaisun myötä otamme askeleen kohti sitä, mikä voisi olla merkittävä muutos vuorovaikutuksessamme teknologian kanssa, sanoi Anthropicin toimitusjohtaja ja toinen perustaja Dario Amodei lausunnossaan.

Anthropic on asettunut yhdeksi OpenAI:sta ensisijaiset kilpailijat. Sen perustivat vuonna 2021 Dario Amodei ja hänen sisarensa Daniela. Molemmat työskentelivät aiemmin OpenAI:ssa valvoen tutkimusta ja sen turvallisuus- ja poliittisia aloitteita jätti yhtiön vuonna 2020 sen suuntaa ja suojatoimien puuttumista koskevista huolenaiheista.

Dario Amodei ehdotti nopeita mallien julkaisuja lähitulevaisuudessa. Claude 3.5 Sonnetin julkaisua seuraa pian uudet julkaisut Claude-perheessä. Tavoitteemme on parantaa merkittävästi älykkyyden, nopeuden ja kustannusten välistä kompromissikäyrää, ja aiomme julkaista Claude 3.5 Haikun ja Claude 3.6 Opusin myöhemmin tänä vuonna samalla, kun jatkamme turvallisuustutkimustamme varmistaaksemme näiden järjestelmien turvallisuuden, toimitusjohtaja sanoi. Anthropic tutkii myös muistiin keskittyviä ominaisuuksia, jotka muokkaavat malleja entisestään muistamaan tietyt käyttäjien mieltymykset ja vuorovaikutusominaisuudet.

huhtikuun horoskooppi

San Franciscossa toimiva startup ylpeilee tällä hetkellä noin 375 työntekijää, verrattuna OpenAI:n henkilöstömäärään. noin 2000. Anthropicin julkaisutulva osoittaa, että se yrittää pysyä nopeatempoisessa A.I:ssä. kilpavarustelu OpenAI:n kanssa, joka debytoi GPT-4o:ssa toukokuussa. Näin kahden yrityksen uusimmat mallit kohtaavat toisiaan vastaan:

Claude on ykkönen lukemisessa, koodauksessa ja matematiikassa

Sen lisäksi, että Anthropic esitteli parannuksia huumorissa, vivahteissa ja kirjoittamisessa luonnollisella ja samankaltaisella äänellä, Anthropic sanoi, että sen uusin malli ylittää GPT-4o:n päättelyn, tiedon ja koodaustaitojen mittareissa.

Claude 3.5 Sonnet suoriutuu hieman GPT-4o:sta korkeakoulutason päättelyssä, koodissa, monikielisessä matematiikassa ja tekstin päättelyssä, käynnistyksen mukaan . GPT-4o puolestaan ​​näyttää korkeammat taidot matemaattisessa ongelmanratkaisussa.

towie valettu

Clauden vaikuttavista tuloksista huolimatta A.I. mallien vertailuarvoja ei pidä ottaa liian vakavasti vaadittujen kykyjen mittarina skeptisyyteen koskien heidän kapeaa keskittymistään ja kyvyttömyyttään välittää sitä, kuinka keskiverto yksilöt ovat vuorovaikutuksessa mallien kanssa.

Parempi GPT-4o visuaalisena mallina

Toinen sarja vertailuarvoja esittelee Clauden visuaalisen ymmärtämisen parannuksia. Anthropic sanoi, että sen uusi malli ylittää GPT-4o:n matematiikan, luonnontieteiden kaavioiden, kaavioiden ja asiakirjojen visuaalisessa ymmärtämisessä. Nämä ominaisuudet ovat erityisen tärkeitä vähittäiskaupan, logistiikan ja finanssipalveluille, jotka pystyvät usein poimimaan enemmän oivalluksia kuvasta, grafiikasta tai kuvituksesta kuin pelkästä tekstistä, kertoo yrityksen.

Antrooppinen sarja integroimaan A.I. työpaikalle

Anthropicin uusi malli esittelee lisäksi Artifacts-nimisen ominaisuuden, joka erottaa sen kilpailevista malleista. Se luo integroidun työtilan, jonka avulla käyttäjät voivat suoraan muokata Clauden luomaa sisältöä, kuten sähköposteja, koodia tai asiakirjoja, ja olla vuorovaikutuksessa sen kanssa. Uusi ominaisuus edustaa Anthropicin halua palvella yrityksiä muuttamalla Claudesta keskustelukykyistä A.I. yhteistyöhön perustuvaan työympäristöön.

Churchillin muotokuva

Molemmat mallit ovat saatavilla veloituksetta

Claude 3.5 Sonnetin verkko- ja sovellusversio on saatavilla veloituksetta. Sillä välin Claude Pro- ja Team-tilaajat voivat käyttää mallia korkeammilla hintarajoilla. Tämä muutos noudattaa OpenAI:n asettamaa standardia, joka julkaisi GPT-4o:n aiemmin tänä vuonna ilmaiseksi ja paremmalla toiminnallisuudella maksaville käyttäjille.

Turvallisuusprotokollien priorisointi

Anthropicin mukaan Claudelle tehtiin tiukat turvallisuustestit, jotka toimittivat mallin Yhdistyneen kuningaskunnan tekoälyn turvallisuusinstituutille käyttöönottoa edeltäviä turvallisuusarviointeja varten. OpenAI on puolestaan ​​joutunut arvostelun kohteeksi viime kuukausina entisten työntekijöiden johdosta, jotka väittävät, että yritys ei ole niin turvaprotokollien priorisointi . Jan Leike, joka aiemmin johti OpenAI:n turvallisuustiimiä, joka on sittemmin hajotettu, jätti yrityksen toukokuussa ja on sittemmin liittynyt Anthropiciin.

Sellaisten järjestelmien luominen, jotka eivät ole vain kykeneviä, vaan myös luotettavia, turvallisia ja inhimillisten arvojen mukaisia, on monimutkainen haaste, Dario Amodei sanoi. Meillä ei ole kaikkia vastauksia, mutta olemme omistautuneet työskentelemään näiden ongelmien parissa harkiten ja vastuullisesti