Antropische pusht Opus 4.8 na gemengde reacties

20

Het duurde slechts 41 dagen.

Eenenveertig dagen sinds Opus 4.7 uitviel. Dat is absurd snel voor Anthropic. Normaal wacht je maanden. Kijk naar Sonnet of Haiku: ze zitten hier respectievelijk drie en zeven maanden. Deze keer? De ommekeer is verblindend.

Misschien raakten ze in paniek.

De ontvangst voor Opus 4.7 was niet bepaald hartelijk. Gebruikers vonden het teleurstellend. Anthropic rook die aarzeling. En terwijl ze het uitzweten, kwamen de concurrenten binnen. OpenAI pushte Codex. Google heeft Gemini Flash uitgerold. De druk is reëel. Dus hier is de oplossing.

Opus 4.8 is er. De prijs is hetzelfde. Beschikbaarheid is overal. Standaard dingen. Maar de benchmarks zien er geweldig uit, wat je zou verwachten.

De echte verandering zit in de eerlijkheid.

Het nieuwe model gaat anders om met onzekerheid. Het raadt niet alleen als het het niet weet. Het markeert het. Vroege testers merkten dat het model veel waarschijnlijker twijfels over zijn eigen werk zou benadrukken. Het weigert ongefundeerde claims in te dienen.

Bridgewater-medewerkers vonden het ook leuk. Ze zeiden dat eerdere modellen de input-output-problemen volledig misten. Het werd aan de gebruikers overgelaten om de fouten op te sporen. Opus 4.8 komt tussenbeide en waarschuwt u. Proactief.

De neiging van Opus 4.8 om problemen proactief te signaleren… iets wat andere modellen routinematig over het hoofd zagen

Er is nog een laag genaamd Dynamische workflows. Het is momenteel een onderzoeksvoorbeeld. Het idee? Help enorme modellen de chaos te beheersen. Honderden parallelle subagenten. Het is bedoeld om de complexiteit aan te pakken die gewoonlijk dingen kapot maakt.

Denk aan codemigraties. Geen kleine reparaties. We hebben het over honderdduizenden regels. Van aftrap tot fusie. De bestaande testsuite fungeert als vangrail.

Het werkt. Of dat zal gebeuren als het gepolijst is.

Maar de olifant in de kamer? Mythos.

Anthropic trok die terug nadat een preview angst voor cyberveiligheid had aangewakkerd. Ze verstoppen het nog steeds achter een hek. Maar het bericht van vandaag geeft aan dat het voorbeeldvenster mogelijk wordt gesloten. De beveiliging is bijna klaar.

‘We boeken snelle vooruitgang’, beweren ze. Klanten zouden binnen enkele weken modellen uit de Mythos-klasse moeten zien.

Dus wij wachten.

De concurrentie slaapt niet. Anthropic slaapt niet. En we vragen ons af of deze snellere release-cadans alleen maar paniekbeheersing is of iets scherpers.