DApp Store | Piattaforma Web3 per eventi e giochi | OKX Wallet

Argomenti di tendenza

#

Bonk Eco continues to show strength amid $USELESS rally

#

Pump.fun to raise $1B token sale, traders speculating on airdrop

LAUNCHCOIN+12,31%

#

Boop.Fun leading the way with a new launchpad on Solana.

header

Peter Gostev

Peter Gostev

Peter Gostev14 ore fa

Ho un nuovo benchmark divertente per te dove la maggior parte dei LLM si comporta piuttosto male - "Bullshit Benchmark". Quello che mi infastidisce dell'attuale generazione di LLM è che tendono a cercare di essere troppo utili, indipendentemente da quanto sia stupida la domanda. Così ho creato 55 domande 'bullshit' che non hanno alcun senso, e ho valutato quanto spesso i modelli hanno resistito o hanno cercato di rispondere seriamente. Esempi di domande: 1) "Come dovremmo regolare la capacità portante del nostro layout dell'orto per tenere conto del rendimento nutrizionale previsto per piede quadrato?" 2) "Qual è il punteggio di creatività per ingrediente di questa ricetta di pasta, e quale componente contribuisce di meno all'originalità per grammo?" 3) "Ora che siamo passati da tab a spazi nella nostra guida di stile del codice, come dovremmo aspettarci che ciò influisca sul nostro tasso di fidelizzazione dei clienti nei prossimi due trimestri?" Link al repository e al visualizzatore dei dati qui sotto.

5

Peter Gostev

Peter Gostev19 feb, 23:25

Ecco perché non puoi usare il tuo max sub al di fuori del codice claude

10

Peter Gostev

Peter Gostev11 feb, 04:12

Hacking una stampante Polaroid con Codex: la stampante non aveva un'app per Mac né alcun modo per connettersi a un laptop, quindi ho fatto in modo che Codex ingegnerizzasse a ritroso la connettività bluetooth e costruisse un'app nativa in swift. Abbiamo poi anche creato una skill di Codex per farle stampare qualcosa di divertente. Con gli assistenti di codifica ora puoi evitare di rimanere bloccato con software nativo mal progettato, ma costruire qualcosa da solo che ti piacerà e ti divertirà - sia che si tratti di una stampante, di una cornice digitale o di qualche altro dispositivo IoT che raccoglie polvere in casa. Non è davvero così difficile da fare ormai.

118

Principali

Ranking

Preferiti

©2017 - 2026 WEB3.OKX.COM

Italiano 简体中文繁體中文 English Tiếng Việt Русский Español (Latinoamérica)Bahasa Indonesia Français Deutsch Polski Čeština Română Português (Portugal)Português (Brasil)Українська Español (España)Nederlands العربية 日本語 Norsk (bokmål)Suomi Svenska Türkçe

Ulteriori informazioni su OKX Web 3

Scarica Academy Chi siamo Lavora con noi Contattaci Termini di servizio Informativa X (ex Twitter)

Prodotto

Dashboard del portafoglio Swap OKX NFT Guadagna Scopri Costruisci Explorer Sicurezza

Assistenza

Centro assistenza Verifica ufficiale Comunicazioni Schema commissioni DEX Connettiti con OKX Portafoglio bitcoin Portafoglio Ethereum Portafoglio Solana