Il flusso di lavoro agentico con tool-calling di AI Helper spiegato
Una chat che risponde solo con testo è utile. Una chat che può ispezionare la pagina, scrivere codice in una finestra TEMP dal vivo e salvare per te una regola finita è qualcos'altro. AI Helper fa la seconda cosa attraverso un flusso di lavoro agentico con tool-calling. Ecco come funziona.
Cosa significa "agentico" qui
Quando invii un messaggio, il modello non deve rispondere in un colpo solo. Può decidere di aver bisogno di informazioni — chiamare uno strumento per ottenerle — leggere il risultato e continuare. Quel ciclo di pensa → agisci → osserva → pensa è il ciclo agentico. In AI Helper il ciclo esegue fino a 8 passi per turno, poi il modello deve darti una risposta finale. Il limite mantiene un turno delimitato e prevedibile.
Il protocollo degli strumenti
Ogni provider ha il proprio formato nativo di function-calling, e non coincidono. Per evitare tre percorsi di codice separati, AI Helper usa un unico protocollo testuale indipendente dal provider. Il modello emette una chiamata a uno strumento come un blocco contrassegnato:
@@JZ_TOOL@@ {"tool": "query_page", "args": {"selector": ".cookie-banner"}} @@END@@
L'estensione analizza quel blocco, esegue lo strumento e reinserisce il risultato nella conversazione così il modello può continuare. Poiché è solo testo, esattamente lo stesso prompt e la stessa logica di analisi funzionano in modo identico per OpenAI, Anthropic e Gemini — cambia provider a metà chat e il flusso di lavoro non cambia.
Gli strumenti
AI Helper espone un insieme piccolo e mirato di strumenti. Si dividono in tre gruppi.
Ispezione
query_page— dagli un selettore CSS, ottieni in cambio il numero di corrispondenze e l'HTML delle corrispondenze. È così che il modello guarda il DOM dal vivo su richiesta.list_structure— restituisce le tue cartelle, gruppi e regole esistenti con i loro id, così il modello sa cosa esiste già e dove potrebbero andare nuove cose.
Test dal vivo
open_temp_pane— apre una finestra TEMP CSS o JS nella pagina.set_temp_pane_code— scrive codice in quel pannello TEMP. La pagina si aggiorna immediatamente, così vedi la modifica proposta dal modello sul sito reale prima che qualcosa venga salvato.
Persistenza (con la tua conferma)
create_folder— crea una cartella.create_group— crea un gruppo dentro una cartella.create_rule— crea una regola con CSS e/o JS e un pattern di URL.
Ognuno di questi tre richiede una conferma utente separata ed esplicita. Il modello non può scrivere silenziosamente nella tua libreria — ogni cartella, ogni gruppo, ogni regola è un sì deliberato da parte tua. La creazione di azioni o barre di azioni non fa parte di questa fase; gli strumenti coprono cartelle, gruppi e regole con CSS e JS.
Il flusso di lavoro guidato dal prompt di sistema
Gli strumenti sono solo metà della storia — il prompt di sistema dice al modello come usarli in ordine:
- Chiedi i dettagli — chiarisci cosa vuoi davvero prima di toccare qualsiasi cosa.
- Ispeziona la pagina — usa
query_pageper confermare la struttura reale invece di indovinare. - Testa in una finestra TEMP — apri un pannello, imposta il codice, lascia che tu lo veda dal vivo.
- Chiedi a te di verificare — "la pagina ha l'aspetto giusto ora?"
- Persisti solo dopo che acconsenti — e solo allora chiama uno strumento di creazione, con la sua conferma.
Questo è lo stesso percorso che segue un essere umano attento: guarda prima, testa poi, salva per ultimo.
Un turno, passo dopo passo
Turno: "rendi la sezione commenti comprimibile"
passo 1 query_page .comments -> 1 corrispondenza, HTML restituito
passo 2 open_temp_pane css -> si apre la finestra TEMP CSS
passo 3 set_temp_pane_code ... -> CSS di compressione iniettato dal vivo
passo 4 (testo) "Ho aggiunto un toggle di compressione - controlla la pagina."
--- il modello si ferma, ti aspetta ---
Tu: "bene, salvalo"
passo 5 list_structure -> legge le tue cartelle/id
passo 6 create_rule (confermi?) -> clicchi conferma -> salvato
Sei passi usati, due rimasti nel budget. Se un turno arriva mai al limite di 8 passi, il modello conclude con ciò che ha e ti dice a che punto sono le cose.
Chip delle chiamate agli strumenti
Non devi mai indovinare cosa ha fatto il modello. Ogni chiamata a uno strumento e il suo risultato vengono renderizzati come un chip nella finestra di chat — una scheda compatta che mostra il nome dello strumento, i suoi argomenti e un riepilogo di ciò che è tornato. Scorri la conversazione e puoi controllare l'intero turno: quale selettore è stato interrogato, quale codice è andato in quale pannello, quale regola è stata creata.
Perché il protocollo testuale conta per te
Strumenti indipendenti dal provider non sono solo un dettaglio implementativo. Significa che puoi scegliere un provider per motivi di costo o qualità e la capacità agentica è identica. Nessun avvertimento del tipo "il tool-calling funziona solo sul provider X". Cambia nella finestra di chat a metà attività e continua.
Vedi anche
- Gli strumenti di ispezione della pagina in dettaglio
- Costruisci una regola con AI Helper, passo dopo passo
- Testare nelle finestre TEMP prima di salvare
Il flusso di lavoro agentico è integrato in AI Helper già oggi. Scarica JustZix, aggiungi una chiave API e chiedigli di costruire qualcosa — poi guarda i chip.
Valuta questo articolo
Nessuna valutazione — sii il primo.