Skip to content
Torna ai Flows
Template

Bot agente AI che comprende testo, audio, immagine e documenti

Automazione pronta all’uso che puoi avviare sul tuo numero WhatsApp in pochi minuti. Personalizza i passaggi in base alle tue esigenze.

Cosa fa questo template

Create your Custom Business AI Agent that speaks, sees, listens and replies to your customers.

🚀 What this workflow does

  1. Receives any inbound WhatsApp message via a Wassenger Trigger
  2. Detects the medium – text, voice note, image or document (PDF)
  3. Processes accordingly
    • Text → straight to the AI brain
    • Voice notes → download ➜ Whisper transcription
    • Images → download ➜ GPT-4o Vision analysis
    • PDFs only → download ➜ text extraction
  4. Feeds the cleaned input + short-term memory buffer (20 turns) to an OpenAI Chat Agent (GPT-4o-mini by default)
  5. Sends the answer back through Wassenger:
    • If the user sent audio, the bot replies in audio (OpenAI TTS ➜ saves mp3 to Google Drive ➜ returns the public link).
    • Otherwise, returns plain text.
  6. Gracefully rejects anything that isn’t text, image, audio or a PDF (“Sorry, you can only send …”)

Result: a polite, context-aware concierge that can read your contract, describe your cat photo, or summarize a 3-minute rant into a single line—without ever leaving WhatsApp.

🧩 Key components

Node Purpose
Wassenger Trigger / Wassenger Receive & send WhatsApp messages
Switch → “Input type” Routes to Text / Audio / Image / Document branches
HTTP Request Securely downloads media from Wassenger
OpenAI Whisper Turns voice notes into text
GPT-4o Vision Describes images in detail
Extract From File Converts PDFs to text
LangChain Agent Central brain with custom system prompt
Memory Buffer Window Keeps the last 20 turns per chat
OpenAI TTS (“Generate Audio Response”) Converts answers to speech (voice “nova”)
Google Drive (Upload + Delete) Stores the mp3, grabs a share link, cleans up

(Sticky notes in the canvas label the four media lanes so future-you won’t get lost.)

🛠️ Prerequisites

  • Wassenger device + API key
  • OpenAI API key (chat, whisper, TTS, vision)
  • Google Drive OAuth credentials (for audio replies)

💡 Ideas & extensions

  • Pipe extracted conversation data into HubSpot or Airtable.
  • Replace GPT-4o with your on-prem model ➜ just swap the Chat node.
  • Add a Sentiment node to auto-escalate angry customers.
  • Expand document branch to Word, PowerPoint or spreadsheets.

⚖️ Limits & best-practice nudges

  • Only PDFs are accepted for now; other file types trigger a polite rejection.
  • The workflow rate-limits itself by design (single execution per message), but you may want extra guards if you point it at a large audience.
  • Delete Google Drive files after sending (already included) to keep storage costs clean.
  • Remember WhatsApp’s 24-hour customer-initiated window.

🏁 Ready, set, automate!

Import → Hit Active. Your WhatsApp number just became a futuristic, multimodal AI agent. Enjoy the peace and quiet while it handles the chatter. 😉

Automazione no-code

Automatizza qualsiasi cosa su WhatsApp.

Usa questo template come punto di partenza o costruisci il tuo da zero. L’editor di Wassenger Flows include oltre 400 integrazioni pronte all’uso.

  • Editor drag-and-drop con oltre 400 nodi pronti all’uso
  • Agenti AI dentro il flusso — Claude, GPT, Gemini
  • Webhooks per qualsiasi passaggio personalizzato che ti viene in mente
Altro

Scopri più modelli

Trova il punto di partenza giusto per il caso d’uso del tuo team.

Template

Chatbot dell'agente AI con memoria di memoria

Visualizza template
Template

Assegna automaticamente le chat di WhatsApp a dipartimenti e utenti con l'intelligenza artificiale

Visualizza template
Template

AI AGENTE WHASPAPP: Formazione dei dati e assistenza clienti intelligente

Visualizza template
Template

WhatsApp appuntamenti AI Agente con l'integrazione del calendario di Google

Visualizza template
Template

Agente AI con Suptabase DataStore

Visualizza template
Template

Bot di supporto per agenti AI per gli usi per lo scopo

Visualizza template
Template

Agente AI Riaccensione Cohere

Visualizza template
Template

Come creare un moderatore di gruppo WhatsApp con l'intelligenza artificiale

Visualizza template
Template

WhatsApp + HubSpot Automation (CRM)

Visualizza template
Template

WhatsApp + Slack Automation

Visualizza template
Template

Bot whatsapp che comprende testo, audio, immagini e PDF

Visualizza template
Template

Social Auto-Publisher (GitHub → Social Platforms)

Visualizza template
Template

Moderatore AI dei gruppi di WhatsApp

Visualizza template
Template

WhatsApp Shopify Integration

Visualizza template
Template

Pubblica gli ultimi video di YouTube su un canale WhatsApp

Visualizza template