Subscribers

Facebook

👉 You must follow matyo91 to access chat.

Feed Shop About

🚀 Je construis un moteur de dictée en PHP (Flow + Symfony + Whisper.cpp)

Facebook

Twitter

3 months ago

https://www.youtube.com/watch?v=JUVqrE78AkY

Construire un moteur de dictée en 2026 est trivial.

Construire une architecture propre autour d’un moteur de dictée est plus intéressant.

Cet article présente Flowvox, un MVP de moteur de transcription audio développé en PHP, en s’appuyant sur :

Symfony
Symfony Messenger
Flow : orchestrateur maison
ffmpeg
whisper.cpp

Le code source est disponible en open source : 👉 https://github.com/darkwood-com/flowvox

L’objectif n’était pas simplement d’utiliser Whisper. L’objectif était de structurer correctement le pipeline.

Le problème : la transcription n’est qu’une étape

Un moteur vocal minimal peut se résumer à :

Audio → Texte

Mais dans un système réel, plusieurs contraintes apparaissent :

Déclenchement start / stop
Finalisation propre du fichier audio
Gestion d’état du recorder
Orchestration des étapes
Extension vers post-traitement (résumé, LLM, analyse)

La question devient alors :

Comment modéliser un pipeline audio propre, extensible et maîtrisé ?

Stack technique

Le MVP repose sur :

PHP 8+
Symfony
Symfony Messenger
Flow (orchestrateur)
ffmpeg (captation audio locale)
whisper.cpp (transcription open source locale)

Aucune API distante. Aucun service cloud. Transcription 100% locale.

Architecture générale

L’architecture est organisée en trois flows :

InputProvider → Recorder → Transcribe

Chaque étape est isolée et responsable d’un rôle précis.

InputProviderFlow

Responsabilité :

Écouter les commandes voice:start et voice:stop
Émettre un VoiceControlEvent

Les commandes CLI déclenchent des messages via Symfony Messenger.

Le worker, en arrière-plan, reçoit ces événements et les injecte dans Flow.

Ce découplage permet :

Un contrôle granulaire
Une gestion multi-session
Une séparation claire des responsabilités

RecorderFlow

Responsabilité :

Piloter une instance de VoiceRecorder
Gérer le cycle de vie d’un processus ffmpeg

Le VoiceRecorder encapsule un processus système lancé via :

Symfony\Component\Process\Process

Problème central :

Comment gérer proprement start / stop sans corrompre le fichier audio ?

Trois états sont explicitement modélisés :

idle
recording
stopping

Lors d’un stop, un SIGINT est envoyé à ffmpeg afin de finaliser correctement le header WAV.

L’état stopping évite :

Les double-start
Les conflits concurrents
Les fichiers incomplets

Le processus est maîtrisé, pas subi.

TranscribeFlow

Responsabilité :

Recevoir un fichier WAV finalisé
Lancer whisper.cpp
Produire un texte transcrit

Whisper est exécuté localement via CLI.

Le MVP reste volontairement simple :

Pas de streaming
Pas de chunking temps réel
Une transcription synchrone

L’objectif est de valider l’intégration et l’orchestration.

Worker et orchestration

Le moteur fonctionne via un worker Symfony :

php bin/console voice:worker

Ce worker :

Instancie Flow
Enregistre les flows
Écoute Symfony Messenger
Ordonne l’exécution des étapes

Commandes disponibles :

voice:start voice:stop voice:worker-list

Le flux complet devient :

voice:start → Recorder démarre → voice:stop → Recorder finalise → TranscribeFlow s’exécute → Texte produit

Sans état global externe.

Pourquoi Flow ?

Flow permet :

Une architecture orientée pipeline
Des stratégies d’Input Processing (IP Strategy)
Une gestion explicite des événements
Une séparation nette entre orchestration et logique métier

Le système n’est pas couplé à Whisper.

Whisper est une implémentation. Flow est la structure.

Ce que valide le MVP

Gestion propre d’un processus système
Modélisation explicite des états
Orchestration événementielle
Extensibilité du pipeline

Ce n’est pas un produit.

C’est une base architecturale.

Évolutions possibles

Les prochaines itérations naturelles :

Streaming par chunk audio
Transcription parallèle
Post-traitement LLM
Intégration NativePHP (desktop)
Support mobile
Batching multi-modèles

Mais ces évolutions ne changent pas le cœur :

Une architecture claire. Une orchestration maîtrisée. Un pipeline extensible.

Code source

Le dépôt open source est disponible ici :

👉 https://github.com/darkwood-com/flowvox

Contributions, suggestions et retours sont les bienvenus.

Conclusion

Construire un moteur vocal en PHP est simple.

Construire une architecture propre autour d’un moteur vocal est plus intéressant.

Flowvox valide un principe :

La transcription n’est qu’un composant. L’orchestration est la véritable structure.

matyo91

€99.00

Consulting Automation avec Flow

Open

Follow matyo91 to comment

matyo91

Je t'aide à automatiser tes process

Visit this Bonzai

Follow matyo91 to get the latest updates.

🎤 Sunday Labs #4 : ce que l’écosystème builder parisien cherche vraiment

2 days ago

🧩 Un agent IA aujourd’hui, c’est un stagiaire hypermotivé avec 400 onglets ouverts.

5 days ago

⬆️ Flowvox update : Symfony devient une plateforme d’agents vocaux temps réel

1 week ago

⚙️ NoLife Models - Vers une infrastructure locale des runtimes IA avec Symfony

2 weeks ago

💡 Devoxx France 2026 - L'Ère de l'Agentique au Cœur de Paris

2 weeks ago

💫 J’ai forcé 4 IA à recréer Mario de zéro avec Symfony AI et Godot

2 weeks ago

⚡️ Projection du film "Mon Extraordinaire"

3 weeks ago

✨ Le design transformatif : ne plus concevoir des usages, mais des métamorphoses

3 weeks ago

⚙️ Construire une architecture multi-agent gouvernée avec Symfony AI, Flow et Navi

4 weeks ago

🚀 Levée de fonds vs Bootstrap : deux chemins pour construire une boîte

4 weeks ago

🚀 J’ai reconstruit un LLM… avec des pixels.

1 month ago

🔊 DJ Matyo Live - Soundcloud set

1 month ago

🤖 Symfony AI in Action - Construire des systèmes IA réels avec Symfony

1 month ago

🐳 Agentic Workflows avec Docker - vers des systèmes autonomes, sécurisés et orchestrés

1 month ago

👨‍💻 Évaluation comparative de petits modèles de langage dans le monde réel

1 month ago

🚀 Sundays Lab #3 - Quand l’IA devient un terrain de jeu collectif

1 month ago

⚙️ Message-oriented vs Data-oriented orchestration - de la donnée à la connaissance

1 month ago

🤩 Relâcher les connecteurs - Des outils au langage

1 month ago

💡 J’ai créé une app IA RGPD en 1h avec Symfony

1 month ago

🗂️ Hellcats Over The Pacific - ouverture des archives

1 month ago