You're seeing this page as if you were . The main menu is still yours, though. Exit from immersion
Arnault G.AG

Arnault G.

data scientist - machine learning - NLP - AI - LLM

$1,045/day
26 projects
Paris, FR
8-15 years

Average response time: 2 hours

About Arnault

🔍 Data Scientist & IA / Machine Learning Engineer, 10 ans d'expérience

💶 Agrément CII : Bénéficiez de 20% de crédit d'impôt sur mes prestations liées à vos projets R&D.

🧠 Spécialités: NLP, IA, Data Science, Machine Learning, Deep Learning, Large Language Models (LLM / chatGPT).

🌐 Expérience: Edtech, Legaltech, Smart City, Greentech, Fintech, Medtech. Teamlead.


🌟 Focus:
- Impact Social
- Modélisation: R&D, PoC, Monitoring
- Management & Stratégie
- Supervision Projets Data.

💡 Expertises / Services:
- Classification et prédiction
- Visualization des données
- OCR / transcription de documents (documents numériques)
- Exploration de tendances textuelles
- Extraction d'entités ou d'information dans des textes
- Détection de churn client
- Segmentation client
- Analyse d'images
- Détection d'anomalies
- Pricing dynamique
- Prédiction de séries temporelles
- Prompt Engineering
- Adaptation / fine-tuning de LLM/ChatGPT

🎓 Diplômes: ENSAE Paris, Paris Saclay.

🌍 Travail à distance, disponible pour déplacements. Suivi hebdomadaire.

🌐 Clients récents: WHO, Silvr, World Bank ou Kalent AI.
  • English

    Fluent

  • Spanish

    Fluent

  • French

    Native or bilingual

Remote only
Primarily works remotely

Experience

  • beta.gouv.fr
    AI Engineer - RAG Juridique
    LEGAL
    September 2025 - Today (9 months)
    Londres, United Kingdom
    RAG Juridique, Agents LLM & Systèmes IA de Production

    J'ai participé à la conception et au déploiement une plateforme d'assistant juridique IA pour le Conseil d'État (Beta.gouv), combinant des technologies LLM, retrieval augmenté et fine-tuning de modèles de languqge.

    Réalisations clés du projet Jacepair:
    • Architecture RAG Hybride — Système de recherche combinant BM25 sparse et embeddings denses avec Reciprocal Rank Fusion, sur un corpus de 1.6M+ articles de loi et 110K+ décisions de justice
    • Pipeline d'ingestion multi-sources — Intégration automatisée de LEGIFRANCE (codes, lois, décrets), ArianeWeb (jurisprudence administrative) et ConsiliaWeb (avis consultatifs), avec versioning et traçabilité des modifications
    • Extraction intelligente de références légales — Système LLM + regex pour identifier et structurer automatiquement les citations d'articles, lois, ordonnances et décisions dans les documents juridiques
    • Abstraction multi-provider LLM — Architecture flexible supportant OpenAI, Mistral AI et Albert (LLM souverain français) via LiteLLM, avec validation Pydantic pour les sorties structurées
    • Infrastructure production-ready — Déploiement Docker Compose avec PostgreSQL/pgvector, Qdrant, FastAPI async, Streamlit, et gestion optimisée des connexions (AsyncPG, pooling jusqu'à 50 connexions)
    intelligence artificielle LLMs IA Python Data Science
  • kwarto
    Malt logoOn Malt
    AI Engineer - Extraction de documents techniques
    MECHANICAL ENGINEERING
    September 2025 - September 2025
    Londres, United Kingdom
    J'ai effectué une mission en tant que Data Scientist / ML / NLP Engineer. Le projet avait pour but de mettre en place une solution d'extraction d'entités techniques à l'intérieur de documents PDF sur des installations de télécommunication.

    - Extraction des informations techniques des PDFs
    - Déploiement de LLMs open-source sur OVH
    - Mise en place d'un système d'évaluation automatique de l'extraction (via MLFlow)
    - Développement du système de fine-tuning
    - Développement de la plateforme d'annotations/correction
    NLP LLM Machine learning intelligence artificielle Data science
  • LaReserve.tech
    AI Engineer (Volunteering)
    PUBLIC SECTOR
    March 2025 - Today (1 year and 3 months)
    Londres, United Kingdom
    RAG Fact-Checking, Recherche Multi-Source & Évaluation Adversariale

    Description: Développement de systèmes RAG de vérification des faits en production.

    J'ai participçe à la conception et au déploiement d'une plateforme complète de fact-checking automatisé combinant recherche multi-source, génération structurées, évaluation de pertinence et red teaming itératif.

    Réalisations clés du projet Vera:
    • Architecture RAG Multi-Source — Pipeline de recherche dual (fact-checking + sources génériques) avec Google CSE, système de priorité, fallback automatique et filtrage temporel configurable
    • Génération de Requêtes Structurées via LLM — Architecture tool-calling générant pour maximiser le recall, support multilingue
    • Système de Métriques Retriever — Évaluation LLM de la pertinence des sources, comparaison baseline et tracking dans le temps
    • Analyse de Sources avec Embeddings — Détection des sources inconnues (indicateur d'hallucination), mesure du recall et de précision
    • Red Teaming Itératif — Orchestration d'attaques adversariales en 4 phases (génération → exécution → analyse → amélioration), raffinement automatique sur N itérations
    • Bridge TypeScript/Python
    LLMs Python intelligence artificielle NLP Machine learning

Reviews

5.0

Out of 7 ratings

F

Fabrice

EzDEV

Reviewed on 18/03/2024

Très professionnel compétent et organisé.
K

Ksenia

Equanimity

Reviewed on 04/12/2023

Bien que Freelance, Arnault était un vrai membre de notre équipe. Disponible et agile, très carré, toujours à l'écoute, mais surtout Arnault a très vite compris nos besoins et a su très bien nous conseiller sur le projet NLP qu'on menait. Il a très bien géré notre équipe anglophone à la fois sur les aspects métier et en tant que manager

Recommendations

MN
Marie BeigelmanMB
Arnaud RachezAR
+1
Maksym Nikolayev and 3 other people have recommended Arnault

These freelancer profiles also match your criteria

AgathaA

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

2

BaptisteB

Baptiste Duhen

Fullstack developer

4.6

(4)

5

AmedA

Amed Hamou

Senior Lead Developer

4

(2)

7

AudreyA

Audrey Champion

Web developer

4.3

(3)

4

Education

  • Ingénieur statisticien économiste
    ENSAE ParisTech
    2016
    Cours (Spécialisation) : • Machine Learning • Apprentissage par agrégation • Gestion de données massives • Programmation • Compressed Sensing • Méthodes séquentielles et chaînes de markov cachées • Méthodes statistiques pour l'économétrie • Econométrie Avancée pour les données qualitatives • Soundings • Modèles statistiques dynamiques avec variables cachées • Bootstrap & statistiques asymptotiques • Statistiques Bayesiennes • Machines Learning Avancée • Data Visualization. Cours (Deux premières années) : • Probability Theory • Advanced Statistics • Non-parametric Statistics • Time Series • Game Theory • Econometrics • Data Analysis • Monte-Carlo methods • Dynamic Optimization • Stochastic Calculus • Macroeconomics
  • Master II - Economie quantitative, spécialisation théorie de la décision
    Université Paris-Saclay
    2016
    Cours : • Advances Econometrics for Qualitative Data • Semi Parametric and Non-Parametric Econometrics • Advanced Game Theory • Decision Theory • Monetary Economics • MacroFinance • Information, Transmissions and Communications in Games.

Skill set

Categories