Remote
Description du poste
Rejoignez tether, une start‑up technologique en pleine expansion qui repousse les frontières de l’intelligence artificielle. En tant qu’Ingénieur(e) Recherche IA spécialisé(e) dans le pré‑entraînement, vous intégrerez l’équipe « Modèles IA », un groupe d’experts passionnés par la création de modèles de grande taille (LLM) et multimodaux. Vous travaillerez en étroite collaboration avec des chercheurs, des data scientists et des ingénieurs systèmes pour concevoir, implémenter et optimiser des architectures de pointe, du prototype à la production à grande échelle.
**Missions principales**
- Concevoir et développer de nouvelles architectures de modèles (transformers, architectures hybrides, réseaux multimodaux) en s’appuyant sur les dernières avancées de la recherche académique.
- Piloter le cycle complet de pré‑entraînement : définition du protocole, sélection et curation de jeux de données massifs, mise en place de pipelines d’ingestion et de nettoyage, gestion du stockage distribué.
- Optimiser les performances d’entraînement (temps, coût, consommation GPU/TPU) grâce à des techniques d’optimisation du parallélisme, du pipeline de données et du quantization.
- Identifier, analyser et résoudre les goulets d’étranglement du pré‑entraînement (bottlenecks de bande passante, saturation de la mémoire, instabilité du gradient, etc.).
- Améliorer les baselines existantes en introduisant des stratégies de régularisation, de curriculum learning et de fine‑tuning adaptatif.
- Rédiger des rapports scientifiques, des articles internes et des présentations pour partager les résultats avec la communauté interne et externe.
- Contribuer à la veille technologique, participer à des conférences, publier des travaux et collaborer avec des laboratoires de recherche partenaires.
**Profil recherché**
- Diplôme d’ingénieur, Master ou PhD en informatique, IA, mathématiques appliquées ou domaine connexe.
- Minimum 5 ans d’expérience professionnelle dans la recherche et le développement de modèles de langage de grande taille ou de systèmes multimodaux.
- Maîtrise approfondie des architectures LLM (Transformer, GPT, BERT, etc.) et des techniques d’optimisation du pré‑entraînement.
- Solide expérience en programmation Python et en frameworks de deep learning (PyTorch, TensorFlow, JAX).
- Expertise en entraînement distribué sur des clusters GPU/TPU, connaissance des outils de gestion de ressources (Kubernetes, Slurm, Ray).
- Compétences avérées en curation de données massives, pipelines ETL, gestion de données non structurées (texte, image, audio).
- Capacité à travailler de façon autonome, à prendre des initiatives et à livrer des résultats dans des environnements à haute pression.
- Excellentes compétences en communication écrite et orale en anglais ; le français est un plus.
**Ce que nous offrons**
- Contrat CDI à temps plein, 100 % télétravail avec une flexibilité horaire totale.
- Accès à des ressources de calcul de pointe (clusters GPU/TPU, stockage haute performance).
- Budget dédié à la formation continue, conférences, publications et cours en ligne.
- Environnement de travail collaboratif, culture d’innovation et d’autonomie.
- Programme de participation aux bénéfices et actions de l’entreprise.
- Assurance santé internationale, congés payés généreux et politique de bien‑être.
Si vous êtes animé(e) par la volonté de repousser les limites de l’IA et de contribuer à des modèles qui transformeront les interactions homme‑machine, rejoignez tether et participez à la prochaine génération de technologies intelligentes.