I am a Master’s student in Artificial Intelligence at the University of Caen Normandy, currently completing an internship at Airbus on Explainable AI applied to visual data analysis. My profile combines Computer Vision, Deep Learning, Data Science, and applied AI, with experience in object detection, model interpretability, data analysis, and end-to-end AI experimentation.
I am currently looking for a full-time position in AI, Computer Vision, Deep Learning, or Data Science, where I can contribute to real-world projects and help build robust, reliable, and interpretable AI systems.
Programming Languages: Python, Java, SQL, C, C++, JavaScript
Data Science: Pandas, NumPy, Matplotlib, data analysis, data cleaning, data preprocessing, exploratory data analysis, feature engineering
Machine Learning: Scikit-learn, SVM, PCA, GMM, boosting, clustering, supervised and unsupervised learning, model training and evaluation
Deep Learning: PyTorch, TensorFlow, Keras, neural networks, CNN, transfer learning, fine-tuning
Computer Vision: OpenCV, YOLO, ByteTrack, object detection, image processing, video tracking, multi-object tracking
Explainable AI: Xplique, concept-based explainability, attribution methods, model interpretability
Natural Language Processing: Transformers, BERT, CamemBERT, Hugging Face, token classification, BIO annotation, embeddings
Data Engineering & Databases: ETL/ELT pipelines, data warehousing, Apache Hop, Talend, OLAP, MDX, PostgreSQL, MongoDB, SQLite, GraphQL
Cloud & Tools: AWS EC2, AWS S3, Docker, Git, GitHub, Linux, Jupyter Notebook, Google Colab, LaTeX
Visualization: D3.js, Matplotlib, data visualization, reporting
Artificial Intelligence / Explainable AI Intern
Airbus SAS — Toulouse, France
March 2026 – September 2026
Contribution to the RELAI-VLS project, focused on Explainable AI for Vision Landing Systems and runway analysis. The work aims to better understand and analyze the decisions of Computer Vision models in an aeronautical context, with a focus on object detection, concept-based explanations, internal activations, and experimental evaluation.
Main tasks:
- Studying and adapting explainability methods for Computer Vision models.
- Designing experiments to extract, visualize, and compare concepts learned by object detection models.
- Analyzing internal activations, reconstruction quality, and concept stability across datasets and model configurations.
- Working with visual datasets, model outputs, and experimental results.
- Using AWS EC2 and S3 to run experiments and manage data/results.
Stack: Python, PyTorch, YOLO, Xplique, NumPy, Pandas, Matplotlib, AWS EC2, AWS S3, Git
Data Science Intern
CENOMEXA – Responsibio Research Project
2025 · 3-month internship
Design and implementation of an end-to-end hybrid AI pipeline for non-invasive assessment of rodents’ emotional states through bio-acoustic analysis. The project combines signal processing, deep learning, and classical machine learning to process complex audio data and improve generalization in laboratory conditions.
Main tasks:
- Built and curated a proprietary bio-acoustic dataset from mouse and rat vocalizations.
- Generated Mel-spectrograms from raw audio signals using Librosa.
- Used a pre-trained ResNet50 model as a feature extractor for spectrogram images.
- Applied PCA for dimensionality reduction.
- Trained and optimized a linear SVM classifier.
- Evaluated the model using stratified K-fold cross-validation and cross-species generalization.
Stack: Python, PyTorch, Scikit-learn, Librosa, Signal Processing, PCA, SVM
Research Project — Automatic Annotation of Clinical Narratives
September 2025 – March 2026
Python, PyTorch, Transformers, CamemBERT, Pandas
Development of an NLP pipeline to automatically annotate autobiographical patient narratives at word level. The project includes corpus preparation, BIO annotation, and fine-tuning of CamemBERT to distinguish episodic and semantic details.
Handball Video Tracking
December 2024
YOLO, ByteTrack, OpenCV, Python
Development of a Computer Vision pipeline to detect and track players, goalkeepers, referees, and the ball in handball match videos. The project separates player tracking from ball tracking and supports movement analysis on the court.
Repository: https://github.com/elymeraj/Handball_Tracking
Interactive Sales Data Visualization
May 2025
Docker, Node.js, GraphQL, MongoDB, D3.js, JavaScript
Development of an interactive web application to explore sales data using a multi-container architecture. The project includes a GraphQL API connected to MongoDB and a dynamic visualization interface with D3.js.
Repository: https://github.com/elymeraj/docker_tp8
Data Warehouse — ETL and OLAP Analysis
2024
Apache Hop, SQLite, SQL, MDX, OLAP
Design and population of a data warehouse from operational sources to support business analysis. The project includes ETL workflows, OLAP cube creation, and MDX queries for multidimensional analysis.
Repository: https://github.com/elymeraj/OLAP_CUBE
Master’s Degree in Artificial Intelligence
University of Caen Normandy — Caen, France
September 2024 – September 2026
Main topics: Machine Learning, Deep Learning, NLP, Computer Vision, Data Mining, ETL, SQL/NoSQL databases.
Bachelor’s Degree in Computer Science
University Clermont Auvergne — ISIMA — Clermont-Ferrand, France
September 2021 – May 2024
Main topics: databases, artificial intelligence, applied mathematics, advanced algorithms, probability and statistics, operations research.
- French: Fluent
- English: Professional
- Albanian: Native
- Email: eldisymeraj0@gmail.com
- LinkedIn: linkedin.com/in/eldis-ymeraj-2b5433226
- GitHub: github.com/elymeraj
- Portfolio: elymeraj.github.io/portfolio
Je suis étudiant en Master Intelligence Artificielle à l’Université de Caen Normandie, actuellement en stage chez Airbus sur l’IA explicable appliquée à l’analyse de données visuelles. Mon profil combine Computer Vision, Deep Learning, Data Science et IA appliquée, avec une expérience en détection d’objets, interprétabilité des modèles, analyse de données et expérimentation IA de bout en bout.
Je recherche actuellement un CDI/CDD en IA, Computer Vision, Deep Learning ou Data Science, afin de contribuer à des projets concrets et au développement de systèmes robustes, fiables et interprétables.
Langages informatiques : Python, Java, SQL, C, C++, JavaScript
Data Science : Pandas, NumPy, Matplotlib, analyse de données, nettoyage de données, prétraitement, analyse exploratoire, feature engineering
Machine Learning : Scikit-learn, SVM, PCA, GMM, boosting, clustering, apprentissage supervisé et non supervisé, entraînement et évaluation de modèles
Deep Learning : PyTorch, TensorFlow, Keras, réseaux de neurones, CNN, transfer learning, fine-tuning
Computer Vision : OpenCV, YOLO, ByteTrack, détection d’objets, traitement d’images, suivi vidéo, suivi multi-objets
IA explicable : Xplique, méthodes basées concepts, méthodes d’attribution, interprétabilité des modèles
Traitement automatique du langage naturel : Transformers, BERT, CamemBERT, Hugging Face, token classification, annotation BIO, embeddings
Data Engineering & Bases de données : pipelines ETL/ELT, data warehouse, Apache Hop, Talend, OLAP, MDX, PostgreSQL, MongoDB, SQLite, GraphQL
Cloud & Outils : AWS EC2, AWS S3, Docker, Git, GitHub, Linux, Jupyter Notebook, Google Colab, LaTeX
Visualisation : D3.js, Matplotlib, visualisation de données, reporting
Stagiaire Intelligence Artificielle / IA Explicable
Airbus SAS — Toulouse, France
Mars 2026 – Septembre 2026
Contribution au projet RELAI-VLS, centré sur l’IA explicable appliquée aux Vision Landing Systems et à l’analyse de pistes. Le travail vise à mieux comprendre et analyser les décisions de modèles de Computer Vision dans un contexte aéronautique, avec un focus sur la détection d’objets, les explications par concepts, les activations internes et l’évaluation expérimentale.
Missions principales :
- Étude et adaptation de méthodes d’explicabilité pour des modèles de Computer Vision.
- Conception d’expériences pour extraire, visualiser et comparer les concepts appris par des modèles de détection d’objets.
- Analyse des activations internes, de la qualité de reconstruction et de la stabilité des concepts selon les jeux de données et les configurations du modèle.
- Exploitation de données visuelles, de sorties de modèles et de résultats expérimentaux.
- Utilisation d’AWS EC2 et S3 pour exécuter les expériences et gérer les données/résultats.
Stack : Python, PyTorch, YOLO, Xplique, NumPy, Pandas, Matplotlib, AWS EC2, AWS S3, Git
Stagiaire Data Science
CENOMEXA – Projet Responsibio
2025 · Stage de 3 mois
Conception et mise en œuvre d’un pipeline d’IA hybride de bout en bout pour l’évaluation non invasive des états émotionnels de rongeurs par analyse bioacoustique. Le projet combine traitement du signal, apprentissage profond et machine learning classique afin de traiter des données audio complexes et d’améliorer la généralisation en conditions de laboratoire.
Missions principales :
- Construction et préparation d’un jeu de données bioacoustiques propriétaire à partir de vocalisations de souris et de rats.
- Génération de spectrogrammes de Mel à partir de signaux audio bruts avec Librosa.
- Utilisation d’un modèle ResNet50 pré-entraîné comme extracteur de caractéristiques pour les images de spectrogrammes.
- Application de la PCA pour réduire la dimension des représentations.
- Entraînement et optimisation d’un classifieur SVM linéaire.
- Évaluation du modèle par validation croisée K-fold stratifiée et généralisation inter-espèces.
Stack : Python, PyTorch, Scikit-learn, Librosa, Traitement du signal, PCA, SVM
Projet de recherche — Annotation automatique de récits cliniques
Septembre 2025 – Mars 2026
Python, PyTorch, Transformers, CamemBERT, Pandas
Développement d’un pipeline NLP pour annoter automatiquement des récits autobiographiques de patients au niveau mot-à-mot. Le projet inclut la préparation du corpus, l’annotation BIO et le fine-tuning de CamemBERT pour distinguer les détails épisodiques et sémantiques.
Handball Video Tracking
Décembre 2024
YOLO, ByteTrack, OpenCV, Python
Développement d’un pipeline de Computer Vision pour détecter et suivre les joueurs, gardiens, arbitres et le ballon dans des vidéos de match de handball. Le projet sépare le suivi des joueurs et le suivi du ballon afin de faciliter l’analyse des déplacements sur le terrain.
Dépôt : https://github.com/elymeraj/Handball_Tracking
Visualisation interactive de données de ventes
Mai 2025
Docker, Node.js, GraphQL, MongoDB, D3.js, JavaScript
Développement d’une application web interactive pour explorer des données de ventes à partir d’une architecture multi-conteneurs. Le projet inclut une API GraphQL connectée à MongoDB et une interface de visualisation dynamique avec D3.js.
Dépôt : https://github.com/elymeraj/docker_tp8
Data Warehouse — ETL et analyse OLAP
2024
Apache Hop, SQLite, SQL, MDX, OLAP
Conception et alimentation d’un entrepôt de données à partir de sources opérationnelles afin de structurer l’analyse décisionnelle. Le projet inclut des workflows ETL, la création d’un cube OLAP et des requêtes MDX pour l’analyse multidimensionnelle.
Dépôt : https://github.com/elymeraj/OLAP_CUBE
Master en Intelligence Artificielle
Université de Caen Normandie — Caen, France
Septembre 2024 – Septembre 2026
Principaux enseignements : Machine Learning, Deep Learning, NLP, Computer Vision, data mining, ETL, bases SQL/NoSQL.
Licence Informatique, parcours Informatique
Université Clermont Auvergne — ISIMA — Clermont-Ferrand, France
Septembre 2021 – Mai 2024
Principaux enseignements : bases de données, intelligence artificielle, mathématiques appliquées, algorithmique avancée, probabilités et statistiques, recherche opérationnelle.
- Français : Courant
- Anglais : Professionnel
- Albanais : Langue maternelle
- Email : eldisymeraj0@gmail.com
- LinkedIn : linkedin.com/in/eldis-ymeraj-2b5433226
- GitHub : github.com/elymeraj
- Portfolio : elymeraj.github.io/portfolio