Skip to content
View elymeraj's full-sized avatar

Block or report elymeraj

Block user

Prevent this user from interacting with your repositories and sending you notifications. Learn more about blocking users.

You must be logged in to block users.

Maximum 250 characters. Please don’t include any personal information such as legal names or email addresses. Markdown is supported. This note will only be visible to you.
Report abuse

Contact GitHub support about this user’s behavior. Learn more about reporting abuse.

Report abuse
elymeraj/README.md

Curriculum Vitae - Eldis Ymeraj

English Version

Profile

I am a Master’s student in Artificial Intelligence at the University of Caen Normandy, currently completing an internship at Airbus on Explainable AI applied to visual data analysis. My profile combines Computer Vision, Deep Learning, Data Science, and applied AI, with experience in object detection, model interpretability, data analysis, and end-to-end AI experimentation.

I am currently looking for a full-time position in AI, Computer Vision, Deep Learning, or Data Science, where I can contribute to real-world projects and help build robust, reliable, and interpretable AI systems.


Skills

Programming Languages: Python, Java, SQL, C, C++, JavaScript

Data Science: Pandas, NumPy, Matplotlib, data analysis, data cleaning, data preprocessing, exploratory data analysis, feature engineering

Machine Learning: Scikit-learn, SVM, PCA, GMM, boosting, clustering, supervised and unsupervised learning, model training and evaluation

Deep Learning: PyTorch, TensorFlow, Keras, neural networks, CNN, transfer learning, fine-tuning

Computer Vision: OpenCV, YOLO, ByteTrack, object detection, image processing, video tracking, multi-object tracking

Explainable AI: Xplique, concept-based explainability, attribution methods, model interpretability

Natural Language Processing: Transformers, BERT, CamemBERT, Hugging Face, token classification, BIO annotation, embeddings

Data Engineering & Databases: ETL/ELT pipelines, data warehousing, Apache Hop, Talend, OLAP, MDX, PostgreSQL, MongoDB, SQLite, GraphQL

Cloud & Tools: AWS EC2, AWS S3, Docker, Git, GitHub, Linux, Jupyter Notebook, Google Colab, LaTeX

Visualization: D3.js, Matplotlib, data visualization, reporting


Professional Experience

Artificial Intelligence / Explainable AI Intern
Airbus SAS — Toulouse, France
March 2026 – September 2026

Contribution to the RELAI-VLS project, focused on Explainable AI for Vision Landing Systems and runway analysis. The work aims to better understand and analyze the decisions of Computer Vision models in an aeronautical context, with a focus on object detection, concept-based explanations, internal activations, and experimental evaluation.

Main tasks:

  • Studying and adapting explainability methods for Computer Vision models.
  • Designing experiments to extract, visualize, and compare concepts learned by object detection models.
  • Analyzing internal activations, reconstruction quality, and concept stability across datasets and model configurations.
  • Working with visual datasets, model outputs, and experimental results.
  • Using AWS EC2 and S3 to run experiments and manage data/results.

Stack: Python, PyTorch, YOLO, Xplique, NumPy, Pandas, Matplotlib, AWS EC2, AWS S3, Git


Data Science Intern
CENOMEXA – Responsibio Research Project
2025 · 3-month internship

Design and implementation of an end-to-end hybrid AI pipeline for non-invasive assessment of rodents’ emotional states through bio-acoustic analysis. The project combines signal processing, deep learning, and classical machine learning to process complex audio data and improve generalization in laboratory conditions.

Main tasks:

  • Built and curated a proprietary bio-acoustic dataset from mouse and rat vocalizations.
  • Generated Mel-spectrograms from raw audio signals using Librosa.
  • Used a pre-trained ResNet50 model as a feature extractor for spectrogram images.
  • Applied PCA for dimensionality reduction.
  • Trained and optimized a linear SVM classifier.
  • Evaluated the model using stratified K-fold cross-validation and cross-species generalization.

Stack: Python, PyTorch, Scikit-learn, Librosa, Signal Processing, PCA, SVM


Projects

Research Project — Automatic Annotation of Clinical Narratives
September 2025 – March 2026
Python, PyTorch, Transformers, CamemBERT, Pandas

Development of an NLP pipeline to automatically annotate autobiographical patient narratives at word level. The project includes corpus preparation, BIO annotation, and fine-tuning of CamemBERT to distinguish episodic and semantic details.


Handball Video Tracking
December 2024
YOLO, ByteTrack, OpenCV, Python

Development of a Computer Vision pipeline to detect and track players, goalkeepers, referees, and the ball in handball match videos. The project separates player tracking from ball tracking and supports movement analysis on the court.

Repository: https://github.com/elymeraj/Handball_Tracking


Interactive Sales Data Visualization
May 2025
Docker, Node.js, GraphQL, MongoDB, D3.js, JavaScript

Development of an interactive web application to explore sales data using a multi-container architecture. The project includes a GraphQL API connected to MongoDB and a dynamic visualization interface with D3.js.

Repository: https://github.com/elymeraj/docker_tp8


Data Warehouse — ETL and OLAP Analysis
2024
Apache Hop, SQLite, SQL, MDX, OLAP

Design and population of a data warehouse from operational sources to support business analysis. The project includes ETL workflows, OLAP cube creation, and MDX queries for multidimensional analysis.

Repository: https://github.com/elymeraj/OLAP_CUBE


Education

Master’s Degree in Artificial Intelligence
University of Caen Normandy — Caen, France
September 2024 – September 2026

Main topics: Machine Learning, Deep Learning, NLP, Computer Vision, Data Mining, ETL, SQL/NoSQL databases.


Bachelor’s Degree in Computer Science
University Clermont Auvergne — ISIMA — Clermont-Ferrand, France
September 2021 – May 2024

Main topics: databases, artificial intelligence, applied mathematics, advanced algorithms, probability and statistics, operations research.


Languages

  • French: Fluent
  • English: Professional
  • Albanian: Native

Contact


Version Française

Profil

Je suis étudiant en Master Intelligence Artificielle à l’Université de Caen Normandie, actuellement en stage chez Airbus sur l’IA explicable appliquée à l’analyse de données visuelles. Mon profil combine Computer Vision, Deep Learning, Data Science et IA appliquée, avec une expérience en détection d’objets, interprétabilité des modèles, analyse de données et expérimentation IA de bout en bout.

Je recherche actuellement un CDI/CDD en IA, Computer Vision, Deep Learning ou Data Science, afin de contribuer à des projets concrets et au développement de systèmes robustes, fiables et interprétables.


Compétences

Langages informatiques : Python, Java, SQL, C, C++, JavaScript

Data Science : Pandas, NumPy, Matplotlib, analyse de données, nettoyage de données, prétraitement, analyse exploratoire, feature engineering

Machine Learning : Scikit-learn, SVM, PCA, GMM, boosting, clustering, apprentissage supervisé et non supervisé, entraînement et évaluation de modèles

Deep Learning : PyTorch, TensorFlow, Keras, réseaux de neurones, CNN, transfer learning, fine-tuning

Computer Vision : OpenCV, YOLO, ByteTrack, détection d’objets, traitement d’images, suivi vidéo, suivi multi-objets

IA explicable : Xplique, méthodes basées concepts, méthodes d’attribution, interprétabilité des modèles

Traitement automatique du langage naturel : Transformers, BERT, CamemBERT, Hugging Face, token classification, annotation BIO, embeddings

Data Engineering & Bases de données : pipelines ETL/ELT, data warehouse, Apache Hop, Talend, OLAP, MDX, PostgreSQL, MongoDB, SQLite, GraphQL

Cloud & Outils : AWS EC2, AWS S3, Docker, Git, GitHub, Linux, Jupyter Notebook, Google Colab, LaTeX

Visualisation : D3.js, Matplotlib, visualisation de données, reporting


Expériences professionnelles

Stagiaire Intelligence Artificielle / IA Explicable
Airbus SAS — Toulouse, France
Mars 2026 – Septembre 2026

Contribution au projet RELAI-VLS, centré sur l’IA explicable appliquée aux Vision Landing Systems et à l’analyse de pistes. Le travail vise à mieux comprendre et analyser les décisions de modèles de Computer Vision dans un contexte aéronautique, avec un focus sur la détection d’objets, les explications par concepts, les activations internes et l’évaluation expérimentale.

Missions principales :

  • Étude et adaptation de méthodes d’explicabilité pour des modèles de Computer Vision.
  • Conception d’expériences pour extraire, visualiser et comparer les concepts appris par des modèles de détection d’objets.
  • Analyse des activations internes, de la qualité de reconstruction et de la stabilité des concepts selon les jeux de données et les configurations du modèle.
  • Exploitation de données visuelles, de sorties de modèles et de résultats expérimentaux.
  • Utilisation d’AWS EC2 et S3 pour exécuter les expériences et gérer les données/résultats.

Stack : Python, PyTorch, YOLO, Xplique, NumPy, Pandas, Matplotlib, AWS EC2, AWS S3, Git


Stagiaire Data Science
CENOMEXA – Projet Responsibio
2025 · Stage de 3 mois

Conception et mise en œuvre d’un pipeline d’IA hybride de bout en bout pour l’évaluation non invasive des états émotionnels de rongeurs par analyse bioacoustique. Le projet combine traitement du signal, apprentissage profond et machine learning classique afin de traiter des données audio complexes et d’améliorer la généralisation en conditions de laboratoire.

Missions principales :

  • Construction et préparation d’un jeu de données bioacoustiques propriétaire à partir de vocalisations de souris et de rats.
  • Génération de spectrogrammes de Mel à partir de signaux audio bruts avec Librosa.
  • Utilisation d’un modèle ResNet50 pré-entraîné comme extracteur de caractéristiques pour les images de spectrogrammes.
  • Application de la PCA pour réduire la dimension des représentations.
  • Entraînement et optimisation d’un classifieur SVM linéaire.
  • Évaluation du modèle par validation croisée K-fold stratifiée et généralisation inter-espèces.

Stack : Python, PyTorch, Scikit-learn, Librosa, Traitement du signal, PCA, SVM


Projets

Projet de recherche — Annotation automatique de récits cliniques
Septembre 2025 – Mars 2026
Python, PyTorch, Transformers, CamemBERT, Pandas

Développement d’un pipeline NLP pour annoter automatiquement des récits autobiographiques de patients au niveau mot-à-mot. Le projet inclut la préparation du corpus, l’annotation BIO et le fine-tuning de CamemBERT pour distinguer les détails épisodiques et sémantiques.


Handball Video Tracking
Décembre 2024
YOLO, ByteTrack, OpenCV, Python

Développement d’un pipeline de Computer Vision pour détecter et suivre les joueurs, gardiens, arbitres et le ballon dans des vidéos de match de handball. Le projet sépare le suivi des joueurs et le suivi du ballon afin de faciliter l’analyse des déplacements sur le terrain.

Dépôt : https://github.com/elymeraj/Handball_Tracking


Visualisation interactive de données de ventes
Mai 2025
Docker, Node.js, GraphQL, MongoDB, D3.js, JavaScript

Développement d’une application web interactive pour explorer des données de ventes à partir d’une architecture multi-conteneurs. Le projet inclut une API GraphQL connectée à MongoDB et une interface de visualisation dynamique avec D3.js.

Dépôt : https://github.com/elymeraj/docker_tp8


Data Warehouse — ETL et analyse OLAP
2024
Apache Hop, SQLite, SQL, MDX, OLAP

Conception et alimentation d’un entrepôt de données à partir de sources opérationnelles afin de structurer l’analyse décisionnelle. Le projet inclut des workflows ETL, la création d’un cube OLAP et des requêtes MDX pour l’analyse multidimensionnelle.

Dépôt : https://github.com/elymeraj/OLAP_CUBE


Formation

Master en Intelligence Artificielle
Université de Caen Normandie — Caen, France
Septembre 2024 – Septembre 2026

Principaux enseignements : Machine Learning, Deep Learning, NLP, Computer Vision, data mining, ETL, bases SQL/NoSQL.


Licence Informatique, parcours Informatique
Université Clermont Auvergne — ISIMA — Clermont-Ferrand, France
Septembre 2021 – Mai 2024

Principaux enseignements : bases de données, intelligence artificielle, mathématiques appliquées, algorithmique avancée, probabilités et statistiques, recherche opérationnelle.


Langues

  • Français : Courant
  • Anglais : Professionnel
  • Albanais : Langue maternelle

Contact

Popular repositories Loading

  1. Web_projet Web_projet Public

    Création d'une page web portfolio en utilisant HTML, CSS, JavaScript

    Python

  2. L2-ALGO-NUM L2-ALGO-NUM Public

    C

  3. L2-SI L2-SI Public

    TeX

  4. LOGIQUE-L2 LOGIQUE-L2 Public

    Prolog

  5. L2-JEU-DE-SOKOBAN L2-JEU-DE-SOKOBAN Public

    C

  6. L2-POO L2-POO Public

    Java